Desde la lectura y el indexado hasta el análisis, resuma brevemente el seguimiento del índice de datos de Web3

Intermedio9/27/2024, 3:37:05 PM
Este artículo explora el proceso de desarrollo de la accesibilidad de datos de blockchain, compara la arquitectura y las características de aplicación de tecnología de IA de tres protocolos de servicios de datos, The Graph, Chainbase y Space and Time, y señala que los servicios de datos de blockchain se están moviendo hacia la inteligencia y se están desarrollando en la dirección de la seguridad y seguirán desempeñando un papel importante como infraestructura de la industria en el futuro.

Este artículo explora la evolución de la accesibilidad de los datos de blockchain, comparando las características de tres protocolos de servicios de datos: The Graph, Chainbase y Space and Time, en términos de arquitectura y aplicaciones de tecnología AI. Se señala que los servicios de datos de blockchain están evolucionando hacia una mayor inteligencia y seguridad, y seguirán desempeñando un papel crucial como infraestructura fundamental en la industria en el futuro.

1. Introducción

A partir de la primera ola de dApps en 2017, que incluía Etheroll, ETHLend y CryptoKitties, ahora vemos una variedad floreciente de dApps financieras, de juegos y sociales basadas en diferentes blockchains. Al discutir las aplicaciones descentralizadas en cadena, ¿alguna vez hemos considerado las fuentes de los diversos datos que estas dApps utilizan en sus interacciones?

En 2024, el enfoque está en la IA y Web3. En el mundo de la inteligencia artificial, los datos son como el flujo vital para su crecimiento y evolución. Al igual que las plantas dependen de la luz solar y el agua para prosperar, los sistemas de IA dependen de vastas cantidades de datos para continuar "aprendiendo" y "pensando". Sin datos, incluso los algoritmos de IA más sofisticados son meros castillos en el aire, incapaces de desatar su inteligencia y eficacia previstas.

Este artículo analiza la evolución de la indexación de datos de blockchain desde la perspectiva de la accesibilidad de datos, comparando el protocolo de indexación de datos establecido The Graph con los protocolos emergentes de servicios de datos de blockchain Chainbase y Space and Time. En particular, explora las similitudes y diferencias en los servicios de datos y la arquitectura del producto entre estos dos nuevos protocolos que incorporan tecnología IA.

2. Complejidad y simplicidad del índice de datos: desde los nodos de la cadena de bloques hasta la base de datos completa de la cadena

2.1 Fuentes de datos: Nodos de la cadena de bloques

Desde el momento en que comenzamos a comprender “qué es blockchain”, a menudo nos encontramos con la frase: blockchain es un libro mayor descentralizado. Los nodos de blockchain son la base de toda la red de blockchain, responsables de grabar, almacenar y difundir todos los datos de transacciones en cadena. Cada nodo posee una copia completa de los datos de blockchain, asegurando la descentralización de la red. Sin embargo, para los usuarios comunes, construir y mantener un nodo de blockchain no es una tarea fácil. Esto requiere no solo habilidades técnicas especializadas, sino que también conlleva altos costos de hardware y ancho de banda. Además, las capacidades de consulta de los nodos comunes son limitadas, lo que dificulta recuperar datos en el formato que los desarrolladores requieren. Por lo tanto, aunque teóricamente cualquiera puede ejecutar su propio nodo, en la práctica, los usuarios tienden a depender de servicios de terceros.

Para abordar este problema, han surgido proveedores de nodos RPC (llamada de procedimiento remoto). Estos proveedores manejan los costos y la gestión de los nodos y ofrecen datos a través de puntos finales de RPC, lo que permite a los usuarios acceder a datos de blockchain sin construir sus propios nodos. Los puntos finales de RPC públicos son gratuitos pero tienen límites de tarifas, lo que puede impactar negativamente la experiencia del usuario de dApps. Los puntos finales de RPC privados ofrecen un mejor rendimiento al reducir la congestión, pero incluso la recuperación de datos simple requiere una comunicación sustancial de ida y vuelta. Esto los hace pesados en solicitudes e ineficientes para consultas de datos complejas. Además, los puntos finales de RPC privados a menudo enfrentan desafíos de escalabilidad y carecen de compatibilidad en diferentes redes. Sin embargo, las interfaces de API estandarizadas proporcionadas por los proveedores de nodos reducen las barreras para que los usuarios accedan a datos en cadena, sentando las bases para el análisis posterior de datos y aplicaciones.

2.2 Análisis de datos: De datos sin procesar a datos utilizables

Los datos obtenidos de los nodos de la cadena de bloques suelen ser datos en bruto que han sido encriptados y codificados. Si bien estos datos conservan la integridad y seguridad de la cadena de bloques, su complejidad aumenta la dificultad del análisis de datos. Para usuarios comunes o desarrolladores, el manejo directo de estos datos en bruto requiere un conocimiento técnico sustancial y recursos computacionales.

En este contexto, el proceso de análisis de datos se vuelve especialmente importante. Al analizar datos crudos complejos y transformarlos en formatos más comprensibles y operables, los usuarios pueden comprender e utilizar intuitivamente estos datos. El éxito del análisis de datos afecta directamente a la eficiencia y efectividad de las aplicaciones de datos de blockchain, lo que lo convierte en un paso crítico en todo el proceso de indexación de datos.

2.3 Evolución de los indexadores de datos

A medida que aumenta el volumen de datos de blockchain, también ha crecido la demanda de indexadores de datos. Los indexadores desempeñan un papel crucial en la organización de los datos en cadena y su envío a bases de datos para facilitar las consultas. El principio de funcionamiento de un indexador es indexar los datos de la cadena de bloques y ponerlos a disposición a través de un lenguaje de consulta similar a SQL (como las API de GraphQL). Al proporcionar una interfaz unificada para la consulta de datos, los indexadores permiten a los desarrolladores recuperar rápidamente y con precisión la información que necesitan utilizando lenguajes de consulta estandarizados, simplificando significativamente el proceso.

Diferentes tipos de indexadores optimizan la recuperación de datos de diversas maneras:

· Indexadores de nodos completos: Estos indexadores ejecutan nodos completos de blockchain y extraen datos directamente de ellos, asegurando la completitud y precisión de los datos, pero requiriendo un almacenamiento y potencia de procesamiento sustanciales.

· Indexadores ligeros: Estos indexadores dependen de nodos completos para obtener datos específicos según sea necesario, lo que reduce los requisitos de almacenamiento pero potencialmente aumenta el tiempo de consulta.

· Indexadores especializados: Estos indexadores se centran en tipos específicos de datos o blockchains particulares, optimizando la recuperación para casos de uso específicos, como datos de NFT o transacciones DeFi.

· AggreGated Indexers: Estos indexadores extraen datos de múltiples blockchains y fuentes, incluida información off-chain, proporcionando una interfaz de consulta unificada, que es especialmente útil para dApps multi-chain.

Actualmente, un nodo de archivo de Ethereum en el cliente Geth en modo de archivo ocupa alrededor de 13,5 TB de espacio de almacenamiento, mientras que en el cliente Erigon, el requisito de archivo es de alrededor de 3 TB. A medida que la cadena de bloques continúe creciendo, los requisitos de almacenamiento de datos para los nodos de archivo también aumentarán. Frente a cantidades tan grandes de datos, los protocolos de indexación convencionales no solo admiten la indexación multicadena, sino que también personalizan los marcos de análisis de datos adaptados a las diferentes necesidades de datos de la aplicación. Por ejemplo, el marco de "subgrafo" de The Graph es un ejemplo típico.

La aparición de los indexadores mejora significativamente la eficiencia de la indexación y consulta de datos. En comparación con los puntos finales RPC tradicionales, los indexadores pueden indexar eficientemente grandes cantidades de datos y admitir consultas de alta velocidad. Estos indexadores permiten a los usuarios realizar consultas complejas, filtrar fácilmente datos y analizarlos después de su extracción. Además, algunos indexadores admiten la agregación de fuentes de datos de múltiples blockchains, evitando la necesidad de implementar múltiples APIs en dApps multi-chain. Al ejecutarse de manera distribuida en múltiples nodos, los indexadores ofrecen una seguridad y rendimiento más sólidos, al mismo tiempo que reducen los riesgos de interrupciones y tiempos de inactividad asociados con los proveedores centralizados de RPC.

Por el contrario, los indexadores permiten a los usuarios obtener la información que necesitan directamente mediante lenguajes de consulta predefinidos sin tener que lidiar con los datos complejos subyacentes. Este mecanismo mejora significativamente la eficiencia y confiabilidad de la recuperación de datos, lo que representa una innovación importante en el acceso a datos blockchain.

2.4 Bases de datos de cadena completa: Alineándose hacia la transmisión primero

Usar nodos indexados para consultar datos generalmente implica que las APIs se convierten en la única Puerta de enlace para digerir los datos on-chain. Sin embargo, cuando un proyecto entra en la fase de escalabilidad, a menudo requiere fuentes de datos más flexibles, que las APIs estandarizadas no pueden proporcionar. A medida que las demandas de las aplicaciones se vuelven más complejas, los indexadores de datos primarios con sus formatos de indexación estandarizados luchan gradualmente por cumplir con las necesidades de consulta cada vez más diversas, como la búsqueda, el acceso entre cadenas o el mapeo de datos fuera de la cadena.

En la arquitectura moderna de canalización de datos, un enfoque de "flujo primero" se ha convertido en una solución a las limitaciones del procesamiento tradicional por lotes, lo que permite la ingesta, el procesamiento y el análisis de datos en tiempo real. Este cambio de paradigma permite a las organizaciones responder inmediatamente a los datos entrantes, proporcionando información y tomando decisiones casi instantáneamente. Del mismo modo, el desarrollo de proveedores de servicios de datos de blockchain está progresando hacia la construcción de flujos de datos de blockchain. Los proveedores de servicios de indexación tradicionales han lanzado sucesivamente productos que obtienen datos de blockchain en tiempo real a través de flujos de datos, como The Graph's Substreams y Goldsky's Mirror, así como lagos de datos en tiempo real como Chainbase y SubSquid que generan flujos de datos basados en blockchains.

Estos servicios tienen como objetivo satisfacer la demanda de análisis en tiempo real de transacciones de blockchain y proporcionar capacidades de consulta más completas. Así como la arquitectura de "primero en transmisión" revoluciona el procesamiento de datos y el consumo en tuberías de datos tradicionales al reducir la latencia y mejorar la capacidad de respuesta, estos proveedores de transmisión de datos de blockchain también buscan apoyar el desarrollo de más aplicaciones y ayudar en el análisis de datos en cadena a través de fuentes de datos más avanzadas y maduras.

Al redefinir los desafíos de los datos en cadena desde la perspectiva de las canalizaciones de datos modernas, podemos ver la gestión, el almacenamiento y la provisión de datos en cadena desde un nuevo ángulo, realizando su máximo potencial. Cuando empezamos a ver subgrafos y servicios de indexación de Ethereum ETL como flujos de datos dentro de la canalización de datos en lugar de salidas finales, podemos imaginar un posible mundo donde los conjuntos de datos de alto rendimiento están diseñados para cualquier caso de uso empresarial.

3. ¿IA + Base de datos? Comparación en profundidad de The Graph, Chainbase y Space and Time

3.1 El Gráfico

La red de Graph logra la indexación de datos y los servicios de consulta de múltiples cadenas a través de una red descentralizada de nodos, lo que permite a los desarrolladores indexar de manera conveniente los datos de blockchain y construir aplicaciones descentralizadas. Sus modelos de productos principales incluyen el mercado de ejecución de consultas de datos y el mercado de caché de indexación de datos, ambos sirven las necesidades de consulta de productos de los usuarios. El mercado de ejecución de consultas de datos se refiere específicamente a los consumidores que pagan a los nodos de índice adecuados por los datos que necesitan, mientras que el mercado de caché de indexación de datos implica que los nodos de índice asignan recursos en función de factores como la popularidad histórica de la indexación de subgrafos, las tarifas de consulta recaudadas y la demanda de los curadores en cadena para las salidas de subgrafos.

Los subgráficos son las estructuras de datos fundamentales dentro de la red de The Graph. Ellos definen cómo extraer y transformar datos desde la cadena de bloques en un formato consultable (por ejemplo, esquema GraphQL). Cualquiera puede crear un subgrafo y múltiples aplicaciones pueden reutilizar estos subgráficos, mejorando la reutilización de datos y la eficiencia operativa.

La red de Graph consta de cuatro roles clave: indexadores, delegados, curadores y desarrolladores, todos los cuales trabajan juntos para proporcionar soporte de datos para aplicaciones Web3. Sus respectivas responsabilidades son las siguientes:

· Indexadores: Los indexadores son operadores de nodos dentro de la red de The Graph que participan apostando GRT (el token nativo de The Graph). Proporcionan servicios de indexación y procesamiento de consultas.

· Delegadores: Los delegadores son usuarios que apuestan tokens GRT para apoyar la operación de nodos de índice. Ganan una parte de las recompensas en función de los nodos de índice a los que delegan.

· Curadores: Los curadores son responsables de señalar qué subgráficos deben ser indexados por la red. Ayudan a garantizar que los subgráficos valiosos tengan prioridad para su procesamiento.

· Desarrolladores: A diferencia de los tres roles anteriores, los Desarrolladores son la parte demandante y son los usuarios principales de The Graph. Ellos crean y envían subgrafos a la red de The Graph, esperando a que la red satisfaga sus necesidades de datos.

3.1 El Gráfico

The Graph ahora se ha trasladado por completo a un servicio de alojamiento de subgráficos descentralizado, con incentivos económicos fluyendo entre diferentes participantes para garantizar el funcionamiento del sistema:

· Recompensas del indexador: Los indexadores obtienen ingresos a través de las tarifas de consulta del consumidor y una parte de las recompensas en bloques de tokens GRT.

· Recompensas para los delegados: los delegados reciben una parte de las recompensas de los indexadores que apoyan.

· Recompensas del curador: Si los curadores señalan subgrafos valiosos, pueden ganar una parte de las tarifas de consulta.

De hecho, los productos de The Graph están evolucionando rápidamente en la ola de la IA. Como uno de los equipos de desarrollo principales en el ecosistema de The Graph, Semiotic Labs se ha centrado en aprovechar la tecnología de IA para optimizar la fijación de precios de indexación y la experiencia de consulta de usuario. Actualmente, las herramientas desarrolladas por Semiotic Labs, como AutoAgora, Allocation Optimizer y AgentC, mejoran varios aspectos del rendimiento del ecosistema.

AutoAgora presenta un mecanismo de precios dinámico que ajusta los precios en tiempo real basado en el volumen de consultas y el uso de recursos, optimizando las estrategias de precios para garantizar la competitividad del indexador y maximizar los ingresos.

· Allocation Optimizer aborda los complejos problemas de asignación de recursos de subgrafos, ayudando a los indexadores a lograr una configuración óptima de recursos para mejorar los ingresos y el rendimiento.

· AgenteC es una herramienta experimental que permite a los usuarios acceder a los datos de blockchain de The Graph utilizando lenguaje natural, mejorando así la experiencia del usuario.

La aplicación de estas herramientas ha permitido que The Graph mejore aún más la inteligencia del sistema y la facilidad de uso con la ayuda de la IA.

3.2 Chainbase

Chainbase es una red de datos integral que integra todos los datos de blockchain en una sola plataforma, lo que facilita a los desarrolladores construir y mantener aplicaciones. Sus características únicas incluyen:

· Lago de datos en tiempo real: Chainbase proporciona un lago de datos en tiempo real específicamente para flujos de datos de blockchain, lo que permite un acceso instantáneo a los datos a medida que se generan.

· Arquitectura de cadena dual: Chainbase se construye sobre Eigenlayer AVS, creando una capa de ejecución que se ejecuta en paralelo con el algoritmo de consenso de CometBFT. Este diseño mejora la programabilidad y componibilidad de datos entre cadenas, soportando un alto rendimiento, baja latencia y finalidad, al tiempo que mejora la seguridad de la red mediante un modelo de doble apuesta.

· Estándar innovador de formato de datos: Chainbase introduce un nuevo estándar de formato de datos llamado "manuscritos", optimizando la estructuración y utilización de datos en la industria criptográfica.

· Modelo Cryptoworld: Con sus amplios recursos de datos de blockchain, Chainbase combina la tecnología de modelos de IA para crear modelos de IA que comprendan, predigan e interactúen eficazmente con transacciones de blockchain. El modelo básico, Theia, ya está disponible para uso público.

Estas características distinguen a Chainbase de los protocolos de indexación de blockchain, centrándose en la accesibilidad de datos en tiempo real, en formatos de datos innovadores y en la creación de modelos más inteligentes a través de la integración de datos on-chain y off-chain para mejorar los conocimientos.

El modelo de IA de Chainbase, Theia, es un punto destacado clave que lo diferencia de otros protocolos de servicios de datos. Basado en el modelo DORA de NVIDIA, Theia aprende y analiza patrones criptográficos mediante la integración de datos en cadena y fuera de la cadena junto con actividades espaciotemporales. A través del razonamiento causal, responde para profundizar en la exploración del valor potencial y los patrones de los datos en cadena, proporcionando a los usuarios servicios de datos más inteligentes.

Los servicios de datos habilitados para IA han transformado a Chainbase de ser simplemente una plataforma de servicios de datos de blockchain en un proveedor de servicios de datos inteligentes más competitivo. Con recursos de datos sólidos y un análisis de IA proactivo, Chainbase puede ofrecer una visión más amplia de los datos y optimizar los flujos de trabajo de procesamiento de datos de los usuarios.

3.3 Espacio y Tiempo

Space and Time (SxT) tiene como objetivo crear una capa de computación verificable que extiende las pruebas de conocimiento cero en un almacén de datos descentralizado, proporcionando procesamiento de datos confiable para contratos inteligentes, modelos de lenguaje grandes y empresas. Space and Time recientemente aseguró $20 millones en su última ronda de financiación de la Serie A, liderada por Framework Ventures, Lightspeed Faction, Arrington Capital y Hivemind Capital.

En el campo de la indexación y verificación de datos, Space and Time introduce un nuevo enfoque técnico: Proof of SQL. Se trata de una innovadora tecnología de prueba de conocimiento cero (ZKP) desarrollada por Space and Time que garantiza que las consultas SQL ejecutadas en el almacén de datos descentralizado sean a prueba de manipulaciones y verificables. Cuando se ejecuta una consulta, Proof of SQL genera una prueba criptográfica que comprueba la integridad y precisión de los resultados de la consulta. Esta prueba se anexa a los resultados de la consulta, lo que permite a cualquier verificador (como los contratos inteligentes) confirmar de forma independiente que los datos no se han manipulado durante el procesamiento. Las redes tradicionales de blockchain generalmente se basan en mecanismos de consenso para verificar la autenticidad de los datos, mientras que la prueba de SQL de Space and Time implementa un método de verificación de datos más eficiente. Específicamente, en el sistema de Space and Time, un nodo es responsable de la adquisición de datos, mientras que otros nodos utilizan la tecnología zk para verificar la autenticidad de esos datos. Este enfoque reduce el consumo de recursos de varios nodos que indexan redundantemente los mismos datos para llegar a un consenso, lo que mejora el rendimiento general del sistema. A medida que esta tecnología madura, sirve como piedra angular para que las industrias tradicionales que se centran en la confiabilidad de los datos construyan productos basados en datos de blockchain.

Al mismo tiempo, SxT ha estado colaborando estrechamente con el laboratorio conjunto de innovación en IA de Microsoft para acelerar el desarrollo de herramientas de IA generativa, lo que permite a los usuarios procesar fácilmente los datos de blockchain a través del lenguaje natural. Actualmente, en Space and Time Studio, los usuarios pueden ingresar consultas en lenguaje natural, y la IA las convertirá automáticamente en SQL y ejecutará la consulta en nombre del usuario para presentar los resultados finales necesarios.

3.4 Comparación de Diferencias

4. Conclusión y perspectivas

En resumen, la tecnología de indexación de datos en blockchain ha evolucionado desde las fuentes de datos iniciales de los nodos, pasando por el desarrollo de analizadores de datos e indexadores, hasta un servicio de datos de cadena completa habilitado para la inteligencia artificial, lo que marca un proceso de mejora gradual. Esta evolución continua de la tecnología no solo mejora la eficiencia y precisión del acceso a los datos, sino que también proporciona a los usuarios una experiencia inteligente sin precedentes.

Mirando hacia adelante, con el desarrollo continuo de nuevas tecnologías como la IA y las pruebas de conocimiento cero, los servicios de datos de blockchain se volverán aún más inteligentes y seguros. Tenemos motivos para creer que los servicios de datos de blockchain seguirán desempeñando un papel vital como infraestructura, brindando un fuerte apoyo para el progreso y la innovación en la industria.

Descargo de responsabilidad:

  1. Este artículo es reproducido de [Trustless Labs], los derechos de autor pertenecen al autor original [Trustless Labs], si tiene alguna objeción a la reimpresión, por favor contacte al Gate Learnequipo, y el equipo lo manejará tan pronto como sea posible de acuerdo con los procedimientos relevantes.

  2. Descargo de responsabilidad: Las opiniones y puntos de vista expresados en este artículo representan únicamente las opiniones personales del autor y no constituyen ningún consejo de inversión.

  3. Las versiones en otros idiomas del artículo son traducidas por el equipo Gate Learn y no se mencionan en Gate.io, el artículo traducido no puede ser reproducido, distribuido o plagiado.

* The information is not intended to be and does not constitute financial advice or any other recommendation of any sort offered or endorsed by Gate.io.
* This article may not be reproduced, transmitted or copied without referencing Gate.io. Contravention is an infringement of Copyright Act and may be subject to legal action.

Desde la lectura y el indexado hasta el análisis, resuma brevemente el seguimiento del índice de datos de Web3

Intermedio9/27/2024, 3:37:05 PM
Este artículo explora el proceso de desarrollo de la accesibilidad de datos de blockchain, compara la arquitectura y las características de aplicación de tecnología de IA de tres protocolos de servicios de datos, The Graph, Chainbase y Space and Time, y señala que los servicios de datos de blockchain se están moviendo hacia la inteligencia y se están desarrollando en la dirección de la seguridad y seguirán desempeñando un papel importante como infraestructura de la industria en el futuro.

Este artículo explora la evolución de la accesibilidad de los datos de blockchain, comparando las características de tres protocolos de servicios de datos: The Graph, Chainbase y Space and Time, en términos de arquitectura y aplicaciones de tecnología AI. Se señala que los servicios de datos de blockchain están evolucionando hacia una mayor inteligencia y seguridad, y seguirán desempeñando un papel crucial como infraestructura fundamental en la industria en el futuro.

1. Introducción

A partir de la primera ola de dApps en 2017, que incluía Etheroll, ETHLend y CryptoKitties, ahora vemos una variedad floreciente de dApps financieras, de juegos y sociales basadas en diferentes blockchains. Al discutir las aplicaciones descentralizadas en cadena, ¿alguna vez hemos considerado las fuentes de los diversos datos que estas dApps utilizan en sus interacciones?

En 2024, el enfoque está en la IA y Web3. En el mundo de la inteligencia artificial, los datos son como el flujo vital para su crecimiento y evolución. Al igual que las plantas dependen de la luz solar y el agua para prosperar, los sistemas de IA dependen de vastas cantidades de datos para continuar "aprendiendo" y "pensando". Sin datos, incluso los algoritmos de IA más sofisticados son meros castillos en el aire, incapaces de desatar su inteligencia y eficacia previstas.

Este artículo analiza la evolución de la indexación de datos de blockchain desde la perspectiva de la accesibilidad de datos, comparando el protocolo de indexación de datos establecido The Graph con los protocolos emergentes de servicios de datos de blockchain Chainbase y Space and Time. En particular, explora las similitudes y diferencias en los servicios de datos y la arquitectura del producto entre estos dos nuevos protocolos que incorporan tecnología IA.

2. Complejidad y simplicidad del índice de datos: desde los nodos de la cadena de bloques hasta la base de datos completa de la cadena

2.1 Fuentes de datos: Nodos de la cadena de bloques

Desde el momento en que comenzamos a comprender “qué es blockchain”, a menudo nos encontramos con la frase: blockchain es un libro mayor descentralizado. Los nodos de blockchain son la base de toda la red de blockchain, responsables de grabar, almacenar y difundir todos los datos de transacciones en cadena. Cada nodo posee una copia completa de los datos de blockchain, asegurando la descentralización de la red. Sin embargo, para los usuarios comunes, construir y mantener un nodo de blockchain no es una tarea fácil. Esto requiere no solo habilidades técnicas especializadas, sino que también conlleva altos costos de hardware y ancho de banda. Además, las capacidades de consulta de los nodos comunes son limitadas, lo que dificulta recuperar datos en el formato que los desarrolladores requieren. Por lo tanto, aunque teóricamente cualquiera puede ejecutar su propio nodo, en la práctica, los usuarios tienden a depender de servicios de terceros.

Para abordar este problema, han surgido proveedores de nodos RPC (llamada de procedimiento remoto). Estos proveedores manejan los costos y la gestión de los nodos y ofrecen datos a través de puntos finales de RPC, lo que permite a los usuarios acceder a datos de blockchain sin construir sus propios nodos. Los puntos finales de RPC públicos son gratuitos pero tienen límites de tarifas, lo que puede impactar negativamente la experiencia del usuario de dApps. Los puntos finales de RPC privados ofrecen un mejor rendimiento al reducir la congestión, pero incluso la recuperación de datos simple requiere una comunicación sustancial de ida y vuelta. Esto los hace pesados en solicitudes e ineficientes para consultas de datos complejas. Además, los puntos finales de RPC privados a menudo enfrentan desafíos de escalabilidad y carecen de compatibilidad en diferentes redes. Sin embargo, las interfaces de API estandarizadas proporcionadas por los proveedores de nodos reducen las barreras para que los usuarios accedan a datos en cadena, sentando las bases para el análisis posterior de datos y aplicaciones.

2.2 Análisis de datos: De datos sin procesar a datos utilizables

Los datos obtenidos de los nodos de la cadena de bloques suelen ser datos en bruto que han sido encriptados y codificados. Si bien estos datos conservan la integridad y seguridad de la cadena de bloques, su complejidad aumenta la dificultad del análisis de datos. Para usuarios comunes o desarrolladores, el manejo directo de estos datos en bruto requiere un conocimiento técnico sustancial y recursos computacionales.

En este contexto, el proceso de análisis de datos se vuelve especialmente importante. Al analizar datos crudos complejos y transformarlos en formatos más comprensibles y operables, los usuarios pueden comprender e utilizar intuitivamente estos datos. El éxito del análisis de datos afecta directamente a la eficiencia y efectividad de las aplicaciones de datos de blockchain, lo que lo convierte en un paso crítico en todo el proceso de indexación de datos.

2.3 Evolución de los indexadores de datos

A medida que aumenta el volumen de datos de blockchain, también ha crecido la demanda de indexadores de datos. Los indexadores desempeñan un papel crucial en la organización de los datos en cadena y su envío a bases de datos para facilitar las consultas. El principio de funcionamiento de un indexador es indexar los datos de la cadena de bloques y ponerlos a disposición a través de un lenguaje de consulta similar a SQL (como las API de GraphQL). Al proporcionar una interfaz unificada para la consulta de datos, los indexadores permiten a los desarrolladores recuperar rápidamente y con precisión la información que necesitan utilizando lenguajes de consulta estandarizados, simplificando significativamente el proceso.

Diferentes tipos de indexadores optimizan la recuperación de datos de diversas maneras:

· Indexadores de nodos completos: Estos indexadores ejecutan nodos completos de blockchain y extraen datos directamente de ellos, asegurando la completitud y precisión de los datos, pero requiriendo un almacenamiento y potencia de procesamiento sustanciales.

· Indexadores ligeros: Estos indexadores dependen de nodos completos para obtener datos específicos según sea necesario, lo que reduce los requisitos de almacenamiento pero potencialmente aumenta el tiempo de consulta.

· Indexadores especializados: Estos indexadores se centran en tipos específicos de datos o blockchains particulares, optimizando la recuperación para casos de uso específicos, como datos de NFT o transacciones DeFi.

· AggreGated Indexers: Estos indexadores extraen datos de múltiples blockchains y fuentes, incluida información off-chain, proporcionando una interfaz de consulta unificada, que es especialmente útil para dApps multi-chain.

Actualmente, un nodo de archivo de Ethereum en el cliente Geth en modo de archivo ocupa alrededor de 13,5 TB de espacio de almacenamiento, mientras que en el cliente Erigon, el requisito de archivo es de alrededor de 3 TB. A medida que la cadena de bloques continúe creciendo, los requisitos de almacenamiento de datos para los nodos de archivo también aumentarán. Frente a cantidades tan grandes de datos, los protocolos de indexación convencionales no solo admiten la indexación multicadena, sino que también personalizan los marcos de análisis de datos adaptados a las diferentes necesidades de datos de la aplicación. Por ejemplo, el marco de "subgrafo" de The Graph es un ejemplo típico.

La aparición de los indexadores mejora significativamente la eficiencia de la indexación y consulta de datos. En comparación con los puntos finales RPC tradicionales, los indexadores pueden indexar eficientemente grandes cantidades de datos y admitir consultas de alta velocidad. Estos indexadores permiten a los usuarios realizar consultas complejas, filtrar fácilmente datos y analizarlos después de su extracción. Además, algunos indexadores admiten la agregación de fuentes de datos de múltiples blockchains, evitando la necesidad de implementar múltiples APIs en dApps multi-chain. Al ejecutarse de manera distribuida en múltiples nodos, los indexadores ofrecen una seguridad y rendimiento más sólidos, al mismo tiempo que reducen los riesgos de interrupciones y tiempos de inactividad asociados con los proveedores centralizados de RPC.

Por el contrario, los indexadores permiten a los usuarios obtener la información que necesitan directamente mediante lenguajes de consulta predefinidos sin tener que lidiar con los datos complejos subyacentes. Este mecanismo mejora significativamente la eficiencia y confiabilidad de la recuperación de datos, lo que representa una innovación importante en el acceso a datos blockchain.

2.4 Bases de datos de cadena completa: Alineándose hacia la transmisión primero

Usar nodos indexados para consultar datos generalmente implica que las APIs se convierten en la única Puerta de enlace para digerir los datos on-chain. Sin embargo, cuando un proyecto entra en la fase de escalabilidad, a menudo requiere fuentes de datos más flexibles, que las APIs estandarizadas no pueden proporcionar. A medida que las demandas de las aplicaciones se vuelven más complejas, los indexadores de datos primarios con sus formatos de indexación estandarizados luchan gradualmente por cumplir con las necesidades de consulta cada vez más diversas, como la búsqueda, el acceso entre cadenas o el mapeo de datos fuera de la cadena.

En la arquitectura moderna de canalización de datos, un enfoque de "flujo primero" se ha convertido en una solución a las limitaciones del procesamiento tradicional por lotes, lo que permite la ingesta, el procesamiento y el análisis de datos en tiempo real. Este cambio de paradigma permite a las organizaciones responder inmediatamente a los datos entrantes, proporcionando información y tomando decisiones casi instantáneamente. Del mismo modo, el desarrollo de proveedores de servicios de datos de blockchain está progresando hacia la construcción de flujos de datos de blockchain. Los proveedores de servicios de indexación tradicionales han lanzado sucesivamente productos que obtienen datos de blockchain en tiempo real a través de flujos de datos, como The Graph's Substreams y Goldsky's Mirror, así como lagos de datos en tiempo real como Chainbase y SubSquid que generan flujos de datos basados en blockchains.

Estos servicios tienen como objetivo satisfacer la demanda de análisis en tiempo real de transacciones de blockchain y proporcionar capacidades de consulta más completas. Así como la arquitectura de "primero en transmisión" revoluciona el procesamiento de datos y el consumo en tuberías de datos tradicionales al reducir la latencia y mejorar la capacidad de respuesta, estos proveedores de transmisión de datos de blockchain también buscan apoyar el desarrollo de más aplicaciones y ayudar en el análisis de datos en cadena a través de fuentes de datos más avanzadas y maduras.

Al redefinir los desafíos de los datos en cadena desde la perspectiva de las canalizaciones de datos modernas, podemos ver la gestión, el almacenamiento y la provisión de datos en cadena desde un nuevo ángulo, realizando su máximo potencial. Cuando empezamos a ver subgrafos y servicios de indexación de Ethereum ETL como flujos de datos dentro de la canalización de datos en lugar de salidas finales, podemos imaginar un posible mundo donde los conjuntos de datos de alto rendimiento están diseñados para cualquier caso de uso empresarial.

3. ¿IA + Base de datos? Comparación en profundidad de The Graph, Chainbase y Space and Time

3.1 El Gráfico

La red de Graph logra la indexación de datos y los servicios de consulta de múltiples cadenas a través de una red descentralizada de nodos, lo que permite a los desarrolladores indexar de manera conveniente los datos de blockchain y construir aplicaciones descentralizadas. Sus modelos de productos principales incluyen el mercado de ejecución de consultas de datos y el mercado de caché de indexación de datos, ambos sirven las necesidades de consulta de productos de los usuarios. El mercado de ejecución de consultas de datos se refiere específicamente a los consumidores que pagan a los nodos de índice adecuados por los datos que necesitan, mientras que el mercado de caché de indexación de datos implica que los nodos de índice asignan recursos en función de factores como la popularidad histórica de la indexación de subgrafos, las tarifas de consulta recaudadas y la demanda de los curadores en cadena para las salidas de subgrafos.

Los subgráficos son las estructuras de datos fundamentales dentro de la red de The Graph. Ellos definen cómo extraer y transformar datos desde la cadena de bloques en un formato consultable (por ejemplo, esquema GraphQL). Cualquiera puede crear un subgrafo y múltiples aplicaciones pueden reutilizar estos subgráficos, mejorando la reutilización de datos y la eficiencia operativa.

La red de Graph consta de cuatro roles clave: indexadores, delegados, curadores y desarrolladores, todos los cuales trabajan juntos para proporcionar soporte de datos para aplicaciones Web3. Sus respectivas responsabilidades son las siguientes:

· Indexadores: Los indexadores son operadores de nodos dentro de la red de The Graph que participan apostando GRT (el token nativo de The Graph). Proporcionan servicios de indexación y procesamiento de consultas.

· Delegadores: Los delegadores son usuarios que apuestan tokens GRT para apoyar la operación de nodos de índice. Ganan una parte de las recompensas en función de los nodos de índice a los que delegan.

· Curadores: Los curadores son responsables de señalar qué subgráficos deben ser indexados por la red. Ayudan a garantizar que los subgráficos valiosos tengan prioridad para su procesamiento.

· Desarrolladores: A diferencia de los tres roles anteriores, los Desarrolladores son la parte demandante y son los usuarios principales de The Graph. Ellos crean y envían subgrafos a la red de The Graph, esperando a que la red satisfaga sus necesidades de datos.

3.1 El Gráfico

The Graph ahora se ha trasladado por completo a un servicio de alojamiento de subgráficos descentralizado, con incentivos económicos fluyendo entre diferentes participantes para garantizar el funcionamiento del sistema:

· Recompensas del indexador: Los indexadores obtienen ingresos a través de las tarifas de consulta del consumidor y una parte de las recompensas en bloques de tokens GRT.

· Recompensas para los delegados: los delegados reciben una parte de las recompensas de los indexadores que apoyan.

· Recompensas del curador: Si los curadores señalan subgrafos valiosos, pueden ganar una parte de las tarifas de consulta.

De hecho, los productos de The Graph están evolucionando rápidamente en la ola de la IA. Como uno de los equipos de desarrollo principales en el ecosistema de The Graph, Semiotic Labs se ha centrado en aprovechar la tecnología de IA para optimizar la fijación de precios de indexación y la experiencia de consulta de usuario. Actualmente, las herramientas desarrolladas por Semiotic Labs, como AutoAgora, Allocation Optimizer y AgentC, mejoran varios aspectos del rendimiento del ecosistema.

AutoAgora presenta un mecanismo de precios dinámico que ajusta los precios en tiempo real basado en el volumen de consultas y el uso de recursos, optimizando las estrategias de precios para garantizar la competitividad del indexador y maximizar los ingresos.

· Allocation Optimizer aborda los complejos problemas de asignación de recursos de subgrafos, ayudando a los indexadores a lograr una configuración óptima de recursos para mejorar los ingresos y el rendimiento.

· AgenteC es una herramienta experimental que permite a los usuarios acceder a los datos de blockchain de The Graph utilizando lenguaje natural, mejorando así la experiencia del usuario.

La aplicación de estas herramientas ha permitido que The Graph mejore aún más la inteligencia del sistema y la facilidad de uso con la ayuda de la IA.

3.2 Chainbase

Chainbase es una red de datos integral que integra todos los datos de blockchain en una sola plataforma, lo que facilita a los desarrolladores construir y mantener aplicaciones. Sus características únicas incluyen:

· Lago de datos en tiempo real: Chainbase proporciona un lago de datos en tiempo real específicamente para flujos de datos de blockchain, lo que permite un acceso instantáneo a los datos a medida que se generan.

· Arquitectura de cadena dual: Chainbase se construye sobre Eigenlayer AVS, creando una capa de ejecución que se ejecuta en paralelo con el algoritmo de consenso de CometBFT. Este diseño mejora la programabilidad y componibilidad de datos entre cadenas, soportando un alto rendimiento, baja latencia y finalidad, al tiempo que mejora la seguridad de la red mediante un modelo de doble apuesta.

· Estándar innovador de formato de datos: Chainbase introduce un nuevo estándar de formato de datos llamado "manuscritos", optimizando la estructuración y utilización de datos en la industria criptográfica.

· Modelo Cryptoworld: Con sus amplios recursos de datos de blockchain, Chainbase combina la tecnología de modelos de IA para crear modelos de IA que comprendan, predigan e interactúen eficazmente con transacciones de blockchain. El modelo básico, Theia, ya está disponible para uso público.

Estas características distinguen a Chainbase de los protocolos de indexación de blockchain, centrándose en la accesibilidad de datos en tiempo real, en formatos de datos innovadores y en la creación de modelos más inteligentes a través de la integración de datos on-chain y off-chain para mejorar los conocimientos.

El modelo de IA de Chainbase, Theia, es un punto destacado clave que lo diferencia de otros protocolos de servicios de datos. Basado en el modelo DORA de NVIDIA, Theia aprende y analiza patrones criptográficos mediante la integración de datos en cadena y fuera de la cadena junto con actividades espaciotemporales. A través del razonamiento causal, responde para profundizar en la exploración del valor potencial y los patrones de los datos en cadena, proporcionando a los usuarios servicios de datos más inteligentes.

Los servicios de datos habilitados para IA han transformado a Chainbase de ser simplemente una plataforma de servicios de datos de blockchain en un proveedor de servicios de datos inteligentes más competitivo. Con recursos de datos sólidos y un análisis de IA proactivo, Chainbase puede ofrecer una visión más amplia de los datos y optimizar los flujos de trabajo de procesamiento de datos de los usuarios.

3.3 Espacio y Tiempo

Space and Time (SxT) tiene como objetivo crear una capa de computación verificable que extiende las pruebas de conocimiento cero en un almacén de datos descentralizado, proporcionando procesamiento de datos confiable para contratos inteligentes, modelos de lenguaje grandes y empresas. Space and Time recientemente aseguró $20 millones en su última ronda de financiación de la Serie A, liderada por Framework Ventures, Lightspeed Faction, Arrington Capital y Hivemind Capital.

En el campo de la indexación y verificación de datos, Space and Time introduce un nuevo enfoque técnico: Proof of SQL. Se trata de una innovadora tecnología de prueba de conocimiento cero (ZKP) desarrollada por Space and Time que garantiza que las consultas SQL ejecutadas en el almacén de datos descentralizado sean a prueba de manipulaciones y verificables. Cuando se ejecuta una consulta, Proof of SQL genera una prueba criptográfica que comprueba la integridad y precisión de los resultados de la consulta. Esta prueba se anexa a los resultados de la consulta, lo que permite a cualquier verificador (como los contratos inteligentes) confirmar de forma independiente que los datos no se han manipulado durante el procesamiento. Las redes tradicionales de blockchain generalmente se basan en mecanismos de consenso para verificar la autenticidad de los datos, mientras que la prueba de SQL de Space and Time implementa un método de verificación de datos más eficiente. Específicamente, en el sistema de Space and Time, un nodo es responsable de la adquisición de datos, mientras que otros nodos utilizan la tecnología zk para verificar la autenticidad de esos datos. Este enfoque reduce el consumo de recursos de varios nodos que indexan redundantemente los mismos datos para llegar a un consenso, lo que mejora el rendimiento general del sistema. A medida que esta tecnología madura, sirve como piedra angular para que las industrias tradicionales que se centran en la confiabilidad de los datos construyan productos basados en datos de blockchain.

Al mismo tiempo, SxT ha estado colaborando estrechamente con el laboratorio conjunto de innovación en IA de Microsoft para acelerar el desarrollo de herramientas de IA generativa, lo que permite a los usuarios procesar fácilmente los datos de blockchain a través del lenguaje natural. Actualmente, en Space and Time Studio, los usuarios pueden ingresar consultas en lenguaje natural, y la IA las convertirá automáticamente en SQL y ejecutará la consulta en nombre del usuario para presentar los resultados finales necesarios.

3.4 Comparación de Diferencias

4. Conclusión y perspectivas

En resumen, la tecnología de indexación de datos en blockchain ha evolucionado desde las fuentes de datos iniciales de los nodos, pasando por el desarrollo de analizadores de datos e indexadores, hasta un servicio de datos de cadena completa habilitado para la inteligencia artificial, lo que marca un proceso de mejora gradual. Esta evolución continua de la tecnología no solo mejora la eficiencia y precisión del acceso a los datos, sino que también proporciona a los usuarios una experiencia inteligente sin precedentes.

Mirando hacia adelante, con el desarrollo continuo de nuevas tecnologías como la IA y las pruebas de conocimiento cero, los servicios de datos de blockchain se volverán aún más inteligentes y seguros. Tenemos motivos para creer que los servicios de datos de blockchain seguirán desempeñando un papel vital como infraestructura, brindando un fuerte apoyo para el progreso y la innovación en la industria.

Descargo de responsabilidad:

  1. Este artículo es reproducido de [Trustless Labs], los derechos de autor pertenecen al autor original [Trustless Labs], si tiene alguna objeción a la reimpresión, por favor contacte al Gate Learnequipo, y el equipo lo manejará tan pronto como sea posible de acuerdo con los procedimientos relevantes.

  2. Descargo de responsabilidad: Las opiniones y puntos de vista expresados en este artículo representan únicamente las opiniones personales del autor y no constituyen ningún consejo de inversión.

  3. Las versiones en otros idiomas del artículo son traducidas por el equipo Gate Learn y no se mencionan en Gate.io, el artículo traducido no puede ser reproducido, distribuido o plagiado.

* The information is not intended to be and does not constitute financial advice or any other recommendation of any sort offered or endorsed by Gate.io.
* This article may not be reproduced, transmitted or copied without referencing Gate.io. Contravention is an infringement of Copyright Act and may be subject to legal action.
Nu Starten
Meld Je Aan En Ontvang
$100
Voucher!