Este artigo explora a evolução da acessibilidade aos dados da blockchain, comparando as características de três protocolos de serviço de dados - The Graph, Chainbase e Space and Time - em termos de arquitetura e aplicações de tecnologia de IA. Ele aponta que os serviços de dados da blockchain estão evoluindo em direção a uma maior inteligência e segurança, e continuarão desempenhando um papel crucial como infraestrutura fundamental na indústria no futuro.
A partir da primeira onda de dApps em 2017, incluindo Etheroll, ETHLend e CryptoKitties, agora vemos uma variedade florescente de dApps financeiros, de jogos e sociais baseados em diferentes blockchains. Ao discutir aplicações descentralizadas on-chain, já consideramos alguma vez as fontes dos vários dados que esses dApps utilizam em suas interações?
Em 2024, o foco é em IA e Web3. No mundo da inteligência artificial, os dados são como o sangue vital para o seu crescimento e evolução. Assim como as plantas dependem da luz solar e da água para prosperarem, os sistemas de IA dependem de grandes quantidades de dados para continuamente “aprender” e “pensar”. Sem dados, mesmo os algoritmos de IA mais sofisticados são meros castelos no ar, incapazes de liberar sua inteligência e eficácia pretendidas.
Este artigo analisa a evolução da indexação de dados de blockchain a partir da perspectiva da acessibilidade de dados, comparando o protocolo estabelecido de indexação de dados The Graph com os protocolos emergentes de serviço de dados de blockchain Chainbase e Space and Time. Ele explora especialmente as semelhanças e diferenças nos serviços de dados e arquitetura de produtos entre estes dois novos protocolos que incorporam tecnologia de IA.
2.1 Fontes de Dados: Nós da Blockchain
A partir do momento em que começamos a entender o que é blockchain, frequentemente nos deparamos com a frase: blockchain é um livro-razão descentralizado. Os nós blockchain são a base de toda a rede blockchain, responsáveis por registrar, armazenar e disseminar todos os dados de transações na cadeia. Cada nó possui uma cópia completa dos dados da blockchain, garantindo a descentralização da rede. No entanto, para usuários comuns, construir e manter um nó blockchain não é uma tarefa fácil. Isso requer não apenas habilidades técnicas especializadas, mas também incorre em altos custos de hardware e largura de banda. Além disso, as capacidades de consulta dos nós comuns são limitadas, dificultando a recuperação de dados no formato exigido pelos desenvolvedores. Portanto, embora teoricamente qualquer pessoa possa executar seu próprio nó, na prática, os usuários tendem a depender de serviços de terceiros.
Para resolver esse problema, surgiram provedores de nó RPC (Remote Procedure Call). Esses provedores lidam com os custos e o gerenciamento de nós e oferecem dados por meio de endpoints RPC, permitindo que os usuários acessem dados de blockchain sem construir seus próprios nós. Os endpoints RPC públicos são gratuitos, mas vêm com limites de taxa, o que pode afetar negativamente a experiência do usuário do dApps. Os endpoints RPC privados oferecem melhor desempenho reduzindo o congestionamento, mas mesmo a recuperação simples de dados requer uma comunicação substancial de ida e volta. Isso os torna muito requisitados e ineficientes para consultas de dados complexas. Além disso, os terminais RPC privados enfrentam frequentemente desafios de escalabilidade e falta de compatibilidade entre diferentes redes. No entanto, as interfaces de API padronizadas fornecidas pelos provedores de nós reduzem as barreiras para os usuários acessarem dados on-chain, estabelecendo as bases para a análise de dados e aplicativos subsequentes.
2.2 Análise de Dados: De Dados Brutos a Dados Utilizáveis
Os dados obtidos dos nós do blockchain são frequentemente dados brutos que foram criptografados e codificados. Embora esses dados mantenham a integridade e segurança do blockchain, sua complexidade aumenta a dificuldade de análise de dados. Para usuários comuns ou desenvolvedores, lidar diretamente com esses dados brutos requer conhecimento técnico substancial e recursos computacionais.
Neste contexto, o processo de análise de dados torna-se particularmente importante. Ao analisar dados brutos complexos e transformá-los em formatos mais compreensíveis e operacionais, os utilizadores podem compreender e utilizar intuitivamente estes dados. O sucesso da análise de dados afeta diretamente a eficiência e eficácia das aplicações de dados em blockchain, tornando-a uma etapa crítica em todo o processo de indexação de dados.
2.3 Evolução dos Indexadores de Dados
À medida que o volume de dados de blockchain aumenta, também cresce a demanda por indexadores de dados. Os indexadores desempenham um papel crucial na organização de dados on-chain e no envio desses dados para bancos de dados para facilitar a consulta. O princípio de funcionamento de um indexador é indexar os dados de blockchain e disponibilizá-los prontamente por meio de uma linguagem de consulta semelhante ao SQL (como APIs do GraphQL). Ao fornecer uma interface unificada para consulta de dados, os indexadores permitem que os desenvolvedores recuperem rapidamente as informações de que precisam usando linguagens de consulta padronizadas, simplificando significativamente o processo.
Diferentes tipos de indexadores otimizam a recuperação de dados de várias maneiras:
· Indexadores de Nó Completo: Estes indexadores executam nós completos da blockchain e extraem diretamente os dados deles, garantindo a completude e a precisão dos dados, mas requerem um armazenamento e poder de processamento substanciais.
· Indexadores leves: Esses indexadores dependem de nós completos para buscar dados específicos conforme necessário, reduzindo os requisitos de armazenamento, mas potencialmente aumentando o tempo de consulta.
· Indexadores Especializados: Esses indexadores focam em tipos específicos de dados ou blockchains específicas, otimizando a recuperação para casos de uso específicos, como dados de NFT ou transações DeFi.
· AggreGated Indexers: Estes indexadores extraem dados de várias blockchains e fontes, incluindo informações off-chain, fornecendo uma interface de consulta unificada, o que é especialmente útil para dApps multi-chain.
Atualmente, um nó de arquivo Ethereum no cliente Geth no modo de arquivo ocupa cerca de 13,5 TB de espaço de armazenamento, enquanto no cliente Erigon, o requisito de arquivamento é de cerca de 3 TB. À medida que o blockchain continua a crescer, os requisitos de armazenamento de dados para nós de arquivo também aumentarão. Diante de quantidades tão vastas de dados, os principais protocolos de indexação não apenas suportam indexação de várias cadeias, mas também personalizam estruturas de análise de dados adaptadas a diferentes necessidades de dados de aplicativos. Por exemplo, a estrutura de "subgrafo" do gráfico é um exemplo típico.
A emergência de indexadores melhora significativamente a eficiência da indexação e consulta de dados. Comparados aos endpoints RPC tradicionais, os indexadores podem indexar eficientemente grandes quantidades de dados e suportar consultas de alta velocidade. Estes indexadores permitem aos utilizadores realizar consultas complexas, filtrar facilmente os dados e analisá-los pós-extração. Além disso, alguns indexadores suportam a agregação de fontes de dados de múltiplas blockchains, evitando a necessidade de implementar múltiplas APIs em dApps multi-cadeia. Ao serem executados distribuídos por vários nós, os indexadores oferecem maior segurança e desempenho, reduzindo os riscos de interrupções e tempos de inatividade associados aos fornecedores centralizados de RPC.
Em contraste, os indexadores permitem aos utilizadores obterem as informações de que necessitam diretamente utilizando linguagens de consulta predefinidas, sem terem de lidar com os dados complexos subjacentes. Este mecanismo melhora significativamente a eficiência e a fiabilidade da recuperação de dados, representando uma inovação importante no acesso a dados de blockchain.
2.4 Bases de Dados de Cadeia Completa: Alinhamento em Direção ao Streaming em Primeiro Lugar
Usar nós indexados para consultar dados geralmente significa que as APIs se tornam o único Gateway para a digestão de dados on-chain. No entanto, quando um projeto entra na fase de escalonamento, muitas vezes requer fontes de dados mais flexíveis, que as APIs padronizadas não podem fornecer. À medida que as demandas de aplicativos se tornam mais complexas, os indexadores de dados primários, com seus formatos de indexação padronizados, lutam gradualmente para atender às necessidades de consulta cada vez mais diversas, como busca, acesso entre cadeias ou mapeamento de dados off-chain.
Na arquitetura moderna de pipeline de dados, uma abordagem "stream-first" tornou-se uma solução para as limitações do processamento em lote tradicional, permitindo a ingestão, processamento e análise de dados em tempo real. Essa mudança de paradigma permite que as organizações respondam imediatamente aos dados recebidos, produzindo insights e tomando decisões quase instantaneamente. Da mesma forma, o desenvolvimento de provedores de serviços de dados blockchain está progredindo em direção à construção de fluxos de dados blockchain. Os provedores de serviços de indexação tradicionais lançaram sucessivamente produtos que obtêm dados de blockchain em tempo real por meio de fluxos de dados, como o The Graph's Substreams e o Goldsky's Mirror, bem como data lakes em tempo real como Chainbase e SubSquid que geram fluxos de dados baseados em blockchains.
Esses serviços visam atender à demanda por análise em tempo real de transações blockchain e fornecer capacidades de consulta mais abrangentes. Assim como a arquitetura "stream-first" revoluciona o processamento e consumo de dados em pipelines de dados tradicionais, reduzindo a latência e aprimorando a capacidade de resposta, esses provedores de fluxo de dados blockchain também buscam apoiar o desenvolvimento de mais aplicativos e auxiliar na análise de dados on-chain por meio de fontes de dados mais avançadas e maduras.
Ao redefinir os desafios dos dados on-chain a partir da perspectiva dos pipelines de dados modernos, podemos visualizar a gestão, armazenamento e provisão de dados on-chain a partir de uma nova perspectiva, realizando o seu pleno potencial. Quando começamos a ver subgráficos e serviços de indexação Ethereum ETL como fluxos de dados dentro do pipeline de dados, em vez de saídas finais, podemos vislumbrar um possível mundo onde conjuntos de dados de alto desempenho são adaptados para qualquer caso de uso empresarial.
3.1 O Gráfico
A rede The Graph alcança a indexação de dados multi-cadeia e serviços de consulta através de uma rede descentralizada de nós, permitindo que os desenvolvedores indexem convenientemente os dados da blockchain e construam aplicações descentralizadas. Seus principais modelos de produto incluem o mercado de execução de consultas de dados e o mercado de cache de indexação de dados, ambos atendendo às necessidades de consulta de produtos dos usuários. O mercado de execução de consultas de dados refere-se especificamente aos consumidores pagando nós de índice adequados pelos dados de que necessitam, enquanto o mercado de cache de indexação de dados envolve nós de índice alocando recursos com base em fatores como a popularidade histórica de indexação de subgráficos, as taxas de consulta coletadas e a demanda de curadores on-chain por saídas de subgráficos.
Os subgráficos são as estruturas de dados fundamentais dentro da rede The Graph. Eles definem como extrair e transformar dados do blockchain em um formato consultável (por exemplo, esquema GraphQL). Qualquer pessoa pode criar um subgráfico, e várias aplicações podem reutilizar esses subgráficos, aumentando a reutilização de dados e eficiência operacional.
A rede Graph é composta por quatro papéis-chave: Indexadores, Delegadores, Curadores e Desenvolvedores, todos eles trabalham em conjunto para fornecer suporte de dados para aplicações Web3. Suas respectivas responsabilidades são as seguintes:
· Indexadores: Os indexadores são operadores de nós dentro da rede The Graph que participam apostando GRT (o token nativo do The Graph). Eles fornecem serviços de indexação e processamento de consultas.
· Delegados: Delegados são usuários que apostam tokens GRT para apoiar a operação de nós de índice. Eles ganham uma parte das recompensas com base nos nós de índice aos quais delegam.
· Curadores: Os curadores são responsáveis por sinalizar quais subgrafos devem ser indexados pela rede. Eles ajudam a garantir que subgrafos valiosos sejam priorizados para processamento.
· Desenvolvedores: Ao contrário dos três papéis anteriores, os Desenvolvedores são o lado da demanda e são os principais usuários do The Graph. Eles criam e enviam subgrafos para a rede The Graph, aguardando que a rede atenda às suas necessidades de dados.
3.1 O Graph
O Graph agora se tornou completamente um serviço descentralizado de hospedagem de subgráficos, com incentivos econômicos fluindo entre diferentes participantes para garantir a operação do sistema:
· Recompensas do Indicador: Os indicadores ganham renda através das taxas de consulta do consumidor e uma parte das recompensas em blocos de tokens GRT.
· Recompensas para Delegadores: Os delegadores recebem uma parte das recompensas dos indexadores que eles apoiam.
· Recompensas do Curador: Se os curadores sinalizarem subgrafos valiosos, eles podem ganhar uma parte das taxas de consulta.
Na verdade, os produtos da The Graph estão evoluindo rapidamente na onda de IA. Como uma das equipes de desenvolvimento principais no ecossistema da The Graph, a Semiotic Labs tem se concentrado em aproveitar a tecnologia de IA para otimizar a precificação de indexação e a experiência de consulta do usuário. Atualmente, as ferramentas desenvolvidas pela Semiotic Labs, como AutoAgora, Allocation Optimizer e AgentC, melhoram vários aspectos do desempenho do ecossistema.
· O AutoAgora introduz um mecanismo de preços dinâmico que ajusta os preços em tempo real com base no volume de consulta e uso de recursos, otimizando as estratégias de preços para garantir a competitividade do indexador e maximizar a receita.
O Allocation Optimizer aborda as questões complexas de alocação de recursos de subgrafo, ajudando os indexadores a alcançar uma configuração ideal de recursos para melhorar a receita e o desempenho.
· AgentC é uma ferramenta experimental que permite aos usuários acessar os dados de blockchain do The Graph usando linguagem natural, melhorando assim a experiência do usuário.
A aplicação dessas ferramentas permitiu ao The Graph aprimorar ainda mais a inteligência do sistema e a facilidade de uso com a assistência de IA.
3.2 Chainbase
Chainbase é uma rede de dados abrangente que integra todos os dados de blockchain em uma única plataforma, facilitando para os desenvolvedores construir e manter aplicações. Suas características únicas incluem:
· Data Lake em tempo real: o Chainbase fornece um data lake em tempo real especificamente para fluxos de dados blockchain, permitindo acesso instantâneo aos dados à medida que são gerados.
· Arquitetura de dupla cadeia: Chainbase é construída na Eigenlayer AVS, criando uma camada de execução que funciona em paralelo com o algoritmo de consenso CometBFT. Este design melhora a programabilidade e composabilidade de dados entre cadeias, suportando alta capacidade, baixa latência e finalidade, ao mesmo tempo que melhora a segurança da rede através de um modelo de duplo-staking.
· Padrão Inovador de Formato de Dados: O Chainbase introduz um novo padrão de formato de dados chamado de “manuscritos”, otimizando a estruturação e utilização de dados na indústria de criptomoedas.
· Modelo Cryptoworld: Com seus extensos recursos de dados blockchain, a Chainbase combina tecnologia de modelo de IA para criar modelos de IA que entendem, prevêem e interagem efetivamente com transações de blockchain. O modelo básico, Theia, agora está disponível para uso público.
Esses recursos diferenciam o Chainbase dos protocolos de indexação de blockchain, concentrando-se na acessibilidade de dados em tempo real, formatos de dados inovadores e na criação de modelos mais inteligentes por meio da integração de dados on-chain e off-chain para aprimorar insights.
O modelo de IA da Chainbase, Theia, é um grande destaque que a diferencia de outros protocolos de serviço de dados. Baseado no modelo DORA da NVIDIA, Theia aprende e analisa padrões criptográficos integrando dados on-chain e off-chain, juntamente com atividades espaço-temporais. Por meio de raciocínio causal, ele responde para aprofundar a exploração do potencial valor e padrões de dados on-chain, fornecendo aos usuários serviços de dados mais inteligentes.
Os serviços de dados habilitados para IA transformaram o Chainbase de uma simples plataforma de serviços de dados em blockchain em um provedor de serviços de dados inteligentes mais competitivo. Com recursos de dados robustos e análises de IA proativas, o Chainbase pode oferecer insights de dados mais amplos e otimizar os fluxos de processamento de dados dos usuários.
3.3 Espaço e Tempo
Space and Time (SxT) tem como objetivo criar uma camada de computação verificável que estende as provas de conhecimento zero em um armazém de dados descentralizado, fornecendo processamento confiável de dados para contratos inteligentes, modelos de linguagem grandes e empresas. Space and Time recentemente garantiu $20 milhões em sua mais recente rodada de financiamento Série A, liderada pela Framework Ventures, Lightspeed Faction, Arrington Capital e Hivemind Capital.
No campo da indexação e verificação de dados, o Espaço e o Tempo introduzem uma nova abordagem técnica: a Prova de SQL. Esta é uma inovadora tecnologia de prova de conhecimento zero (ZKP) desenvolvida pela Space and Time que garante que as consultas SQL executadas no armazém de dados descentralizado sejam invioláveis e verificáveis. Quando uma consulta é executada, a Prova de SQL gera uma prova criptográfica que verifica a integridade e a precisão dos resultados da consulta. Essa prova é anexada aos resultados da consulta, permitindo que qualquer verificador (como contratos inteligentes) confirme independentemente que os dados não foram adulterados durante o processamento. As redes de blockchain tradicionais geralmente dependem de mecanismos de consenso para verificar a autenticidade dos dados, enquanto a Prova de SQL do Espaço e do Tempo implementa um método de verificação de dados mais eficiente. Especificamente, no sistema do Espaço e do Tempo, um nó é responsável pela aquisição de dados, enquanto outros nós usam a tecnologia zk para verificar a autenticidade desses dados. Essa abordagem reduz o consumo de recursos de vários nós indexando redundantemente os mesmos dados para chegar a um consenso, melhorando assim o desempenho geral do sistema. À medida que essa tecnologia amadurece, ela serve como uma pedra angular para as indústrias tradicionais com foco na confiabilidade de dados para construir produtos baseados em dados de blockchain.
Ao mesmo tempo, o SxT tem colaborado estreitamente com o laboratório conjunto de inovação de IA da Microsoft para acelerar o desenvolvimento de ferramentas de IA generativas, permitindo que os usuários processem facilmente dados de blockchain por meio de linguagem natural. Atualmente, no Space and Time Studio, os usuários podem inserir consultas em linguagem natural, e a IA as converterá automaticamente em SQL e executará a consulta em nome do usuário para apresentar os resultados finais necessários.
3.4 Comparação de Diferenças
Em resumo, a tecnologia de indexação de dados blockchain evoluiu a partir de fontes de dados iniciais de nós, através do desenvolvimento de análise de dados e indexadores, até um serviço de dados de cadeia completa habilitado para IA, marcando um processo de melhoria gradual. Essa evolução contínua da tecnologia não só aprimora a eficiência e precisão do acesso aos dados, mas também proporciona aos usuários uma experiência inteligente sem precedentes.
Olhando para o futuro, com o contínuo desenvolvimento de novas tecnologias como IA e provas de conhecimento zero, os serviços de dados blockchain se tornarão ainda mais inteligentes e seguros. Temos motivos para acreditar que os serviços de dados blockchain continuarão a desempenhar um papel vital como infraestrutura, fornecendo forte suporte para o progresso e a inovação na indústria.
Este artigo é reproduzido de [Trustless Labs], os direitos de autor pertencem ao autor original [Trustless Labs], se tiver alguma objeção à reimpressão, por favor entre em contato com o Gate AprenderEquipe e a equipe lidará com isso assim que possível de acordo com os procedimentos relevantes.
Aviso legal: As opiniões expressas neste artigo representam apenas as opiniões pessoais do autor e não constituem qualquer conselho de investimento.
Outras versões de idiomas do artigo são traduzidas pela equipe Gate Learn e não são mencionadas em.Gate.ioO artigo traduzido não pode ser reproduzido, distribuído ou plagiado.
Este artigo explora a evolução da acessibilidade aos dados da blockchain, comparando as características de três protocolos de serviço de dados - The Graph, Chainbase e Space and Time - em termos de arquitetura e aplicações de tecnologia de IA. Ele aponta que os serviços de dados da blockchain estão evoluindo em direção a uma maior inteligência e segurança, e continuarão desempenhando um papel crucial como infraestrutura fundamental na indústria no futuro.
A partir da primeira onda de dApps em 2017, incluindo Etheroll, ETHLend e CryptoKitties, agora vemos uma variedade florescente de dApps financeiros, de jogos e sociais baseados em diferentes blockchains. Ao discutir aplicações descentralizadas on-chain, já consideramos alguma vez as fontes dos vários dados que esses dApps utilizam em suas interações?
Em 2024, o foco é em IA e Web3. No mundo da inteligência artificial, os dados são como o sangue vital para o seu crescimento e evolução. Assim como as plantas dependem da luz solar e da água para prosperarem, os sistemas de IA dependem de grandes quantidades de dados para continuamente “aprender” e “pensar”. Sem dados, mesmo os algoritmos de IA mais sofisticados são meros castelos no ar, incapazes de liberar sua inteligência e eficácia pretendidas.
Este artigo analisa a evolução da indexação de dados de blockchain a partir da perspectiva da acessibilidade de dados, comparando o protocolo estabelecido de indexação de dados The Graph com os protocolos emergentes de serviço de dados de blockchain Chainbase e Space and Time. Ele explora especialmente as semelhanças e diferenças nos serviços de dados e arquitetura de produtos entre estes dois novos protocolos que incorporam tecnologia de IA.
2.1 Fontes de Dados: Nós da Blockchain
A partir do momento em que começamos a entender o que é blockchain, frequentemente nos deparamos com a frase: blockchain é um livro-razão descentralizado. Os nós blockchain são a base de toda a rede blockchain, responsáveis por registrar, armazenar e disseminar todos os dados de transações na cadeia. Cada nó possui uma cópia completa dos dados da blockchain, garantindo a descentralização da rede. No entanto, para usuários comuns, construir e manter um nó blockchain não é uma tarefa fácil. Isso requer não apenas habilidades técnicas especializadas, mas também incorre em altos custos de hardware e largura de banda. Além disso, as capacidades de consulta dos nós comuns são limitadas, dificultando a recuperação de dados no formato exigido pelos desenvolvedores. Portanto, embora teoricamente qualquer pessoa possa executar seu próprio nó, na prática, os usuários tendem a depender de serviços de terceiros.
Para resolver esse problema, surgiram provedores de nó RPC (Remote Procedure Call). Esses provedores lidam com os custos e o gerenciamento de nós e oferecem dados por meio de endpoints RPC, permitindo que os usuários acessem dados de blockchain sem construir seus próprios nós. Os endpoints RPC públicos são gratuitos, mas vêm com limites de taxa, o que pode afetar negativamente a experiência do usuário do dApps. Os endpoints RPC privados oferecem melhor desempenho reduzindo o congestionamento, mas mesmo a recuperação simples de dados requer uma comunicação substancial de ida e volta. Isso os torna muito requisitados e ineficientes para consultas de dados complexas. Além disso, os terminais RPC privados enfrentam frequentemente desafios de escalabilidade e falta de compatibilidade entre diferentes redes. No entanto, as interfaces de API padronizadas fornecidas pelos provedores de nós reduzem as barreiras para os usuários acessarem dados on-chain, estabelecendo as bases para a análise de dados e aplicativos subsequentes.
2.2 Análise de Dados: De Dados Brutos a Dados Utilizáveis
Os dados obtidos dos nós do blockchain são frequentemente dados brutos que foram criptografados e codificados. Embora esses dados mantenham a integridade e segurança do blockchain, sua complexidade aumenta a dificuldade de análise de dados. Para usuários comuns ou desenvolvedores, lidar diretamente com esses dados brutos requer conhecimento técnico substancial e recursos computacionais.
Neste contexto, o processo de análise de dados torna-se particularmente importante. Ao analisar dados brutos complexos e transformá-los em formatos mais compreensíveis e operacionais, os utilizadores podem compreender e utilizar intuitivamente estes dados. O sucesso da análise de dados afeta diretamente a eficiência e eficácia das aplicações de dados em blockchain, tornando-a uma etapa crítica em todo o processo de indexação de dados.
2.3 Evolução dos Indexadores de Dados
À medida que o volume de dados de blockchain aumenta, também cresce a demanda por indexadores de dados. Os indexadores desempenham um papel crucial na organização de dados on-chain e no envio desses dados para bancos de dados para facilitar a consulta. O princípio de funcionamento de um indexador é indexar os dados de blockchain e disponibilizá-los prontamente por meio de uma linguagem de consulta semelhante ao SQL (como APIs do GraphQL). Ao fornecer uma interface unificada para consulta de dados, os indexadores permitem que os desenvolvedores recuperem rapidamente as informações de que precisam usando linguagens de consulta padronizadas, simplificando significativamente o processo.
Diferentes tipos de indexadores otimizam a recuperação de dados de várias maneiras:
· Indexadores de Nó Completo: Estes indexadores executam nós completos da blockchain e extraem diretamente os dados deles, garantindo a completude e a precisão dos dados, mas requerem um armazenamento e poder de processamento substanciais.
· Indexadores leves: Esses indexadores dependem de nós completos para buscar dados específicos conforme necessário, reduzindo os requisitos de armazenamento, mas potencialmente aumentando o tempo de consulta.
· Indexadores Especializados: Esses indexadores focam em tipos específicos de dados ou blockchains específicas, otimizando a recuperação para casos de uso específicos, como dados de NFT ou transações DeFi.
· AggreGated Indexers: Estes indexadores extraem dados de várias blockchains e fontes, incluindo informações off-chain, fornecendo uma interface de consulta unificada, o que é especialmente útil para dApps multi-chain.
Atualmente, um nó de arquivo Ethereum no cliente Geth no modo de arquivo ocupa cerca de 13,5 TB de espaço de armazenamento, enquanto no cliente Erigon, o requisito de arquivamento é de cerca de 3 TB. À medida que o blockchain continua a crescer, os requisitos de armazenamento de dados para nós de arquivo também aumentarão. Diante de quantidades tão vastas de dados, os principais protocolos de indexação não apenas suportam indexação de várias cadeias, mas também personalizam estruturas de análise de dados adaptadas a diferentes necessidades de dados de aplicativos. Por exemplo, a estrutura de "subgrafo" do gráfico é um exemplo típico.
A emergência de indexadores melhora significativamente a eficiência da indexação e consulta de dados. Comparados aos endpoints RPC tradicionais, os indexadores podem indexar eficientemente grandes quantidades de dados e suportar consultas de alta velocidade. Estes indexadores permitem aos utilizadores realizar consultas complexas, filtrar facilmente os dados e analisá-los pós-extração. Além disso, alguns indexadores suportam a agregação de fontes de dados de múltiplas blockchains, evitando a necessidade de implementar múltiplas APIs em dApps multi-cadeia. Ao serem executados distribuídos por vários nós, os indexadores oferecem maior segurança e desempenho, reduzindo os riscos de interrupções e tempos de inatividade associados aos fornecedores centralizados de RPC.
Em contraste, os indexadores permitem aos utilizadores obterem as informações de que necessitam diretamente utilizando linguagens de consulta predefinidas, sem terem de lidar com os dados complexos subjacentes. Este mecanismo melhora significativamente a eficiência e a fiabilidade da recuperação de dados, representando uma inovação importante no acesso a dados de blockchain.
2.4 Bases de Dados de Cadeia Completa: Alinhamento em Direção ao Streaming em Primeiro Lugar
Usar nós indexados para consultar dados geralmente significa que as APIs se tornam o único Gateway para a digestão de dados on-chain. No entanto, quando um projeto entra na fase de escalonamento, muitas vezes requer fontes de dados mais flexíveis, que as APIs padronizadas não podem fornecer. À medida que as demandas de aplicativos se tornam mais complexas, os indexadores de dados primários, com seus formatos de indexação padronizados, lutam gradualmente para atender às necessidades de consulta cada vez mais diversas, como busca, acesso entre cadeias ou mapeamento de dados off-chain.
Na arquitetura moderna de pipeline de dados, uma abordagem "stream-first" tornou-se uma solução para as limitações do processamento em lote tradicional, permitindo a ingestão, processamento e análise de dados em tempo real. Essa mudança de paradigma permite que as organizações respondam imediatamente aos dados recebidos, produzindo insights e tomando decisões quase instantaneamente. Da mesma forma, o desenvolvimento de provedores de serviços de dados blockchain está progredindo em direção à construção de fluxos de dados blockchain. Os provedores de serviços de indexação tradicionais lançaram sucessivamente produtos que obtêm dados de blockchain em tempo real por meio de fluxos de dados, como o The Graph's Substreams e o Goldsky's Mirror, bem como data lakes em tempo real como Chainbase e SubSquid que geram fluxos de dados baseados em blockchains.
Esses serviços visam atender à demanda por análise em tempo real de transações blockchain e fornecer capacidades de consulta mais abrangentes. Assim como a arquitetura "stream-first" revoluciona o processamento e consumo de dados em pipelines de dados tradicionais, reduzindo a latência e aprimorando a capacidade de resposta, esses provedores de fluxo de dados blockchain também buscam apoiar o desenvolvimento de mais aplicativos e auxiliar na análise de dados on-chain por meio de fontes de dados mais avançadas e maduras.
Ao redefinir os desafios dos dados on-chain a partir da perspectiva dos pipelines de dados modernos, podemos visualizar a gestão, armazenamento e provisão de dados on-chain a partir de uma nova perspectiva, realizando o seu pleno potencial. Quando começamos a ver subgráficos e serviços de indexação Ethereum ETL como fluxos de dados dentro do pipeline de dados, em vez de saídas finais, podemos vislumbrar um possível mundo onde conjuntos de dados de alto desempenho são adaptados para qualquer caso de uso empresarial.
3.1 O Gráfico
A rede The Graph alcança a indexação de dados multi-cadeia e serviços de consulta através de uma rede descentralizada de nós, permitindo que os desenvolvedores indexem convenientemente os dados da blockchain e construam aplicações descentralizadas. Seus principais modelos de produto incluem o mercado de execução de consultas de dados e o mercado de cache de indexação de dados, ambos atendendo às necessidades de consulta de produtos dos usuários. O mercado de execução de consultas de dados refere-se especificamente aos consumidores pagando nós de índice adequados pelos dados de que necessitam, enquanto o mercado de cache de indexação de dados envolve nós de índice alocando recursos com base em fatores como a popularidade histórica de indexação de subgráficos, as taxas de consulta coletadas e a demanda de curadores on-chain por saídas de subgráficos.
Os subgráficos são as estruturas de dados fundamentais dentro da rede The Graph. Eles definem como extrair e transformar dados do blockchain em um formato consultável (por exemplo, esquema GraphQL). Qualquer pessoa pode criar um subgráfico, e várias aplicações podem reutilizar esses subgráficos, aumentando a reutilização de dados e eficiência operacional.
A rede Graph é composta por quatro papéis-chave: Indexadores, Delegadores, Curadores e Desenvolvedores, todos eles trabalham em conjunto para fornecer suporte de dados para aplicações Web3. Suas respectivas responsabilidades são as seguintes:
· Indexadores: Os indexadores são operadores de nós dentro da rede The Graph que participam apostando GRT (o token nativo do The Graph). Eles fornecem serviços de indexação e processamento de consultas.
· Delegados: Delegados são usuários que apostam tokens GRT para apoiar a operação de nós de índice. Eles ganham uma parte das recompensas com base nos nós de índice aos quais delegam.
· Curadores: Os curadores são responsáveis por sinalizar quais subgrafos devem ser indexados pela rede. Eles ajudam a garantir que subgrafos valiosos sejam priorizados para processamento.
· Desenvolvedores: Ao contrário dos três papéis anteriores, os Desenvolvedores são o lado da demanda e são os principais usuários do The Graph. Eles criam e enviam subgrafos para a rede The Graph, aguardando que a rede atenda às suas necessidades de dados.
3.1 O Graph
O Graph agora se tornou completamente um serviço descentralizado de hospedagem de subgráficos, com incentivos econômicos fluindo entre diferentes participantes para garantir a operação do sistema:
· Recompensas do Indicador: Os indicadores ganham renda através das taxas de consulta do consumidor e uma parte das recompensas em blocos de tokens GRT.
· Recompensas para Delegadores: Os delegadores recebem uma parte das recompensas dos indexadores que eles apoiam.
· Recompensas do Curador: Se os curadores sinalizarem subgrafos valiosos, eles podem ganhar uma parte das taxas de consulta.
Na verdade, os produtos da The Graph estão evoluindo rapidamente na onda de IA. Como uma das equipes de desenvolvimento principais no ecossistema da The Graph, a Semiotic Labs tem se concentrado em aproveitar a tecnologia de IA para otimizar a precificação de indexação e a experiência de consulta do usuário. Atualmente, as ferramentas desenvolvidas pela Semiotic Labs, como AutoAgora, Allocation Optimizer e AgentC, melhoram vários aspectos do desempenho do ecossistema.
· O AutoAgora introduz um mecanismo de preços dinâmico que ajusta os preços em tempo real com base no volume de consulta e uso de recursos, otimizando as estratégias de preços para garantir a competitividade do indexador e maximizar a receita.
O Allocation Optimizer aborda as questões complexas de alocação de recursos de subgrafo, ajudando os indexadores a alcançar uma configuração ideal de recursos para melhorar a receita e o desempenho.
· AgentC é uma ferramenta experimental que permite aos usuários acessar os dados de blockchain do The Graph usando linguagem natural, melhorando assim a experiência do usuário.
A aplicação dessas ferramentas permitiu ao The Graph aprimorar ainda mais a inteligência do sistema e a facilidade de uso com a assistência de IA.
3.2 Chainbase
Chainbase é uma rede de dados abrangente que integra todos os dados de blockchain em uma única plataforma, facilitando para os desenvolvedores construir e manter aplicações. Suas características únicas incluem:
· Data Lake em tempo real: o Chainbase fornece um data lake em tempo real especificamente para fluxos de dados blockchain, permitindo acesso instantâneo aos dados à medida que são gerados.
· Arquitetura de dupla cadeia: Chainbase é construída na Eigenlayer AVS, criando uma camada de execução que funciona em paralelo com o algoritmo de consenso CometBFT. Este design melhora a programabilidade e composabilidade de dados entre cadeias, suportando alta capacidade, baixa latência e finalidade, ao mesmo tempo que melhora a segurança da rede através de um modelo de duplo-staking.
· Padrão Inovador de Formato de Dados: O Chainbase introduz um novo padrão de formato de dados chamado de “manuscritos”, otimizando a estruturação e utilização de dados na indústria de criptomoedas.
· Modelo Cryptoworld: Com seus extensos recursos de dados blockchain, a Chainbase combina tecnologia de modelo de IA para criar modelos de IA que entendem, prevêem e interagem efetivamente com transações de blockchain. O modelo básico, Theia, agora está disponível para uso público.
Esses recursos diferenciam o Chainbase dos protocolos de indexação de blockchain, concentrando-se na acessibilidade de dados em tempo real, formatos de dados inovadores e na criação de modelos mais inteligentes por meio da integração de dados on-chain e off-chain para aprimorar insights.
O modelo de IA da Chainbase, Theia, é um grande destaque que a diferencia de outros protocolos de serviço de dados. Baseado no modelo DORA da NVIDIA, Theia aprende e analisa padrões criptográficos integrando dados on-chain e off-chain, juntamente com atividades espaço-temporais. Por meio de raciocínio causal, ele responde para aprofundar a exploração do potencial valor e padrões de dados on-chain, fornecendo aos usuários serviços de dados mais inteligentes.
Os serviços de dados habilitados para IA transformaram o Chainbase de uma simples plataforma de serviços de dados em blockchain em um provedor de serviços de dados inteligentes mais competitivo. Com recursos de dados robustos e análises de IA proativas, o Chainbase pode oferecer insights de dados mais amplos e otimizar os fluxos de processamento de dados dos usuários.
3.3 Espaço e Tempo
Space and Time (SxT) tem como objetivo criar uma camada de computação verificável que estende as provas de conhecimento zero em um armazém de dados descentralizado, fornecendo processamento confiável de dados para contratos inteligentes, modelos de linguagem grandes e empresas. Space and Time recentemente garantiu $20 milhões em sua mais recente rodada de financiamento Série A, liderada pela Framework Ventures, Lightspeed Faction, Arrington Capital e Hivemind Capital.
No campo da indexação e verificação de dados, o Espaço e o Tempo introduzem uma nova abordagem técnica: a Prova de SQL. Esta é uma inovadora tecnologia de prova de conhecimento zero (ZKP) desenvolvida pela Space and Time que garante que as consultas SQL executadas no armazém de dados descentralizado sejam invioláveis e verificáveis. Quando uma consulta é executada, a Prova de SQL gera uma prova criptográfica que verifica a integridade e a precisão dos resultados da consulta. Essa prova é anexada aos resultados da consulta, permitindo que qualquer verificador (como contratos inteligentes) confirme independentemente que os dados não foram adulterados durante o processamento. As redes de blockchain tradicionais geralmente dependem de mecanismos de consenso para verificar a autenticidade dos dados, enquanto a Prova de SQL do Espaço e do Tempo implementa um método de verificação de dados mais eficiente. Especificamente, no sistema do Espaço e do Tempo, um nó é responsável pela aquisição de dados, enquanto outros nós usam a tecnologia zk para verificar a autenticidade desses dados. Essa abordagem reduz o consumo de recursos de vários nós indexando redundantemente os mesmos dados para chegar a um consenso, melhorando assim o desempenho geral do sistema. À medida que essa tecnologia amadurece, ela serve como uma pedra angular para as indústrias tradicionais com foco na confiabilidade de dados para construir produtos baseados em dados de blockchain.
Ao mesmo tempo, o SxT tem colaborado estreitamente com o laboratório conjunto de inovação de IA da Microsoft para acelerar o desenvolvimento de ferramentas de IA generativas, permitindo que os usuários processem facilmente dados de blockchain por meio de linguagem natural. Atualmente, no Space and Time Studio, os usuários podem inserir consultas em linguagem natural, e a IA as converterá automaticamente em SQL e executará a consulta em nome do usuário para apresentar os resultados finais necessários.
3.4 Comparação de Diferenças
Em resumo, a tecnologia de indexação de dados blockchain evoluiu a partir de fontes de dados iniciais de nós, através do desenvolvimento de análise de dados e indexadores, até um serviço de dados de cadeia completa habilitado para IA, marcando um processo de melhoria gradual. Essa evolução contínua da tecnologia não só aprimora a eficiência e precisão do acesso aos dados, mas também proporciona aos usuários uma experiência inteligente sem precedentes.
Olhando para o futuro, com o contínuo desenvolvimento de novas tecnologias como IA e provas de conhecimento zero, os serviços de dados blockchain se tornarão ainda mais inteligentes e seguros. Temos motivos para acreditar que os serviços de dados blockchain continuarão a desempenhar um papel vital como infraestrutura, fornecendo forte suporte para o progresso e a inovação na indústria.
Este artigo é reproduzido de [Trustless Labs], os direitos de autor pertencem ao autor original [Trustless Labs], se tiver alguma objeção à reimpressão, por favor entre em contato com o Gate AprenderEquipe e a equipe lidará com isso assim que possível de acordo com os procedimentos relevantes.
Aviso legal: As opiniões expressas neste artigo representam apenas as opiniões pessoais do autor e não constituem qualquer conselho de investimento.
Outras versões de idiomas do artigo são traduzidas pela equipe Gate Learn e não são mencionadas em.Gate.ioO artigo traduzido não pode ser reproduzido, distribuído ou plagiado.