Cet article explore l'évolution de l'accessibilité des données de la blockchain, en comparant les caractéristiques de trois protocoles de services de données - The Graph, Chainbase et Space and Time - en termes d'architecture et d'applications technologiques de l'IA. Il souligne que les services de données de la blockchain évoluent vers une intelligence et une sécurité accrues, et continueront de jouer un rôle crucial en tant qu'infrastructure fondamentale de l'industrie à l'avenir.
À partir de la première vague de dApps en 2017, notamment Etheroll, ETHLend et CryptoKitties, nous voyons maintenant une grande variété de dApps financières, de jeux et sociales basées sur différentes blockchains. Lorsque nous discutons des applications décentralisées sur la chaîne, avons-nous déjà envisagé les sources des différentes données que ces dApps utilisent dans leurs interactions?
En 2024, l'accent est mis sur l'IA et Web3. Dans le monde de l'intelligence artificielle, les données sont comme le sang pour sa croissance et son évolution. Tout comme les plantes dépendent de la lumière du soleil et de l'eau pour prospérer, les systèmes d'IA dépendent de vastes quantités de données pour continuellement "apprendre" et "penser". Sans données, même les algorithmes d'IA les plus sophistiqués ne sont que des châteaux en l'air, incapables de libérer leur intelligence et leur efficacité voulues.
Cet article analyse l'évolution de l'indexation des données de la blockchain du point de vue de l'accessibilité des données, en comparant le protocole établi d'indexation des données The Graph avec les protocoles émergents de services de données de la blockchain Chainbase et Space and Time. Il explore en particulier les similitudes et les différences dans les services de données et l'architecture des produits entre ces deux nouveaux protocoles qui intègrent la technologie de l'IA.
2.1 Sources de données: Noeuds de la blockchain
Dès le moment où nous commençons à comprendre "qu'est-ce que la blockchain," nous rencontrons souvent la phrase : la blockchain est un registre décentralisé. Les nœuds de la blockchain sont le fondement de l'ensemble du réseau blockchain, responsables de l'enregistrement, du stockage et de la diffusion de toutes les données de transaction sur la chaîne. Chaque nœud possède une copie complète des données de la blockchain, garantissant la décentralisation du réseau. Cependant, pour les utilisateurs ordinaires, la construction et la maintenance d'un nœud de la blockchain ne sont pas des tâches faciles. Cela nécessite non seulement des compétences techniques spécialisées, mais entraîne également des coûts élevés en termes de matériel et de bande passante. De plus, les capacités de requête des nœuds ordinaires sont limitées, ce qui rend difficile la récupération des données dans le format requis par les développeurs. Par conséquent, bien que théoriquement n'importe qui puisse exécuter son propre nœud, en pratique, les utilisateurs ont tendance à s'appuyer sur des services tiers.
Pour résoudre ce problème, des fournisseurs de nœuds RPC (Remote Procedure Call) sont apparus. Ces fournisseurs gèrent les coûts et la gestion des nœuds et offrent des données via des points de terminaison RPC, permettant aux utilisateurs d'accéder aux données de la blockchain sans construire leurs propres nœuds. Les points de terminaison RPC publics sont gratuits mais sont soumis à des limites de taux, ce qui peut avoir un impact négatif sur l'expérience utilisateur des dApps. Les points de terminaison RPC privés offrent de meilleures performances en réduisant la congestion, mais même la simple récupération de données nécessite une communication importante. Cela les rend demandeurs et inefficaces pour les requêtes de données complexes. De plus, les points de terminaison RPC privés sont souvent confrontés à des défis de scalabilité et manquent de compatibilité entre différents réseaux. Cependant, les interfaces API standardisées fournies par les fournisseurs de nœuds réduisent les barrières pour les utilisateurs afin d'accéder aux données on-chain, posant ainsi les bases pour l'analyse ultérieure des données et les applications.
2.2 Analyse des données : Des données brutes aux données utilisables
Les données obtenues à partir des nœuds de la blockchain sont souvent des données brutes qui ont été chiffrées et encodées. Bien que ces données conservent l'intégrité et la sécurité de la blockchain, leur complexité accroît la difficulté de l'analyse des données. Pour les utilisateurs ordinaires ou les développeurs, la manipulation directe de ces données brutes nécessite des connaissances techniques approfondies et des ressources de calcul importantes.
Dans ce contexte, le processus d'analyse des données devient particulièrement important. En analysant des données brutes complexes et en les transformant en formats plus compréhensibles et exploitables, les utilisateurs peuvent comprendre intuitivement et utiliser ces données. Le succès de l'analyse des données affecte directement l'efficacité et l'efficacité des applications de données de la blockchain, ce qui en fait une étape critique dans l'ensemble du processus d'indexation des données.
2.3 Évolution des indexeurs de données
À mesure que le volume des données de la blockchain augmente, la demande d'indexeurs de données a également augmenté. Les indexeurs jouent un rôle crucial dans l'organisation des données on-chain et leur envoi aux bases de données pour faciliter les requêtes. Le principe de fonctionnement d'un indexeur est d'indexer les données de la blockchain et de les rendre rapidement disponibles grâce à un langage de requête de type SQL (tel que les API GraphQL). En fournissant une interface unifiée pour interroger les données, les indexeurs permettent aux développeurs de récupérer rapidement et avec précision les informations dont ils ont besoin en utilisant des langages de requête normalisés, simplifiant considérablement le processus.
Différents types d'indexeurs optimisent la récupération des données de différentes manières:
· Indexeurs de nœuds complets: Ces indexeurs exécutent des nœuds de blockchain complets et extraient directement des données d'eux, garantissant la complétude et l'exactitude des données mais nécessitant une capacité de stockage et de traitement substantielle.
· Indexeurs légers: ces indexeurs s'appuient sur des nœuds complets pour récupérer des données spécifiques au besoin, réduisant ainsi les besoins de stockage mais potentiellement augmentant le temps de requête.
· Indexeurs spécialisés: Ces indexeurs se concentrent sur des types de données spécifiques ou des blockchains particulières, optimisant la récupération pour des cas d'utilisation spécifiques, tels que les données NFT ou les transactions DeFi.
· Indexeurs agrégés: Ces indexeurs extraient des données de plusieurs blockchains et sources, y compris des informations hors chaîne, fournissant une interface de requête unifiée, ce qui est particulièrement utile pour les dApps multi-chaînes.
Actuellement, un nœud d'archive Ethereum dans le client Geth en mode archive occupe environ 13,5 To d'espace de stockage, tandis que sous le client Erigon, l'exigence d'archive est d'environ 3 To. Alors que la blockchain continue de croître, les besoins de stockage des données pour les nœuds d'archive augmenteront également. Face à de telles quantités de données, les protocoles d'indexation grand public prennent en charge non seulement l'indexation multi-chaîne, mais également la personnalisation des cadres d'analyse des données adaptés aux différents besoins des applications. Par exemple, le cadre « sous-graphe » de The Graph est un exemple typique.
L'émergence des indexeurs améliore considérablement l'efficacité de l'indexation et de l'interrogation des données. Par rapport aux points de terminaison RPC traditionnels, les indexeurs peuvent indexer efficacement de grandes quantités de données et prendre en charge des requêtes à haute vitesse. Ces indexeurs permettent aux utilisateurs d'effectuer des requêtes complexes, de filtrer facilement les données et de les analyser après extraction. De plus, certains indexeurs prennent en charge l'agrégation de sources de données provenant de plusieurs blockchains, évitant ainsi le besoin de déployer de multiples API dans les dApps multi-chaînes. En s'exécutant de manière distribuée sur plusieurs nœuds, les indexeurs offrent une sécurité et des performances renforcées tout en réduisant les risques d'interruptions et de temps d'arrêt associés aux fournisseurs RPC centralisés.
En revanche, les indexeurs permettent aux utilisateurs d'obtenir directement les informations dont ils ont besoin en utilisant des langages de requête prédéfinis sans avoir à traiter les données complexes sous-jacentes. Ce mécanisme améliore considérablement l'efficacité et la fiabilité de la récupération des données, représentant une innovation importante dans l'accès aux données de la blockchain.
2.4 Bases de données Full-Chain : Alignement vers le streaming en premier
L'utilisation de nœuds indexés pour interroger les données signifie généralement que les API deviennent la seule passerelle pour digérer les données en chaîne. Cependant, lorsqu'un projet entre dans la phase de mise à l'échelle, il nécessite souvent des sources de données plus flexibles, que les API standardisées ne peuvent pas fournir. À mesure que les demandes des applications deviennent plus complexes, les indexeurs de données primaires avec leurs formats d'indexation standardisés ont de plus en plus de difficultés à répondre aux besoins de requête de plus en plus diversifiés, tels que la recherche, l'accès inter-chaînes ou la cartographie des données hors chaîne.
Dans l'architecture moderne des pipelines de données, une approche "stream-first" est devenue une solution aux limitations du traitement par lot traditionnel, permettant l'ingestion, le traitement et l'analyse des données en temps réel. Ce changement de paradigme permet aux organisations de répondre immédiatement aux données entrantes, fournissant des informations et prenant des décisions presque instantanément. De même, le développement de fournisseurs de services de données blockchain progresse vers la construction de flux de données blockchain. Les fournisseurs de services d'indexation traditionnels ont successivement lancé des produits qui obtiennent des données blockchain en temps réel via des flux de données, tels que les sous-flux de The Graph et le miroir de Goldsky, ainsi que des lacs de données en temps réel comme Chainbase et SubSquid qui génèrent des flux de données basés sur les blockchains.
Ces services visent à répondre à la demande de traitement en temps réel des transactions de la blockchain et à offrir des capacités de requête plus complètes. Tout comme l'architecture "stream-first" révolutionne le traitement et la consommation des données dans les pipelines de données traditionnels en réduisant la latence et en améliorant la réactivité, ces fournisseurs de flux de données de la blockchain cherchent également à soutenir le développement de plus d'applications et à aider à l'analyse des données on-chain grâce à des sources de données plus avancées et matures.
En redéfinissant les défis des données on-chain du point de vue des pipelines de données modernes, nous pouvons envisager la gestion, le stockage et la fourniture de données on-chain sous un nouvel angle, réalisant ainsi leur plein potentiel. Lorsque nous commençons à voir les sous-graphiques et les services d'indexation Ethereum ETL comme des flux de données au sein du pipeline de données plutôt que des sorties finales, nous pouvons envisager un monde possible où des ensembles de données haute performance sont adaptés à tout cas d'utilisation commercial.
3.1 Le Graphique
Le réseau Graph offre des services d’indexation et de requête de données multi-chaînes grâce à un réseau décentralisé de nœuds, ce qui permet aux développeurs d’indexer facilement les données de la blockchain et de créer des applications décentralisées. Ses principaux modèles de produits incluent le marché de l’exécution des requêtes de données et le marché du cache d’indexation des données, qui répondent tous deux aux besoins des utilisateurs en matière de requêtes de produits. Le marché de l’exécution des requêtes de données fait spécifiquement référence aux consommateurs qui paient des nœuds d’index appropriés pour les données dont ils ont besoin, tandis que le marché du cache d’indexation des données implique que les nœuds d’index allouent des ressources en fonction de facteurs tels que la popularité historique de l’indexation des sous-graphes, les frais de requête collectés et la demande des curateurs on-chain pour les sorties de sous-graphes.
Les sous-graphes sont les structures de données fondamentales au sein du réseau The Graph. Ils définissent comment extraire et transformer les données de la blockchain en un format interrogeable (par exemple, un schéma GraphQL). Tout le monde peut créer un sous-graphe, et plusieurs applications peuvent réutiliser ces sous-graphes, ce qui améliore la réutilisabilité des données et l'efficacité opérationnelle.
Le réseau Graph se compose de quatre rôles clés : Indexeurs, Délégués, Curateurs et Développeurs, qui travaillent tous ensemble pour fournir un support de données aux applications Web3. Leurs responsabilités respectives sont les suivantes :
· Indexeurs : Les indexeurs sont des opérateurs de nœuds au sein du réseau The Graph qui participent en misant des GRT (le jeton natif de The Graph). Ils fournissent des services d'indexation et de traitement de requêtes.
· Délégataires: Les délégataires sont des utilisateurs qui misent des jetons GRT pour soutenir le fonctionnement des nœuds d'index. Ils gagnent une partie des récompenses en fonction des nœuds d'index auxquels ils délèguent.
· Curateurs : Les curateurs sont responsables de signaler quels sous-graphiques devraient être indexés par le réseau. Ils aident à garantir que les sous-graphiques de valeur sont priorisés pour le traitement.
· Développeurs : Contrairement aux trois rôles précédents, les développeurs sont le côté demande et sont les principaux utilisateurs de The Graph. Ils créent et soumettent des sous-graphes au réseau The Graph, en attendant que le réseau réponde à leurs besoins en matière de données.
3.1 Le Graphique
Le Graph est maintenant entièrement passé à un service d'hébergement de sous-graphes décentralisé, avec des incitations économiques circulant entre les différents participants pour garantir le fonctionnement du système :
· Récompenses de l'indexeur : Les indexeurs gagnent des revenus grâce aux frais de requête des consommateurs et une partie des récompenses de blocs de jetons GRT.
· Récompenses des délégants : Les délégants reçoivent une part des récompenses des indexeurs qu'ils soutiennent.
· Récompenses du conservateur : Si les conservateurs signalent des sous-graphiques précieux, ils peuvent gagner une partie des frais de requête.
En fait, les produits de The Graph évoluent rapidement dans la vague de l'IA. En tant que l'une des équipes de développement principales de l'écosystème de The Graph, Semiotic Labs s'est concentrée sur l'utilisation de la technologie de l'IA pour optimiser la tarification de l'indexation et l'expérience de requête de l'utilisateur. Actuellement, les outils développés par Semiotic Labs, tels que AutoAgora, Allocation Optimizer et AgentC, améliorent différents aspects des performances de l'écosystème.
· AutoAgora introduit un mécanisme de tarification dynamique qui ajuste les prix en temps réel en fonction du volume de requêtes et de l'utilisation des ressources, optimisant les stratégies de tarification pour garantir la compétitivité de l'indexeur et maximiser les revenus.
· Allocation Optimizer résout les problèmes complexes liés à l’allocation des ressources des sous-graphes, en aidant les indexeurs à obtenir une configuration optimale des ressources afin d’améliorer les revenus et les performances.
· AgentC est un outil expérimental qui permet aux utilisateurs d'accéder aux données de blockchain de The Graph en utilisant un langage naturel, améliorant ainsi l'expérience utilisateur.
L'application de ces outils a permis à The Graph d'améliorer encore l'intelligence du système et la convivialité avec l'assistance de l'IA.
3.2 Chainbase
Chainbase est un réseau de données complet qui intègre toutes les données de la blockchain dans une seule plateforme, ce qui facilite la création et la maintenance d'applications pour les développeurs. Ses fonctionnalités uniques comprennent :
· Lac de données en temps réel : Chainbase fournit un lac de données en temps réel spécifiquement pour les flux de données de la blockchain, permettant un accès instantané aux données telles qu'elles sont générées.
· Architecture à double chaîne : Chainbase est construit sur Eigenlayer AVS, créant une couche d'exécution qui fonctionne en parallèle avec l'algorithme de consensus de CometBFT. Cette conception améliore la programmabilité et la composabilité des données entre chaînes, prend en charge un débit élevé, une faible latence et une finalité, tout en améliorant la sécurité du réseau grâce à un modèle de double-staking.
· Norme de format de données innovante : Chainbase introduit une nouvelle norme de format de données appelée « manuscrits », optimisant la structuration et l'utilisation des données dans l'industrie crypto.
· Modèle Cryptoworld: Avec ses ressources étendues de données de blockchain, Chainbase combine la technologie des modèles d'IA pour créer des modèles d'IA qui comprennent, prédisent et interagissent efficacement avec les transactions de blockchain. Le modèle de base, Theia, est maintenant disponible pour une utilisation publique.
Ces fonctionnalités distinguent Chainbase des protocoles d'indexation de la blockchain, en mettant l'accent sur l'accessibilité des données en temps réel, les formats de données innovants et la création de modèles plus intelligents grâce à l'intégration de données sur la chaîne et hors chaîne pour améliorer les connaissances.
Le modèle d'IA de Chainbase, Theia, est un point fort clé qui le différencie des autres protocoles de services de données. Basé sur le modèle DORA de NVIDIA, Theia apprend et analyse les modèles cryptographiques en intégrant des données on-chain et off-chain ainsi que des activités spatiotemporelles. Grâce à un raisonnement causal, il répond pour approfondir l'exploration de la valeur potentielle et des modèles des données on-chain, offrant aux utilisateurs des services de données plus intelligents.
Les services de données activés par l'IA ont transformé Chainbase d'une simple plateforme de services de données blockchain en un fournisseur de services de données intelligents plus compétitif. Avec des ressources de données robustes et une analyse proactive de l'IA, Chainbase peut offrir des perspectives de données plus larges et optimiser les flux de traitement des données des utilisateurs.
3.3 Espace et temps
Space and Time (SxT) vise à créer une couche de calcul vérifiable qui étend les preuves de connaissance nulle sur un entrepôt de données décentralisé, fournissant un traitement de données fiable pour les contrats intelligents, les grands modèles de langage et les entreprises. Space and Time a récemment sécurisé 20 millions de dollars lors de sa dernière levée de fonds de série A, dirigée par Framework Ventures, Lightspeed Faction, Arrington Capital et Hivemind Capital.
Dans le domaine de l'indexation et de la vérification des données, Space and Time introduit une nouvelle approche technique - Proof of SQL. Il s'agit d'une technologie innovante de preuve de connaissance nulle (ZKP) développée par Space and Time qui garantit que les requêtes SQL exécutées sur l'entrepôt de données décentralisé sont infalsifiables et vérifiables. Lorsqu'une requête est exécutée, Proof of SQL génère une preuve cryptographique qui vérifie l'intégrité et l'exactitude des résultats de la requête. Cette preuve est ajoutée aux résultats de la requête, permettant à tout vérificateur (comme les contrats intelligents) de confirmer indépendamment que les données n'ont pas été altérées pendant leur traitement. Les réseaux blockchain traditionnels reposent généralement sur des mécanismes de consensus pour vérifier l'authenticité des données, tandis que le Proof of SQL de Space and Time met en œuvre une méthode de vérification des données plus efficace. Plus précisément, dans le système de Space and Time, un nœud est responsable de l'acquisition de données tandis que d'autres nœuds utilisent la technologie zk pour vérifier l'authenticité de ces données. Cette approche permet de réduire la consommation de ressources liée à l'indexation redondante des mêmes données par plusieurs nœuds afin d'atteindre un consensus, améliorant ainsi les performances globales du système. À mesure que cette technologie mûrit, elle sert de pierre angulaire pour les industries traditionnelles axées sur la fiabilité des données afin de construire des produits basés sur les données de la blockchain.
Parallèlement, SxT collabore étroitement avec le laboratoire d'innovation conjointe d'IA de Microsoft pour accélérer le développement d'outils d'IA générative, permettant aux utilisateurs de traiter facilement les données blockchain grâce au langage naturel. Actuellement, dans Space and Time Studio, les utilisateurs peuvent saisir des requêtes en langage naturel et l'IA les convertira automatiquement en SQL et exécutera la requête au nom de l'utilisateur pour présenter les résultats finaux nécessaires.
3.4 Comparaison des différences
En résumé, la technologie d'indexation des données de la blockchain a évolué à partir des sources de données initiales des nœuds, en passant par le développement d'analyseurs de données et d'indexeurs, jusqu'à un service de données complet basé sur l'IA, marquant un processus d'amélioration progressive. Cette évolution continue de la technologie améliore non seulement l'efficacité et la précision de l'accès aux données, mais offre également aux utilisateurs une expérience intelligente sans précédent.
En regardant vers l'avenir, avec le développement continu de nouvelles technologies telles que l'IA et les preuves de non-divulgation, les services de données de la blockchain deviendront encore plus intelligents et sécurisés. Nous avons des raisons de croire que les services de données de la blockchain continueront de jouer un rôle vital en tant qu'infrastructure, fournissant un soutien solide pour le progrès et l'innovation dans l'industrie.
Cet article est reproduit à partir de [Trustless Labs], le droit d'auteur appartient à l'auteur original [Trustless Labs], si vous avez des objections à la reproduction, veuillez contacter le Gate Learnl'équipe et l'équipe s'en occuperont dès que possible conformément aux procédures pertinentes.
Avertissement : Les points de vue et opinions exprimés dans cet article ne représentent que les opinions personnelles de l'auteur et ne constituent pas des conseils en investissement.
Les autres versions linguistiques de l'article sont traduites par l'équipe Gate Learn et ne sont pas mentionnées dans Gate.io, l'article traduit ne peut être reproduit, distribué ou plagié.
Cet article explore l'évolution de l'accessibilité des données de la blockchain, en comparant les caractéristiques de trois protocoles de services de données - The Graph, Chainbase et Space and Time - en termes d'architecture et d'applications technologiques de l'IA. Il souligne que les services de données de la blockchain évoluent vers une intelligence et une sécurité accrues, et continueront de jouer un rôle crucial en tant qu'infrastructure fondamentale de l'industrie à l'avenir.
À partir de la première vague de dApps en 2017, notamment Etheroll, ETHLend et CryptoKitties, nous voyons maintenant une grande variété de dApps financières, de jeux et sociales basées sur différentes blockchains. Lorsque nous discutons des applications décentralisées sur la chaîne, avons-nous déjà envisagé les sources des différentes données que ces dApps utilisent dans leurs interactions?
En 2024, l'accent est mis sur l'IA et Web3. Dans le monde de l'intelligence artificielle, les données sont comme le sang pour sa croissance et son évolution. Tout comme les plantes dépendent de la lumière du soleil et de l'eau pour prospérer, les systèmes d'IA dépendent de vastes quantités de données pour continuellement "apprendre" et "penser". Sans données, même les algorithmes d'IA les plus sophistiqués ne sont que des châteaux en l'air, incapables de libérer leur intelligence et leur efficacité voulues.
Cet article analyse l'évolution de l'indexation des données de la blockchain du point de vue de l'accessibilité des données, en comparant le protocole établi d'indexation des données The Graph avec les protocoles émergents de services de données de la blockchain Chainbase et Space and Time. Il explore en particulier les similitudes et les différences dans les services de données et l'architecture des produits entre ces deux nouveaux protocoles qui intègrent la technologie de l'IA.
2.1 Sources de données: Noeuds de la blockchain
Dès le moment où nous commençons à comprendre "qu'est-ce que la blockchain," nous rencontrons souvent la phrase : la blockchain est un registre décentralisé. Les nœuds de la blockchain sont le fondement de l'ensemble du réseau blockchain, responsables de l'enregistrement, du stockage et de la diffusion de toutes les données de transaction sur la chaîne. Chaque nœud possède une copie complète des données de la blockchain, garantissant la décentralisation du réseau. Cependant, pour les utilisateurs ordinaires, la construction et la maintenance d'un nœud de la blockchain ne sont pas des tâches faciles. Cela nécessite non seulement des compétences techniques spécialisées, mais entraîne également des coûts élevés en termes de matériel et de bande passante. De plus, les capacités de requête des nœuds ordinaires sont limitées, ce qui rend difficile la récupération des données dans le format requis par les développeurs. Par conséquent, bien que théoriquement n'importe qui puisse exécuter son propre nœud, en pratique, les utilisateurs ont tendance à s'appuyer sur des services tiers.
Pour résoudre ce problème, des fournisseurs de nœuds RPC (Remote Procedure Call) sont apparus. Ces fournisseurs gèrent les coûts et la gestion des nœuds et offrent des données via des points de terminaison RPC, permettant aux utilisateurs d'accéder aux données de la blockchain sans construire leurs propres nœuds. Les points de terminaison RPC publics sont gratuits mais sont soumis à des limites de taux, ce qui peut avoir un impact négatif sur l'expérience utilisateur des dApps. Les points de terminaison RPC privés offrent de meilleures performances en réduisant la congestion, mais même la simple récupération de données nécessite une communication importante. Cela les rend demandeurs et inefficaces pour les requêtes de données complexes. De plus, les points de terminaison RPC privés sont souvent confrontés à des défis de scalabilité et manquent de compatibilité entre différents réseaux. Cependant, les interfaces API standardisées fournies par les fournisseurs de nœuds réduisent les barrières pour les utilisateurs afin d'accéder aux données on-chain, posant ainsi les bases pour l'analyse ultérieure des données et les applications.
2.2 Analyse des données : Des données brutes aux données utilisables
Les données obtenues à partir des nœuds de la blockchain sont souvent des données brutes qui ont été chiffrées et encodées. Bien que ces données conservent l'intégrité et la sécurité de la blockchain, leur complexité accroît la difficulté de l'analyse des données. Pour les utilisateurs ordinaires ou les développeurs, la manipulation directe de ces données brutes nécessite des connaissances techniques approfondies et des ressources de calcul importantes.
Dans ce contexte, le processus d'analyse des données devient particulièrement important. En analysant des données brutes complexes et en les transformant en formats plus compréhensibles et exploitables, les utilisateurs peuvent comprendre intuitivement et utiliser ces données. Le succès de l'analyse des données affecte directement l'efficacité et l'efficacité des applications de données de la blockchain, ce qui en fait une étape critique dans l'ensemble du processus d'indexation des données.
2.3 Évolution des indexeurs de données
À mesure que le volume des données de la blockchain augmente, la demande d'indexeurs de données a également augmenté. Les indexeurs jouent un rôle crucial dans l'organisation des données on-chain et leur envoi aux bases de données pour faciliter les requêtes. Le principe de fonctionnement d'un indexeur est d'indexer les données de la blockchain et de les rendre rapidement disponibles grâce à un langage de requête de type SQL (tel que les API GraphQL). En fournissant une interface unifiée pour interroger les données, les indexeurs permettent aux développeurs de récupérer rapidement et avec précision les informations dont ils ont besoin en utilisant des langages de requête normalisés, simplifiant considérablement le processus.
Différents types d'indexeurs optimisent la récupération des données de différentes manières:
· Indexeurs de nœuds complets: Ces indexeurs exécutent des nœuds de blockchain complets et extraient directement des données d'eux, garantissant la complétude et l'exactitude des données mais nécessitant une capacité de stockage et de traitement substantielle.
· Indexeurs légers: ces indexeurs s'appuient sur des nœuds complets pour récupérer des données spécifiques au besoin, réduisant ainsi les besoins de stockage mais potentiellement augmentant le temps de requête.
· Indexeurs spécialisés: Ces indexeurs se concentrent sur des types de données spécifiques ou des blockchains particulières, optimisant la récupération pour des cas d'utilisation spécifiques, tels que les données NFT ou les transactions DeFi.
· Indexeurs agrégés: Ces indexeurs extraient des données de plusieurs blockchains et sources, y compris des informations hors chaîne, fournissant une interface de requête unifiée, ce qui est particulièrement utile pour les dApps multi-chaînes.
Actuellement, un nœud d'archive Ethereum dans le client Geth en mode archive occupe environ 13,5 To d'espace de stockage, tandis que sous le client Erigon, l'exigence d'archive est d'environ 3 To. Alors que la blockchain continue de croître, les besoins de stockage des données pour les nœuds d'archive augmenteront également. Face à de telles quantités de données, les protocoles d'indexation grand public prennent en charge non seulement l'indexation multi-chaîne, mais également la personnalisation des cadres d'analyse des données adaptés aux différents besoins des applications. Par exemple, le cadre « sous-graphe » de The Graph est un exemple typique.
L'émergence des indexeurs améliore considérablement l'efficacité de l'indexation et de l'interrogation des données. Par rapport aux points de terminaison RPC traditionnels, les indexeurs peuvent indexer efficacement de grandes quantités de données et prendre en charge des requêtes à haute vitesse. Ces indexeurs permettent aux utilisateurs d'effectuer des requêtes complexes, de filtrer facilement les données et de les analyser après extraction. De plus, certains indexeurs prennent en charge l'agrégation de sources de données provenant de plusieurs blockchains, évitant ainsi le besoin de déployer de multiples API dans les dApps multi-chaînes. En s'exécutant de manière distribuée sur plusieurs nœuds, les indexeurs offrent une sécurité et des performances renforcées tout en réduisant les risques d'interruptions et de temps d'arrêt associés aux fournisseurs RPC centralisés.
En revanche, les indexeurs permettent aux utilisateurs d'obtenir directement les informations dont ils ont besoin en utilisant des langages de requête prédéfinis sans avoir à traiter les données complexes sous-jacentes. Ce mécanisme améliore considérablement l'efficacité et la fiabilité de la récupération des données, représentant une innovation importante dans l'accès aux données de la blockchain.
2.4 Bases de données Full-Chain : Alignement vers le streaming en premier
L'utilisation de nœuds indexés pour interroger les données signifie généralement que les API deviennent la seule passerelle pour digérer les données en chaîne. Cependant, lorsqu'un projet entre dans la phase de mise à l'échelle, il nécessite souvent des sources de données plus flexibles, que les API standardisées ne peuvent pas fournir. À mesure que les demandes des applications deviennent plus complexes, les indexeurs de données primaires avec leurs formats d'indexation standardisés ont de plus en plus de difficultés à répondre aux besoins de requête de plus en plus diversifiés, tels que la recherche, l'accès inter-chaînes ou la cartographie des données hors chaîne.
Dans l'architecture moderne des pipelines de données, une approche "stream-first" est devenue une solution aux limitations du traitement par lot traditionnel, permettant l'ingestion, le traitement et l'analyse des données en temps réel. Ce changement de paradigme permet aux organisations de répondre immédiatement aux données entrantes, fournissant des informations et prenant des décisions presque instantanément. De même, le développement de fournisseurs de services de données blockchain progresse vers la construction de flux de données blockchain. Les fournisseurs de services d'indexation traditionnels ont successivement lancé des produits qui obtiennent des données blockchain en temps réel via des flux de données, tels que les sous-flux de The Graph et le miroir de Goldsky, ainsi que des lacs de données en temps réel comme Chainbase et SubSquid qui génèrent des flux de données basés sur les blockchains.
Ces services visent à répondre à la demande de traitement en temps réel des transactions de la blockchain et à offrir des capacités de requête plus complètes. Tout comme l'architecture "stream-first" révolutionne le traitement et la consommation des données dans les pipelines de données traditionnels en réduisant la latence et en améliorant la réactivité, ces fournisseurs de flux de données de la blockchain cherchent également à soutenir le développement de plus d'applications et à aider à l'analyse des données on-chain grâce à des sources de données plus avancées et matures.
En redéfinissant les défis des données on-chain du point de vue des pipelines de données modernes, nous pouvons envisager la gestion, le stockage et la fourniture de données on-chain sous un nouvel angle, réalisant ainsi leur plein potentiel. Lorsque nous commençons à voir les sous-graphiques et les services d'indexation Ethereum ETL comme des flux de données au sein du pipeline de données plutôt que des sorties finales, nous pouvons envisager un monde possible où des ensembles de données haute performance sont adaptés à tout cas d'utilisation commercial.
3.1 Le Graphique
Le réseau Graph offre des services d’indexation et de requête de données multi-chaînes grâce à un réseau décentralisé de nœuds, ce qui permet aux développeurs d’indexer facilement les données de la blockchain et de créer des applications décentralisées. Ses principaux modèles de produits incluent le marché de l’exécution des requêtes de données et le marché du cache d’indexation des données, qui répondent tous deux aux besoins des utilisateurs en matière de requêtes de produits. Le marché de l’exécution des requêtes de données fait spécifiquement référence aux consommateurs qui paient des nœuds d’index appropriés pour les données dont ils ont besoin, tandis que le marché du cache d’indexation des données implique que les nœuds d’index allouent des ressources en fonction de facteurs tels que la popularité historique de l’indexation des sous-graphes, les frais de requête collectés et la demande des curateurs on-chain pour les sorties de sous-graphes.
Les sous-graphes sont les structures de données fondamentales au sein du réseau The Graph. Ils définissent comment extraire et transformer les données de la blockchain en un format interrogeable (par exemple, un schéma GraphQL). Tout le monde peut créer un sous-graphe, et plusieurs applications peuvent réutiliser ces sous-graphes, ce qui améliore la réutilisabilité des données et l'efficacité opérationnelle.
Le réseau Graph se compose de quatre rôles clés : Indexeurs, Délégués, Curateurs et Développeurs, qui travaillent tous ensemble pour fournir un support de données aux applications Web3. Leurs responsabilités respectives sont les suivantes :
· Indexeurs : Les indexeurs sont des opérateurs de nœuds au sein du réseau The Graph qui participent en misant des GRT (le jeton natif de The Graph). Ils fournissent des services d'indexation et de traitement de requêtes.
· Délégataires: Les délégataires sont des utilisateurs qui misent des jetons GRT pour soutenir le fonctionnement des nœuds d'index. Ils gagnent une partie des récompenses en fonction des nœuds d'index auxquels ils délèguent.
· Curateurs : Les curateurs sont responsables de signaler quels sous-graphiques devraient être indexés par le réseau. Ils aident à garantir que les sous-graphiques de valeur sont priorisés pour le traitement.
· Développeurs : Contrairement aux trois rôles précédents, les développeurs sont le côté demande et sont les principaux utilisateurs de The Graph. Ils créent et soumettent des sous-graphes au réseau The Graph, en attendant que le réseau réponde à leurs besoins en matière de données.
3.1 Le Graphique
Le Graph est maintenant entièrement passé à un service d'hébergement de sous-graphes décentralisé, avec des incitations économiques circulant entre les différents participants pour garantir le fonctionnement du système :
· Récompenses de l'indexeur : Les indexeurs gagnent des revenus grâce aux frais de requête des consommateurs et une partie des récompenses de blocs de jetons GRT.
· Récompenses des délégants : Les délégants reçoivent une part des récompenses des indexeurs qu'ils soutiennent.
· Récompenses du conservateur : Si les conservateurs signalent des sous-graphiques précieux, ils peuvent gagner une partie des frais de requête.
En fait, les produits de The Graph évoluent rapidement dans la vague de l'IA. En tant que l'une des équipes de développement principales de l'écosystème de The Graph, Semiotic Labs s'est concentrée sur l'utilisation de la technologie de l'IA pour optimiser la tarification de l'indexation et l'expérience de requête de l'utilisateur. Actuellement, les outils développés par Semiotic Labs, tels que AutoAgora, Allocation Optimizer et AgentC, améliorent différents aspects des performances de l'écosystème.
· AutoAgora introduit un mécanisme de tarification dynamique qui ajuste les prix en temps réel en fonction du volume de requêtes et de l'utilisation des ressources, optimisant les stratégies de tarification pour garantir la compétitivité de l'indexeur et maximiser les revenus.
· Allocation Optimizer résout les problèmes complexes liés à l’allocation des ressources des sous-graphes, en aidant les indexeurs à obtenir une configuration optimale des ressources afin d’améliorer les revenus et les performances.
· AgentC est un outil expérimental qui permet aux utilisateurs d'accéder aux données de blockchain de The Graph en utilisant un langage naturel, améliorant ainsi l'expérience utilisateur.
L'application de ces outils a permis à The Graph d'améliorer encore l'intelligence du système et la convivialité avec l'assistance de l'IA.
3.2 Chainbase
Chainbase est un réseau de données complet qui intègre toutes les données de la blockchain dans une seule plateforme, ce qui facilite la création et la maintenance d'applications pour les développeurs. Ses fonctionnalités uniques comprennent :
· Lac de données en temps réel : Chainbase fournit un lac de données en temps réel spécifiquement pour les flux de données de la blockchain, permettant un accès instantané aux données telles qu'elles sont générées.
· Architecture à double chaîne : Chainbase est construit sur Eigenlayer AVS, créant une couche d'exécution qui fonctionne en parallèle avec l'algorithme de consensus de CometBFT. Cette conception améliore la programmabilité et la composabilité des données entre chaînes, prend en charge un débit élevé, une faible latence et une finalité, tout en améliorant la sécurité du réseau grâce à un modèle de double-staking.
· Norme de format de données innovante : Chainbase introduit une nouvelle norme de format de données appelée « manuscrits », optimisant la structuration et l'utilisation des données dans l'industrie crypto.
· Modèle Cryptoworld: Avec ses ressources étendues de données de blockchain, Chainbase combine la technologie des modèles d'IA pour créer des modèles d'IA qui comprennent, prédisent et interagissent efficacement avec les transactions de blockchain. Le modèle de base, Theia, est maintenant disponible pour une utilisation publique.
Ces fonctionnalités distinguent Chainbase des protocoles d'indexation de la blockchain, en mettant l'accent sur l'accessibilité des données en temps réel, les formats de données innovants et la création de modèles plus intelligents grâce à l'intégration de données sur la chaîne et hors chaîne pour améliorer les connaissances.
Le modèle d'IA de Chainbase, Theia, est un point fort clé qui le différencie des autres protocoles de services de données. Basé sur le modèle DORA de NVIDIA, Theia apprend et analyse les modèles cryptographiques en intégrant des données on-chain et off-chain ainsi que des activités spatiotemporelles. Grâce à un raisonnement causal, il répond pour approfondir l'exploration de la valeur potentielle et des modèles des données on-chain, offrant aux utilisateurs des services de données plus intelligents.
Les services de données activés par l'IA ont transformé Chainbase d'une simple plateforme de services de données blockchain en un fournisseur de services de données intelligents plus compétitif. Avec des ressources de données robustes et une analyse proactive de l'IA, Chainbase peut offrir des perspectives de données plus larges et optimiser les flux de traitement des données des utilisateurs.
3.3 Espace et temps
Space and Time (SxT) vise à créer une couche de calcul vérifiable qui étend les preuves de connaissance nulle sur un entrepôt de données décentralisé, fournissant un traitement de données fiable pour les contrats intelligents, les grands modèles de langage et les entreprises. Space and Time a récemment sécurisé 20 millions de dollars lors de sa dernière levée de fonds de série A, dirigée par Framework Ventures, Lightspeed Faction, Arrington Capital et Hivemind Capital.
Dans le domaine de l'indexation et de la vérification des données, Space and Time introduit une nouvelle approche technique - Proof of SQL. Il s'agit d'une technologie innovante de preuve de connaissance nulle (ZKP) développée par Space and Time qui garantit que les requêtes SQL exécutées sur l'entrepôt de données décentralisé sont infalsifiables et vérifiables. Lorsqu'une requête est exécutée, Proof of SQL génère une preuve cryptographique qui vérifie l'intégrité et l'exactitude des résultats de la requête. Cette preuve est ajoutée aux résultats de la requête, permettant à tout vérificateur (comme les contrats intelligents) de confirmer indépendamment que les données n'ont pas été altérées pendant leur traitement. Les réseaux blockchain traditionnels reposent généralement sur des mécanismes de consensus pour vérifier l'authenticité des données, tandis que le Proof of SQL de Space and Time met en œuvre une méthode de vérification des données plus efficace. Plus précisément, dans le système de Space and Time, un nœud est responsable de l'acquisition de données tandis que d'autres nœuds utilisent la technologie zk pour vérifier l'authenticité de ces données. Cette approche permet de réduire la consommation de ressources liée à l'indexation redondante des mêmes données par plusieurs nœuds afin d'atteindre un consensus, améliorant ainsi les performances globales du système. À mesure que cette technologie mûrit, elle sert de pierre angulaire pour les industries traditionnelles axées sur la fiabilité des données afin de construire des produits basés sur les données de la blockchain.
Parallèlement, SxT collabore étroitement avec le laboratoire d'innovation conjointe d'IA de Microsoft pour accélérer le développement d'outils d'IA générative, permettant aux utilisateurs de traiter facilement les données blockchain grâce au langage naturel. Actuellement, dans Space and Time Studio, les utilisateurs peuvent saisir des requêtes en langage naturel et l'IA les convertira automatiquement en SQL et exécutera la requête au nom de l'utilisateur pour présenter les résultats finaux nécessaires.
3.4 Comparaison des différences
En résumé, la technologie d'indexation des données de la blockchain a évolué à partir des sources de données initiales des nœuds, en passant par le développement d'analyseurs de données et d'indexeurs, jusqu'à un service de données complet basé sur l'IA, marquant un processus d'amélioration progressive. Cette évolution continue de la technologie améliore non seulement l'efficacité et la précision de l'accès aux données, mais offre également aux utilisateurs une expérience intelligente sans précédent.
En regardant vers l'avenir, avec le développement continu de nouvelles technologies telles que l'IA et les preuves de non-divulgation, les services de données de la blockchain deviendront encore plus intelligents et sécurisés. Nous avons des raisons de croire que les services de données de la blockchain continueront de jouer un rôle vital en tant qu'infrastructure, fournissant un soutien solide pour le progrès et l'innovation dans l'industrie.
Cet article est reproduit à partir de [Trustless Labs], le droit d'auteur appartient à l'auteur original [Trustless Labs], si vous avez des objections à la reproduction, veuillez contacter le Gate Learnl'équipe et l'équipe s'en occuperont dès que possible conformément aux procédures pertinentes.
Avertissement : Les points de vue et opinions exprimés dans cet article ne représentent que les opinions personnelles de l'auteur et ne constituent pas des conseils en investissement.
Les autres versions linguistiques de l'article sont traduites par l'équipe Gate Learn et ne sont pas mentionnées dans Gate.io, l'article traduit ne peut être reproduit, distribué ou plagié.