Web3データインデックストラックの読み取り、インデックス、および分析の概要

本文では、ブロックチェーンデータのアクセシビリティの発展について、The Graph、Chainbase、Space and Timeの3つのデータサービスプロトコルのアーキテクチャとAI技術の適用特性を比較し、ブロックチェーンデータサービスが知能化とセキュリティ向上に向けて発展し、将来も業界の基盤インフラとして重要な役割を果たすことを指摘しています。

1. イントロダクション

2017年に最初の波のdAppであるEtheroll、ETHLend、CryptoKittiesが始まり、さまざまな金融、ゲーム、ソーシャルdAppが異なるブロックチェーンに基づいて発展しました。分散化のオンチェーンアプリについて話すとき、これらのdAppが採用するさまざまなデータソースについて考えたことはありますか？

2024年、AIとWeb3が焦点となり、人工知能の世界では、データは成長と進化の源泉のようなものです。植物が日光と水に依存して健やかに育つように、AIシステムも膨大なデータに依存して絶えず"学習"と"考える"必要があります。データがなければ、AIのアルゴリズムはどんなに精巧でも虚飾に過ぎず、その持つべき知能と効能を発揮することはできません。

本文は、ブロックチェーンのデータアクセシビリティ（データの利用可能性）の観点から、業界の発展過程でのブロックチェーンデータインデックスの進化について詳しく分析し、伝統的なデータインデックスプロトコルであるThe Graphと新興のブロックチェーンデータサービスプロトコルであるChainbaseとSpace and Timeを比較し、特にAI技術を組み合わせたこれら2つの新しいプロトコルのデータサービスと製品アーキテクチャの特徴の違いについて探究しています。

2. データインデックスの繁簡：ブロックチェーンノードからフルチェーンデータベースへ

2.1 データのソース：ブロックチェーンノード

「ブロックチェーンとは何か」を理解し始めると、よく「ブロックチェーンは分散化された台帳である」という言葉を見かけます。ブロックチェーンノードは、ブロックチェーンネットワーク全体の基盤であり、チェーン上のすべてのトランザクションデータの記録、保存、および伝播の責任を負っています。各ノードは完全なブロックチェーンデータのコピーを持ち、ネットワークの分散性を維持することを保証します。しかし、一般のユーザーにとって、自分自身でブロックチェーンノードを構築および維持することは容易ではありません。これには専門的な技術能力だけでなく、高いハードウェアおよび帯域幅のコストも伴います。また、一般のノードは開発者が必要とする形式でデータをクエリする能力にも限界があります。したがって、理論的には誰でも自分自身のノードを実行することができますが、実際の操作では、ユーザーは通常、第三者のサービスに依存する傾向があります。

この問題を解決するために、RPC（リモートプロシージャコール）ノードプロバイダが登場しました。これらのプロバイダは、ノードのコストと管理を担当し、RPCエンドポイントを介してデータを提供します。これにより、ユーザーはノードを自分で構築する必要なく、簡単にブロックチェーンデータにアクセスできます。公共RPCエンドポイントは無料ですが、速度制限があり、dAppのユーザーエクスペリエンスに悪影響を与える可能性があります。プライベートRPCエンドポイントは、混雑を減らすことでより良いパフォーマンスを提供しますが、単純なデータ検索でも多くの往復通信が必要です。これにより、リクエストが重く、複雑なデータクエリの効率が低下する可能性があります。さらに、プライベートRPCエンドポイントは通常拡張性が低く、異なるネットワーク間の互換性がないことが多いです。ただし、ノードプロバイダの標準化されたAPIインターフェイスにより、ユーザーはオンチェーンのデータにより低いハードルでアクセスでき、後続のデータ解析やアプリケーションに基盤を提供することができます。

2.2 データ解析：元のデータから使用可能なデータへ

ブロックチェーンノードから取得されるデータは通常、暗号化およびエンコーディング処理が施された元のデータです。これらのデータはブロックチェーンの完全性とセキュリティを保持していますが、データの解析の難度も増しています。一般のユーザーや開発者にとって、これらの元のデータを直接処理するには、多くの技術知識と計算リソースが必要です。

この背景の下で、データ解析のプロセスは特に重要です。複雑な原型データを解析して、より理解しやすく操作しやすい形式に変換することで、ユーザーはこれらのデータをより直感的に理解して活用することができます。データ解析の成功はブロックチェーンデータアプリケーションの効率と効果に直接影響し、全体のデータインデックスプロセスにおける重要なステップです。

2.3 データインデクサーの進化

ブロックチェーンデータの増加に伴い、データインデクサの需要もますます増加しています。インデクサはオンチェーンデータを整理し、データベースに送信してクエリを容易にする重要な役割を果たしています。インデクサの動作原理は、ブロックチェーンデータをインデクス化し、GraphQLなどのSQLに似たクエリ言語を使用してデータをリアルタイムに利用できるようにすることです。クエリデータの統一されたインターフェースを提供することで、インデクサは開発者が必要な情報を迅速かつ正確に検索するための標準化されたクエリ言語を使用できるようにし、プロセスを大幅に簡素化します。

さまざまなタイプのインデクサーがデータ検索を最適化するためにさまざまな方法で使用されています：

・完全ノードインデクサ：これらのインデクサは完全なブロックチェーンノードを実行し、データを直接取得するため、データの完全性と正確性を確保しますが、大量のストレージおよび処理能力が必要です。

・軽量インデクサー：これらのインデクサーは、必要に応じてフルノードに特定のデータを取得させることにより、ストレージ要件を減らすが、クエリ時間が増加する可能性があります。

・専用インデクサー：これらのインデックサーは、特定のデータタイプや特定のブロックチェーンに特化しており、代替不可能トークンのような特定のユースケースの検索を最適化することができます。また、分散型金融取引の場合も同様です。

・集約インデクサー：これらのインデクサーは、複数のブロックチェーンやソースからデータを抽出し、オフチェーン情報を含めて統一されたクエリインターフェースを提供します。これは、マルチチェーンのdAppにとって特に役立ちます。

現在、イーサリアムのアーカイブノードはGethクライアントのアーカイブモードで約13.5TBのストレージスペースを占有し、Erigonクライアントではアーカイブ要件が約3TBである。ブロックチェーンがますます上昇するにつれて、アーカイブノードのデータストレージ量も増加していきます。このように膨大なデータ量に直面する場合、主要なインデックスプロトコルは、複数のチェーンインデックスをサポートするだけでなく、さまざまなアプリケーションのデータ要件に応じて、データ解析フレームワークをカスタマイズしています。例えば、The Graphの「サブグラフ」フレームワークは典型的な例です。

インデックス作成ツールの出現により、データのインデックス作成と検索効率が大幅に向上しました。従来のRPCエンドポイントと比較して、インデックス作成ツールは大量のデータを効率的にインデックス作成し、高速な検索をサポートできます。これらのインデックス作成ツールにより、ユーザーは複雑なクエリを実行し、データを簡単にフィルタリングし、抽出後に分析することができます。また、いくつかのインデックス作成ツールは、複数のブロックチェーンからデータソースを集約することもサポートしており、多数のチェーンを必要とするdAppにおいて、複数のAPIをデプロイする必要がなくなります。複数のノードで分散実行することにより、インデックス作成ツールは、より強力なセキュリティとパフォーマンスを提供するだけでなく、集中型RPCプロバイダが中断や停止のリスクを引き起こす可能性も減らします。

それに対して、インデクサは事前に定義されたクエリ言語を通じて、ユーザーが基礎となる複雑なデータを処理することなく、必要な情報を直接取得できるようにします。このメカニズムにより、データの検索効率と信頼性が大幅に向上し、ブロックチェーンデータへのアクセスが重要なイノベーションとなっています。

2.4 フルチェーンデータベース:ストリームへのアライメントを優先

索引ノードを使用してデータを問い合わせることは通常、APIがオンチェーンデータの唯一のゲートウェイとなることを意味します。しかし、プロジェクトが拡大すると、より柔軟なデータソースが必要になることがしばしばあります。標準化されたAPIでは提供できないことです。アプリケーション要件が複雑化するにつれ、初等データインデクサとその標準化されたインデックス形式では、検索、クロスチェーンインタラクションアクセス、またはオフチェーンデータマッピングなど、ますます多様化するクエリ要件を満たすのが難しくなってきています。

現代のデータパイプラインアーキテクチャでは、「フローファースト」アプローチが従来のバッチ処理の制約を解決する一つの解決策となり、リアルタイムのデータ取込み、処理、分析を実現できます。このパラダイムの変化により、組織は入力データに対して即座に応答し、ほぼリアルタイムで洞察を得て意思決定を行うことが可能となります。同様に、ブロックチェーンデータサービスプロバイダーの開発もブロックチェーンデータフローの構築に向けて進んでおり、従来のインデクサーサービスプロバイダーはリアルタイムなブロックチェーンデータをデータフロー形式で取得する製品を相次いで発売しています。例えば、The GraphのSubstreamsやGoldskyのMirror、ChainbaseやSubSquidなどの、ブロックチェーンからデータフローを生成するリアルタイムデータ湖があります。

これらのサービスは、ブロックチェーン取引のリアルタイム解析とより包括的なクエリ機能のニーズに対処するために提供されています。同様に、「フロー優先」アーキテクチャは、ドロップレイテンシーと応答能力の向上によって、従来のデータパイプラインのデータ処理と消費方法を革新しました。これらのブロックチェーンデータフローサービスプロバイダは、より先進的かつ成熟したデータソースによって、より多くのアプリケーションの開発をサポートし、オンチェーンデータ分析を補助することを目指しています。

現代的なデータパイプラインの視点から、オンチェーンデータの課題を再定義することで、オンチェーンデータの管理、保存、提供に関するすべての潜在能力を新しい視点から見ることができます。サブグラフやETHブロックチェーンETLなどのインデックサを、データパイプライン内のデータフローとして捉えると、あらゆるビジネスケースに合わせて高性能なデータセットをカスタマイズできる可能な世界を想像することができます。

3. AI+データベース? The Graph、Chainbase、Space and Timeの詳細な比較

3.1 グラフ

The Graphネットワークは、分散化のノードネットワークを通じて、マルチチェーンデータのインデックスとクエリサービスを実現し、開発者がブロックチェーンデータを簡単にインデックスし、分散型アプリケーションを構築できるよう促進します。主要な製品モデルはデータクエリ実行市場とデータインデックスキャッシュ市場であり、これら2つの市場はどちらもユーザーの製品クエリ需要に対応するものであり、データクエリ実行市場では、消費者が必要なデータを適切なインデックスノードに支払い、データインデックスキャッシュ市場では、インデックスノードがサブグラフの過去のインデックスの人気、クエリ料金、オンチェーンのキュレーターによるサブグラフの出力ニーズに基づいてリソースを割り当てる市場です。

サブグラフ（Subgraphs）はThe Graphネットワークの基本的なデータ構造です。サブグラフは、ブロックチェーンからデータを抽出してクエリ可能な形式（例えばGraphQLスキーマ）に変換する方法を定義します。誰でもサブグラフを作成することができ、複数のアプリケーションでこれらのサブグラフを再利用することができます。これにより、データの再利用性と使用効率が向上します。

The Graphネットワークは、インデックサー、キュレーター、デリゲート、およびデベロッパーの4つの重要な役割で構成されており、彼らは共同でweb3アプリケーションにデータサポートを提供しています。以下に彼らのそれぞれの責任を示します。

· インデクサ（Indexer）：インデクサはThe Graphネットワークのノードオペレータであり、インデックス節はGRT（The Graphのネイティブトークン）をステークしてネットワークに参加し、インデックスとクエリ処理サービスを提供します。

・委託者（Delegator）：委託者は、GRTトークンをステークしてインデックスノードをサポートするために利用するユーザーです。委託者は、委託したインデックスノードから一部の報酬を受け取ります。

· キュレーター（Curator）：キュレーターは、ネットワークがどのサブグラフをインデックスする必要があるかを決定する責任を持ちます。キュレーターは価値のあるサブグラフが優先的に処理されるように支援します。

・開発者（Developer）：前述の3者とは異なり、開発者は需要側であり、The Graphの主要なユーザーです。彼らはサブグラフを作成し、The Graphネットワークに提出し、需要データが満たされるのを待ちます。01928374656574839201

現在、The Graph は完全に分散型のサブグラフホスティングサービスに移行し、異なる参加者間で経済的インセンティブが循環し、システムの運営が確保されています。

・索引ノード奨励：索引ノードは消費者のクエリ料金と一部のGRTトークンブロック報酬によって収益を得ます。

・委託者報酬：委託者は、彼らが支援するインデックスノードから一部の報酬を受け取ります。

· キュレーター報酬：キュレーターが価値のあるサブグラフをシグナルした場合、彼らはクエリ料金から一部の報酬を受け取ることができます。

実際には、The Graphの製品もAIの波に迅速に成長しています。 The Graphエコシステムの中核開発チームの1つであるSemiotic Labsは、AI技術を活用してインデックス価格設定とユーザークエリエクスペリエンスを最適化することに取り組んできました。現在、Semiotic Labsが開発したAutoAgora、Allocation Optimizer、AgentCツールは、それぞれエコシステムのパフォーマンスを向上させています。

・AutoAgoraは、クエリ量とリソースの使用状況に基づいて価格をリアルタイムで調整し、価格設定戦略を最適化し、インデクサーの競争力と収益を最大化する動的価格設定メカニズムを導入しています。

・Allocation Optimizerは、サブグラフのリソース割り当ての複雑な問題を解決し、インデックス作成者が収益とパフォーマンスを向上させるために最適なリソース構成を実現するのを支援します。

· AgentCは、自然な言語でThe Graphのブロックチェーンデータにアクセスすることを可能にする実験的なツールであり、ユーザーエクスペリエンスを向上させます。

これらのツールの使用により、The GraphはAIのサポートを組み合わせて、システムの知能化とユーザーフレンドリーさをさらに向上させることができます。

3.2 チェーンベース

Chainbaseは、すべてのブロックチェーンデータを1つのプラットフォームに統合し、開発者がアプリケーションをより簡単に構築およびメンテナンスすることができる全体的なデータネットワークです。その特徴的な機能には、

・リアルタイムデータ湖：Chainbaseは、ブロックチェーンのデータフローに特化したリアルタイムデータ湖を提供し、データが生成された時点で即時にアクセスできるようにします。

・双鎖アーキテクチャ：ChainbaseはEigenlayer AVSに基づいて実行レイヤーを構築し、CometBFTのコンセンサスアルゴリズムと並行する双鎖アーキテクチャを形成しています。この設計により、クロスチェーンインタラクションデータのプログラム可能性と組み合わせ可能性が向上し、高スループット、低レイテンシー、および最終性がサポートされ、またダブルステークモデルによりネットワークのセキュリティが向上しています。

・新しいデータフォーマット規格の導入：Chainbaseは「手稿」という新しいデータフォーマット規格を導入し、暗号化業界のデータの構造化と利用の方法を最適化しました。

・暗号化世界モデル：Chainbaseは、その大規模なブロックチェーンデータリソースとAIモデル技術を組み合わせて、ブロックチェーン取引を効果的に理解し、予測し、相互作用することができるAIモデルを構築しました。現在、一般の方に利用していただける基本バージョンのモデルTheiaがリリースされています。

これらの機能により、Chainbaseはブロックチェーンインデックスプロトコルで特にリアルタイムデータのアクセシビリティ、革新的なデータフォーマット、およびオンチェーンとオフチェーンデータの組み合わせを重視し、よりスマートなモデルを作成して洞察力を高めることに焦点を当てています。

ChainbaseのAIモデルTheiaは、他のデータサービスプロトコルとは異なる重要なポイントです。Theiaは、NVIDIAが開発したDORAモデルに基づき、オンチェーンおよびオフチェーンデータ、時空活動を組み合わせて学習し、暗号化パターンを分析し、因果推論を用いて応答を行い、オンチェーンデータの潜在的な価値や規則を探求し、ユーザーによりスマートなデータサービスを提供します。

AIを活用したデータサービスにより、Chainbaseはもはや単なるブロックチェーンデータサービスプラットフォームではなく、より競争力のあるインテリジェントなデータサービスプロバイダーとなっています。 Chainbaseは、強力なデータリソースとAIのプロアクティブな分析を通じて、より幅広いデータインサイトを提供し、ユーザーのデータ処理プロセスを最適化することができます。

3.3 空間と時間

Space and Time (SxT) は、分散化されたデータウェアハウス上でゼロ知識証明を拡張し、スマートコントラクト、大規模言語モデル、および企業に信頼性のあるデータ処理を提供することを目指しています。現在、Space and Time はFramework Ventures、Lightspeed Faction、Arrington Capital、およびHivemind Capitalのリード投資により、最新のシリーズAラウンドで2000万ドルの資金調達を実施しました。

データのインデックスと検証の領域で、Space and TimeはProof of SQLという新しい技術路線を導入しました。これは、Space and Timeが開発した新しいゼロ知識証明（ZKP）技術であり、分散データウェアハウス上で実行されるSQLクエリが改ざんされていないことと検証可能であることを保証します。クエリを実行する際に、Proof of SQLは暗号化証明を生成し、クエリ結果の完全性と正確性を検証します。この証明はクエリ結果に付加され、任意のバリデータ（スマートコントラクトなど）がデータが改ざんされていないことを独立して確認できます。従来のブロックチェーンネットワークは通常、データの真正性を検証するためにコンセンサスメカニズムに依存していますが、Space and TimeのProof of SQLはより効率的なデータ検証方法を実現しています。具体的には、Space and Timeのシステムでは、1つのノードがデータの取得を担当し、他のノードはzk技術を使用してそのデータの真正性を検証します。この方法により、複数のノードが同じデータを重複してインデックスするためのリソース消費を回避し、システムの全体的なパフォーマンスを向上させることができます。この技術の成熟とともに、データの信頼性を重視するさまざまな伝統的な産業におけるブロックチェーンデータ構築製品の開発において基盤を提供します。

同時、SxTは常にマイクロソフトAIとの共同イノベーション実験室と密接に連携しており、生成型AIツールの研究開発を加速させています。これにより、ユーザーは自然言語処理を介してブロックチェーンデータにより容易にアクセスできます。現在、Space and Time Studioでは、ユーザーは自然言語クエリを入力し、AIが自動的にSQLに変換し、ユーザーの要求する最終結果を表示するクエリを実行することができます。

3.4 相違の比較

4. 結論と展望

総じて、ブロックチェーンデータインデックス技術は最初のノードデータソースから、データ解析とインデクサーの発展を経て、最終的にAIエンパワード全体のデータサービスに発展し、段階的に完璧なプロセスを経験しました。これらの技術の進化により、データアクセスの効率と正確性が向上するだけでなく、ユーザーに前代未聞のスマート体験をもたらしました。

展望未来、AI技術やzk-SNARKsなどの新技術の発展により、ブロックチェーンデータサービスはさらにスマート化およびセキュリティ化されます。我々は、ブロックチェーンデータサービスが将来的にも基盤として重要な役割を果たし、業界の進歩とイノベーションを力強くサポートすると信じています。

免責事項:

本記事は[Trustless Labs](https://x.com/TrustlessLabs/status/1833815530647834843)]からの転載であり、著作権は原著作者[**[Trustless Labs](https://x.com/TrustlessLabs転載に異議がある場合は、[Gate Learn](https://www.gate.io/questionnaire/3967チームに連絡していただければ、チームは関連するプロセスに従ってできるだけ早く対処します。
免責事項：この記事に表現されている視点や意見は著者個人のものであり、投資アドバイスを意味するものではありません。
記事の他の言語版はGate Learnチームによって翻訳されており、[Gate.io](http://Gate.io)に言及されていない場合、翻訳された記事をコピー、配布、または盗用することはできません。