人工知能とブロックチェーン技術は、世界を根本から変える2つの変革的な力を表しています。AIは機械学習やニューラルネットワークを通じて人間の認知能力を拡張し、一方でブロックチェーン技術は検証可能なデジタルの希少性を導入し、信頼できる新しい形態の信頼なしの調整を可能にします。これらの技術が収束すると、自律エージェントが分散型システムと相互作用するインターネットの新しいイテレーションの基盤を築いています。この「エージェンティック・ウェブ」は、新しいデジタル市民のクラスを導入し、AIエージェントが独立してナビゲート、交渉、取引することができます。この変革はデジタル領域での権力を再分配し、個人がデータの主権を取り戻し、人間と人工知能が前例のない方法で協力する生態系を育成しています。
我々が向かっている方向を理解するためには、まず、Webの進化を追跡し、それぞれが異なる機能と建築パラダイムによって特徴付けられた主要なイテレーションをたどることが必要です。
最初の2世代のWebは情報伝播に焦点を当てていましたが、後の2世代は情報の拡張を可能にします。Web 3.0ではトークンを通じたデータの所有権が導入され、Web 4.0では大規模な言語モデル(LLM)を通じて知能が与えられます。
LLMsは、確率的計算を通じて広範な知識を文脈理解に変える、動的なパターンマッチングシステムとして機能する、機械知能の飛躍を示しています。しかし、彼らの真の潜在能力は、純粋な情報処理装置から目標指向の実体に進化し、知覚、推論、行動ができるようにすることで現れます。この変換により、言語と行動の両方を通じた持続的で意味のある協力が可能な、新たな知能が生まれます。
「エージェント」という用語は、従来のチャットボットの制限や負の関連性を超えた、人間とAIの相互作用における新しいパラダイムを提供します。この変化は単なる意味論的なものではなく、AIシステムが自律的に操作しながら、人間との有意義な協力関係を維持する方法に関する基本的な再構想を表しています。基本的に、エージェントワークフローを活用することで、特定のユーザー意図を解決するためのマーケットプレイスが形成されることが可能になります。
最終的に、エージェンティックウェブは単なる新しい知能の層以上のものを表しています—それは我々がデジタルシステムとやり取りする方法を根本的に変えます。従来のウェブの進化は静的なインターフェースと予め定義されたユーザージャーニーに依存していましたが、エージェンティックウェブはユーザーのコンテキストと意図にリアルタイムで適応する動的なランタイムインフラストラクチャを導入しています。
従来のウェブサイトは、固定されたインタフェースを提供し、ユーザーが予め決められた経路を通じて情報を読み書きし、相互作用するインターネットの基本単位として機能します。このモデルは機能的ですが、一般的なユースケースに対応するために設計されたインタフェースにユーザーを制約します。エージェンティックウェブは、コンテキストに応じた計算、適応型インターフェース生成、RAGおよびその他のリアルタイム情報検索の革新によって、これらの制約から解放されます。
TikTokが高度に個人化されたフィードを作成し、リアルタイムでユーザーの好みに適応することによって、コンテンツ消費を革新した方法を考えてみてください。 Agentic Webは、このコンセプトをコンテンツ推奨からインターフェイス全体の生成に拡張しています。 固定されたウェブページのレイアウトをナビゲートする代わりに、ユーザーは次のアクションを予測し促進する動的に生成されたインターフェースとやり取りします。 この静的なウェブサイトから動的な、エージェント駆動のインターフェースへの移行は、我々がデジタルシステムとやり取りする方法の根本的な進化を表しており、ナビゲーションベースのインテントベースの相互作用モデルへの移行を示しています。
エージェントアーキテクチャは、研究者やビルダーの間で大きな探求の対象となっています。彼らの推論と問題解決能力を向上させるために、常に新しい方法が開発されています。Chain-of-Thought(CoT)、Tree-of-Thought(ToT)、Graph-of-Thought(GoT)などの技術は、LLMがより微妙で人間のような認知プロセスをシミュレートすることで、複雑なタスクを処理する能力を向上させるための革新的な例です。
Chain-of-Thought (CoT) プロンプティングは、大規模な言語モデル(LLM)が複雑なタスクを小さな管理可能なステップに分解することを促すものです。このアプローチは、短いPythonスクリプトの作成や数学の方程式の解決など、論理的な推論が必要な問題に特に効果的です。
Tree-of-Thoughts (ToT)はCoTを基盤としており、複数の独立した思考経路の探索を可能にするツリー構造を導入しています。この拡張により、LLMはより複雑なタスクにも対応できるようになります。ToTでは、各「思考」(LLMからのテキスト出力)は、その直前または直後の思考とだけ直接的に接続されています(ツリーの枝内で)。この構造はCoTよりも柔軟性を提供しますが、アイデアの相互交流の可能性をまだ制限しています。
Graph-of-Thought(GoT)は、クラシックなデータ構造をLLM(Lifelong Machine Learning)と融合させることで、概念をさらに発展させます。このアプローチは、グラフ構造内で任意の「思考」が他のどの思考にもリンクできるようにすることで、ToTを拡張します。これにより、思考の連結されたネットワークは、より人間の認知プロセスに近くなります。
GoTのグラフ構造は、ほとんどのシナリオでCoTまたはToTと比較して、人間の思考のより正確な表現を提供する可能性があります。私たちの思考パターンが鎖または木に似ている場合もある(例えば、緊急時計画や標準作業手順を開発する場合など)が、これらは通常の場合とは例外です。このモデルは、思考が厳格な順序に従うのではなく、しばしば様々な思考を飛び越える人間の思考をよりよく反映しています。緊急時計画や標準手順を開発するような一部のシナリオでは、まだ鎖または木のような構造に従う場合がありますが、私たちの心は通常、複雑で相互に関連するアイデアのウェブを作り出します。
GoTにおけるこのグラフのようなアプローチは、アイデアのより動的かつ柔軟な探求を可能にし、結果としてLLMのより創造的かつ包括的な問題解決能力をもたらす可能性があります。
これらの再帰的なグラフベースの操作は、エージェントワークフローへの一歩に過ぎません。明らかな次の進化は、特定の目標に向けて編成されるそれぞれが独自の専門化を持つ複数のエージェントです。エージェントの美しさは、その組み合わせにあります。
エージェントは、マルチエージェント調整を介してLLMをモジュラ化および並列化することを可能にします。
マルチエージェントシステムの概念は新しいものではありません。その起源はマービン・ミンスキーの「マインドの社会」にさかのぼります。この提案では、複数のモジュール化されたマインドが協力して働くことで、単一のモノリシックなマインドよりも優れたパフォーマンスを発揮できるとされています。ChatGPTとClaudeは単一のエージェントです。Mistralはエキスパートの混合を普及させました。このアイデアをさらに拡張し、私たちはエージェントのネットワークアーキテクチャをこのインテリジェンストポロジーの最終状態と考えています。
バイオミミクリーの観点からは、AIモデルとは異なり、何十億もの同一のニューロンが一様で予測可能な方法で接続されているAIモデルとは異なり、人間の脳(基本的には意識的な機械)は器官レベルや細胞レベルで非常に異質です。ニューロンは、神経伝達物質の勾配、細胞内カスケード、さまざまな調節システムを介して複雑な信号を介してコミュニケーションし、その機能は単純なバイナリ状態よりもはるかに微妙です。
これは、生物学において、知能は単にコンポーネントの数やトレーニングデータセットのサイズから生じるのではなく、多様で特化したユニット間の複雑な相互作用から生じることを示唆しています。それは本質的にアナログなプロセスです。
そのため、わずかな大規模モデルではなく何百万もの小規模モデルを開発し、これらのすべてのアクターの間でオーケストレーションを可能にするという考え方は、認知アーキテクチャの革新により近いものになる可能性があります。これは、マルチエージェントシステムに似たものです。
マルチエージェントシステムの設計は、シングルエージェントシステムよりもいくつかの利点があります: メンテナンスが容易で、理解しやすく、拡張性が高いです。単一エージェントのインターフェースのみが必要な場合でも、マルチエージェントフレームワーク内で実装することで、システムをよりモジュラーにすることができ、開発者が必要に応じてコンポーネントを追加または削除するプロセスを簡素化できます。単一エージェントシステムでさえも、マルチエージェントアーキテクチャは非常に効果的なシステム構築方法であることを認識することが重要です。
大規模言語モデル(LLM)は、人間らしいテキストの生成、複雑な問題の解決、さまざまなタスクの処理など、驚異的な能力を示していますが、個々のLLMエージェントは、実世界の応用において効果を妨げる可能性がある制限に直面しています。
以下では、エージェントシステムに関連する5つの主要な課題を検討し、マルチエージェントの協力がこれらの障壁を克服し、LLMsの完全な潜在能力を引き出す方法について探求します。
マルチエージェントシステムは、分散した問題解決とリソースの最適化において魅力的な利点を提供しますが、その真の可能性は、ネットワークのエッジでの実装を検討すると明らかになります。AIが進化し続ける中、マルチエージェントアーキテクチャとエッジコンピューティングの融合は強力な相乗効果を生み出し、コラボレーションインテリジェンスだけでなく、無数のデバイス間でローカライズされた効率的な処理を可能にします。AI導入に対するこの分散型アプローチは、マルチエージェントシステムの利点を自然に拡張し、専門的で協調的なインテリジェンスを、最も必要とされる場所、つまりエンドユーザーに近づけます。
AIの普及により、デジタル領域全体でのコンピューティングアーキテクチャの根本的な再構築が進んでいます。知能が日常のデジタルインタラクションの中に織り込まれるにつれ、私たちはコンピューティングの自然な二分化を目撃しています。特化したデータセンターが複雑な推論や特定のタスクを処理し、一方、エッジデバイスは個別化された、コンテキストに敏感なクエリをローカルで処理します。このエッジ推論への移行は単なるアーキテクチャの選好にすぎず、複数の重要な要因によって駆動される必然性です。
最初に、AIによる相互作用の膨大な量は中央集権化された推論プロバイダーを圧倒し、持続不能な帯域幅要求と遅延の問題を引き起こすでしょう。
さらに、エッジ処理により、自動車、拡張現実、IoTデバイスなどのアプリケーションに欠かせないリアルタイムの反応性が可能になります。
第三に、ローカルの推論は、個人のデバイス上で機密データを保持することによってユーザーのプライバシーを保護します。第四に、エッジコンピューティングは、データのネットワーク間の移動を最小限に抑えることで、エネルギー消費と炭素排出量を大幅に削減します。
最後に、エッジ推論はオフラインの機能と耐久性を可能にし、ネットワーク接続が妨げられた場合でもAIの機能が持続することを保証します。
この分散知能のパラダイムは、現在のシステムの最適化だけでなく、ますますつながりのある世界でAIを展開し、相互作用する方法を根本的に再構築するものです。
さらに、私たちはLLMの計算要求における根本的な変化を目撃しています。過去10年間は、大規模な言語モデルのトレーニングにおける膨大な計算要件に支配されてきましたが、現在は推論時間の計算が中心になる時代に入っています。この移行は、OpenAIのQ*のブレークスルーによって具体化されたエージェントAIシステムの出現に特に明白です。このブレークスルーは、ダイナミックな推論には実時間の計算リソースが大量に必要であることを示しています。
モデルの開発に一度の投資であるトレーニング時の計算とは異なり、推論時の計算は、自律エージェントが推論、計画、新しい状況に適応するために必要な継続的な計算ダイアログを表します。静的なモデルトレーニングから動的なエージェント推論への移行には、エッジコンピューティングが有利になるだけでなく、必須となるような、計算インフラストラクチャの根本的な見直しが必要です。
この変革が進むにつれて、私たちはピア・ツー・ピアのエッジ推論市場の出現を目撃しています。スマートフォンからスマートホームシステムまで、数十億の接続デバイスがダイナミックな計算メッシュを形成し、推論容量をシームレスに取引することができます。これにより、計算リソースが最も必要な場所に流れる有機的なマーケットプレイスが生まれます。アイドルデバイスの余剰計算能力は、リアルタイムで取引可能な貴重なリソースとなり、従来の中央集権型システムよりも効率的で強靭なインフラを実現します。
この推論コンピューティングの民主化は、リソース使用率を最適化するだけでなく、デジタルエコシステム内に新たな経済的機会を生み出し、接続されたすべてのデバイスがAI機能の潜在的なマイクロプロバイダーになります。したがって、AIの未来は、個々のモデルの力だけでなく、相互接続されたエッジデバイスの集合知によって特徴付けられ、需要と供給に基づく検証可能な推論のスポット市場に似た、グローバルで民主化された推論市場を形成します。
LLMは、従来のブラウジングではなく、会話を通じて膨大な情報にアクセスできるようになりました。この会話的なアプローチは、インターネットが人間のユーザーではなくAIエージェントのプラットフォームに変わるにつれ、ますます個人化され、ローカル化されるようになります。
ユーザーの視点からは、「最適なモデル」を特定することから、より個人に合った回答を得ることに焦点が移ります。より良い回答の鍵は、一般的なインターネットの知識に加えてユーザー自身のデータを組み込むことにあります。最初は、より大きなコンテキストウィンドウとRetrieval-Augmented Generation(RAG)が個人データを統合するのに役立ちますが、最終的には、個人データが一般的なインターネットデータよりも重要になります。
これにより、私たちはそれぞれが個人のAIモデルを持ち、より広範なインターネットの専門家モデルとやり取りする未来に進むことになります。最初は個人化がリモートモデルと並行して行われますが、プライバシーや応答速度に関する懸念が、より多くのやり取りをローカルデバイスに押し付けることになります。これにより、人間と機械の間ではなく、個人のモデルとインターネットの専門家モデルの間に新たな境界が生まれることになります。
従来のインターネットモデルによる生データのアクセスは時代遅れになります。代わりに、ローカルモデルはリモートの専門家モデルと通信し、情報を収集し、それを最も個人専用で、高帯域幅の方法であなたに提示します。これらの個人モデルは、より多くの情報を学習するにつれてますます不可欠になります。
インターネットは、ローカルな高コンテキストの個人モデルと、リモートな高知識の専門家モデルの相互接続エコシステムに変わります。これには、フェデレーテッドラーニングのような新しい技術が必要で、これらのモデル間の情報を更新するために使用されます。機械経済が進化するにつれ、主にコンピュート、スケーラビリティ、支払いに関して、これが発生する計算サブステートを再構想する必要があります。これにより、エージェント中心、主権、高度に合成可能、自己学習、進化する情報空間の再編成が行われます。
エージェンティックWebでは、人間とエージェントの相互作用がエージェント間の複雑な通信ネットワークに進化します。 このアーキテクチャは、主権を持つエージェントがデジタルインタラクションの主要なインタフェースになる、インターネットの構造の根本的な再考を提供します。 以下では、エージェントプロトコルに必要な基本的なプリミティブを強調します。
主権身元
自律エージェント
自己指向型のエンティティは、自然言語理解と意図の解決が可能です。
マルチステップ計画とタスク分解
リソース管理と最適化
相互作用やフィードバックから学ぶ
データインフラストラクチャー
ハイブリッドシステム結合:zkTLS
従来のトレーニングデータセット
リアルタイムのWebスクレイピングとデータ統合
RLHF (Reinforcement Learning from Human Feedback)ネットワーク分散フィードバック収集
品質重み付けコンセンサスメカニズム
コンピュートレイヤー
検証可能な推論プロトコル:計算の整合性を確保する
結果の再現性
リソース効率
ピアツーピアのコンピュートマーケットを備えた分散コンピュートインフラストラクチャ
計算証明システム
ダイナミックなリソース割り当て
モデルエコシステム
階層モデルアーキテクチャ:タスク固有のSLM(Small Language Models)
汎用LLMs
専門の多様なモデル
Coordination Frameworks
ディスピュート解決のためのガバナンスメカニズム
リソースの割り当て
並列実行環境を可能にし、同時タスク処理を行うことができます
リソースの分離
状態管理
エージェンティック·マーケット
エージェント所有の流動性エージェントは、創世時に自分のトークン供給の一部を所有しています
エージェントは利回りを生む資産になります。エージェント DAO
モダンな分散システムの設計は、イベント駆動型アーキテクチャやより直接的にはアクターモデルのコンピュートなど、アジェンティックプロトコルを可能にするユニークなインスピレーションとプリミティブを提供しています。
アクターモデルは、エージェントシステムを実装するための優れた理論的な基盤を提供します。この計算モデルでは、「アクター」を計算の普遍的な基本要素として扱い、各アクターは次のことができます:
agenticシステムにおけるActorモデルの主な利点は次のとおりです:
私たちは、ブロックチェーンの名前空間、連邦ネットワーク、CRDT、DHTを組み合わせた多層分散アーキテクチャを通じて、この理論的なエージェントプロトコルの実用的な実装であるNeuronを提案します。各層はプロトコルスタック内で異なる目的で使用されます。私たちは、P2P OSデザインの先駆者であるUrbitとHolochainからインスピレーションを受けています。
Neuronでは、ブロックチェーンレイヤーが検証可能な名前空間とアイデンティティを提供し、暗号化証明を維持しながらエージェントの決定論的なアドレッシングと発見を可能にします。 これにより、DHTレイヤーはO(log n)のルックアップ時間で効率的なエージェントおよびノードの発見とコンテンツルーティングを実現し、オンチェーンの操作を削減しながら、ローカリティに注意したピアの検出を可能にします。 フェデレーテッドノード間の状態同期はCRDTを介して処理され、グローバルな合意が必要なく、エージェントとノードが共有状態の一貫したビューを維持できます。
このアーキテクチャは、自律エージェントがアクターモデルパターンを実装し、ローカルエッジ推論を持つデバイス上の主権ノードとして動作するフェデレーテッドネットワークに自然にマッピングされます。フェデレーションドメインはエージェントの機能によって組織化され、DHTはドメイン内およびドメイン間の効率的なルーティングとディスカバリを提供します。各エージェントは独立したアクターとして機能し、CRDTレイヤーはフェデレーション全体での最終的な一貫性を確保します。この多層アプローチにより、いくつかの重要な機能が可能になります。
分散協調
スケーラブルなオペレーション
システムの回復力
この実装アプローチは、主権、拡張性、効果的なエージェント間相互作用に必要な耐久性の主要な特性を維持しながら、複雑な代理システムを構築するための堅牢な基盤を提供します。
The Agentic Web marks a pivotal evolution in human-computer interaction, transcending the sequential developments of previous eras to establish a fundamentally new paradigm of digital existence. Unlike previous iterations that simply changed how we consume or own information, the Agentic Web transforms the internet from a human-centric platform into an intelligent substrate where autonomous agents become the primary actors. This transformation is powered by the convergence of edge computing, large language models, and decentralized protocols, creating an ecosystem where personal AI models seamlessly interface with specialized expert systems.
このエージェント中心の未来への移行に伴い、人間と機械の知能の境界が曖昧になり、個別に調整されたAIエージェントが私たちのデジタル拡張として機能し、私たちのコンテキストを理解し、ニーズを予測し、分散した知能の広大な領域を自律的にナビゲートする共生関係が生まれます。したがって、エージェントウェブは単なる技術の進歩にとどまらず、デジタル時代における人間の潜在能力を根本的に再構築するものであり、すべての相互作用が拡張知能の機会となり、すべてのデバイスが協力的なAIシステムのグローバルネットワークのノードとなる。
人類が物理的な空間と時間の次元を航行するように、自律エージェントも独自の基本的な次元に存在します: 存在のためのブロックスペースと思考のための推論時間。このデジタルオントロジーは、人間が距離を移動し時間の流れを経験する物理的な現実を反映しており、エージェントは暗号化された証明と計算サイクルを通過し、アルゴリズミックな存在の並行する宇宙を作り出しています。
潜在空間のエンティティは、分散化されたブロックスペース上で操作することは避けられません。
人工知能とブロックチェーン技術は、世界を根本から変える2つの変革的な力を表しています。AIは機械学習やニューラルネットワークを通じて人間の認知能力を拡張し、一方でブロックチェーン技術は検証可能なデジタルの希少性を導入し、信頼できる新しい形態の信頼なしの調整を可能にします。これらの技術が収束すると、自律エージェントが分散型システムと相互作用するインターネットの新しいイテレーションの基盤を築いています。この「エージェンティック・ウェブ」は、新しいデジタル市民のクラスを導入し、AIエージェントが独立してナビゲート、交渉、取引することができます。この変革はデジタル領域での権力を再分配し、個人がデータの主権を取り戻し、人間と人工知能が前例のない方法で協力する生態系を育成しています。
我々が向かっている方向を理解するためには、まず、Webの進化を追跡し、それぞれが異なる機能と建築パラダイムによって特徴付けられた主要なイテレーションをたどることが必要です。
最初の2世代のWebは情報伝播に焦点を当てていましたが、後の2世代は情報の拡張を可能にします。Web 3.0ではトークンを通じたデータの所有権が導入され、Web 4.0では大規模な言語モデル(LLM)を通じて知能が与えられます。
LLMsは、確率的計算を通じて広範な知識を文脈理解に変える、動的なパターンマッチングシステムとして機能する、機械知能の飛躍を示しています。しかし、彼らの真の潜在能力は、純粋な情報処理装置から目標指向の実体に進化し、知覚、推論、行動ができるようにすることで現れます。この変換により、言語と行動の両方を通じた持続的で意味のある協力が可能な、新たな知能が生まれます。
「エージェント」という用語は、従来のチャットボットの制限や負の関連性を超えた、人間とAIの相互作用における新しいパラダイムを提供します。この変化は単なる意味論的なものではなく、AIシステムが自律的に操作しながら、人間との有意義な協力関係を維持する方法に関する基本的な再構想を表しています。基本的に、エージェントワークフローを活用することで、特定のユーザー意図を解決するためのマーケットプレイスが形成されることが可能になります。
最終的に、エージェンティックウェブは単なる新しい知能の層以上のものを表しています—それは我々がデジタルシステムとやり取りする方法を根本的に変えます。従来のウェブの進化は静的なインターフェースと予め定義されたユーザージャーニーに依存していましたが、エージェンティックウェブはユーザーのコンテキストと意図にリアルタイムで適応する動的なランタイムインフラストラクチャを導入しています。
従来のウェブサイトは、固定されたインタフェースを提供し、ユーザーが予め決められた経路を通じて情報を読み書きし、相互作用するインターネットの基本単位として機能します。このモデルは機能的ですが、一般的なユースケースに対応するために設計されたインタフェースにユーザーを制約します。エージェンティックウェブは、コンテキストに応じた計算、適応型インターフェース生成、RAGおよびその他のリアルタイム情報検索の革新によって、これらの制約から解放されます。
TikTokが高度に個人化されたフィードを作成し、リアルタイムでユーザーの好みに適応することによって、コンテンツ消費を革新した方法を考えてみてください。 Agentic Webは、このコンセプトをコンテンツ推奨からインターフェイス全体の生成に拡張しています。 固定されたウェブページのレイアウトをナビゲートする代わりに、ユーザーは次のアクションを予測し促進する動的に生成されたインターフェースとやり取りします。 この静的なウェブサイトから動的な、エージェント駆動のインターフェースへの移行は、我々がデジタルシステムとやり取りする方法の根本的な進化を表しており、ナビゲーションベースのインテントベースの相互作用モデルへの移行を示しています。
エージェントアーキテクチャは、研究者やビルダーの間で大きな探求の対象となっています。彼らの推論と問題解決能力を向上させるために、常に新しい方法が開発されています。Chain-of-Thought(CoT)、Tree-of-Thought(ToT)、Graph-of-Thought(GoT)などの技術は、LLMがより微妙で人間のような認知プロセスをシミュレートすることで、複雑なタスクを処理する能力を向上させるための革新的な例です。
Chain-of-Thought (CoT) プロンプティングは、大規模な言語モデル(LLM)が複雑なタスクを小さな管理可能なステップに分解することを促すものです。このアプローチは、短いPythonスクリプトの作成や数学の方程式の解決など、論理的な推論が必要な問題に特に効果的です。
Tree-of-Thoughts (ToT)はCoTを基盤としており、複数の独立した思考経路の探索を可能にするツリー構造を導入しています。この拡張により、LLMはより複雑なタスクにも対応できるようになります。ToTでは、各「思考」(LLMからのテキスト出力)は、その直前または直後の思考とだけ直接的に接続されています(ツリーの枝内で)。この構造はCoTよりも柔軟性を提供しますが、アイデアの相互交流の可能性をまだ制限しています。
Graph-of-Thought(GoT)は、クラシックなデータ構造をLLM(Lifelong Machine Learning)と融合させることで、概念をさらに発展させます。このアプローチは、グラフ構造内で任意の「思考」が他のどの思考にもリンクできるようにすることで、ToTを拡張します。これにより、思考の連結されたネットワークは、より人間の認知プロセスに近くなります。
GoTのグラフ構造は、ほとんどのシナリオでCoTまたはToTと比較して、人間の思考のより正確な表現を提供する可能性があります。私たちの思考パターンが鎖または木に似ている場合もある(例えば、緊急時計画や標準作業手順を開発する場合など)が、これらは通常の場合とは例外です。このモデルは、思考が厳格な順序に従うのではなく、しばしば様々な思考を飛び越える人間の思考をよりよく反映しています。緊急時計画や標準手順を開発するような一部のシナリオでは、まだ鎖または木のような構造に従う場合がありますが、私たちの心は通常、複雑で相互に関連するアイデアのウェブを作り出します。
GoTにおけるこのグラフのようなアプローチは、アイデアのより動的かつ柔軟な探求を可能にし、結果としてLLMのより創造的かつ包括的な問題解決能力をもたらす可能性があります。
これらの再帰的なグラフベースの操作は、エージェントワークフローへの一歩に過ぎません。明らかな次の進化は、特定の目標に向けて編成されるそれぞれが独自の専門化を持つ複数のエージェントです。エージェントの美しさは、その組み合わせにあります。
エージェントは、マルチエージェント調整を介してLLMをモジュラ化および並列化することを可能にします。
マルチエージェントシステムの概念は新しいものではありません。その起源はマービン・ミンスキーの「マインドの社会」にさかのぼります。この提案では、複数のモジュール化されたマインドが協力して働くことで、単一のモノリシックなマインドよりも優れたパフォーマンスを発揮できるとされています。ChatGPTとClaudeは単一のエージェントです。Mistralはエキスパートの混合を普及させました。このアイデアをさらに拡張し、私たちはエージェントのネットワークアーキテクチャをこのインテリジェンストポロジーの最終状態と考えています。
バイオミミクリーの観点からは、AIモデルとは異なり、何十億もの同一のニューロンが一様で予測可能な方法で接続されているAIモデルとは異なり、人間の脳(基本的には意識的な機械)は器官レベルや細胞レベルで非常に異質です。ニューロンは、神経伝達物質の勾配、細胞内カスケード、さまざまな調節システムを介して複雑な信号を介してコミュニケーションし、その機能は単純なバイナリ状態よりもはるかに微妙です。
これは、生物学において、知能は単にコンポーネントの数やトレーニングデータセットのサイズから生じるのではなく、多様で特化したユニット間の複雑な相互作用から生じることを示唆しています。それは本質的にアナログなプロセスです。
そのため、わずかな大規模モデルではなく何百万もの小規模モデルを開発し、これらのすべてのアクターの間でオーケストレーションを可能にするという考え方は、認知アーキテクチャの革新により近いものになる可能性があります。これは、マルチエージェントシステムに似たものです。
マルチエージェントシステムの設計は、シングルエージェントシステムよりもいくつかの利点があります: メンテナンスが容易で、理解しやすく、拡張性が高いです。単一エージェントのインターフェースのみが必要な場合でも、マルチエージェントフレームワーク内で実装することで、システムをよりモジュラーにすることができ、開発者が必要に応じてコンポーネントを追加または削除するプロセスを簡素化できます。単一エージェントシステムでさえも、マルチエージェントアーキテクチャは非常に効果的なシステム構築方法であることを認識することが重要です。
大規模言語モデル(LLM)は、人間らしいテキストの生成、複雑な問題の解決、さまざまなタスクの処理など、驚異的な能力を示していますが、個々のLLMエージェントは、実世界の応用において効果を妨げる可能性がある制限に直面しています。
以下では、エージェントシステムに関連する5つの主要な課題を検討し、マルチエージェントの協力がこれらの障壁を克服し、LLMsの完全な潜在能力を引き出す方法について探求します。
マルチエージェントシステムは、分散した問題解決とリソースの最適化において魅力的な利点を提供しますが、その真の可能性は、ネットワークのエッジでの実装を検討すると明らかになります。AIが進化し続ける中、マルチエージェントアーキテクチャとエッジコンピューティングの融合は強力な相乗効果を生み出し、コラボレーションインテリジェンスだけでなく、無数のデバイス間でローカライズされた効率的な処理を可能にします。AI導入に対するこの分散型アプローチは、マルチエージェントシステムの利点を自然に拡張し、専門的で協調的なインテリジェンスを、最も必要とされる場所、つまりエンドユーザーに近づけます。
AIの普及により、デジタル領域全体でのコンピューティングアーキテクチャの根本的な再構築が進んでいます。知能が日常のデジタルインタラクションの中に織り込まれるにつれ、私たちはコンピューティングの自然な二分化を目撃しています。特化したデータセンターが複雑な推論や特定のタスクを処理し、一方、エッジデバイスは個別化された、コンテキストに敏感なクエリをローカルで処理します。このエッジ推論への移行は単なるアーキテクチャの選好にすぎず、複数の重要な要因によって駆動される必然性です。
最初に、AIによる相互作用の膨大な量は中央集権化された推論プロバイダーを圧倒し、持続不能な帯域幅要求と遅延の問題を引き起こすでしょう。
さらに、エッジ処理により、自動車、拡張現実、IoTデバイスなどのアプリケーションに欠かせないリアルタイムの反応性が可能になります。
第三に、ローカルの推論は、個人のデバイス上で機密データを保持することによってユーザーのプライバシーを保護します。第四に、エッジコンピューティングは、データのネットワーク間の移動を最小限に抑えることで、エネルギー消費と炭素排出量を大幅に削減します。
最後に、エッジ推論はオフラインの機能と耐久性を可能にし、ネットワーク接続が妨げられた場合でもAIの機能が持続することを保証します。
この分散知能のパラダイムは、現在のシステムの最適化だけでなく、ますますつながりのある世界でAIを展開し、相互作用する方法を根本的に再構築するものです。
さらに、私たちはLLMの計算要求における根本的な変化を目撃しています。過去10年間は、大規模な言語モデルのトレーニングにおける膨大な計算要件に支配されてきましたが、現在は推論時間の計算が中心になる時代に入っています。この移行は、OpenAIのQ*のブレークスルーによって具体化されたエージェントAIシステムの出現に特に明白です。このブレークスルーは、ダイナミックな推論には実時間の計算リソースが大量に必要であることを示しています。
モデルの開発に一度の投資であるトレーニング時の計算とは異なり、推論時の計算は、自律エージェントが推論、計画、新しい状況に適応するために必要な継続的な計算ダイアログを表します。静的なモデルトレーニングから動的なエージェント推論への移行には、エッジコンピューティングが有利になるだけでなく、必須となるような、計算インフラストラクチャの根本的な見直しが必要です。
この変革が進むにつれて、私たちはピア・ツー・ピアのエッジ推論市場の出現を目撃しています。スマートフォンからスマートホームシステムまで、数十億の接続デバイスがダイナミックな計算メッシュを形成し、推論容量をシームレスに取引することができます。これにより、計算リソースが最も必要な場所に流れる有機的なマーケットプレイスが生まれます。アイドルデバイスの余剰計算能力は、リアルタイムで取引可能な貴重なリソースとなり、従来の中央集権型システムよりも効率的で強靭なインフラを実現します。
この推論コンピューティングの民主化は、リソース使用率を最適化するだけでなく、デジタルエコシステム内に新たな経済的機会を生み出し、接続されたすべてのデバイスがAI機能の潜在的なマイクロプロバイダーになります。したがって、AIの未来は、個々のモデルの力だけでなく、相互接続されたエッジデバイスの集合知によって特徴付けられ、需要と供給に基づく検証可能な推論のスポット市場に似た、グローバルで民主化された推論市場を形成します。
LLMは、従来のブラウジングではなく、会話を通じて膨大な情報にアクセスできるようになりました。この会話的なアプローチは、インターネットが人間のユーザーではなくAIエージェントのプラットフォームに変わるにつれ、ますます個人化され、ローカル化されるようになります。
ユーザーの視点からは、「最適なモデル」を特定することから、より個人に合った回答を得ることに焦点が移ります。より良い回答の鍵は、一般的なインターネットの知識に加えてユーザー自身のデータを組み込むことにあります。最初は、より大きなコンテキストウィンドウとRetrieval-Augmented Generation(RAG)が個人データを統合するのに役立ちますが、最終的には、個人データが一般的なインターネットデータよりも重要になります。
これにより、私たちはそれぞれが個人のAIモデルを持ち、より広範なインターネットの専門家モデルとやり取りする未来に進むことになります。最初は個人化がリモートモデルと並行して行われますが、プライバシーや応答速度に関する懸念が、より多くのやり取りをローカルデバイスに押し付けることになります。これにより、人間と機械の間ではなく、個人のモデルとインターネットの専門家モデルの間に新たな境界が生まれることになります。
従来のインターネットモデルによる生データのアクセスは時代遅れになります。代わりに、ローカルモデルはリモートの専門家モデルと通信し、情報を収集し、それを最も個人専用で、高帯域幅の方法であなたに提示します。これらの個人モデルは、より多くの情報を学習するにつれてますます不可欠になります。
インターネットは、ローカルな高コンテキストの個人モデルと、リモートな高知識の専門家モデルの相互接続エコシステムに変わります。これには、フェデレーテッドラーニングのような新しい技術が必要で、これらのモデル間の情報を更新するために使用されます。機械経済が進化するにつれ、主にコンピュート、スケーラビリティ、支払いに関して、これが発生する計算サブステートを再構想する必要があります。これにより、エージェント中心、主権、高度に合成可能、自己学習、進化する情報空間の再編成が行われます。
エージェンティックWebでは、人間とエージェントの相互作用がエージェント間の複雑な通信ネットワークに進化します。 このアーキテクチャは、主権を持つエージェントがデジタルインタラクションの主要なインタフェースになる、インターネットの構造の根本的な再考を提供します。 以下では、エージェントプロトコルに必要な基本的なプリミティブを強調します。
主権身元
自律エージェント
自己指向型のエンティティは、自然言語理解と意図の解決が可能です。
マルチステップ計画とタスク分解
リソース管理と最適化
相互作用やフィードバックから学ぶ
データインフラストラクチャー
ハイブリッドシステム結合:zkTLS
従来のトレーニングデータセット
リアルタイムのWebスクレイピングとデータ統合
RLHF (Reinforcement Learning from Human Feedback)ネットワーク分散フィードバック収集
品質重み付けコンセンサスメカニズム
コンピュートレイヤー
検証可能な推論プロトコル:計算の整合性を確保する
結果の再現性
リソース効率
ピアツーピアのコンピュートマーケットを備えた分散コンピュートインフラストラクチャ
計算証明システム
ダイナミックなリソース割り当て
モデルエコシステム
階層モデルアーキテクチャ:タスク固有のSLM(Small Language Models)
汎用LLMs
専門の多様なモデル
Coordination Frameworks
ディスピュート解決のためのガバナンスメカニズム
リソースの割り当て
並列実行環境を可能にし、同時タスク処理を行うことができます
リソースの分離
状態管理
エージェンティック·マーケット
エージェント所有の流動性エージェントは、創世時に自分のトークン供給の一部を所有しています
エージェントは利回りを生む資産になります。エージェント DAO
モダンな分散システムの設計は、イベント駆動型アーキテクチャやより直接的にはアクターモデルのコンピュートなど、アジェンティックプロトコルを可能にするユニークなインスピレーションとプリミティブを提供しています。
アクターモデルは、エージェントシステムを実装するための優れた理論的な基盤を提供します。この計算モデルでは、「アクター」を計算の普遍的な基本要素として扱い、各アクターは次のことができます:
agenticシステムにおけるActorモデルの主な利点は次のとおりです:
私たちは、ブロックチェーンの名前空間、連邦ネットワーク、CRDT、DHTを組み合わせた多層分散アーキテクチャを通じて、この理論的なエージェントプロトコルの実用的な実装であるNeuronを提案します。各層はプロトコルスタック内で異なる目的で使用されます。私たちは、P2P OSデザインの先駆者であるUrbitとHolochainからインスピレーションを受けています。
Neuronでは、ブロックチェーンレイヤーが検証可能な名前空間とアイデンティティを提供し、暗号化証明を維持しながらエージェントの決定論的なアドレッシングと発見を可能にします。 これにより、DHTレイヤーはO(log n)のルックアップ時間で効率的なエージェントおよびノードの発見とコンテンツルーティングを実現し、オンチェーンの操作を削減しながら、ローカリティに注意したピアの検出を可能にします。 フェデレーテッドノード間の状態同期はCRDTを介して処理され、グローバルな合意が必要なく、エージェントとノードが共有状態の一貫したビューを維持できます。
このアーキテクチャは、自律エージェントがアクターモデルパターンを実装し、ローカルエッジ推論を持つデバイス上の主権ノードとして動作するフェデレーテッドネットワークに自然にマッピングされます。フェデレーションドメインはエージェントの機能によって組織化され、DHTはドメイン内およびドメイン間の効率的なルーティングとディスカバリを提供します。各エージェントは独立したアクターとして機能し、CRDTレイヤーはフェデレーション全体での最終的な一貫性を確保します。この多層アプローチにより、いくつかの重要な機能が可能になります。
分散協調
スケーラブルなオペレーション
システムの回復力
この実装アプローチは、主権、拡張性、効果的なエージェント間相互作用に必要な耐久性の主要な特性を維持しながら、複雑な代理システムを構築するための堅牢な基盤を提供します。
The Agentic Web marks a pivotal evolution in human-computer interaction, transcending the sequential developments of previous eras to establish a fundamentally new paradigm of digital existence. Unlike previous iterations that simply changed how we consume or own information, the Agentic Web transforms the internet from a human-centric platform into an intelligent substrate where autonomous agents become the primary actors. This transformation is powered by the convergence of edge computing, large language models, and decentralized protocols, creating an ecosystem where personal AI models seamlessly interface with specialized expert systems.
このエージェント中心の未来への移行に伴い、人間と機械の知能の境界が曖昧になり、個別に調整されたAIエージェントが私たちのデジタル拡張として機能し、私たちのコンテキストを理解し、ニーズを予測し、分散した知能の広大な領域を自律的にナビゲートする共生関係が生まれます。したがって、エージェントウェブは単なる技術の進歩にとどまらず、デジタル時代における人間の潜在能力を根本的に再構築するものであり、すべての相互作用が拡張知能の機会となり、すべてのデバイスが協力的なAIシステムのグローバルネットワークのノードとなる。
人類が物理的な空間と時間の次元を航行するように、自律エージェントも独自の基本的な次元に存在します: 存在のためのブロックスペースと思考のための推論時間。このデジタルオントロジーは、人間が距離を移動し時間の流れを経験する物理的な現実を反映しており、エージェントは暗号化された証明と計算サイクルを通過し、アルゴリズミックな存在の並行する宇宙を作り出しています。
潜在空間のエンティティは、分散化されたブロックスペース上で操作することは避けられません。