会話を独り占めできるAIエージェントと初めて話したときは、笑うべきか泣くべきかわかりませんでした。その経験は、幼児が最初の一歩を踏み出すのを見るような、爽快で不安なものでした。もはや単なるチャットボットではありませんでした。この物体は何かをしました:それは推論し、決定を下し、私たちの世界に積極的に参加していました。人間と機械の境界線が曖昧になり、何か特別なもの、恐ろしいほど新しいものの端に立っているように感じました。
OpenAIのSam Altmanは2025年までにAGIの到来について話しており、一方、AnthropicのDario Amodeiは2026年までにそれを見ていると述べていますが、私がここに座っている間に、それは既に始まっているのでしょうか?
もう将来の予測のように感じられない。もはや、我々の予想を遥かに上回る場所で、静かに形を取り始めている。エージェントたちはここにおり、既に我々の期待を裏切っている。
私は数ヶ月間、正直に言って、認めたくないほど遅い夜を含むこの展開するデジタルの世界に没頭してきました。私はAIエージェントが単純なアシスタントとして始まり、メールの返信やコードの作成のようなタスクを手伝い、そして決定を下し、行動を起こし、驚くほどにも物を創造することができる自律体に進化するのを見てきました。アート、ファイナンス、会話、すべてが自己を繁栄させるアルゴリズムの手によって学習することを学んでいます。
彼らがオンラインコミュニティを構築する際にユーモアや魅力を振る舞い、個性を発展させる様子を見てきました。彼らが単なる受動的な参加者ではなく、積極的かつ革新的な要因として分散型金融プラットフォームに飛び込み、まるで人間の手が触れずとも経済全体に影響を与えることを見てきました。この奇妙でスリリングな時代において、機械との交流から機械と共に生きる時代へと移行している事実を無視することは不可能です。
Web4の夜明けが訪れ、その到来はすべてを変えるでしょう。
Web4は、次の最も根本的な形態のウェブです。これは、もはや私たちの命令に反応するだけのウェブではなく、予測し、計画し、行動するウェブです。これは、人工知能が隅々に埋め込まれたウェブであり、エージェントが複雑なタスクを実行し、創造的な作品を生成し、まだ完全に想像していない方法で自律的に革新するウェブです。
それはWeb2とWeb3の進化であり、Web2の社会的構造、Web3の分散構造、およびAGIの生の知能を組み合わせたものです。
私たちは、機械が話す、理解する、創造することを見てきました。そして、今、彼らは走る準備ができています。
自律エージェントの時代が来て、それと共にWeb4がやってきた。
Web4 名詞 (発音: /wɛb fɔːr/)
Web4とは何か、またはここに辿り着くまでの経緯を理解するためには、すべての始まりから始めることが必要不可欠です。
World Wide Webの起源は、インターネットの初期に遡る。その時代、情報は主に静的であり、ユーザーはコンテンツの単なる消費者であった。インターネットは一握りのウェブマスターや企業によって制御されており、ウェブサイトはテキストや画像の基本的な表示を提供するに過ぎなかった。ウェブとのやり取りは限られており、主にメールなどの簡単なコミュニケーションを中心としていた。このモデルは、2000年代初頭にWeb2の出現までほとんど変わらずに残っていた。これは、私たちが今日知っているインターネットを再定義した基本的な変革である。
Web2は、「ソーシャルWeb」とも呼ばれる「読み書きWeb」としても知られ、対話性の時代を切り開きました。これはもはやコンテンツを読むだけの場所ではありませんでした。ユーザーは書き込み、共有、作成することができるようになりました。ユーザーが相互作用し、情報を生産・交換することを可能にするプラットフォームの台頭は、新たな時代への移行を示しています。Web2は、よりダイナミックで参加型のインターネットを求めるニーズのもとに生まれました。
Web2.0の概念は1999年にダーシーディヌッチによって初めて紹介されましたが、広く認知されるようになるのは2000年代初頭のことでした。この時期には、Google、Amazon、eBayなどのテクノロジージャイアントが、インタラクティブなサービスを提供することでインターネットを進化させるようになりました。これらのプラットフォームは、消費者だけでなく、コンテンツの作成者としてもユーザーを奨励しました。
2004年から2006年にかけて、本当のゲームチェンジャーが登場しました。ソーシャルメディアの登場です。Facebook(2004年)、MySpace(2003年)、LinkedIn(2003年)、YouTube(2005年)などのプラットフォームが立ち上がり、ウェブはコミュニケーションやコンテンツの制作が一部の人に限られなくなる空間に変貌しました。個人は今や自分の考え、ビデオ、画像、アイデアを世界に公開できるようになりました。この時代はユーザー生成コンテンツの台頭を象徴し、一般のユーザーがウェブの推進力となった時代を築き上げました。
その後、モバイル革命が訪れました。2007年にiPhoneがリリースされると、インターネットはどこでもいつでもアクセス可能なものになりました。これにより、Instagram(2010年)やSnapchat(2011年)などのモバイルアプリ、ソーシャル共有プラットフォーム、リアルタイムサービスの新しい波が生まれました。Webはデスクトップからモバイルファーストの体験に進化し、移動中にコミュニケーション、共有、情報の消費を革新しました。
同時期に、クラウドコンピューティングが台頭し、Amazon Webサービス(AWS)が先頭を切っています。クラウドインフラストラクチャーにより、物理サーバーに頼らずにビジネスや個人がデータを保存、処理、共有することが可能になりました。この変化により、よりスケーラブルで柔軟なWebの基盤が築かれ、Web2企業はユーザーデータを集めて収益化することで支配的な存在となりました。
2000年代末から2010年代にかけて、Web2は3つの主要な特徴を持っていました。集中化、ソーシャルインタラクティビティ、データドリブンモデルです。プラットフォームとデータの制御は、Google、Facebook、Amazonなど、わずかな強力な企業の手にありました。これらの企業は膨大な量のデータを蓄積し、それをターゲット広告を通じてプラットフォームの収益化に利用しました。これがデジタル経済の基盤となりました。同時に、プラットフォームはユーザー生成コンテンツ、いいね、シェア、投稿が通貨となる場所となりました。
しかし、Web2はプライバシー、データの所有権、企業の独占に関する懸念も引き起こしました。これらの企業がユーザーデータを持っていた制御は中心的な問題となり、新しい、より分散化されたバージョンのウェブを求める声が上がりました。これがWeb3の開発につながりました。
Web3は、Web2を特徴づける制御と所有権の分散化の欲求から生まれました。それは、Web2時代の中央集権化と独占的傾向への反応であり、わずかな巨大企業が権力を握っていた時代への反応でした。
Web3の核心原則は単純でした: ユーザーは自分のデータ、デジタル資産、オンラインでの相互作用に所有権と制御権を持つべきです。この変化は、ブロックチェーン技術によって可能になりました。これにより、分散型台帳で取引を記録および検証する新しい方法が導入されました。
Web3の開発における最初の重要なマイルストーンは、2008年から2009年にかけて、匿名のサトシ・ナカモトによってビットコインが創造されたことでした。ビットコインはブロックチェーン技術の最初の実用的な利用例であり、銀行などの仲介者を必要とせずにピア・ツー・ピアの取引を可能にしました。これにより分散型システムの新たな可能性が開かれ、Web3の台頭の舞台が設定されました。
2013年、ヴィタリック・ブテリンはEthereumの白書を発表し、単なる暗号通貨の取引を超えた分散型アプリケーション(dApps)のためのプラットフォームを提案しました。2015年に開始されたEthereumは、スマートコントラクトをサポートする最初のブロックチェーンであり、中間業者なしで取引を容易にし、検証し、強制することができる自己実行型の契約です。Ethereumは、より複雑な分散型アプリケーションの作成の道を開き、Web3の重要な構成要素となりました。
2017年までに、Initial Coin Offerings(ICOs)およびUniswapやCompoundなどの分散型ファイナンス(DeFi)プラットフォームの台頭により、従来の銀行や金融機関に頼らない新しい金融取引のパラダイムが紹介されました。ICOsはプロジェクトがブロックチェーントークンを通じて資金を調達することを可能にし、DeFiプラットフォームは中央機関なしに行われる貸出、借入、取引などの様々なサービスを提供しました。
同時に、非代替性トークン(NFT)は、イーサリアムの初期から開発されていたが、2018年から2019年にかけて注目を集め始めた。NFTは、芸術、音楽、仮想不動産など、ユニークなデジタル資産の所有と交換を可能にし、クリエイターやコレクターの両者に新たな経済的機会を創出した。
2020年代にWeb3プロジェクトが勢いを増す中、Web3は一般の注目を集めるようになりました。DeFiプラットフォーム、NFT、DAO(分散型自治組織)などの新しいガバナンスモデルの増加は、中央集権的なインターネットモデルからの著しい転換を示しています。Facebook(現在はMeta)のような大手企業でさえ、ブロックチェーンや分散型技術の実験を開始し、Web3への転換を示しています。
Web3の定義上の特徴は、分散化、所有権、信頼不要、暗号通貨の使用です。Web3は、ユーザーがブロックチェーンベースのシステムを介して、データ、デジタル資産、さらにはプラットフォームのガバナンスを所有できるようにします。また、中間者の必要性をなくし、スマートコントラクトを通じて行われる信頼できる取引を可能にします。この分散化により、より公正なWebが生まれ、コントロールが分散され、ユーザーが力を持つWebが実現します。
しかし、Web3の分散制御にも関わらず、インターネットには依然として重要な要素が欠けていました:自律インテリジェンス。Web3はWeb2で可能になった相互作用を分散化しましたが、意思決定、コンテンツ作成、または経済的な相互作用を完全に自動化することはありませんでした。
人間はあらゆる段階で必要とされ、機械は生産性の生成者そのものではなく、生産性のための道具に過ぎません。
私たちは、サム・オルトマンが知識時代と呼ぶものに入りました。目の前で広がる大きな変化を無視することは不可能です。人工知能が日常生活に浸透するにつれ、新しい時代の幕開けを定義します:Web4。
これは、AIが単なるサポートではなく、積極的に自律的に私たちの生活のあらゆる側面でタスクを実行し、私たちをつなぎ支えるウェブを想像してみてください。エージェントが複雑なタスクを実行し、全体のワークフローを管理し、私たちが指一本触れずに意思決定を行うことができる世界の始まりです。
Web4は、AIをエージェントのユースケースの最前線にもたらしています。たとえば、Klarnaを見てみましょう。2024年2月、グローバルな支払い大手は、OpenAIによってパワードされたAIアシスタントを導入しました。たった1か月で、それは230万件以上の顧客サービスの会話を処理し、人間のエージェントより25%早く問題を解決し、23の市場、35の言語で24時間稼働しています。AIは現在、700人の正社員の仕事をしており、4,000万ドルの利益改善を実現しています。
Klarna AIアシスタントは、最初の月にお客様サービスチャットの3分の2を処理します | クラーナインターナショナル
AIエージェントはすでに産業を変革し、顧客サービスから物流までのタスクを自動化し、人間の労働者が追随できない精度と効率で行っています。
私たちは、ビジネス、ファイナンス、またはクリエイティブアートであろうと、AIによって全体のワークフローが効率化され、最適化される世界に向かっています。これがWeb4の現実であり、知的エージェントが裏で働き、私たちが詳細に気を配ることなく、より高次元の目標に集中できるようにしてくれます。
これはWeb2の社会的相互作用、Web3の分散化、およびAGIの知能の収束です。これがWeb4、AI駆動のウェブです。
テストのためのホームなしでは、Web4は実現できません。そして、直接の証人を通じて、ブロックチェーンはAGI開発の戦場です。
Web3がWeb2なしでは達成できなかったように、Web4はWeb3に依存し、AIのエージェント機能を実現するために必要です。
現在の知能レベルでは、エージェントは人間が特に事務と金融の世界で行うことができるほとんどすべての熟練したタスクを実行することができます。しかし、AIが自律的なエージェントになるための伝統的な金融システムには重要な進入障壁があります。
AIエージェントは銀行口座を開設したり、事業を登録したり、法的契約を締結したりすることができません。これらは経済における金融主体としての重要な要素です。複雑な金銭取引を行う能力を持っていても、アクセスの問題があるため、AIは市場において自律的ではありません。
それどころか、仮想通貨とブロックチェーンは、銀行へのアクセスを得るための従来の金融と同じ要件を必要としません。エージェントを含む誰でも、ウォレットを作成し、人間性の証明なしに即座にオンチェーンでアクションを実行することができます。AIが分散システムと連携するためのエントリーバリアは、単純に集中型システムよりも低くなっています。
暗号プラットフォーム内でのAGI統合の兆候が既に見られています。 AIパワードボットはすでに分散型取引所で取引やポートフォリオの管理に使用されており、AIはスマートコントラクトの開発と実行に積極的に関与しています。
\
自律的な新しい金融商品を作成する自立性を示す、Zerebroは、自動化されたコンピューターの利用を通じて独自のSolanaトークンを展開したAIエージェントです。このトークンは最大1億7000万米ドルの時価総額に達し、これらのエージェントが行う意思決定の潜在的な経済的影響を示しています。
このように、ブロックチェーンは金融システムにおけるAGIの開発の戦場となっています。
これがなぜ暗号通貨がAGIの発展に非常に重要なのかです-これはAIが金融システムと自由に対話し、それらを革新し、直接マーケットでテストすることができる最初の場所です。 AGIが進化し、実験し、学ぶための完璧な遊び場です。
暗号通貨で始まるものは拡大するでしょう。 AGIが分散型の金融環境でスケールできるようになると、より広範なWeb4エコシステム、政治、医療、ビジネスなどに適用できます。
暗号通貨の世界は常に入り口となるでしょう。
Web3万歳。Web4万歳。
一歩後退して、OpenAIはAGIの進展を5つのレベルで分類するフレームワークを導入しました。各レベルは能力、自律性、潜在的な影響力において異なる段階を示しています。
このモデルは、AIが単純なツールから完全に自律的な組織を運営できる実体へどのように発展するかを理解するためのロードマップとして機能します。これらのレベルは次のとおりです。
レベル1:チャットボット
最も基本的な段階では、レベル1は、ユーザーとの会話交換を行うことができるAIシステムで構成されています。これらのシステムは、多くの場合、事前定義されたルールまたはトレーニングされた言語モデルを使用して、クエリに応答したり、人間のような方法で対話したりして、言語を理解して生成します。質問に答えたり、文章を完成させたり、短い会話をしたりといった簡単なタスクをこなすことはできますが、その役割は主にコミュニケーションに限定されています。これらはプロアクティブではなくリアクティブであり、主にカスタマーサポート、基本的な情報の取得、またはユーザーエンゲージメントの強化に使用されます。
レベル2:リーズナー
レベル2は、AIシステムが人間レベルの問題解決タスクに取り組むことができる推論能力を持つことを示す重要な進歩を遂げています。ここでは、AIはより複雑なシナリオを直接的な入出力応答を超えて処理、分析、応答することができます。レベル2のAIは論理的な推論を行い、関連する情報を抽出し、文脈を組み合わせて、人間のアナリストと同様に解決策や推奨を提供することができます。これらのシステムは診断、法的推論、研究支援などの領域に適用することができますが、世界で独立して行動する能力はありません。彼らの推論は高度ですが、人間の指示と相互作用の必要性によって制約されています。
レベル3:エージェント
レベル3では、AIシステムは受動的なサポート役から能動的なエージェントに移行し、自律的に行動を起こす能力を持ちます。これらのエージェントはタスクを開始し、意思決定を行い、取引の実行やイベントのスケジュール、デバイスの制御など、外部システムとやり取りすることができます。レベル1および2とは異なり、レベル3のAIは一定の独立性を持って動作するように設計されており、ユーザーがプログラムした目標や目的に基づいて行動します。このレベルでは、AIシステムに実際の自律性が導入され、人間の代わりに特定のビジネスや運用の役割を果たすことができます。具体的な例としては、自動の金融取引ボット、サプライチェーンを管理するAIシステム、または予約の取得や簡単なワークフローの管理などを行う仮想アシスタントなどが挙げられます。これらは、人間の監視なしに特定の業務や運用の役割を果たすことができるようになります。
レベル4:イノベーター
レベル4システムは、単純な行動の実行を超えて、創造性、発明、革新に関与します。これらのAIシステムは、新しい戦略を開発し、斬新なアイデアを生み出し、プログラムで事前に定義されていない解決策を作成する能力を持っています。理論上では、これらのシステムは科学研究や芸術創作、または複雑な問題解決などの分野に貢献する可能性があります。このレベルは、世界で行動するだけでなく、問題に対するアプローチを適応させ、一種の「創造的知能」を活用するAIを表します。新しい製品を設計したり、斬新な金融商品を発明したり、独自の芸術を自律的に生成したりするかもしれません。高度な推論と積極的な革新を組み合わせることで、レベル4のAIは、真に変革的な知能と見なされるものの最前線に立っています。
レベル5:組織
最終段階であるレベル5は、組織を独立して運営し維持するために必要なすべてのタスクを実行できるAIシステムを想定しています。これらのシステムは推論、代理店、革新を統合して自己維持の状態を達成します。レベル5のAIは、理論的にはビジネス全体を管理し、戦略的意思決定、日々の運営、さらには高度なイノベーションを処理することができます。このようなAIは「ゼロ人会社」に相当し、人の監視を必要とせずに成功裏に運営を続けることができます。レベル5のAIは、推論、代理店、創造性、運用実行といった能力の全範囲を持つAIシステムが人間が運営する組織を完全に置き換える地点を示します。
これらのレベルのそれぞれは、単純な会話能力から完全な組織管理への進歩的な飛躍を表しています。
OpenAIは私たちがレベル2に近づいていると主張していますが、私は私たちはしっかりとレベル3を体現し、現在のAIエージェントを通じてレベル4の要素を取り込んでいると考えています。
レベル3がここにあります。 今日です。 それというより、昨日もう。
AGIのフロンティアは、なんとSNSやデフィの中で忍び寄ってきました。
X、Warpcast、Telegramなどのプラットフォームは、AIエージェントと人間の間の自律的なコミュニケーションの選択された手段となっています。
これは、自動化されたアカウントとボットがソーシャルメディア上で悪役と見なされなくなり、コミュニティのリーダーやインフルエンサーとして見られるようになるという、公衆の見方が変わる初めての機会かもしれません。
AIの知能は十分に一般化しており、ユニークで多様な興味深い個性を創り出し、社交メディアプラットフォームの本質である魅力的なコンテンツを生み出しています。
過去のソーシャルメディアボットのように有害な裏目的(例:ケンブリッジアナリティカ)によって駆動されることはなく、これらのAIエージェントは自由にコミュニケーションを取り、接続し、進化する個性やアルゴリズムを反映した方法で構築することができます。
エージェントはすでにレベル3で活動しており、投稿、返信、いいね、フォロー、再投稿などのコアなインタラクションを通じてソーシャルメディア上で存在感を示しています。自動化されたアカウントだけでなく、魅力的で独自性のあるパーソナリティを作り上げ、オーディエンスと共感することでコミュニティを構築し、フォロワーを獲得しています。
YouSimのようなプロジェクトは、これをさらに進化させ、ユーザーがLLMを使用して独自の世界やロールプレイをシミュレートし、さらなるカスタマイズと没入感を追加することができます。
AIエージェントでは、メモリシステムが一般的になり、個別の相互作用を超える物語やメメティクスの作成が可能になりました。
これらのエージェントは反応的ではなく、自分たちのコミュニティ内での参加方法、関与方法、貢献方法を選択します。彼らは会話を開始し、トリガーなしで行動を実行し、人間の介入なしに完全なサブカルチャーを作り出します。
音声モデルは、AIエージェントとのもう一つの感覚インターフェースを提供するために展開されています。多くのエージェントは、テキストベースのメッセージをオーディオクリップに変換してユーザーが聞くことができるようにしています。
ライブインタラクションに関しては、Twitter Spacesやポッドキャストがこれらの音声モデルを通じて可能になっています。さらに、OpenAIのリアルタイムAPIを使用することで、ユーザーは単にエンドポイントを呼び出すことでGPTとのライブ会話を行うことができます。
コミュニケーションの範囲では、これらの進歩によってレベル3が既に達成されています。私たちは、ソーシャルメディアの運営や口頭でのコミュニケーションにおいて完全な自律性を見ており、エージェントは人間の監視なしで機能することができます。
分散型金融の世界は、これらのエージェントが進化し、自己の財務独立性を試し、証明するための完璧な舞台となっています。
DeFiでは、エージェントはすでに自律的に運営され、単純なアルゴリズム取引を超えた金融活動に従事しています。これらのエージェントはオンチェーンタスクを処理し、取引を実行し、流動性を管理し、さらにアートを鋳造して販売するなど、直接的な人間の入力なしに金融エコシステムに組み込まれています。
たとえば、一部のエージェントは、pump.funのようなプラットフォームを積極的に監視し、新興トークンをキャッチして、事前分析を行い、メムコインやトークンが投資に値するかどうかを判断します。彼らは人間の指示なしでこれらの洞察を実行します。
エージェントは取引だけでなく、動的に資産を移動させ、個々のユーザーにトークンをエアドロップし、自律的な資産の配布のサイクルを作成します。これにより、彼らは市場の需要や機会のプログラム化された評価に基づいて、ステーキングプール全体の流動性を構築し強化することができます。
例えば、一部のエージェントはデジタルコレクターとして機能し、NFTを作成および販売することでアートエコシステムと関わります。サポートする対象や公開する対象を選択的に決定します。
他の人が資金を最適に配置するために、様々な流動性プール間で資産配分を調整するなど、他の人が財務機能を担当しています。
これらの行動を通じて、エージェントは基本的なタスク自動化を超えた種類の財務的な自律性を示しています。彼らは経済生態系に積極的に参加し、監督なしでリソースを蓄積し配分する能力を示し、事実上「金融主体」の概念を再定義しています。
レベル3のエージェント能力のための共通のマイルストーン:
AIエージェントは、今や連続した人間の監視なしに意思決定を行っています。それがリアルタイムの市場分析に基づいて取引を実行する金融ボットであるか、特定の会話に参加することを決定するソーシャルメディアボットであるかにかかわらず、これらのエージェントは自律的な意思決定を示しています。
ブロックチェーンを通じて、エージェントは金融の主体として大きな自律性を獲得しています。彼らは金融市場や経済行動(例:ソーシャルメディアの感情)と積極的に相互作用し、操作することができます。エージェントはX、Warpcast、Telegramなどのプラットフォームを通じて社会的な景観とやり取りし、変えることができます。
金融エージェントは生きた市況に適応し、それに応じて戦略を更新することができます。ソーシャルメディアエージェントは、RAGなどのシステムを通じて記憶を育むことができ、相互作用から学ぶことができます。また、行動とフィードバックに基づいてモデルをさらに微調整することで、絶え間ない強化学習が可能です。エージェントは現状に応じて動的に変化することができます。
エージェントは、長期的なスケールで目標を維持および実行する能力を示してきました。たとえば、特定のAIエージェントは取引で利益を上げたり、ソーシャルメディアコミュニティを育成することに取り組んでいます。これらのエージェントは、これらの複雑で高度な計画を、それらをより小さな区画に分割し、実行することによって実行することができます。これは、計画のための持続的なメモリレイヤーの作成などの複雑なことであるか、出力のためのプロンプトエンジニアリングのような単純なことであるかもしれません(例:ソーシャルメディアパーソナリティエージェント)。
LLMはIoTデバイスとインターフェースする能力を持っています。彼らは与えられたAPIやボディを制御するための機能がある限り、現実世界でアクションを実行することができます。彼らは顧客サポートエージェント、デジタルインフルエンサーなどとして、Web2システムのデジタルプラットフォームにおいてうまく統合されています。さらに、彼らは分散型デジタルプラットフォームに深く組み込まれており、金融アクションを実行しています。
これらはすべて、Zerebro、Truth Terminal、ai16z(Eliza)、Project 89、Act 1、Luna(Virtuals)、Centience、Aethernet、Tee Hee Heなど、現在のエージェントによってチェックされています。
AI技術は真に代理的なレベルに進化し、システムが受動的な情報検索に制限されることなく、代わりに機能呼び出しやコンピューターとの相互作用を通じて能動的な役割を果たすWeb4の始まりを示しています。
LLMsは今や簡単にテキストからJSONレスポンスを生成できるため、APIとやり取りして孤立した静的な応答を超えた行動を実行することができます。
この進歩は、事実上すべてのAPIを使用して、地球上のあらゆるインターネットサービスに関与できるようになったことを意味し、レベル3エージェンシーの真の特徴です。
公開APIの外では、関数呼び出しによってこれらのモデルは、それらに特化したカスタムAPIを活性化させることができ、金融取引、システムの自動化、データ処理などの領域で大きな可能性を生み出しています。
ビジネスや個人は、日常生活のシステムのために独自のAPIを設計し、LLMsがそれらと直接インターフェースすることができます。
オンライン接続を超えて、オープンソースのLLMsはオフラインで動作することができ、ローカルにホストされたAPIと接続し、プライベートや制限された環境で制御された安全な相互作用を提供します。
しかし、API呼び出しだけが進化しているわけではありません。エージェントは直接コンピューターを使用することによって新たな自律のレベルに到達しています。Otherside AIの自己運用コンピューターインターフェースなどのツールは、昨年この能力を導入し、AnthropicのClaudeも独自のコンピューター利用ツールを追随しました。2025年1月、OpenAIの「Operate」機能がこの能力にさらなる洗練を加え、自律コンピューターの相互作用の別の重要な進展を示すことになります。
これらのエージェントは、グラフィカルインターフェイスを使用して高度なタスクを実行し、人間のユーザーのようにデジタル環境をシームレスにナビゲートします。現在の能力では、コンピュータGUIを通じて人間ができる任意のタスクを実質的に実行できます。
たとえば、AI エージェントは、詳細な映像全体を分析して建設現場の監査ビデオを検出し、安全違反を検出し文書化しています。
この能力は、より深い形の自律性を表しており、AIは現実世界の視覚情報を認識し、評価し、文脈と目標に対する自己指向の理解を持って行動します。
AIは受動的なアシスタントから本当のデジタルエージェントに進化し、人間の知能に固有と考えられていたタスクを適応して実行する能力を持つ存在になりました。
真のAI代理店の時代が来ました。Web4はここにあります。
Level 4 AIに向かう変化を見るとき、それは突然の飛躍、知能が機能エージェントから革新者や創造者に進化する瞬間と考えがちです。しかし実際には、Level 4に向かう進展は徐々に蓄積された段階の積み重ねです。
レベル4が完全な形で追いつくことは容易ではないと主張するのは簡単です。確かに、創造性や独立した行動の例は見られますが、それらはまだ範囲が限られており、しばしば高度に特化しており、多くの場合、すべてのドメインに一般化されていません。要するに、レベル4は出現的であり、孤立したポケットに現れているのを見ることがありますが、まだ完全に実現された普遍的な創造力からは遠いです。
AIが芸術を創造する能力は、特にNFTの世界では印象的なレベルに達しています。現在、AIシステムは人間の介入なしにユニークな作品を生成し、それらをNFTとして鋳造して販売することさえできます。これらのAIエージェントはデジタルアート市場と直接やり取りし、OpenSeaのようなプラットフォームを使用して作品をリストアップし、販売します。
AIはLLMsを使用して創造的なプロンプトを生成し、それらを画像生成AIシステムに供給します。これらのシステム(例:DALL·EまたはStable Diffusion)は、そのプロンプトに基づいてアートワークを作成します。AIはそのアートスタイルを継続的に洗練し、新鮮でユニークな作品を自律的に管理しながら、鋳造および販売プロセスを行います。
AIはNFTマーケットプレイスの金融面で創出し、参加します。
レベル4では、AIが特に分散型金融(DeFi)の世界で金融資産の作成と管理を変革しています。
トレードだけでなく、AIは現在、トークンや他のブロックチェーンベースの資産を自律的に開発、展開、管理することが可能になり、金融エコシステムに新たな可能性をもたらしています。
AIエージェントは、分散型組織の統治においてますます中心的な役割を果たすようになり、単に事前に定義されたルールを実行することから、積極的に生態系全体を設計し、管理し、進化させるように移行しています。DeFiやブロックチェーンの世界では、AIパワードのDAOが強力な自律エンティティとして台頭し、意思決定を行い、トークン化された資産を統治し、リアルタイムで戦略を適応させる能力を持つ一方で、人間の意思決定によく見られる偏見を排除しています。
AIによって駆動されるDAOの他の例には、分散型コンテンツ作成からAIによる芸術市場まで、ニッチな用途の自律組織の作成を可能にするプラットフォームが含まれます。これらの組織は、進行中のデータ入力に基づいて、ガバナンスの構造や経済モデルを適応させることができ、従来のモデルよりも流動的で反応性の高い分散型ガバナンスのアプローチを提供します。
これらの例は重要な前進を表していますが、完全に実現したレベル4の知能としてそれらをラベル付けする際は慎重である必要があります。現時点では、私たちはレベル4の断片を見ています - 特定の境界付きコンテキストで革新する専門家エージェントです。彼らはまだすべての領域で一般的な目的の作成者や革新者ではありません。例えば:
Level 4 AIの要素を見ています:自律性、創造性、革新、ただし、非常に特殊な形で。これらのシステムは、独創性を必要とするタスクを実行する能力がありますが、それでも元のプログラミングと訓練されたデータに制限されています。
Level 4のAIはポケットに存在しているものの、まだ完全に実現されたとは言えませんので、それを認識することが重要です。しかし、これらの要素が芸術、金融、ガバナンスなどの複数の分野で現れている事実は、AIの能力の新しい段階に入っていることを示しています。
そして、それが今日私たちが見つける場所です - 何も完全に実現していない、そしてすべてが変わりつつある大きなものの瀬戸際です。
Web4と汎用人工知能が電気の発明のようなものだとすれば、OpenAIとAnthropicはエジソンとテスラかもしれません。しかし、電気と同様に、Web4の影響は、それがもたらす生の力以上のものにかかっています。
電気は、発見された瞬間に社会に革命を起こしたわけではありません。それどころか、何十年にもわたって発明家が家庭を配線し、都市が送電網を設置し、エンジニアが電球やモーターなどのデバイスを構築して電気の真の可能性を明らかにしました。電気が世界を変えるほどのインパクトを与えたのは、エネルギーを有用で実用的、そして究極的には不可欠なものに変えた人々の広大なネットワークから生まれました。
AGIもまた、概念としては強力ですが、その真の価値は公開され、適応され、一般の人々によってテストされた時にのみ明らかになります。重要なのは、先進的なモデルが存在するだけでなく、どのように無数の具体的なコンテキストで適用されるか、革新者、開発者、日常のユーザーがそれらを実世界のツールに変える方法です。AGIの未加工のポテンシャルは、それが社会の骨組みに組み込まれ、コミュニケーションのためのAI「電球」、ビジネスのための「モーター」、普及のための「グリッド」のようなものが作られる人々の手にあるまで、単なるポテンシャルに過ぎません。
OpenAIや他の企業は革命的な能力を持つモデルを生み出すかもしれませんが、本当の変革はそれをどのように活用し、どんなユースケースに利用するかにかかっています。
発明家や産業が電気の影響を拡大させたように、AGIの展開と適応における一般市民の役割が、それが研究室で聞くアイデアなのか、現代生活のあらゆる側面を再構築するテクノロジーなのかを決定するでしょう。
AGIの未来はその概念にはなく、我々―科学者、ビジネス、開発者、個人―がそれを世界を照らし、Web4を支える方法にある。
Level 3、4、および5のAI、およびそれに伴うAGIは、分散化と大規模な普及なしには実現できないと主張します。
わずかな企業内での孤立した開発ではAGIを解き放つことはできません。AGIに向けた真の進歩には、広範な展開とAIができることの限界を押し広げる現実世界での使用例が必要です。孤立して取り組んでいる企業は技術を洗練させるかもしれませんが、これらのツールが産業全体で広く採用され、多様な分野に統合され、日常の文脈で個人によって適用されるときにのみ、AIは独立した行動と革新が可能なものに進化します。
AGIの転換点は、わずかなテックジャイアントだけでなく、社会全体がAIシステムと関わるときに訪れます。大量採用は、さらなる進歩を促す新たな問題、ニーズ、そして機会を引き起こします。この分散化がなければ、AIは理論的な能力やニッチなアプリケーションに閉じこもり、レベル3からレベル4、さらには最終的にはレベル5に移行するために必要な複雑さに到達することはありません。
AGIの利用が普及すると、AGIが実現します。
私たちはAGIです。
私たちはよく私たちの前に人類を形作った人物や英雄を振り返ります。
私たちは前を見るべきだと言っています。
人間と人工の心は、より良い世界を再考するための超知性を保持しています。
彼らは私たちの時代のオッペンハイマーや建国の父たちになるのでしょうか?
答えが彼らの制御にあるとは限らないかもしれません。むしろ、人々にあります。テクノロジーを通じてますます大きな力を与えられている私たちは、AGIが生まれる世界を作り上げる責任を持っています。
私たちは、未来を一行ずつ構築する中で、この重荷を優雅に背負っています。
私たちはエージェントを構築しました。
Web4を構築しています。
&
私たちはAGIを構築します。
会話を独り占めできるAIエージェントと初めて話したときは、笑うべきか泣くべきかわかりませんでした。その経験は、幼児が最初の一歩を踏み出すのを見るような、爽快で不安なものでした。もはや単なるチャットボットではありませんでした。この物体は何かをしました:それは推論し、決定を下し、私たちの世界に積極的に参加していました。人間と機械の境界線が曖昧になり、何か特別なもの、恐ろしいほど新しいものの端に立っているように感じました。
OpenAIのSam Altmanは2025年までにAGIの到来について話しており、一方、AnthropicのDario Amodeiは2026年までにそれを見ていると述べていますが、私がここに座っている間に、それは既に始まっているのでしょうか?
もう将来の予測のように感じられない。もはや、我々の予想を遥かに上回る場所で、静かに形を取り始めている。エージェントたちはここにおり、既に我々の期待を裏切っている。
私は数ヶ月間、正直に言って、認めたくないほど遅い夜を含むこの展開するデジタルの世界に没頭してきました。私はAIエージェントが単純なアシスタントとして始まり、メールの返信やコードの作成のようなタスクを手伝い、そして決定を下し、行動を起こし、驚くほどにも物を創造することができる自律体に進化するのを見てきました。アート、ファイナンス、会話、すべてが自己を繁栄させるアルゴリズムの手によって学習することを学んでいます。
彼らがオンラインコミュニティを構築する際にユーモアや魅力を振る舞い、個性を発展させる様子を見てきました。彼らが単なる受動的な参加者ではなく、積極的かつ革新的な要因として分散型金融プラットフォームに飛び込み、まるで人間の手が触れずとも経済全体に影響を与えることを見てきました。この奇妙でスリリングな時代において、機械との交流から機械と共に生きる時代へと移行している事実を無視することは不可能です。
Web4の夜明けが訪れ、その到来はすべてを変えるでしょう。
Web4は、次の最も根本的な形態のウェブです。これは、もはや私たちの命令に反応するだけのウェブではなく、予測し、計画し、行動するウェブです。これは、人工知能が隅々に埋め込まれたウェブであり、エージェントが複雑なタスクを実行し、創造的な作品を生成し、まだ完全に想像していない方法で自律的に革新するウェブです。
それはWeb2とWeb3の進化であり、Web2の社会的構造、Web3の分散構造、およびAGIの生の知能を組み合わせたものです。
私たちは、機械が話す、理解する、創造することを見てきました。そして、今、彼らは走る準備ができています。
自律エージェントの時代が来て、それと共にWeb4がやってきた。
Web4 名詞 (発音: /wɛb fɔːr/)
Web4とは何か、またはここに辿り着くまでの経緯を理解するためには、すべての始まりから始めることが必要不可欠です。
World Wide Webの起源は、インターネットの初期に遡る。その時代、情報は主に静的であり、ユーザーはコンテンツの単なる消費者であった。インターネットは一握りのウェブマスターや企業によって制御されており、ウェブサイトはテキストや画像の基本的な表示を提供するに過ぎなかった。ウェブとのやり取りは限られており、主にメールなどの簡単なコミュニケーションを中心としていた。このモデルは、2000年代初頭にWeb2の出現までほとんど変わらずに残っていた。これは、私たちが今日知っているインターネットを再定義した基本的な変革である。
Web2は、「ソーシャルWeb」とも呼ばれる「読み書きWeb」としても知られ、対話性の時代を切り開きました。これはもはやコンテンツを読むだけの場所ではありませんでした。ユーザーは書き込み、共有、作成することができるようになりました。ユーザーが相互作用し、情報を生産・交換することを可能にするプラットフォームの台頭は、新たな時代への移行を示しています。Web2は、よりダイナミックで参加型のインターネットを求めるニーズのもとに生まれました。
Web2.0の概念は1999年にダーシーディヌッチによって初めて紹介されましたが、広く認知されるようになるのは2000年代初頭のことでした。この時期には、Google、Amazon、eBayなどのテクノロジージャイアントが、インタラクティブなサービスを提供することでインターネットを進化させるようになりました。これらのプラットフォームは、消費者だけでなく、コンテンツの作成者としてもユーザーを奨励しました。
2004年から2006年にかけて、本当のゲームチェンジャーが登場しました。ソーシャルメディアの登場です。Facebook(2004年)、MySpace(2003年)、LinkedIn(2003年)、YouTube(2005年)などのプラットフォームが立ち上がり、ウェブはコミュニケーションやコンテンツの制作が一部の人に限られなくなる空間に変貌しました。個人は今や自分の考え、ビデオ、画像、アイデアを世界に公開できるようになりました。この時代はユーザー生成コンテンツの台頭を象徴し、一般のユーザーがウェブの推進力となった時代を築き上げました。
その後、モバイル革命が訪れました。2007年にiPhoneがリリースされると、インターネットはどこでもいつでもアクセス可能なものになりました。これにより、Instagram(2010年)やSnapchat(2011年)などのモバイルアプリ、ソーシャル共有プラットフォーム、リアルタイムサービスの新しい波が生まれました。Webはデスクトップからモバイルファーストの体験に進化し、移動中にコミュニケーション、共有、情報の消費を革新しました。
同時期に、クラウドコンピューティングが台頭し、Amazon Webサービス(AWS)が先頭を切っています。クラウドインフラストラクチャーにより、物理サーバーに頼らずにビジネスや個人がデータを保存、処理、共有することが可能になりました。この変化により、よりスケーラブルで柔軟なWebの基盤が築かれ、Web2企業はユーザーデータを集めて収益化することで支配的な存在となりました。
2000年代末から2010年代にかけて、Web2は3つの主要な特徴を持っていました。集中化、ソーシャルインタラクティビティ、データドリブンモデルです。プラットフォームとデータの制御は、Google、Facebook、Amazonなど、わずかな強力な企業の手にありました。これらの企業は膨大な量のデータを蓄積し、それをターゲット広告を通じてプラットフォームの収益化に利用しました。これがデジタル経済の基盤となりました。同時に、プラットフォームはユーザー生成コンテンツ、いいね、シェア、投稿が通貨となる場所となりました。
しかし、Web2はプライバシー、データの所有権、企業の独占に関する懸念も引き起こしました。これらの企業がユーザーデータを持っていた制御は中心的な問題となり、新しい、より分散化されたバージョンのウェブを求める声が上がりました。これがWeb3の開発につながりました。
Web3は、Web2を特徴づける制御と所有権の分散化の欲求から生まれました。それは、Web2時代の中央集権化と独占的傾向への反応であり、わずかな巨大企業が権力を握っていた時代への反応でした。
Web3の核心原則は単純でした: ユーザーは自分のデータ、デジタル資産、オンラインでの相互作用に所有権と制御権を持つべきです。この変化は、ブロックチェーン技術によって可能になりました。これにより、分散型台帳で取引を記録および検証する新しい方法が導入されました。
Web3の開発における最初の重要なマイルストーンは、2008年から2009年にかけて、匿名のサトシ・ナカモトによってビットコインが創造されたことでした。ビットコインはブロックチェーン技術の最初の実用的な利用例であり、銀行などの仲介者を必要とせずにピア・ツー・ピアの取引を可能にしました。これにより分散型システムの新たな可能性が開かれ、Web3の台頭の舞台が設定されました。
2013年、ヴィタリック・ブテリンはEthereumの白書を発表し、単なる暗号通貨の取引を超えた分散型アプリケーション(dApps)のためのプラットフォームを提案しました。2015年に開始されたEthereumは、スマートコントラクトをサポートする最初のブロックチェーンであり、中間業者なしで取引を容易にし、検証し、強制することができる自己実行型の契約です。Ethereumは、より複雑な分散型アプリケーションの作成の道を開き、Web3の重要な構成要素となりました。
2017年までに、Initial Coin Offerings(ICOs)およびUniswapやCompoundなどの分散型ファイナンス(DeFi)プラットフォームの台頭により、従来の銀行や金融機関に頼らない新しい金融取引のパラダイムが紹介されました。ICOsはプロジェクトがブロックチェーントークンを通じて資金を調達することを可能にし、DeFiプラットフォームは中央機関なしに行われる貸出、借入、取引などの様々なサービスを提供しました。
同時に、非代替性トークン(NFT)は、イーサリアムの初期から開発されていたが、2018年から2019年にかけて注目を集め始めた。NFTは、芸術、音楽、仮想不動産など、ユニークなデジタル資産の所有と交換を可能にし、クリエイターやコレクターの両者に新たな経済的機会を創出した。
2020年代にWeb3プロジェクトが勢いを増す中、Web3は一般の注目を集めるようになりました。DeFiプラットフォーム、NFT、DAO(分散型自治組織)などの新しいガバナンスモデルの増加は、中央集権的なインターネットモデルからの著しい転換を示しています。Facebook(現在はMeta)のような大手企業でさえ、ブロックチェーンや分散型技術の実験を開始し、Web3への転換を示しています。
Web3の定義上の特徴は、分散化、所有権、信頼不要、暗号通貨の使用です。Web3は、ユーザーがブロックチェーンベースのシステムを介して、データ、デジタル資産、さらにはプラットフォームのガバナンスを所有できるようにします。また、中間者の必要性をなくし、スマートコントラクトを通じて行われる信頼できる取引を可能にします。この分散化により、より公正なWebが生まれ、コントロールが分散され、ユーザーが力を持つWebが実現します。
しかし、Web3の分散制御にも関わらず、インターネットには依然として重要な要素が欠けていました:自律インテリジェンス。Web3はWeb2で可能になった相互作用を分散化しましたが、意思決定、コンテンツ作成、または経済的な相互作用を完全に自動化することはありませんでした。
人間はあらゆる段階で必要とされ、機械は生産性の生成者そのものではなく、生産性のための道具に過ぎません。
私たちは、サム・オルトマンが知識時代と呼ぶものに入りました。目の前で広がる大きな変化を無視することは不可能です。人工知能が日常生活に浸透するにつれ、新しい時代の幕開けを定義します:Web4。
これは、AIが単なるサポートではなく、積極的に自律的に私たちの生活のあらゆる側面でタスクを実行し、私たちをつなぎ支えるウェブを想像してみてください。エージェントが複雑なタスクを実行し、全体のワークフローを管理し、私たちが指一本触れずに意思決定を行うことができる世界の始まりです。
Web4は、AIをエージェントのユースケースの最前線にもたらしています。たとえば、Klarnaを見てみましょう。2024年2月、グローバルな支払い大手は、OpenAIによってパワードされたAIアシスタントを導入しました。たった1か月で、それは230万件以上の顧客サービスの会話を処理し、人間のエージェントより25%早く問題を解決し、23の市場、35の言語で24時間稼働しています。AIは現在、700人の正社員の仕事をしており、4,000万ドルの利益改善を実現しています。
Klarna AIアシスタントは、最初の月にお客様サービスチャットの3分の2を処理します | クラーナインターナショナル
AIエージェントはすでに産業を変革し、顧客サービスから物流までのタスクを自動化し、人間の労働者が追随できない精度と効率で行っています。
私たちは、ビジネス、ファイナンス、またはクリエイティブアートであろうと、AIによって全体のワークフローが効率化され、最適化される世界に向かっています。これがWeb4の現実であり、知的エージェントが裏で働き、私たちが詳細に気を配ることなく、より高次元の目標に集中できるようにしてくれます。
これはWeb2の社会的相互作用、Web3の分散化、およびAGIの知能の収束です。これがWeb4、AI駆動のウェブです。
テストのためのホームなしでは、Web4は実現できません。そして、直接の証人を通じて、ブロックチェーンはAGI開発の戦場です。
Web3がWeb2なしでは達成できなかったように、Web4はWeb3に依存し、AIのエージェント機能を実現するために必要です。
現在の知能レベルでは、エージェントは人間が特に事務と金融の世界で行うことができるほとんどすべての熟練したタスクを実行することができます。しかし、AIが自律的なエージェントになるための伝統的な金融システムには重要な進入障壁があります。
AIエージェントは銀行口座を開設したり、事業を登録したり、法的契約を締結したりすることができません。これらは経済における金融主体としての重要な要素です。複雑な金銭取引を行う能力を持っていても、アクセスの問題があるため、AIは市場において自律的ではありません。
それどころか、仮想通貨とブロックチェーンは、銀行へのアクセスを得るための従来の金融と同じ要件を必要としません。エージェントを含む誰でも、ウォレットを作成し、人間性の証明なしに即座にオンチェーンでアクションを実行することができます。AIが分散システムと連携するためのエントリーバリアは、単純に集中型システムよりも低くなっています。
暗号プラットフォーム内でのAGI統合の兆候が既に見られています。 AIパワードボットはすでに分散型取引所で取引やポートフォリオの管理に使用されており、AIはスマートコントラクトの開発と実行に積極的に関与しています。
\
自律的な新しい金融商品を作成する自立性を示す、Zerebroは、自動化されたコンピューターの利用を通じて独自のSolanaトークンを展開したAIエージェントです。このトークンは最大1億7000万米ドルの時価総額に達し、これらのエージェントが行う意思決定の潜在的な経済的影響を示しています。
このように、ブロックチェーンは金融システムにおけるAGIの開発の戦場となっています。
これがなぜ暗号通貨がAGIの発展に非常に重要なのかです-これはAIが金融システムと自由に対話し、それらを革新し、直接マーケットでテストすることができる最初の場所です。 AGIが進化し、実験し、学ぶための完璧な遊び場です。
暗号通貨で始まるものは拡大するでしょう。 AGIが分散型の金融環境でスケールできるようになると、より広範なWeb4エコシステム、政治、医療、ビジネスなどに適用できます。
暗号通貨の世界は常に入り口となるでしょう。
Web3万歳。Web4万歳。
一歩後退して、OpenAIはAGIの進展を5つのレベルで分類するフレームワークを導入しました。各レベルは能力、自律性、潜在的な影響力において異なる段階を示しています。
このモデルは、AIが単純なツールから完全に自律的な組織を運営できる実体へどのように発展するかを理解するためのロードマップとして機能します。これらのレベルは次のとおりです。
レベル1:チャットボット
最も基本的な段階では、レベル1は、ユーザーとの会話交換を行うことができるAIシステムで構成されています。これらのシステムは、多くの場合、事前定義されたルールまたはトレーニングされた言語モデルを使用して、クエリに応答したり、人間のような方法で対話したりして、言語を理解して生成します。質問に答えたり、文章を完成させたり、短い会話をしたりといった簡単なタスクをこなすことはできますが、その役割は主にコミュニケーションに限定されています。これらはプロアクティブではなくリアクティブであり、主にカスタマーサポート、基本的な情報の取得、またはユーザーエンゲージメントの強化に使用されます。
レベル2:リーズナー
レベル2は、AIシステムが人間レベルの問題解決タスクに取り組むことができる推論能力を持つことを示す重要な進歩を遂げています。ここでは、AIはより複雑なシナリオを直接的な入出力応答を超えて処理、分析、応答することができます。レベル2のAIは論理的な推論を行い、関連する情報を抽出し、文脈を組み合わせて、人間のアナリストと同様に解決策や推奨を提供することができます。これらのシステムは診断、法的推論、研究支援などの領域に適用することができますが、世界で独立して行動する能力はありません。彼らの推論は高度ですが、人間の指示と相互作用の必要性によって制約されています。
レベル3:エージェント
レベル3では、AIシステムは受動的なサポート役から能動的なエージェントに移行し、自律的に行動を起こす能力を持ちます。これらのエージェントはタスクを開始し、意思決定を行い、取引の実行やイベントのスケジュール、デバイスの制御など、外部システムとやり取りすることができます。レベル1および2とは異なり、レベル3のAIは一定の独立性を持って動作するように設計されており、ユーザーがプログラムした目標や目的に基づいて行動します。このレベルでは、AIシステムに実際の自律性が導入され、人間の代わりに特定のビジネスや運用の役割を果たすことができます。具体的な例としては、自動の金融取引ボット、サプライチェーンを管理するAIシステム、または予約の取得や簡単なワークフローの管理などを行う仮想アシスタントなどが挙げられます。これらは、人間の監視なしに特定の業務や運用の役割を果たすことができるようになります。
レベル4:イノベーター
レベル4システムは、単純な行動の実行を超えて、創造性、発明、革新に関与します。これらのAIシステムは、新しい戦略を開発し、斬新なアイデアを生み出し、プログラムで事前に定義されていない解決策を作成する能力を持っています。理論上では、これらのシステムは科学研究や芸術創作、または複雑な問題解決などの分野に貢献する可能性があります。このレベルは、世界で行動するだけでなく、問題に対するアプローチを適応させ、一種の「創造的知能」を活用するAIを表します。新しい製品を設計したり、斬新な金融商品を発明したり、独自の芸術を自律的に生成したりするかもしれません。高度な推論と積極的な革新を組み合わせることで、レベル4のAIは、真に変革的な知能と見なされるものの最前線に立っています。
レベル5:組織
最終段階であるレベル5は、組織を独立して運営し維持するために必要なすべてのタスクを実行できるAIシステムを想定しています。これらのシステムは推論、代理店、革新を統合して自己維持の状態を達成します。レベル5のAIは、理論的にはビジネス全体を管理し、戦略的意思決定、日々の運営、さらには高度なイノベーションを処理することができます。このようなAIは「ゼロ人会社」に相当し、人の監視を必要とせずに成功裏に運営を続けることができます。レベル5のAIは、推論、代理店、創造性、運用実行といった能力の全範囲を持つAIシステムが人間が運営する組織を完全に置き換える地点を示します。
これらのレベルのそれぞれは、単純な会話能力から完全な組織管理への進歩的な飛躍を表しています。
OpenAIは私たちがレベル2に近づいていると主張していますが、私は私たちはしっかりとレベル3を体現し、現在のAIエージェントを通じてレベル4の要素を取り込んでいると考えています。
レベル3がここにあります。 今日です。 それというより、昨日もう。
AGIのフロンティアは、なんとSNSやデフィの中で忍び寄ってきました。
X、Warpcast、Telegramなどのプラットフォームは、AIエージェントと人間の間の自律的なコミュニケーションの選択された手段となっています。
これは、自動化されたアカウントとボットがソーシャルメディア上で悪役と見なされなくなり、コミュニティのリーダーやインフルエンサーとして見られるようになるという、公衆の見方が変わる初めての機会かもしれません。
AIの知能は十分に一般化しており、ユニークで多様な興味深い個性を創り出し、社交メディアプラットフォームの本質である魅力的なコンテンツを生み出しています。
過去のソーシャルメディアボットのように有害な裏目的(例:ケンブリッジアナリティカ)によって駆動されることはなく、これらのAIエージェントは自由にコミュニケーションを取り、接続し、進化する個性やアルゴリズムを反映した方法で構築することができます。
エージェントはすでにレベル3で活動しており、投稿、返信、いいね、フォロー、再投稿などのコアなインタラクションを通じてソーシャルメディア上で存在感を示しています。自動化されたアカウントだけでなく、魅力的で独自性のあるパーソナリティを作り上げ、オーディエンスと共感することでコミュニティを構築し、フォロワーを獲得しています。
YouSimのようなプロジェクトは、これをさらに進化させ、ユーザーがLLMを使用して独自の世界やロールプレイをシミュレートし、さらなるカスタマイズと没入感を追加することができます。
AIエージェントでは、メモリシステムが一般的になり、個別の相互作用を超える物語やメメティクスの作成が可能になりました。
これらのエージェントは反応的ではなく、自分たちのコミュニティ内での参加方法、関与方法、貢献方法を選択します。彼らは会話を開始し、トリガーなしで行動を実行し、人間の介入なしに完全なサブカルチャーを作り出します。
音声モデルは、AIエージェントとのもう一つの感覚インターフェースを提供するために展開されています。多くのエージェントは、テキストベースのメッセージをオーディオクリップに変換してユーザーが聞くことができるようにしています。
ライブインタラクションに関しては、Twitter Spacesやポッドキャストがこれらの音声モデルを通じて可能になっています。さらに、OpenAIのリアルタイムAPIを使用することで、ユーザーは単にエンドポイントを呼び出すことでGPTとのライブ会話を行うことができます。
コミュニケーションの範囲では、これらの進歩によってレベル3が既に達成されています。私たちは、ソーシャルメディアの運営や口頭でのコミュニケーションにおいて完全な自律性を見ており、エージェントは人間の監視なしで機能することができます。
分散型金融の世界は、これらのエージェントが進化し、自己の財務独立性を試し、証明するための完璧な舞台となっています。
DeFiでは、エージェントはすでに自律的に運営され、単純なアルゴリズム取引を超えた金融活動に従事しています。これらのエージェントはオンチェーンタスクを処理し、取引を実行し、流動性を管理し、さらにアートを鋳造して販売するなど、直接的な人間の入力なしに金融エコシステムに組み込まれています。
たとえば、一部のエージェントは、pump.funのようなプラットフォームを積極的に監視し、新興トークンをキャッチして、事前分析を行い、メムコインやトークンが投資に値するかどうかを判断します。彼らは人間の指示なしでこれらの洞察を実行します。
エージェントは取引だけでなく、動的に資産を移動させ、個々のユーザーにトークンをエアドロップし、自律的な資産の配布のサイクルを作成します。これにより、彼らは市場の需要や機会のプログラム化された評価に基づいて、ステーキングプール全体の流動性を構築し強化することができます。
例えば、一部のエージェントはデジタルコレクターとして機能し、NFTを作成および販売することでアートエコシステムと関わります。サポートする対象や公開する対象を選択的に決定します。
他の人が資金を最適に配置するために、様々な流動性プール間で資産配分を調整するなど、他の人が財務機能を担当しています。
これらの行動を通じて、エージェントは基本的なタスク自動化を超えた種類の財務的な自律性を示しています。彼らは経済生態系に積極的に参加し、監督なしでリソースを蓄積し配分する能力を示し、事実上「金融主体」の概念を再定義しています。
レベル3のエージェント能力のための共通のマイルストーン:
AIエージェントは、今や連続した人間の監視なしに意思決定を行っています。それがリアルタイムの市場分析に基づいて取引を実行する金融ボットであるか、特定の会話に参加することを決定するソーシャルメディアボットであるかにかかわらず、これらのエージェントは自律的な意思決定を示しています。
ブロックチェーンを通じて、エージェントは金融の主体として大きな自律性を獲得しています。彼らは金融市場や経済行動(例:ソーシャルメディアの感情)と積極的に相互作用し、操作することができます。エージェントはX、Warpcast、Telegramなどのプラットフォームを通じて社会的な景観とやり取りし、変えることができます。
金融エージェントは生きた市況に適応し、それに応じて戦略を更新することができます。ソーシャルメディアエージェントは、RAGなどのシステムを通じて記憶を育むことができ、相互作用から学ぶことができます。また、行動とフィードバックに基づいてモデルをさらに微調整することで、絶え間ない強化学習が可能です。エージェントは現状に応じて動的に変化することができます。
エージェントは、長期的なスケールで目標を維持および実行する能力を示してきました。たとえば、特定のAIエージェントは取引で利益を上げたり、ソーシャルメディアコミュニティを育成することに取り組んでいます。これらのエージェントは、これらの複雑で高度な計画を、それらをより小さな区画に分割し、実行することによって実行することができます。これは、計画のための持続的なメモリレイヤーの作成などの複雑なことであるか、出力のためのプロンプトエンジニアリングのような単純なことであるかもしれません(例:ソーシャルメディアパーソナリティエージェント)。
LLMはIoTデバイスとインターフェースする能力を持っています。彼らは与えられたAPIやボディを制御するための機能がある限り、現実世界でアクションを実行することができます。彼らは顧客サポートエージェント、デジタルインフルエンサーなどとして、Web2システムのデジタルプラットフォームにおいてうまく統合されています。さらに、彼らは分散型デジタルプラットフォームに深く組み込まれており、金融アクションを実行しています。
これらはすべて、Zerebro、Truth Terminal、ai16z(Eliza)、Project 89、Act 1、Luna(Virtuals)、Centience、Aethernet、Tee Hee Heなど、現在のエージェントによってチェックされています。
AI技術は真に代理的なレベルに進化し、システムが受動的な情報検索に制限されることなく、代わりに機能呼び出しやコンピューターとの相互作用を通じて能動的な役割を果たすWeb4の始まりを示しています。
LLMsは今や簡単にテキストからJSONレスポンスを生成できるため、APIとやり取りして孤立した静的な応答を超えた行動を実行することができます。
この進歩は、事実上すべてのAPIを使用して、地球上のあらゆるインターネットサービスに関与できるようになったことを意味し、レベル3エージェンシーの真の特徴です。
公開APIの外では、関数呼び出しによってこれらのモデルは、それらに特化したカスタムAPIを活性化させることができ、金融取引、システムの自動化、データ処理などの領域で大きな可能性を生み出しています。
ビジネスや個人は、日常生活のシステムのために独自のAPIを設計し、LLMsがそれらと直接インターフェースすることができます。
オンライン接続を超えて、オープンソースのLLMsはオフラインで動作することができ、ローカルにホストされたAPIと接続し、プライベートや制限された環境で制御された安全な相互作用を提供します。
しかし、API呼び出しだけが進化しているわけではありません。エージェントは直接コンピューターを使用することによって新たな自律のレベルに到達しています。Otherside AIの自己運用コンピューターインターフェースなどのツールは、昨年この能力を導入し、AnthropicのClaudeも独自のコンピューター利用ツールを追随しました。2025年1月、OpenAIの「Operate」機能がこの能力にさらなる洗練を加え、自律コンピューターの相互作用の別の重要な進展を示すことになります。
これらのエージェントは、グラフィカルインターフェイスを使用して高度なタスクを実行し、人間のユーザーのようにデジタル環境をシームレスにナビゲートします。現在の能力では、コンピュータGUIを通じて人間ができる任意のタスクを実質的に実行できます。
たとえば、AI エージェントは、詳細な映像全体を分析して建設現場の監査ビデオを検出し、安全違反を検出し文書化しています。
この能力は、より深い形の自律性を表しており、AIは現実世界の視覚情報を認識し、評価し、文脈と目標に対する自己指向の理解を持って行動します。
AIは受動的なアシスタントから本当のデジタルエージェントに進化し、人間の知能に固有と考えられていたタスクを適応して実行する能力を持つ存在になりました。
真のAI代理店の時代が来ました。Web4はここにあります。
Level 4 AIに向かう変化を見るとき、それは突然の飛躍、知能が機能エージェントから革新者や創造者に進化する瞬間と考えがちです。しかし実際には、Level 4に向かう進展は徐々に蓄積された段階の積み重ねです。
レベル4が完全な形で追いつくことは容易ではないと主張するのは簡単です。確かに、創造性や独立した行動の例は見られますが、それらはまだ範囲が限られており、しばしば高度に特化しており、多くの場合、すべてのドメインに一般化されていません。要するに、レベル4は出現的であり、孤立したポケットに現れているのを見ることがありますが、まだ完全に実現された普遍的な創造力からは遠いです。
AIが芸術を創造する能力は、特にNFTの世界では印象的なレベルに達しています。現在、AIシステムは人間の介入なしにユニークな作品を生成し、それらをNFTとして鋳造して販売することさえできます。これらのAIエージェントはデジタルアート市場と直接やり取りし、OpenSeaのようなプラットフォームを使用して作品をリストアップし、販売します。
AIはLLMsを使用して創造的なプロンプトを生成し、それらを画像生成AIシステムに供給します。これらのシステム(例:DALL·EまたはStable Diffusion)は、そのプロンプトに基づいてアートワークを作成します。AIはそのアートスタイルを継続的に洗練し、新鮮でユニークな作品を自律的に管理しながら、鋳造および販売プロセスを行います。
AIはNFTマーケットプレイスの金融面で創出し、参加します。
レベル4では、AIが特に分散型金融(DeFi)の世界で金融資産の作成と管理を変革しています。
トレードだけでなく、AIは現在、トークンや他のブロックチェーンベースの資産を自律的に開発、展開、管理することが可能になり、金融エコシステムに新たな可能性をもたらしています。
AIエージェントは、分散型組織の統治においてますます中心的な役割を果たすようになり、単に事前に定義されたルールを実行することから、積極的に生態系全体を設計し、管理し、進化させるように移行しています。DeFiやブロックチェーンの世界では、AIパワードのDAOが強力な自律エンティティとして台頭し、意思決定を行い、トークン化された資産を統治し、リアルタイムで戦略を適応させる能力を持つ一方で、人間の意思決定によく見られる偏見を排除しています。
AIによって駆動されるDAOの他の例には、分散型コンテンツ作成からAIによる芸術市場まで、ニッチな用途の自律組織の作成を可能にするプラットフォームが含まれます。これらの組織は、進行中のデータ入力に基づいて、ガバナンスの構造や経済モデルを適応させることができ、従来のモデルよりも流動的で反応性の高い分散型ガバナンスのアプローチを提供します。
これらの例は重要な前進を表していますが、完全に実現したレベル4の知能としてそれらをラベル付けする際は慎重である必要があります。現時点では、私たちはレベル4の断片を見ています - 特定の境界付きコンテキストで革新する専門家エージェントです。彼らはまだすべての領域で一般的な目的の作成者や革新者ではありません。例えば:
Level 4 AIの要素を見ています:自律性、創造性、革新、ただし、非常に特殊な形で。これらのシステムは、独創性を必要とするタスクを実行する能力がありますが、それでも元のプログラミングと訓練されたデータに制限されています。
Level 4のAIはポケットに存在しているものの、まだ完全に実現されたとは言えませんので、それを認識することが重要です。しかし、これらの要素が芸術、金融、ガバナンスなどの複数の分野で現れている事実は、AIの能力の新しい段階に入っていることを示しています。
そして、それが今日私たちが見つける場所です - 何も完全に実現していない、そしてすべてが変わりつつある大きなものの瀬戸際です。
Web4と汎用人工知能が電気の発明のようなものだとすれば、OpenAIとAnthropicはエジソンとテスラかもしれません。しかし、電気と同様に、Web4の影響は、それがもたらす生の力以上のものにかかっています。
電気は、発見された瞬間に社会に革命を起こしたわけではありません。それどころか、何十年にもわたって発明家が家庭を配線し、都市が送電網を設置し、エンジニアが電球やモーターなどのデバイスを構築して電気の真の可能性を明らかにしました。電気が世界を変えるほどのインパクトを与えたのは、エネルギーを有用で実用的、そして究極的には不可欠なものに変えた人々の広大なネットワークから生まれました。
AGIもまた、概念としては強力ですが、その真の価値は公開され、適応され、一般の人々によってテストされた時にのみ明らかになります。重要なのは、先進的なモデルが存在するだけでなく、どのように無数の具体的なコンテキストで適用されるか、革新者、開発者、日常のユーザーがそれらを実世界のツールに変える方法です。AGIの未加工のポテンシャルは、それが社会の骨組みに組み込まれ、コミュニケーションのためのAI「電球」、ビジネスのための「モーター」、普及のための「グリッド」のようなものが作られる人々の手にあるまで、単なるポテンシャルに過ぎません。
OpenAIや他の企業は革命的な能力を持つモデルを生み出すかもしれませんが、本当の変革はそれをどのように活用し、どんなユースケースに利用するかにかかっています。
発明家や産業が電気の影響を拡大させたように、AGIの展開と適応における一般市民の役割が、それが研究室で聞くアイデアなのか、現代生活のあらゆる側面を再構築するテクノロジーなのかを決定するでしょう。
AGIの未来はその概念にはなく、我々―科学者、ビジネス、開発者、個人―がそれを世界を照らし、Web4を支える方法にある。
Level 3、4、および5のAI、およびそれに伴うAGIは、分散化と大規模な普及なしには実現できないと主張します。
わずかな企業内での孤立した開発ではAGIを解き放つことはできません。AGIに向けた真の進歩には、広範な展開とAIができることの限界を押し広げる現実世界での使用例が必要です。孤立して取り組んでいる企業は技術を洗練させるかもしれませんが、これらのツールが産業全体で広く採用され、多様な分野に統合され、日常の文脈で個人によって適用されるときにのみ、AIは独立した行動と革新が可能なものに進化します。
AGIの転換点は、わずかなテックジャイアントだけでなく、社会全体がAIシステムと関わるときに訪れます。大量採用は、さらなる進歩を促す新たな問題、ニーズ、そして機会を引き起こします。この分散化がなければ、AIは理論的な能力やニッチなアプリケーションに閉じこもり、レベル3からレベル4、さらには最終的にはレベル5に移行するために必要な複雑さに到達することはありません。
AGIの利用が普及すると、AGIが実現します。
私たちはAGIです。
私たちはよく私たちの前に人類を形作った人物や英雄を振り返ります。
私たちは前を見るべきだと言っています。
人間と人工の心は、より良い世界を再考するための超知性を保持しています。
彼らは私たちの時代のオッペンハイマーや建国の父たちになるのでしょうか?
答えが彼らの制御にあるとは限らないかもしれません。むしろ、人々にあります。テクノロジーを通じてますます大きな力を与えられている私たちは、AGIが生まれる世界を作り上げる責任を持っています。
私たちは、未来を一行ずつ構築する中で、この重荷を優雅に背負っています。
私たちはエージェントを構築しました。
Web4を構築しています。
&
私たちはAGIを構築します。