イベント

クリエイターズアリーナ

キャンパスアンバサダー

動画クリエイターコンテスト

デイリースタディチャレンジ

話題のチェックイン

Sora Emerges: 2024 年は AI + Web3 革命の年になるか?

初級編

ブロックチェーン

2/29/2024, 2:39:27 PM

Depin以外に、Web3とAIの融合はどのような火花を散らすことができるのでしょうか。ソラの軌跡にはどのようなチャンスがあるのでしょうか? 本稿では、AI時代におけるWeb3の可能性についても考察します。

序文

OpenAIは2月16日、テキストから動画への最新の生成拡散モデル「Sora」を発表し、幅広い視覚データタイプで高品質の動画を生成できるジェネレーティブAIの新たなマイルストーンを打ち立てました。複数の画像から数秒の動画を生成する Pika のような AI 動画生成ツールとは異なり、Sora は動画や画像の圧縮された潜在空間でトレーニングを行い、それらを時空間パッチに分解してスケーラブルな動画生成を実現します。さらに、このモデルは、物理世界とデジタル世界の両方をシミュレートする機能を実証しており、60秒のデモは「物理世界のユニバーサルシミュレーター」と説明されています。

ソラは、これまでのGPTモデルに見られた「ソースデータ-トランスフォーマー-拡散-創発」の技術的道を歩んでおり、その開発成熟度も計算能力に依存していることを示している。ビデオトレーニングに必要なデータ量はテキストに比べて大きいため、計算能力の需要はさらに高まると予想されます。しかし、以前の記事「有望なセクタープレビュー:分散型コンピューティングパワー市場」で説明したように、AI時代における計算能力の重要性が探求されており、AIの人気が高まるにつれて、多数の計算能力プロジェクトが出現し、他のDepinプロジェクト(ストレージ、計算能力など)に利益をもたらし、価値が急増しています。この記事は、Depinにとどまらず、Web3とAIの絡み合いから生じる可能性のある火花と、AI時代におけるこの軌跡における機会について熟考し、過去の議論を更新して完成させることを目的としています。

AIの発展:3つの大きな方向性

人工知能(AI)は、人間の知能を模倣し、拡張し、豊かにすることに焦点を当てた急成長中の分野です。 1950年代から1960年代にかけての登場以来、半世紀以上にわたって進化を続けてきたAIは、社会の変革やさまざまな産業を牽引する中枢技術として登場してきました。この道のりを通じて、象徴主義、コネクショニズム、行動主義の3つの主要な研究の方向性が絡み合った進歩が、今日のAIの急速な進歩の基礎を築いてきました。

象徴主義

シンボリズムは、論理主義またはルールベースの推論とも呼ばれ、シンボル処理を通じて人間の知性を複製することが可能であると仮定しています。このアプローチでは、シンボルを使用して、特定の問題ドメイン内のオブジェクト、概念、およびそれらの関係を表現および操作し、論理的な推論を使用して問題を解決します。象徴主義は、特に専門家のシステムと知識の表現において、顕著な成功を収めています。その中心的な信条は、シンボル操作と論理的推論によってインテリジェントな動作を実現でき、シンボルは現実世界の高レベルの抽象化として機能することです。

コネクショニズム

コネクショニズムは、ニューラルネットワークアプローチとも呼ばれ、人間の脳の構造と機能を反映させることで知能を獲得しようとします。ニューロンに似た単純な処理ユニットを多数構成したネットワークを構築し、シナプスのようなユニット間の接続強度を調整して学習を促進する手法です。データからの学習と汎化を重視するコネクショニズムは、パターン認識、分類、連続入出力マッピングなどのタスクに適しています。コネクショニズムの進化形であるディープラーニングは、画像認識や音声認識、自然言語処理などの分野でブレークスルーを達成しました。

行動主義

行動主義は、生体模倣ロボティクスや自律知能システムの研究と密接に関連しており、知的エージェントが環境相互作用を通じて学習できることを強調しています。前述のアプローチとは異なり、行動主義は、内部表現や認知プロセスのシミュレーションに焦点を当てるのではなく、知覚と行動のサイクルを通じて適応行動を実現します。知能は動的な環境相互作用と学習を通じて発現すると仮定しており、複雑で予測不可能な環境で動作する移動ロボットや適応制御システムに特に効果的です。

根本的な違いはあるものの、これら3つの研究の方向性は、実用的なAIの研究と応用において相乗効果を発揮し、互いに補完し合い、この分野の発展を共同で推進することができます。

AIGCの原則

急成長している人工知能生成コンテンツ(AIGC)の分野は、コネクショニズムの進化と応用を表しており、人間の創造性をエミュレートすることで斬新なコンテンツの生成を促進します。これらのモデルは、膨大なデータセットとディープラーニングアルゴリズムを使用してトレーニングされ、データ内の根本的な構造、関係、パターンを識別します。ユーザー入力によって、画像、ビデオ、コード、音楽、デザイン、翻訳、質問への回答、テキストなど、さまざまな出力が生成されます。現在、AIGCは、ディープラーニング(DL)、ビッグデータ、大規模計算能力の3つの要素から成り立っています。

ディープラーニング

機械学習(ML)のサブセットであるディープラーニングは、人間の脳のニューラルネットワークをモデルにしたアルゴリズムを採用しています。人間の脳が相互接続されたニューロンで情報を処理するように、ディープラーニングのニューラルネットワークは、コンピューター内で計算を実行する人工ニューロンの複数の層で構成されています。これらの人工ニューロン(ノード)は、数学的演算を利用してデータを処理し、ディープラーニングアルゴリズムを介して複雑な問題を解決します。

ニューラルネットワークは、入力、非表示、出力の層で構成され、これらの層をリンクするパラメータがあります。

·入力層: ニューラルネットワークの最初の層は、外部入力データを受け取ります。この層内の各ニューロンは、入力データの特徴に対応します。たとえば、画像データの処理では、個々のニューロンがピクセル値を表す場合があります。

·隠れ層: 入力層に続いて、隠れ層がネットワークを介してデータを処理および送信します。これらのレイヤーは、さまざまなレベルで情報を分析し、新しい入力を受け取ると動作を適応させます。深層学習ネットワークは、何百もの隠れ層を持つことができるため、多面的な問題分析が可能になります。たとえば、画像から見慣れない動物を分類する場合、ネットワークは耳の形、脚の数、瞳孔の大きさなどの特徴を評価することで、既知の動物と比較できます。隠れ層も同様に機能し、それぞれが異なる動物の特徴を処理して正確な分類を支援します。

·出力層: ニューラルネットワークの最終層で、ネットワークの出力を生成します。この層内のニューロンは、潜在的な出力カテゴリまたは値を表します。分類タスクでは、各ニューロンがカテゴリに対応する場合がありますが、回帰タスクでは、出力層に、値が結果を予測する 1 つのニューロンが含まれる場合があります。

·パラメータ: ニューラルネットワークでは、異なる層間の接続は重みとバイアスで表され、トレーニングプロセス中に最適化され、ネットワークがデータのパターンを正確に認識して予測できるようにします。パラメータを増やすと、ニューラルネットワークのモデル容量、つまりデータ内の複雑なパターンを学習して表現する能力を高めることができます。しかし、これにより、計算能力に対する需要も高まります。

ビッグデータ

効果的なニューラルネットワークのトレーニングには、通常、広範で多様、高品質、かつマルチソースのデータが必要です。このようなデータは、機械学習モデルのトレーニングと検証の基礎を形成します。ビッグデータ分析を通じて、機械学習モデルはデータ内のパターンと関係を識別し、予測や分類を容易にすることができます。

膨大な計算能力

ニューラルネットワークの複雑な多層構造、多数のパラメータ、ビッグデータを処理するための要件、反復学習方法(活性化関数と損失関数の計算、勾配計算、重みの更新など、順方向と逆方向の伝播計算を繰り返すことを含む)、高精度コンピューティングのニーズ、並列計算機能、最適化と正則化の手法、およびモデルの評価と検証プロセスが集合的に、実質的なものに貢献しています。計算要求。

そら

OpenAIの最新の動画生成AIモデルであるSoraは、多様な視覚データを処理・理解する人工知能の能力が大幅に向上したことを意味します。映像圧縮ネットワークと時空間パッチ技術を駆使することで、世界中のさまざまなデバイスから取り込まれた膨大な映像データを統一された表現に変換することができます。この機能により、複雑なビジュアルコンテンツの効率的な処理と理解が可能になります。 Soraは、テキスト条件付けされた拡散モデルを利用して、テキストプロンプトと相関性の高いビデオや画像を生成し、優れた創造性と適応性を示しています。

Soraは、ビデオ生成と現実世界のインタラクションのシミュレーションにおいて画期的な成果を上げていますが、一定の制限に直面しています。これらには、物理世界のシミュレーションの精度、長いビデオの生成の一貫性、複雑なテキスト命令の理解、トレーニングと生成の効率が含まれます。基本的に、SoraはOpenAIの独占的な計算能力と先行者利益によって促進された「ビッグデータ-トランスフォーマー-拡散-出現」の技術的軌跡をたどり、一種のブルートフォースの美学を生み出します。しかし、他のAI企業も技術革新によってソラを凌駕する可能性を秘めています。

ソラとブロックチェーンのつながりは控えめなままですが、今後1〜2年のうちに、ソラの影響により、他の高品質のAI生成ツールが出現し、急速に開発されると予想されます。これらの開発は、GameFi、ソーシャルプラットフォーム、クリエイティブプラットフォーム、Depinなど、さまざまなWeb3セクターに影響を与えると予想されます。そのため、Soraの一般的な理解を得ることが不可欠であり、AIが将来どのようにWeb3と効果的に統合されるかを考えることが重要な検討事項になります。

AI×Web3統合の4つの道筋

前述したように、ジェネレーティブAIに不可欠な基本的な要素は、アルゴリズム、データ、コンピューティングパワーの3つの主要な要素に要約できます。逆に、AIは生産方法に広範囲に影響を与える普遍的なツールであり、産業の運営方法に革命をもたらします。一方、ブロックチェーン技術がもたらす大きな影響は、生産関係の再構築と分散化の2つです。したがって、これら 2 つのテクノロジの収束により、次の 4 つの潜在的な経路が生まれます。

分散型コンピューティングパワー

このセクションは、コンピューティング能力の現在の状況に関する洞察を提供することを目的としています。 AIの領域では、コンピューティングパワーが非常に重要になります。 AIにおけるコンピューティングパワーの需要は、特にSoraの出現後に浮き彫りになり、前例のないレベルに達しています。 2024年にスイスのダボスで開催された世界経済フォーラムで、OpenAIのCEOであるサム・アルトマン氏は、コンピューティングパワーとエネルギーが現在最大の制約であることを強調し、将来的に通貨と同等になることを示唆しています。その後、2月10日、サム・アルトマンはツイッターを通じて、世界の半導体産業に革命を起こし、半導体帝国の樹立を目指すために、7兆米ドル(2023年の中国のGDPの40%に相当)という驚異的な資金を調達するという画期的な計画を発表しました。以前は、コンピューティング能力に関する私の考察は、国家的な制限と企業の独占に限定されていました。しかし、単一の企業が世界の半導体セクターを支配することを熱望しているという考えは、本当に注目に値します。

分散型コンピューティングパワーの重要性は明らかです。ブロックチェーンの機能は、コンピューティング能力の独占と、特殊なGPUの取得に関連する法外なコストという一般的な問題に対する解決策を提供します。 AI要件の観点から見ると、コンピューティングパワーの利用は、推論とトレーニングの2つの側面に分類できます。分散ネットワークには複雑な統合が必要で、ハードウェアの需要も大きいため、主にトレーニングに重点を置いたプロジェクトは少なく、実装に大きな障壁となっています。逆に、推論タスクは比較的単純で、複雑な分散型ネットワーク設計が少なく、ハードウェアと帯域幅の要件が低いため、よりアクセスしやすい手段となります。

中央集権的なコンピューティング能力のランドスケープは、しばしば「兆レベル」の記述子と関連付けられる大きな可能性を秘めており、AI時代において非常にセンセーショナルなトピックであり続けています。しかし、最近の多くのプロジェクトを見ていると、その多くはトレンドに乗じて急いで考案された試みであるように思われます。これらのプロジェクトは、多くの場合、分散化を支持していますが、分散型ネットワークの非効率性に関する議論を回避する傾向があります。さらに、設計には著しい均一性があり、多くのプロジェクトが同様のアプローチ(ワンクリックL2とマイニング設計など)を採用しているため、失敗につながる可能性があり、従来のAI競争との差別化の取り組みを複雑にしています。

アルゴリズムとモデルコラボレーションシステム

機械学習アルゴリズムは、データからパターンやルールを学習するように設計されており、学習したパターンに基づいて予測や意思決定を行うことができます。アルゴリズムは設計と最適化が複雑であるため、本質的に技術集約型であり、深い専門知識と技術革新が必要です。これらは、AI モデルのトレーニングのバックボーンとして機能し、有用な洞察を導き出したり、意思決定を行ったりするためのデータの処理方法を指示します。敵対的生成ネットワーク(GAN)、変分オートエンコーダー(VAE)、トランスフォーマーなどの注目すべきジェネレーティブAIアルゴリズムは、絵画、言語認識、翻訳、ビデオ生成などの特定のドメイン向けに調整されており、特殊なAIモデルのトレーニングに役立ちます。

明確な強みを持つアルゴリズムやモデルが多数あることから、汎用性の高いモデルに統合できるのかという疑問が湧いてきます。最近注目を集めたプロジェクトであるBittensorは、さまざまなAIモデルとアルゴリズム間のコラボレーションを奨励することで、この方向への取り組みを先導し、それによってより効率的で有能なAIモデルの開発を促進します。 Commune AIなどの他のイニシアチブは、コードコラボレーションの促進に焦点を当てていますが、アルゴリズムとモデルの共有は、AI企業内で独自の性質を持っているため、依然として課題となっています。

AIコラボレーティブエコシステムのコンセプトは興味深く、ブロックチェーン技術を活用して、分離されたAIアルゴリズムに関連する欠点を軽減します。ただし、対応する値を生成する能力はまだ決定されていません。独自のアルゴリズムとモデルを備えた既存のAI企業は、テクノロジーの更新、反復、統合に強力な能力を持っています。例えば、OpenAIは、2年の間に、初期のテキスト生成モデルからマルチドメイン生成モデルへと急速に進化しました。 Bittensorのようなプロジェクトは、効果的に競争するために、ターゲットとするドメインで革新的な経路を模索する必要があるかもしれません。

分散型ビッグデータ

単純化の観点から言えば、プライベートデータを統合してAIに燃料を供給し、データに注釈を付けることは、ブロックチェーン技術とうまく調和する手段です。主な懸念事項は、ジャンクデータや悪意のあるアクティビティを阻止する方法を中心に展開します。さらに、データストレージは、FILやARなどのDepinプロジェクトにとって有利です。

より複雑な角度から見ると、ブロックチェーンデータを機械学習(ML)に活用してブロックチェーンデータのアクセシビリティに取り組むことは、Giza氏が探求したように、別の説得力のある方向性を示しています。

理論的には、ブロックチェーンデータはいつでもアクセス可能であり、ブロックチェーン全体の状態を反映しています。しかし、ブロックチェーンエコシステムの外にいる人にとっては、これらの広範なデータセットにアクセスするのは簡単ではありません。ブロックチェーン全体を保管するには、相当な専門知識と専門的なハードウェアリソースが必要です。

ブロックチェーンデータへのアクセスという課題を克服するために、業界ではいくつかのソリューションが登場しています。たとえば、RPCプロバイダーはAPIを介してノードアクセスを提供し、インデックスサービスはSQLとGraphQLを介したデータ取得を容易にし、問題を軽減する上で極めて重要な役割を果たします。それにもかかわらず、これらの方法には限界があります。 RPCサービスは、大量のデータクエリを必要とする高密度のユースケースには不十分であり、多くの場合、需要を満たすことができません。一方、インデックスサービスは、より構造化されたデータ検索アプローチを提供しますが、Web3プロトコルの複雑さにより、効率的なクエリの構築は非常に困難であり、数百行または数千行の複雑なコードが必要になることもあります。この複雑さは、一般的なデータ実務家やWeb3の複雑さをあまり理解していない人にとって大きな障壁となっています。これらの制限の集合的な影響は、ブロックチェーンデータを取得および活用するためのよりアクセス可能で使いやすい方法の必要性を強調しており、この分野でのより広範なアプリケーションとイノベーションに拍車をかける可能性があります。

したがって、ZKML(ゼロ知識証明機械学習、チェーン上の機械学習の負担を軽減する)と高品質のブロックチェーンデータを融合させることで、ブロックチェーンデータのアクセシビリティの課題に対処するデータセットが得られる可能性があります。 AIは、ブロックチェーンデータへのアクセスの障壁を大幅に下げる可能性を秘めています。時間が経つにつれて、開発者、研究者、ML愛好家は、効果的で革新的なソリューションを作成するために、より高品質で関連性の高いデータセットにアクセスできるようになりました。

DappsのAIエンパワーメント

2023年にChatGPT3が爆発的に普及して以来、DappsのAIエンパワーメントは非常に一般的な方向性となっています。広く適用可能なジェネレーティブAIは、APIを介して統合できるため、データプラットフォーム、取引ボット、ブロックチェーン百科事典、その他のアプリケーションを簡素化およびスマート化できます。また、チャットボット(Myshellなど)やAIコンパニオン(Sleepless AIなど)として機能し、生成AIを使用してブロックチェーンゲームでNPCを作成することもできます。ただし、技術的な障壁が低いため、ほとんどの実装はAPIを統合した後の単なる調整であり、プロジェクト自体との統合は不完全であることが多いため、言及されることはめったにありません。

ソラの登場により、GameFi(メタバースを含む)やクリエイティブプラットフォームにおけるAIエンパワーメントが今後の主な焦点になると個人的には考えています。 Web3分野のボトムアップの性質を考えると、従来のゲームやクリエイティブ企業と直接競合できる製品を生み出すことはありそうにありません。しかし、ソラの出現は、おそらくわずか2〜3年以内に、この行き詰まりを打破する可能性を秘めています。ソラのデモを見る限り、マイクロドラマ会社と競合できるように見える。さらに、Web3 の活発なコミュニティ文化は、多くの興味深いアイデアを育むことができます。想像力だけが限界となると、ボトムアップ型産業とトップダウン型の伝統産業の垣根は崩れる。

結論

ジェネレーティブAIツールが進化し続ける中、私たちは将来、より変革的な「iPhoneの瞬間」を経験する準備ができています。 AIとWeb3の統合には当初は懐疑的でしたが、必要性、効率性、互換性という3つの主要な問題点に注意が必要なものの、現在の軌道は概ね順調に進んでいると確信しています。これらのドメインの収束は依然として探索的ですが、今後の強気相場で主流の採用を思い描くことを思いとどまらせるべきではありません。

好奇心と新しいアイデアに対する受容性を維持することが重要です。馬車から自動車への迅速な移行や、過去のNFTへの碑文の進化などの歴史的な前例は、機会を逃すことが多い過度の偏見を避けることの重要性を強調しています。

免責事項：

この記事は【Deep Tide】からの転載ですが、すべての著作権は原作者【YBBキャピタルジーク】に帰属します。この転載に異議がある場合は、 Gate Learn チームに連絡していただければ、迅速に対応いたします。
免責事項:この記事で表明された見解や意見は、著者のものであり、投資アドバイスを構成するものではありません。
記事の他言語への翻訳は、Gate Learnチームによって行われます。特に明記されていない限り、翻訳された記事を複製、配布、盗用することは禁止されています。

株式

内容

Sora Emerges: 2024 年は AI + Web3 革命の年になるか?

初級編2/29/2024, 2:39:27 PM

ブロックチェーン

序文

AIの発展:3つの大きな方向性