対談 | 3ヶ月で79の基本大型モデルが誕生 中国に必要な大型モデルとは?

文:呉君宇 編集:謝立栄

出典: ファイナンスイレブン

画像ソース: Unbounded AI によって生成

昨年末にChatGPTがリリースされて以来、中国企業は少なくとも79の基本的な大型モデルをリリースした。ただし、大規模なモデルのほとんどは、ChatGPT との技術的なギャップがあると外部から見なされています。大型モデルのビジネスが目前に迫っているが、中国にはどのような大型モデルが必要なのか?

マイクロソフトが出資するAIスタートアップ企業OpenAIは2022年12月、会話型AI「ChatGPT」をローンチした。 ChatGPT は本質的に OpenAI によって独自に開発された GPT 言語の大規模モデルであり、約 1,800 億のパラメーターが含まれています。今年2月、NvidiaのCEO、Huang Renxun氏は「ChatGPTはiPhoneにAIの時代をもたらした」とコメントした。 Huang Renxun 氏は、大規模なモデルによってアプリケーション開発の敷居が下がっており、すべてのアプリケーションは大規模なモデルでやり直す価値があると考えています。

これは黄仁勲さんの家族の言葉ではなく、誰もがチャンスだと考えている。今年3月以降、中国企業も競って大型モデルの製品を投入している。これらには、Baidu の Wenxin モデル、Ali の Tongyi モデル、Tencent のインダストリー モデルなどのトップ企業、Xunfei や SenseTime などの業界企業、さらには多数の新興企業が含まれます。 5月、科学技術省傘下の中国科学技術情報研究院は「中国人工知能大型モデルマップに関する研究報告」を発表した。報告書によると、5月28日の時点で、中国ではパラメータ10億を超える基本的な大型モデルが少なくとも79台リリースされている。

モデルのパラメータの数は重要です。現在、Baidu や Ali などの大手企業は、Wenxin と Tongyi のパラメータボリュームが通常 1,000 億レベルであると発表しており、例えば Wenxin 大型モデルのパラメータボリュームは 2,600 億です。他の企業や新興企業の大規模モデルのパラメーターは、通常 100 億または 10 億のレベルです。

**現在市場に公開されている AI モデルはすべて「ビッグモデル」と呼ばれていますが、デフォルトではパラメータの数が大規模モデルと小規模モデルを決定する要素の 1 つであると考えられています。 **百度グループの副社長、侯振宇氏は財経記者に対し、2022年に10億個のパラメータを持つモデルは大規模モデルと呼ばれると語った。しかし、現在の大規模なモデルのパラメーターは、多くの場合数千億です。 「知的創発」効果は1000億を超えるパラメータで発現するため、汎化能力が形成され、様々なシナリオにおける普遍的な能力が形成されます。この大規模なモデルに基づいて微調整されたモデルは、より優れた産業応用効果をもたらします。

**「インテリジェントな創発」効果とは、モデルの規模と計算能力レベルが特定のパラメーターのしきい値を超えた後、AI の効果がランダムな確率のイベントではなくなるという事実を指します。 **一般分野では、パラメータの量が多いほど、一般に知性が発現する可能性が高くなり、AIの精度が高くなります。専用の垂直フィールドでは、大きなパラメーターのモデルを切り取って最適化した後、正確な結果を得ることが容易になります。

中国では少なくとも79の大規模モデルが登場しているが、財経がインタビューした多くの業界専門家は、大規模モデルには計算能力、アルゴリズム、データの蓄積が必要だと考えている。高性能 GPU チップの不足、ハードウェアの調達コスト、運用コストの高さにより、中国には大型モデルの商品化を実行するための資本準備金、戦略的意志、実践能力を備えた企業がほとんどありません。 「百モデル戦争」においては、ほとんどの製品とChatGPTの間には確かに差があります。

騒動後、大物模型マニアが徐々に現実に戻りつつある。国内外の大規模モデル市場ではより合理的な考え方が台頭しており、商品化できないChatGPTはおもちゃでしかなく、エンタープライズアプリケーションとなり得る大規模モデルには産業上の価値がある。

Apple、Samsung、JPMorgan Chase などの企業は、セキュリティ上の懸念から従業員による ChatGPT の使用を禁止しています。一方で、ChatGPT ユーザーの増加と維持もボトルネックに達しています。 Webサイト分析ツールSimilarWebのデータによると、1月から5月までのChatGPTのトラフィック増加率は131.6%、62.5%、55.8%、12.6%、2.8%でした。 6 月初旬のモルガン・スタンレーの調査によると、ChatGPT を使用したことがあると回答したのは回答者の 19% のみで、ChatGPT に依存していると回答したのはわずか 4% でした。

Hou Zhenyu 氏は、「今年 3 月に顧客が初めて大型モデルのニーズについて私たちに話し始めたとき、彼らは皆想像力を働かせて、より多くの SF を求めていました。しかし 4 月以降、大型モデルの限界が見えてきました。 「主観的要因と客観的要因の影響を受けて、世界の基本的な大型モデルは主に To B 業界市場を指向しています。

**To C エンドでの大型モデルの商品化は遅れています。 **現在、計算能力のコストが高く、ユーザー規模が大きくなるほど企業の損失も大きくなるなどの問題に直面しています。誤った「ノイズ」を出力することも避けられず、情報漏洩や政策監視といった倫理的な問題さえある。 Microsoft でさえ、ツール製品 (オフィス オフィス スイート、Web ブラウザ、Photoshop などの写真編集ツール) でのみ大規模なモデルを展開しています。 Microsoft がツール会社にサービスを販売する本質は、依然として To B の商用化です。

**これは、B エンドの企業顧客向けに大規模なモデルを実装するための実用的なアプローチです。 **産業市場では、顧客のニーズは活発かつ明確です。世界中で、小売、金融、製造、政府、その他の分野が、インテリジェントなアップグレードのために大型モデルに依存しています。業界のコンセンサスは、大規模モデルに基づいて業界の知識に基づいて微調整されたモデルの方が、最適化されていない汎用の大規模モデルよりも優れたパフォーマンスを発揮するということです。

市場調査会社IDCが今年5月に発表したデータによると、2022年の中国の人工知能市場規模はハードウェア81億3000万ドル、ソフトウェア26億9000万ドル、サービス14億1000万ドルの合計122億ドルとなる見通しだ。 IDC は、2026 年に中国の人工知能市場は 269 億米ドルに達し、そのうちハードウェアが 148 億 5000 万米ドル、ソフトウェアが 76 億 9000 万米ドル、サービスが 38 億 9000 万米ドルに達すると予測しています。ハードウェア、ソフトウェア、サービスの年間複合成長率は、それぞれ 15.1%、32.0%、28.5% です。

狂信は必ず現実に戻ってくる。 『ファイナンス』は6月、百度グループ副社長侯振宇氏と百度スマートクラウド副社長朱勇氏と「中国が本当に必要としているモデルは何か?」をテーマに対談を行った。侯振宇氏と朱勇氏Baidu Wenxin Qianfan この会話では、モデル プラットフォームの作成と商業エコロジーの形成という 3 つの主要な問題について話し合いました。 大型モデルは高級ゲームですか?企業はどのような大きなモデルを必要としていますか?大型モデル市場にバブルが起きているのか?

対談者のプロフィール:

百度グループ副社長、侯振宇氏(百度スマートクラウドビジネスグループのクラウドコンピューティング生産研究チームおよび基礎技術エンジニアリングチーム担当)

Zhu Yong 氏、Baidu Smart Cloud 副社長 (Baidu Smart Cloud アプリケーション製品センター担当)

ホスト: 謝立栄、財経誌副編集長

以下は対話記録の要約版です。

**ビッグモデルは高級ゲームですか? **

** 「金融」謝立栄:中国は大型モデル起業の波を引き起こしており、大型モデルの敷居は非常に高いが、中国市場の現状は観点から見てそうではないようだ参入のスピードと規模は? **

Zhu Yong: 大型モデルの敷居は相対的なものであり、さまざまなタイプのプレイヤーが存在します。最初のカテゴリは Baidu と同じで、基本的な大型モデルをゼロから作成します。これには、コンピューティング能力、アルゴリズム、データ、人材に対する非常に高い要件が求められます。

データを例にとると、基本的な大規模モデルには、インターネット データ、専門分野のデータ、ニュース情報データ、専門的にラベル付けされた高品質のデータなど、大量のデータ トレーニングが必要です。コンピューティング能力を例に挙げると、ChatGPT などの数千億のパラメータを持つ大規模なモデルは、NVIDIA の最もハイエンドの A100/H100 GPU を使用して 100 日間継続的にトレーニングする必要があります。アルゴリズムと才能も重要です。同じ原材料を使って異なる料理人が異なる味の料理を作るのと同じように、エンジニアにも異なるトレーニング方法があります。これには長期にわたる実務経験の蓄積が必要となるため、敷居が非常に高いです。

2 番目のカテゴリは大規模インダストリ モデルで、基本的な大規模モデルの機能に基づいた微調整と的を絞ったカスタマイズが必要です。これは、これまでデータのラベル付けやアルゴリズムの微調整をゼロから行っていたコストよりもはるかに低くなります。 3 番目のカテゴリは、最初の 2 つの大きなモデルに基づいてアプリケーションを開発するもので、Baidu、その他の企業、さらには一部のオープン ソース プラットフォームでも、ソフトウェア開発の敷居を下げるための開発ツールが提供されています。

**「金融」謝立栄:世界市場における中国の大型モデルのレベルはどの程度ですか? **

**Hou Zhenyu:**個人的には、中国の大型モデルが依然として世界市場をリードしていると思います。大規模モデル開発と検索エンジン開発は実は似ており、どちらも非常に深い技術蓄積が必要です。世界的に見て、検索エンジン技術を独自に研究開発している国はわずかです。現時点で完全に独立して大型模型技術を開発できるのは中国と米国の二か国だけかもしれない。

** 「金融」謝立栄氏: 大型モデルには絶対的な進歩と後退はありますか? **

**Hou Zhenyu: **大型モデルが絶対的に良いとか悪いというわけではありません。分野によって多少の違いはあるかもしれませんが、スマートフォンを選ぶようなものです。 Appleを使う人もいれば、Androidを使う人もいますが、最適なものが最適です。この大型モデルが最初に発売されたとき、人々はそれについてしばしばいくつかの難しい質問をしました。しかし実際には、本当に深刻なエンタープライズレベルの環境では、そのようなシナリオはほとんどありません。企業は、ビジネス シナリオに応じて、より適切な大規模モデルを選択する必要があります。特に中国企業は中国語を理解し、中国企業の特性に合った製品を選択する必要があります。

** 「財務」謝立栄氏: 百度は大規模モデルにどれだけのリソースと人材を投資しましたか? **

**Hou Zhenyu: **AI 大規模モデルは Baidu の中核戦略であり、継続的かつ包括的な大規模投資が必要です。コンピューティングパワーを例に挙げると、これまでに蓄積してきたGPUの数は数万単位にのぼり、膨大な投資となります。 Baidu は、モデルをより速く、より適切にトレーニングするために、長年にわたってツール チェーンの完全なセットを開発してきました。

過去 10 年間で、百度は AI に 1,000 億元以上を投資してきました。テクノロジー企業として、Baidu は毎年、収益の 20% 以上を研究開発に費やしています。 (注:2019年以降、百度の中核的研究開発支出は長らく売上高の20%以上を占めていた。2022年時点で百度の研究開発支出比率は24%で、中国テクノロジー企業の中でファーウェイの25%に次いで2位となっている。百度のコアとは、以下を除くものを指す) Aiqi Baidu は芸術の後に独自のビジネスを持っていますが、大きなモデルは、モデルを作成するために多額の資金を投資するほど単純ではなく、コンピューティング能力、データ、経験豊富な AI エンジニアが長期にわたって優れたデータを蓄積する必要があります。研究開発プラットフォーム。

**「金融」Xie Lirong: お金、カード、データに加えて、新興企業が基本的な大規模モデルを作成する際の課題は何ですか? **

**Hou Zhenyu: **お金、カード、データは、それ自体が非常に困難です。スタートアップ企業は基本的な大規模モデルを作成するため、最小限の計算能力、十分で高品質なデータ、経験豊富なAI研究開発人材に加えて、モデルと計算能力を適切に管理できるAI開発プラットフォームも必要とします。現在、大企業はこれらのプラットフォームを利用してクラウドの形で外部サービスを提供することになります。たとえば、Baidu Smart Cloud は、Wenxin Qianfan 大規模モデル プラットフォームを通じて外部サービスを提供します。ただし、基本的な大規模モデルをゼロからトレーニングする敷居は依然として非常に高いです。なぜなら、大規模なモデルはトレーニングに十分ではなく、継続的なアジャイルな反復も必要であり、大企業は比較的成熟しているからです。

** 「金融」謝立栄氏: 一部の企業は独自の大規模モデルを構築し始めています。大きなモデルを自分で構築する必要がありますか? 2014 年にパブリック クラウドが登場したばかりのとき、一部の顧客はデータのセキュリティを心配していましたが、大規模なモデルを使用する場合もこの問題を心配するのでしょうか? **

**Hou Zhenyu:**すべての企業は大規模モデルを使用する必要がありますが、すべての企業が独自に大規模モデルを作成する必要があるのでしょうか?私はそうは思わない。基本的な大型モデルを自分で一から作るのは非常に高価です。企業は自社のデータを使用して他人の基本モデルを微調整することができ、非常に優れた結果を達成することもできます。

Zhu Yong: 企業は、大規模なモデルをどのように使用するか、また大規模なモデルをうまく活用する方法についてもっと考える必要があると思います。どの企業も独自のモックアップを持つことができますが、最初からやり直す必要はありません。それは、Baidu のような企業が優れた技術基盤を提供してきたからです。 Baidu に頼ってカスタマイズされた製品を作成することもでき、顧客にとってはコスト効率の高い選択肢となります。データ セキュリティの問題は、大規模モデルの出現によってもたらされる新しい問題ではありません。クラウドコンピューティングに例えると、パブリッククラウド、プライベートクラウド、ホスティングなどがあります。大規模なビジネスモデルにおいては、対応する製品やソリューションを十分に検討しております。

** 「金融」謝立栄氏:スマートフォンやクラウドの人気は価格の安さによるものです。中国の大型モデルはいつ一般適用段階に入るのか? **

Hou Zhenyu: 大型モデル自体が大幅なコスト削減につながります。これまで、企業が AI アプリケーションを開発する場合、アプリケーションのシナリオに従って、データのクリーニング、ラベル付け、モデルのトレーニング、推論、最適化を行う必要がありました。どんなに小さなシーンであっても、すべてのプロセスを実行する必要があり、コストが非常に高くなります。しかし、大規模なモデルに基づくと、これまでのように多くのデータ、時間、リソース、マンパワーは必要なくなります。大規模モデル技術は AI 応用の敷居を大幅に下げることができるため、企業はできるだけ早くこの技術に注目し、使用することをお勧めします。

**中国企業が必要とする大型モデルは何ですか? **

**「金融」謝立栄氏:BaiduのWenxin大規模モデルは3月に内部テストを開始した。内部テスト中に、企業は自社のニーズを明確に提示できますか?彼らのニーズはどこに集中しているのでしょうか? **

**Zhu Yong:**3 月の社内テスト以来、15 万人を超えるお客様からのアクセス要求が相次いでいます。同時に、何百ものパートナーが現場で私たちと一緒に研究開発テストを実施しています。これは、インターネット、製造、金融などのさまざまな業界をカバーしており、その中の多くのシナリオは価値の高いものです。要約すると、高頻度シナリオには、ナレッジ マネジメント、コンテンツ作成 (マーケティング コピーライティング、メディア情報を含む)、インテリジェントな顧客サービス、コード生成、オフィス効率の改善など、いくつかのカテゴリがあります。

** 「金融」謝立栄氏: デジタルトランスフォーメーション市場には長年の問題があり、多くの顧客は自分たちが何を望んでいるのか分かっていません。大型模型の分野でもこの矛盾は存在するのでしょうか? **

**Zhu Yong: **業界や顧客によっては確かに違いがあります。ビッグモデルの登場以降、インターネット業界は最新の開発に注目しており、技術的な理解と製品の認知度が非常に高いため、研究開発テストを共同で迅速に実施し、デモや製品の革新を行うことができます。

一部の伝統的な業界のデジタル基盤は比較的弱いため、百度は顧客と共同開発し、業界の課題とAI機能を組み合わせて、多くの非常に斬新な製品コンセプトを生み出すエンジニアを多数抱えている。 AI テクノロジーを産業と組み合わせる場合、一方ではテクノロジーと AI を理解し、他方では業界を理解する必要があります。したがって、顧客やパートナーとつながるときは、多くの場合、両者が一緒に創造する必要があります。

** 「金融」謝立栄: 百度はさまざまな業界やさまざまな種類の顧客に大規模なモデル サービスをどのように提供していますか?顧客視点でのコストパフォーマンスをどう評価するか? **

Zhu Yong: 価格の点では、企業が試しているだけで価格に敏感であれば、パブリック クラウド サービスを使用できます。通話量に応じて、従量課金制 (使用した分だけ支払う) )は一度限りの投資が不要です。設備への投資もパブリック クラウドの利点です。一部の企業は、大規模なインフラ投資を行って独自のインテリジェント アプリケーションを構築することに意欲的ですが、百度は AI モデルと AI ベースの完全なセットを提供でき、企業は AI モデルと AI ベースに基づいてアプリケーションを開発できます。

** 「財務」謝立栄: 企業は自社に合った大型モデルをどのように選択するのでしょうか? **

Hou Zhenyu: まず、大型モデルを選択するための基礎となるモデル効果でなければなりません。企業は、大規模モデルが使用シナリオで果たせる価値を評価する必要があります。次に、反復速度に焦点を当てます。それは、基本的な大規模モデル自体に活力があるかどうかだけでなく、プラットフォームに完全なツールチェーンがあり、便利な二次開発とモデルの再トレーニングをサポートし、大規模モデルのより良い反復をサポートしているかどうかにも依存します。第三に、大型モデルの実際の着陸コストと納入形態。企業はニーズに応じてパブリック クラウドとプライベート クラウドの配信モードを選択できます。

**「財務」謝立栄氏:Wenxin Qianfanはワンストップのエンタープライズレベルの大規模モデルプラットフォームとして位置付けられていますが、「ワンストップ」と「エンタープライズレベル」をどのように理解すればよいですか? **

Hou Zhenyu: まず「ワンストップ」ですが、AI はデータによって駆動されるテクノロジーです。 AIは誕生当初からデータの収集・クリーンアップ・ラベル付けを行い、既存のモデルに基づいて学習を行い、学習後にはきめ細かなデータとモデルのバージョンを管理し、最終的にビジネスに活用する必要があります。 。それは全体のプロセスです。 Baidu が提供するこれらの機能は非常に使いやすく、AI 研究開発から応用までのライフサイクル全体で顧客のニーズを満たすことができます。

「エンタープライズ レベル」とは別に、エンタープライズ レベルのアプリケーションは個人用アプリケーションではなく、写真をアップロードするほど単純ではありません。エンタープライズレベルのアプリケーションはより洗練され、複雑になるため、スケール、スケーラビリティ、実装コスト、安定性と堅牢性などの要素を考慮する必要があります。

** 「金融」謝立栄氏: 百度によると、文心銭帆大規模モデルプラットフォームには使いやすさ、安全性、包括性、効率性、オープン性、統合性という6つの特徴があるそうです。なぜ使いやすさが最優先されるのでしょうか?有用な技術だけが普及するって本当ですか? **

**Hou Zhenyu: **使いやすさは非常に重要です。自然言語の大規模モデルは、誰もがマシンを操作するのに便利な、使いやすいインターフェイスを顧客に提供できます。 「クラウドとインテリジェンスの統合、AI の包括性」が Baidu スマート クラウドの戦略であり、「AI の包括性」は常に当社の理想の 1 つです。 AIは単なる象牙の塔の技術ではなく、データの利用、リソースの利用、人による利用など、AIを利用する敷居を下げる必要があり、使いやすさは非常に重要です。

**「金融」謝立栄氏: 過去 3 か月で、人工知能モデルが一般に広く普及しました。何千もの業界にとって、大型モデルの商業的チャンスは到来しているでしょうか?良いビジネスリズムとはどのようなものであるべきでしょうか? **

**Zhu Yong: **人工知能の大規模モデルでは、研究開発と応用パラダイムに非常に明らかな変化が見られます。大きなモデルを早く受け入れて理解するほど、それがビジネスに与える影響は大きくなります。これは「はい」か「いいえ」で答える質問ではありません。ペース配分に関しては、企業ごとに大きなモデルをさまざまな方法で採用しています。一部の企業では、シングルポイントのアプリケーション試用から開始し、パブリック クラウドを使用してサービスを呼び出すことができるため、低コストで迅速に検証し、デモ開発を行うことができます。

一方で、大企業であろうと中小企業であろうと、AIネイティブ思考を養う必要があります。たとえば、一部のアプリケーションは段階的に変換およびアップグレードできます。もう 1 つのアプローチはリファクタリングと呼ばれ、Baidu の内部声明によると、将来のすべての製品は大規模モデルに基づいて作り直される予定です。

** 大型模型市場にバブルが起きているのか? **

** 「金融」謝立栄氏: ビジネス志向のBエンド市場にこれほど多くの大型モデルが本当に必要ですか? **

**Hou Zhenyu:**私の個人的な意見は、基本的な大型モデルにはそれほど多くは必要ないと思います。もちろん、これはあくまで最後からの楽しみです。しかし、どんな産業でも発展の初期段階では、市場は繁栄し、泡立ってきます。産業発展の観点からは、今は多少のバブルは許容すべきだろう。私たちもこのことに向き合わなければなりません。しかし、大きな波が砂を押し流した後でも、最終的に基本的なモデルサービスを提供できるのは依然として少数の企業であると私は信じています。

**Zhu Yong: **基本的な大規模モデルの方向では、現在多くのプレーヤーがいますが、迅速なイテレーションを維持し、より包括的で完全なツールチェーンを継続的に開発し、顧客に基づいて製品機能を継続的に改善することは非常に困難です。フィードバックのこと。したがって、大型モデルは今非常に熱いかもしれませんが、それは長距離レースであり、最終的には今日のクラウドコンピューティングの状況と同じようになり、市場は徐々に収束するでしょう。

** "財務" Xie Lirong: サーバー ハードウェアを製造する多くの企業も、大規模なインダストリ モデルを作成したいと考えています。 Baidu は以前は彼らの顧客でしたが、今では互いに競合しています。私たちはどのようにして平和に共存すべきでしょうか? **

侯振宇: 競争について直接話すことはできないと思いますが、まずは協力関係です。確かに両社は同様のサービスを提供し、同時に同様の業界に直面することになりますが、私たちと従来のハードウェアメーカーはより補完的です。百度はインターネットの遺伝子を持ったAI企業であり、大量の汎用データと汎用大型モデルを蓄積しており、AI、ソフトウェア、テクノロジーなどの分野で強みを持っています。従来のハードウェア メーカーは、従来の政府産業や企業産業などの垂直分野で業界データを蓄積し、ノウハウを開発してきました。大規模モデルの構築において、両者は異なる強みを持っています。 Baidu や H3C などの企業は、サーバーやスイッチの購入パートナーであるだけでなく、大規模なモデルを共同で構築しています。

** 「財務」謝立栄氏:百度は通常、競合他社の大型モデルの進歩に注意を払っていますか? **

Zhu Yong: まず、テクノロジーと全体的な効果です。 2つ目はサポートツールです。第三に、ビジネスモデルです。 3 ~ 4 年前に遡ると、人工知能市場はまだ比較的遠い存在でしたが、現在ではディープラーニング技術、製品の商品化、投資、オープンソースエコロジーがすべて加速しています。

** 「財務」謝立栄氏: 今後数年間は、大規模モデルが百度の中核の主要な方向性となるでしょうか?なぜ? **

**Hou Zhenyu: **大型モデルは、Baidu の中核となるでしょう。 Baidu は AI 企業であり、大規模モデルは AI の重要な開発方向です。 To C 側でも To B 側でも、Baidu の製品とサービスに大きな変化をもたらすでしょう。 Baidu にとって、大規模モデルは非常にエキサイティングであり、チャンスであると同時に課題でもあります。 Baidu は大規模モデルへの投資を継続します。私は大規模モデルがクラウド コンピューティングを AI 時代に加速させ、クラウド コンピューティングの状況を再構築すると信じています。MaaS (Model as a Service) の地位はますます重要になり、それはまた、Baidu の「クラウドとインテリジェンスの統合」戦略と、スマート クラウドが提唱する「AI 包摂性」の理想の実現も加速します。

** 「金融」謝立栄氏: 2016年に始まった人工知能の商業化の最終ラウンドにはいくつかの問題があり、AI企業は多くの退屈で詳細なカスタマイズプロジェクトを行う必要がありました。大規模モデルは、人工知能の商業化の最終段階で遭遇する問題をどのように回避できるでしょうか? **

Hou Zhenyu: 今回の大規模モデル産業の上陸は、10年前のディープラーニングに代表されるAI産業とは異なります。これは、これまでの投資とは異なる、AI 研究開発の新しいパラダイムです。大規模なモデルが登場する前、AI は最も批判され、実装が最も困難だったのは、実際の産業環境が細分化されていたことでした。例えば、ゲートの顔認証と支払いの顔認証は異なります。光や環境が異なるため、用途に応じて使い分ける必要があり、顧客が蓄積したデータに基づいて一からトレーニングを行い、シーンに合わせてトレーニングする必要があります。この種のカスタマイズされた配信は非常に面倒です。

しかし、基本的な大規模モデルでは、データをあまり微調整したり、トレーニングを何度も繰り返したりしなくても、非常に良好な結果が得られます。基本的な大規模モデルは、多くのシナリオを以前よりもはるかに簡単に解決します。大規模モデルの汎化能力は以前よりもはるかに強力です。これは、前回の AI 着陸とは異なります。昨年、10 億のパラメーターを持つモデルは大規模モデルと呼ばれていましたが、現在ではモデルのパラメーターは数千億になることがよくあります。 1,000 億を超えるパラメーターを使用すると、インテリジェンスが出現し、より強力な汎化機能が提供され、さまざまなシナリオで汎用的な機能が得られます。

** 「金融」謝立栄氏: 多くの人が業界に流入すると、バブルが起こるのは避けられないかもしれません。大規模なモデルを健全な方法で開発する場合、どのような提案がありますか? **

Hou Zhenyu: 大規模モデルの実践者へのアドバイスは、できる限りのことをすることです。すべてを自分で行う必要はありません。代わりに、AI の商用化を検討し、自分の能力に最も適したシナリオとチェーンを見つけてください。業界が初期段階で急速に発展する際には、ある程度のバブルが許容されることを願っています。ただし、技術適用の監督と技術の品質を評価する業界の基準については、政策の合意に達することができます。私たちが健全に発展するためには、従うべき基準やルールがあります。

朱勇: 私たちも考え方を変える必要があります。大きなモデルは分水嶺テクノロジー、破壊的テクノロジーです。心を開いて学び続けてください。

原文表示
内容は参考用であり、勧誘やオファーではありません。 投資、税務、または法律に関するアドバイスは提供されません。 リスク開示の詳細については、免責事項 を参照してください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGate.ioアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)