一般VS垂直、大型モデルが最初のマッチポイントに近づいた

出典: Shenmou Finance、著者 | Zhang Wei

画像クレジット: Unbounded AI ツールによって生成

AI メガモデルの戦場は細分化されています。

Chatgpt は導火線として AI2.0 の時代への扉を開き、AI2.0 の特徴は「産業知能とデジタル化」であり、労働力を効率的に代替し、あらゆる分野で広く使用することができます。すでに暴走期を過ぎており、AI大型モデルの実装はより現実的です。

最も典型的な兆候は、大規模な AI モデルが B サイドだけでなく、より広範囲にサークルの外に出ることです。たとえば、chatGPT がリリースされてから半年以上が経過しているにもかかわらず、著者は上海 CBD の階下のコーヒー ショップで ChatGPT について話している出稼ぎ労働者の声をまだ聞いています。メディアの報道によると、一部の企業は AIGC を生産性ツール。

アリババグループの会長兼最高経営責任者(CEO)兼アリババクラウドインテリジェンスグループの最高経営責任者(CEO)である張勇氏は次のように述べています。AI時代に直面して、すべての製品は大規模なモデルでやり直す価値があります。

大工場、科学研究機関、起業家はすべて終焉を迎えました。

Baidu Wenxin Yiyan、Huawei Pangu、360 Zhinao、Shangtang Rixin、Ali Tongyi Qianwen、Jingdong Lingxi、Kunlun Wanwei Tiangongなどの大手メーカーが続々と登場し、続いてTencent Hunyuan、HKUST Xunfei Xinghuoなどの大型モデルが待機中です。オンラインに接続するためのライン。

起業家には著名人もおり、Sogou 創業者の王暁川氏、美団共同創業者の王恵文氏、Sinovation Works 会長の Li Kaifu 氏などが AI 大型モデルで注目を集めました。

数カ月以上続いたAI大型模型ブームは2つの道を生み出した。

AI 軍拡競争、大規模モデルの差別化

AI大型モデルは競争段階に入り、徐々に道が分かれつつある。

AIモデルが徐々に加熱するにつれ、メディアの統計によると、2月初めにはオリエンタル・フォーチュンの「ChatGPT」セクションに29銘柄しかありませんでしたが、現在は61銘柄に達し、その数はまだ増加しています。不完全な統計によると、現時点で我が国では40以上の企業や機関が大規模モデル製品をリリースしたり、大規模モデル計画を発表したりしている。

その中で、AI 大型モデルの「軍拡競争」に参加しているプレーヤーも 2 つの開発方向を開発しています。垂直大型モデルと一般大型モデルは、人工知能の分野における 2 つの主要な開発方向になりつつあります。

垂直大規模モデルとは、音声認識、自然言語処理、画像分類など、特定のドメインまたはタスクに最適化されたモデルを指します。

現在、垂直型大型モデルに参入する企業が増えています。 Xueersi は、世界中の数学愛好家や科学研究機関向けに、MathGPT という名前の自社開発の大規模な数学モデルを開発中であると発表し、5 月 6 日、Taoyun Technology は、子供向けの大規模な認知モデルである Alpha Egg Children's Cognitive Big の発売を発表しました。このモデルは、表現の練習、EQの育成、創造性の刺激、学習の支援という点で、子供たちに新しいインタラクティブな体験をもたらします。

一般的な大規模モデルとは、BERT、GPT など、複数のタスクやドメインを処理できるモデルを指します。

大手メーカーは資本や人材の優位性から、主に汎用大型モデルの軌道を目指している。

大手メーカーは汎用の大型モデルを目指す一方、自社製品にAI機能を組み合わせることができる アリババ、ファーウェイ、バイドゥなどの代表的なインターネット企業やテクノロジー巨人。

たとえば、Microsoft が GPT-4 を Office ファミリ バケットに統合した後、Ali の "Tongyi Qianwen" も DingTalk にアクセスし始めており、ユーザーはドキュメントでコンテンツを生成したり、ビデオ会議でそれぞれの個人ビューやコンテンツを生成したりできます。

例えば、Baidu の大規模モデルは自社のビジネスと組み合わせることができ、「Wen Xin Yi Yan」は検索エンジンの繰り返しで質的変化を起こすことができ、NetEase の「Yuyan」や JD.com の「ChatJD」は最初に使用できます。独自の産業。

一方、汎用大型モデルは適用範囲が広く、先に優位に立った者が先行者利益を確立し、AI2.0時代のリーダーになれる。結局のところ、「速く走った者は肉を獲得し、ゆっくり走った者は残り物しか食べられない」という真実は誰もが知っています。

垂直適用大規模モデルは「清流」とも言え、垂直適用大規模モデルは一般的な大規模モデルよりも垂直シナリオのニーズに適合し、品質が高いため、多くの企業もチャンスを見出しています。たとえば、Shenlan、Mobvoi、Youdao、および特定の AI トラックに焦点を当てているその他の企業です。

大規模垂直モデルの開発は主に、音声認識の誤り率が年々減少し、自然言語処理の意味理解能力が向上し続けるなど、さまざまな分野でモデルの性能が継続的に向上していることに反映されています。一般的な大規模モデルは、マルチタスク学習と転移学習において目覚ましい進歩を遂げ、自然言語処理分野における重要な研究方向となっています。

たとえば、大規模な生物学的モデルは AI 医薬品の効率を向上させることができます。外国の研究報告によると、AI は新薬の研究開発の成功率を 16.7% 向上させることができ、AI を活用した医薬品の研究開発により、毎年 540 億米ドルの研究開発費が節約され、医療費の 40% ~ 60% が節約できるとのことです。研究開発の主要なプロセスにおける時間とコスト。 Nvidiaの公開情報によると、AI技術を活用することで早期創薬にかかる時間を3分の1に短縮し、コストを200分の1に削減できるという。

業界の観点から見ると、一般モデルはあらゆる質問に答え、さまざまな産業土壌に適用できる「百科事典」であるのに対し、垂直モデルは単一分野の専門家に似ています。少人数になる運命にあります。

データは致命的です

垂直ラージ モデルの利点は、十分に「大きく」ないことです。つまり、計算能力が十分に大きくなく、アルゴリズムの難易度が低いことです。

王暁川氏は大規模モデルの道に入ってから、将来の取り組みの方向性はOpenAIのようなAGI(汎用人工知能)を行うことではなく、ある特定の分野で大規模モデルを垂直に作成し、アプリケーションの着陸を実現することであると常に強調してきた。 。

広義の大規模モデルとは、実際には汎用的な大規模モデルのことを指しますが、大規模モデルが「大きい」モデルであるのは、「大きな」モデルと同様に、パラメータの数が多く、データ量が膨大であるためです。アルゴリズム、計算能力、データストレージスペースに大きな影響を与えるため、要件が大きく、これらを補える人材だけでなく、多額の資金も必要となります。ご存知のとおり、Open AI の成功も Microsoft によって数十億ドルを投じて構築されました。巨額の資金需要は、大手メーカーの研究開発における判断の試金石でもある。

過去 5 年間で、AI 大型モデルのパラメータ量は毎年一桁増加しており、たとえば GPT-4 のパラメータ量は GPT-3 の 16 倍の 1 兆 6,000 億に達しています。画像、音声、動画などのマルチモーダルデータに伴い、大規模モデルのデータ量も急速に拡大しています。これは、大規模なモデルでプレイしたい場合は、大きな計算能力が必要であることを意味します。

縦型大型模型を作る企業は、大手メーカーに比べて資金や計算能力、データが相対的に乏しいため、汎用大型模型メーカーと同じスタートラインに立っているわけではないのが現状です。

新エネルギー車がモーター、バッテリー、電子制御の 3 つの主要コンポーネントから切り離せないのと同様に、AI 大型モデルもコンピューティング能力、アルゴリズム、データのサポートから切り離すことはできません。

コンピューティング能力、アルゴリズム、データのうち、大規模な垂直モデルの難しさはデータです。

3 つの要素のうち、アルゴリズムの研究開発難易度は比較的低く、現在の企業は大規模モデルを実装するための独自のパス アルゴリズムを持っており、参考となるオープンソース プロジェクトも多数あります。

チップはコンピューティング能力を決定します。大規模な AI モデル全体では、モデル全体のニューラル ネットワークのトレーニングと構築を完了するために、より高性能のチップが必要です。しかし、現在のチップは自社開発が少なく、依然として主に外部から調達されています。たとえば、ChatGPT に最適なチップは Nvidia のフラッグシップ チップ H100 とサブフラッグシップ チップ A100 です。

問題はデータにあります。 AI のトレーニングと調整を支援するには高品質のデータが鍵であり、十分で豊富なデータは生成 AI の大規模モデルの基盤です。

OpenAIの以前の開示によると、ChatGPT3パラメータの数だけで1,750億個に達し、トレーニングデータは45TBに達しました。

中国のモバイル インターネットの発展が比較的成熟しているため、大量の中国のデータ リソースがさまざまな企業や機関に保存されており、共有することが困難になっています。

「企業の多くのビジネスデータ、物流データ、財務データなどは非常に中核的なプライベートドメインデータであるため、チャイナスターオプトエレクトロニクスやペトロチャイナがそのデータを他社のトレーニングに使用することは想像しにくいです。」 Xu Hui氏荘新旗志のCEOは最近証券のインタビューを受けたタイムズ紙のインタビューでも率直にこう語った。

AI製薬業界を例に挙げると、大規模な生物学的モデルはテクノロジーによって「行き詰まっている」という問題に直面しています。医薬品の研究開発では高精度の実験データを取得するコストが比較的高く、公的データベースにはラベルのないデータが多数存在するため、大量のラベルなしデータと少量のラベルなしデータの両方をうまく活用する必要があります。高精度のデータが大量にあるため、モデルの構築にはより高い要件が課されます。

**最初のゴールドポットを獲得するのは誰ですか? **

どのモデルであっても商品化が最重要課題です。大規模なモデルを備えた現在の AI プレーヤーから判断すると、彼らは急速にエンパワーメントと商用化を進めています。

汎用大型機種と垂直大型機種は、道は違えど本質的には「ファミリー」であり、同じ軌道に乗っているため、競合の問題は避けられない。

一般大型モデルの場合、垂直大型モデルが先に着地し、一般大型モデルの進路が狭くなります。同様に、汎用の大型モデルが急速に市場を掌握すると、事業分野が狭い垂直型の大型モデルが収益を上げるのはさらに困難になるだろう。

経済モデルでも普遍的価値観でも、理想段階では垂直型大規模モデルよりも汎用大規模モデルの方が優れている。しかし、現実は理想郷ではなく、汎用型大型モデルと垂直型大型モデルのどちらが速く走れるかは、さまざまな企業間の競争にかかっています。

昨年のAIGCの熱戦から判断すると。ユーザーが AI を使用して C エンドでより低いしきい値のコンテンツを生成できるようにするのと比較して、一部の市場参加者は、B エンドが AIGC のより重要なビジネス モデルになると考えています。

ファーウェイは自社のToBビジネスにも注力している。記者会見でファーウェイは、ファーウェイ盤古大型モデルは主に産業を強化するためにAIを活用しており、電力、金融、農業などの多くの産業で使用されており、その中でCV大型モデルは鉱山、NLPで使用されていると述べた。大きなモデルはインテリジェントなドキュメント検索に使用されます。

たとえば、検索エンジンを専門とする Baidu は、GPT-3 のような検索属性を備えた Wenxin Yiyan を立ち上げました。

実はChatGPT以外にもAI大規模モデルの突風が起こる前に着陸シーンがあったのですが、この「大きな」モデルというのは実は主に垂直型の大規模モデルなんです。

言語モデル: GPT、BERT など。主に機械翻訳、テキスト生成、感情分析などの自然言語処理の分野で使用されます。 画像モデル: ResNet、Inception など。主に画像分類、ターゲット検出、画像セグメンテーションなどのコンピューター ビジョンの分野で使用されます。 レコメンデーションモデル: DNN、RNN など。主に製品レコメンデーションや広告レコメンデーションなどのレコメンデーション システムの分野で使用されます。 チャットボット: Seq2Seq、Transformer など。主にインテリジェントな顧客サービスやインテリジェント アシスタントなどのシナリオで使用されます。 金融リスク管理: XGBoost、LightGBM など。主に銀行や証券などの金融機関の信用スコアリングや不正行為対策などのリスク管理シナリオで使用されます。 医用画像診断:DeepLung、DeepLesionなど、主に肺がん診断や病理解析などの医用画像診断分野で使用されます。

お金を稼ぐことは着陸することよりも重要です。

Guosheng Securities のレポート「ChatGPT に必要な計算能力」によると、GPT-3 トレーニングのコストは約 140 万米ドルと推定されており、一部のより大きな LLM (大規模言語モデル) の場合、トレーニング コストは次のとおりです。 200万米ドルと1,200万米ドルの間。 1 月の ChatGPT の平均ユニーク訪問者数 1,300 万人に基づくと、対応するチップ需要は 30,000 NVIDIA A100 GPU 以上、初期投資コストは約 8 億米ドル、1 日の電気代は約 5 万米ドルとなります。

着地シナリオでは汎用大型モデルの方が多く使われるのは間違いない 汎用大型モデルに自信があるプレイヤーにとっては商品化は二の次 垂直大型モデルは底をカバーするためにより早い商品化が必要縦型大規模モデルの方がメリットが大きい 確率が高く、採用率も早い。

どちらが最初に絶対的なアドバンテージを形成できるかについて明確な答えはありません。この AI 大型モデルの「軍拡競争」は、まさに web1 から web2 への蝶の変化のようなもので、企業は時間との戦いであり、最初にチャンスを掴んだ者が市場を掌握することになります。

原文表示
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
スキャンしてGate.ioアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)