OpenAI が最初の買収を正式に発表しました!オープンソース「Minecraft」8人のトップチームが参加、AIエージェントに賭ける

出典:新志源

著者:編集者:Taoziはとても眠いです

OpenAIは史上初の買収を正式に発表した。

つい先ほど、OpenAIが、オープンソース版「Minecraft」を制作した新興企業Globalilluminationを金額不明で買収した。

発表によると、Global Illumination チーム全体が OpenAI に参加し、将来的には ChatGPT の開発に注力する予定です。

トーマス ディムソン、テイラー ゴードン、ジョーイ フリンが共同設立したグローバル イルミネーションは、AI を使用してクリエイティブ ツール、インフラストラクチャ、デジタル エクスペリエンスを構築する企業です。

OpenAIの買収は何を意味するのでしょうか?

これに関して、Nvidia の上級研究員である Jim Fan 氏は、大きな好奇心を表明しました。「次のステップは何ですか? GPT-5 でマルチエージェント文明シミュレーションを実行するのですか? AGI を構築するのに必要なのは、おそらく「My World」だけでしょうか? 」

「エイト キング コング」が OpenAI に参加

2021 年に設立された Global Illumination は、ニューヨークを拠点とするデジタル製品会社です。

ごく最近では、同社は最も人気のある製品であるオープンソースのマルチプレイヤー オンライン ロールプレイング ゲーム「Biomes」を開発しました。

プロジェクトアドレス:

グローバル イルミネーションの仕事は、ずっとビジョン指向の製品とサービスに焦点を当ててきました。

言い換えれば、OpenAI は、ChatGPT の画像/ビデオ機能をさらに拡張したり、Dall-E 2 画像生成サービスを構築したり、スタートアップ Runway の Gen-2 競争に対抗するテキストビデオ製品を発売したりする可能性があります。

一方で、会社のネーミングも異なります。

「グローバル イルミネーション」という用語は、3D オブジェクトにリアルな照明効果を作成するアルゴリズムを表すために、コンピュータ グラフィックスで長年使用されてきました。

グローバル イルミネーションのオリジナル アルゴリズムの 1 つは、1986 年にカリフォルニア工科大学の研究者、ジェームス ジム カジヤによって提案されました。

同社は8人のメンバーと3人の創設者で構成されています。面白いのは、公式サイトの全員のアバターがピクセル悪役を使っていること。

一部のネチズンは、この動きは新しい人材を採用するための買収を通じたOpenAIの素晴らしい「買収」であると述べた。

OpenAIの発表では、Global IlluminationチームがInstagram、Facebook、YouTube、Google、Pixar、Riot Gamesなどの有名企業に貢献していることも記載されている。

この買収による OpenAI を支えるチームの強みは何でしょうか? 一緒に見てみましょう。

トーマス・ディムソン

トーマス・ディムソンはグローバル・イルミネーションのCEOです。

会社を設立する前、彼はキャリアのほとんどを Instagram に費やしていました。

2013 年に Thomas は Instagram にチーフエンジニアとして入社し、5 年後にはエンジニアリング ディレクターに昇進しました。

彼はInsの「No.16エンジニア」、「Instagramコンテンツランキングアルゴリズムのオリジナル作成者」として知られ、2020年に正式に辞任した。

Instagram に携わった 7 年間で、情報ランキング アルゴリズム、探索ランキング、ストーリー ランキングなど、Instagram の反復プラットフォームの発見アルゴリズムで重要な役割を果たしてきました。

さらに、ストーリー投票ステッカー、ハイパーラプス、エモジニアリングなどの製品も発明し、Fast Company によってビジネス界で最もクリエイティブな 10 人の 1 人に選ばれました。

昨年Futureに書いた記事の中で、トーマス氏は自身が率いたチームがInstagramのパーソナライズされたコンテンツランキング/推奨システムを開発し、デフォルトの逆時系列推奨システムを置き換えたことを明らかにした。

テイラー・ゴードン

Taylor Gordon は、Global Illumination の最高技術責任者です。

Taylor は 20 年以上のプログラミング経験、8 年以上のコンピュータ サイエンス教育、そして 10 年以上の大手テクノロジー企業での勤務経験を持っています。

Facebook AI、Instagram、YouTube、Google、Microsoft などの多くの研究室で豊富な経験を持っています。

2019年、彼はFacebook AIで主にコンピュータビジョンの研究を行っていました。

同様に、2015 年に Instagram に入社した後は、機械学習とインフラストラクチャ コンポーネントのランキングに重点を置いて、フィード ランキングの開発を主導しました。

2012 年には、YouTube 機械学習エンジニアとして、主にビデオの推奨を担当し、コア インフラストラクチャのランキング機能のリファクタリングを主導しました。

Microsoft 在籍中に、Bing 検索結果のサイト内リンクの運用アルゴリズムを設計および構築しました。 Google では、社内のコア サービスとインフラストラクチャ開発の分析、およびソフトウェアの監視を担当しています。

ジョーイ・フリン

Joey Flynn は Global Illumination の最高製品責任者です。

彼自身も Facebook や Ins で働いた経験があり、外の世界では Facebook のトップデザイナーの 1 人として知られています。

2010 年に Facebook に入社し、Chat Heads や Facebook のモバイル ソフトウェア Home などのいくつかの重要なプロジェクトを指揮しました。

2014 年に、フリンは Facebook メッセージング アプリである Slingshot を考案し、構築しました。

アレクセイ・カルペンコ

アレクセイ・カルペンコ氏自身は、Facebook、Midnox、Apple で働いた経験があります。

アンドリュー・トップ

Andrew Top は、YouTube TV アプリの背後にあるアプリ プラットフォームである Cobalt の技術責任者であり、YouTube に 7 年間勤務しています。

2012 年に、彼はグラフィックス リードとしてチームに加わり、PlayStation 3、PlayStation 4、および WiiU 用の GLES グラフィックス API のそれぞれの独自グラフィックス API サブセットを実装しました。

また、組み込みデバイス上で Chrome よりも高速なアニメーション フレーム レートを可能にする Cobalt グラフィック レンダリング スタックも設計しました。

アンドリューのその他の貢献には以下が含まれます。

-主要なブラウザコンポーネント、Java エンジン、Web API (DOM を含む)、ネットワーク エンジン、およびグラフィックスの高レベルのレイアウトを設計しました。

-テレビや VR ヘッドセットで YouTube の 3D 360 全天球ビデオを視聴するための、クロスプラットフォームの低遅延 Web ベース ソリューションを設計および実装しました。

  • パフォーマンスの問題を監視および分析するように設計されたシステム。

ニック・クーパー

Nick Cooper は、Artifact、Ins、Google で働いてきました。

イアン・シルバー

彼のホームページによると、イアン・シルバーは Artifact と Ins でも働いていました。

ブランドン・ワン

チーム内で唯一の中国人研究者で、ライアットゲームズやピクサーでゲームアニメーションの研究に携わった。

彼はリアルタイム レンダリング、物理ベースのレンダリング、ネットワーク ゲームプレイにも非常に優れています。

以下は、Brandon Wang によって設計されたプロジェクトの一部です。

「My World」のオープンソースバージョン。ブラウザで実行できます

「Biomes」は、Web 向けに構築されたオープンソースのサンドボックス MMORPG (大規模多人数参加型オンライン ロールプレイング ゲーム) です。

ブラウザを開くだけで、建築したり、集めたり、ミニゲームなどをプレイしたりできます。

OpenAIに関しては、実際、2022年という早い時期に、AIが「Minecraft」で石のツルハシをゼロから構築することを学習できるようにする、まったく新しいVPT「ビデオ事前トレーニングモデル」が提案されました。

プロセス全体は、ハードコア プレーヤーが完了するまでに少なくとも 20 分かかり、合計 24,000 回の操作が必要です。

研究アドレス:

具体的には、研究者らはまず、キーボードやマウスの操作のビデオや記録を含む、ゲームをプレイしているデータ注釈アウトソーサーの波を収集した。

VPT法の概要

次に、これらのデータを使用して逆ダイナミクス モデル (逆ダイナミクス モデル、IDM) を作成し、ビデオの各ステップの進行中にキーボードとマウスがどのように動くかを推測します。

このようにして、タスク全体がはるかに単純になり、目標を達成するために必要なデータは以前よりもはるかに少なくなります。

ベースモデルのトレーニングデータが微調整に及ぼす影響

70,000 時間のトレーニングを経て、OpenAI の行動クローン モデルは他のモデルではできないことができるようになりました。

たとえば、木を伐って木を集める方法、木を使って棒を作る方法、棒を使ってテーブルを作る方法などです。そして、この一連のことを行うには、より熟練したプレーヤーが 50 秒以内に操作する必要があります。

テーブルであることに加えて、モデルは泳いだり、狩りをしたり、食事をしたりすることができます。

離陸する際に足元にレンガや木のブロックを置き、飛び跳ねることで柱を建てる「走って、跳んで、建てる」というショーオペレーションもある。これはハードコアプレイヤーにとって必須のコースです。

「走ってジャンプ」簡易版

ダイヤモンドのつるはしの作成はさらに難しく、長く複雑な一連のサブタスクが必要です。

このタスクを扱いやすくするために、研究者たちはシーケンス内の各アイテムに対してエージェントに報酬を与えます。

彼らは、従来の方法で訓練されたRLポリシーはほとんど報酬を受け取っておらず、丸太の収集方法をまったく学習しておらず、棒をほとんど収集していないことを発見しました。

まったく対照的に、人間のデータに基づいて微調整された VPT モデルは、ダイヤモンドのつるはしの作り方を学習できるだけでなく、すべてのアイテムを収集するという人間レベルの成功も達成できます。

石のつるはしを作る

これに関して、一部のネチズンは、OpenAI Gymの遊び場が「私の世界」であると考えています。

これらのシステムを現実世界に適用する前に、仮想世界で実践して、何が起こるかを確認することをお勧めします。トレーニングのスピードも速くなるかもしれません。数か月以内に Minecraft のスピードアップに関する素晴らしいビデオが公開されることを楽しみにしています。

このスタートアップのエンジニアリング チームはハイレベルな設計チームから来ており、ChatGPT は間もなく大幅にアップグレードされると思います。

グローバル・イルミネーションが行ったことからそう考える人もいます。彼らの製品力はOpenAIにとって非常に必要とされているが、先日のスタンフォードAIタウンと合わせて、AIと組み合わせることで自由度が高く運営コストが低いこの種のサンドボックスゲームは無限の可能性を秘めており、OpenAIはメンバーを大切にしているのかもしれない製品の機能も、純粋にこの自由度の高いゲームに基づいている可能性があります。

参考文献:

原文表示
  • 報酬
  • コメント
  • 共有
コメント
コメントなし