OpenAI a officiellement annoncé la première acquisition ! La meilleure équipe de 8 membres de "Minecraft" open source se joint, pariant sur les agents de l'IA
OpenAI a officiellement annoncé la toute première acquisition.
Tout à l'heure, OpenAI a acquis Global Illumination, une start-up qui a produit une version open source de "Minecraft", pour un montant inconnu.
Selon l'annonce, toute l'équipe de Global Illumination rejoindra OpenAI et se concentrera sur le développement de ChatGPT à l'avenir.
Global illumination, cofondée par Thomas Dimson, Taylor Gordon et Joey Flynn, est une entreprise qui utilise l'IA pour créer des outils créatifs, des infrastructures et des expériences numériques.
Qu'implique l'acquisition d'OpenAI ?
À cet égard, Jim Fan, chercheur principal chez Nvidia, a exprimé sa grande curiosité : "Quelle est la prochaine étape ? Exécuter une simulation de civilisation multi-agents sur GPT-5 ? Peut-être que "My World" est tout ce qui est nécessaire pour construire AGI ? "
"Eight King Kong" a rejoint OpenAI
Fondée en 2021, Global Illumination est une société de produits numériques basée à New York.
Plus récemment, la société a développé son produit le plus populaire, le jeu de rôle en ligne multijoueur open source « Biomes ».
adresse du projet :
Depuis le début, le travail de Global Illumination s'est concentré sur les produits et services axés sur la vision.
En d'autres termes, OpenAI peut étendre davantage de fonctions d'image/vidéo pour ChatGPT, ou pour créer des services de génération d'images Dall-E 2, ou pour lancer un produit texte-vidéo pour concurrencer la concurrence Gen-2 de Runway.
D'autre part, la dénomination de l'entreprise est également différente.
Le terme "Global Illumination" est utilisé en infographie depuis de nombreuses années pour décrire des algorithmes permettant de créer des effets d'éclairage réalistes sur des objets 3D.
L'un des algorithmes originaux d'illumination globale a été proposé en 1986 par le chercheur de Caltech, James Jim Kajiya.
La société se compose de 8 membres et 3 fondateurs. Ce qui est intéressant, c'est que l'avatar de tout le monde sur le site officiel utilise des méchants pixel.
Certains internautes ont déclaré que cette décision est une excellente "acquisition" d'OpenAI, par le biais d'acquisitions pour recruter de nouveaux talents.
Dans l'annonce d'OpenAI, il est également indiqué que l'équipe de Global Illumination a apporté des contributions à des sociétés célèbres telles que Instagram, Facebook, YouTube, Google, Pixar, Riot Games, etc.
Voyons ensemble, quelle est la force de l'équipe derrière OpenAI depuis cette acquisition ?
Thomas Dimson
Thomas Dimson est PDG de Global Illumination.
Avant de créer l'entreprise, il a passé la majeure partie de sa carrière sur Instagram.
En 2013, Thomas a rejoint Instagram en tant qu'ingénieur en chef, et 5 ans plus tard, il a été promu directeur de l'ingénierie.
Il est connu comme «l'ingénieur n ° 16» d'Ins, «le créateur original de l'algorithme de classement de contenu Instagram», et a officiellement démissionné en 2020.
Au cours des 7 années de travail sur Instagram, il a joué un rôle important dans l'algorithme de découverte de la plate-forme itérative d'Instagram, tel que l'algorithme de classement des informations, le classement d'exploration et le classement des histoires.
En outre, il a également inventé des produits tels que des autocollants de vote d'histoire, Hyperlapse, emojineering, et a été nommé l'une des dix personnes les plus créatives en affaires par Fast Company.
Dans un article écrit pour Future l'année dernière, Thomas a révélé que l'équipe qu'il dirigeait avait développé le système de classement/recommandation de contenu personnalisé d'Instagram, remplaçant la recommandation chronologique inversée par défaut.
Taylor Gordon
Taylor Gordon est le directeur de la technologie de Global Illumination.
Taylor a plus de 20 ans d'expérience en programmation, plus de 8 ans de formation en informatique et plus de 10 ans d'expérience de travail dans des entreprises technologiques de premier plan.
Il a une riche expérience dans de nombreux laboratoires Facebook AI, Instagram, YouTube, Google, Microsoft.
En 2019, il faisait principalement de la recherche en vision par ordinateur chez Facebook AI.
De même, après avoir rejoint Instagram en 2015, il a dirigé le développement des classements de flux, en se concentrant sur l'apprentissage automatique et les classements des composants d'infrastructure.
En 2012, en tant qu'ingénieur en machine learning sur YouTube, il était principalement responsable de la recommandation vidéo et a dirigé la refactorisation de l'outil de classement de l'infrastructure centrale.
Chez Microsoft, j'ai conçu et construit des algorithmes de production pour les liens sur le site dans les résultats de recherche Bing. Chez Google, responsable des services de base internes et de l'analyse du développement de l'infrastructure, et des logiciels de surveillance.
Joey Flynn
Joey Flynn est chef de produit chez Global Illumination.
Lui-même a également travaillé dans Facebook et Ins, et est connu comme l'un des meilleurs concepteurs de Facebook par le monde extérieur.
En 2010, il a rejoint Facebook et a dirigé des projets importants, tels que Chat Heads et le logiciel mobile Home de Facebook.
En 2014, Flynn a conçu et construit Slingshot, une application de messagerie Facebook.
Alexeï Karpenko
Alexei Karpenko lui-même a travaillé chez Facebook, Midnox et Apple.
André Top
Andrew Top est responsable technique chez Cobalt, la plate-forme d'application à l'origine de l'application YouTube TV, et travaille chez YouTube depuis sept ans.
En 2012, il a rejoint l'équipe en tant que responsable graphique, implémentant leurs sous-ensembles d'API graphiques propriétaires respectifs de l'API graphique GLES pour PlayStation 3, PlayStation 4 et WiiU.
Il a également conçu la pile de rendu graphique Cobalt pour permettre des fréquences d'images d'animation plus rapides sur les appareils intégrés que Chrome.
Les autres contributions d'Andrew incluent:
-Conception d'une mise en page de haut niveau des principaux composants du navigateur, du moteur Java, de l'API Web (y compris DOM), du moteur réseau et des graphiques.
Conception et mise en œuvre d'une solution Web multiplateforme à faible latence pour regarder les vidéos sphériques 3D 360 de YouTube sur des téléviseurs et des casques VR.
Systèmes conçus pour surveiller et analyser les problèmes de performance.
Nick Cooper
Nick Cooper a travaillé chez Artifact, Ins, Google.
Ian Silver
Selon sa page d'accueil, Ian Silber a également travaillé dans Artifact et Ins.
Brandon Wang
Le seul chercheur chinois de l'équipe, qui a travaillé sur la recherche d'animation de jeux chez Riot Games et Pixar.
Il est également très doué pour le rendu en temps réel, le rendu physique et le jeu en réseau.
Voici quelques-uns des projets conçus par Brandon Wang.
Version open source de "My World", vous pouvez l'exécuter avec un navigateur
"Biomes" est un MMORPG sandbox open source (jeu de rôle en ligne massivement multijoueur) conçu pour le Web.
Ouvrez simplement le navigateur, vous pouvez construire, rassembler, jouer à des mini-jeux et plus encore.
Quant à OpenAI, en effet, dès 2022, un tout nouveau "modèle de pré-formation vidéo" VPT a été proposé, qui permet à l'IA d'apprendre à construire des pioches en pierre à partir de zéro dans "Minecraft".
L'ensemble du processus prend au moins 20 minutes à un joueur hardcore, et un total de 24 000 opérations sont nécessaires.
Adresse de recherche :
Plus précisément, les chercheurs ont d'abord recueilli une vague de sous-traitants d'annotation de données jouant à des jeux, y compris des vidéos et des enregistrements d'opérations au clavier et à la souris.
Présentation de la méthode VPT
Ensuite, utilisez ces données pour créer un modèle de dynamique inverse (modèle de dynamique inverse, IDM), afin de déduire comment le clavier et la souris se déplacent à chaque étape de la vidéo.
De cette façon, toute la tâche devient beaucoup plus simple et ne nécessite que beaucoup moins de données qu'auparavant pour atteindre l'objectif.
L'influence des données de formation du modèle de base sur le réglage fin
Après 70 000 heures d'entraînement, le modèle de clonage comportemental d'OpenAI peut faire des choses que d'autres modèles ne peuvent pas faire.
Par exemple, comment abattre des arbres pour ramasser du bois, comment utiliser du bois pour fabriquer des bâtons et comment utiliser des bâtons pour fabriquer des tables. Et cet ensemble de choses nécessite un joueur plus expérimenté pour fonctionner pendant moins de 50 secondes.
En plus d'être une table, le modèle peut nager, chasser et manger.
Il y a même une opération spectacle de "courir, sauter et construire", c'est-à-dire, lors du décollage, mettez une brique ou un bloc de bois sous vos pieds, et vous pouvez construire un pilier en sautant et en sautant. Il s'agit d'un cours obligatoire pour les joueurs confirmés.
Version simplifiée "Courir et sauter"
La fabrication d'une pioche en diamant, plus difficile, nécessite une série de sous-tâches longues et compliquées.
Pour rendre cette tâche réalisable, les chercheurs récompensent l'agent pour chaque élément de la séquence.
Ils ont constaté que les politiques de RL formées avec des méthodes traditionnelles ne recevaient presque aucune récompense, n'avaient jamais appris à collecter des bûches et collectaient rarement des bâtons.
À l'opposé, le modèle VPT affiné sur les données humaines peut non seulement apprendre à fabriquer une pioche en diamant, mais également réussir au niveau humain dans la collecte de tous les objets.
Fabriquer une pioche en pierre
À cet égard, certains internautes pensent que les terrains de jeux OpenAI Gym sont un "My World".
Avant d'appliquer ces systèmes dans le monde réel, c'est une bonne idée de les pratiquer dans un monde virtuel et de voir ce qui se passe. La vitesse de formation peut également être plus rapide. J'ai hâte de voir des vidéos incroyables de Minecraft qui s'accélèrent dans quelques mois.
L'équipe d'ingénierie de la startup est issue d'une équipe de conception de haut niveau, et je pense que ChatGPT sera bientôt considérablement amélioré.
D'autres pensent que d'après ce que Global Illumination a fait. OpenAI a grand besoin de leurs capacités de produit, mais combiné avec la ville de l'IA de Stanford il y a quelques jours, ce type de jeu de bac à sable avec un degré élevé de liberté et un faible coût d'exploitation combiné à l'IA aura des possibilités infinies, donc OpenAI peut valoriser ses membres Les capacités du produit peuvent également être purement basées sur ce jeu à haut degré de liberté.
OpenAI a officiellement annoncé la première acquisition ! La meilleure équipe de 8 membres de "Minecraft" open source se joint, pariant sur les agents de l'IA
Source : Xinzhiyuan
Auteur : Éditeur : Taozi a tellement sommeil
OpenAI a officiellement annoncé la toute première acquisition.
Tout à l'heure, OpenAI a acquis Global Illumination, une start-up qui a produit une version open source de "Minecraft", pour un montant inconnu.
Selon l'annonce, toute l'équipe de Global Illumination rejoindra OpenAI et se concentrera sur le développement de ChatGPT à l'avenir.
Global illumination, cofondée par Thomas Dimson, Taylor Gordon et Joey Flynn, est une entreprise qui utilise l'IA pour créer des outils créatifs, des infrastructures et des expériences numériques.
Qu'implique l'acquisition d'OpenAI ?
À cet égard, Jim Fan, chercheur principal chez Nvidia, a exprimé sa grande curiosité : "Quelle est la prochaine étape ? Exécuter une simulation de civilisation multi-agents sur GPT-5 ? Peut-être que "My World" est tout ce qui est nécessaire pour construire AGI ? "
"Eight King Kong" a rejoint OpenAI
Fondée en 2021, Global Illumination est une société de produits numériques basée à New York.
Plus récemment, la société a développé son produit le plus populaire, le jeu de rôle en ligne multijoueur open source « Biomes ».
adresse du projet :
Depuis le début, le travail de Global Illumination s'est concentré sur les produits et services axés sur la vision.
En d'autres termes, OpenAI peut étendre davantage de fonctions d'image/vidéo pour ChatGPT, ou pour créer des services de génération d'images Dall-E 2, ou pour lancer un produit texte-vidéo pour concurrencer la concurrence Gen-2 de Runway.
D'autre part, la dénomination de l'entreprise est également différente.
Le terme "Global Illumination" est utilisé en infographie depuis de nombreuses années pour décrire des algorithmes permettant de créer des effets d'éclairage réalistes sur des objets 3D.
L'un des algorithmes originaux d'illumination globale a été proposé en 1986 par le chercheur de Caltech, James Jim Kajiya.
La société se compose de 8 membres et 3 fondateurs. Ce qui est intéressant, c'est que l'avatar de tout le monde sur le site officiel utilise des méchants pixel.
Certains internautes ont déclaré que cette décision est une excellente "acquisition" d'OpenAI, par le biais d'acquisitions pour recruter de nouveaux talents.
Dans l'annonce d'OpenAI, il est également indiqué que l'équipe de Global Illumination a apporté des contributions à des sociétés célèbres telles que Instagram, Facebook, YouTube, Google, Pixar, Riot Games, etc.
Voyons ensemble, quelle est la force de l'équipe derrière OpenAI depuis cette acquisition ?
Thomas Dimson
Thomas Dimson est PDG de Global Illumination.
Avant de créer l'entreprise, il a passé la majeure partie de sa carrière sur Instagram.
En 2013, Thomas a rejoint Instagram en tant qu'ingénieur en chef, et 5 ans plus tard, il a été promu directeur de l'ingénierie.
Il est connu comme «l'ingénieur n ° 16» d'Ins, «le créateur original de l'algorithme de classement de contenu Instagram», et a officiellement démissionné en 2020.
Au cours des 7 années de travail sur Instagram, il a joué un rôle important dans l'algorithme de découverte de la plate-forme itérative d'Instagram, tel que l'algorithme de classement des informations, le classement d'exploration et le classement des histoires.
En outre, il a également inventé des produits tels que des autocollants de vote d'histoire, Hyperlapse, emojineering, et a été nommé l'une des dix personnes les plus créatives en affaires par Fast Company.
Dans un article écrit pour Future l'année dernière, Thomas a révélé que l'équipe qu'il dirigeait avait développé le système de classement/recommandation de contenu personnalisé d'Instagram, remplaçant la recommandation chronologique inversée par défaut.
Taylor Gordon
Taylor Gordon est le directeur de la technologie de Global Illumination.
Taylor a plus de 20 ans d'expérience en programmation, plus de 8 ans de formation en informatique et plus de 10 ans d'expérience de travail dans des entreprises technologiques de premier plan.
Il a une riche expérience dans de nombreux laboratoires Facebook AI, Instagram, YouTube, Google, Microsoft.
En 2019, il faisait principalement de la recherche en vision par ordinateur chez Facebook AI.
De même, après avoir rejoint Instagram en 2015, il a dirigé le développement des classements de flux, en se concentrant sur l'apprentissage automatique et les classements des composants d'infrastructure.
En 2012, en tant qu'ingénieur en machine learning sur YouTube, il était principalement responsable de la recommandation vidéo et a dirigé la refactorisation de l'outil de classement de l'infrastructure centrale.
Chez Microsoft, j'ai conçu et construit des algorithmes de production pour les liens sur le site dans les résultats de recherche Bing. Chez Google, responsable des services de base internes et de l'analyse du développement de l'infrastructure, et des logiciels de surveillance.
Joey Flynn
Joey Flynn est chef de produit chez Global Illumination.
Lui-même a également travaillé dans Facebook et Ins, et est connu comme l'un des meilleurs concepteurs de Facebook par le monde extérieur.
En 2010, il a rejoint Facebook et a dirigé des projets importants, tels que Chat Heads et le logiciel mobile Home de Facebook.
En 2014, Flynn a conçu et construit Slingshot, une application de messagerie Facebook.
Alexeï Karpenko
Alexei Karpenko lui-même a travaillé chez Facebook, Midnox et Apple.
André Top
Andrew Top est responsable technique chez Cobalt, la plate-forme d'application à l'origine de l'application YouTube TV, et travaille chez YouTube depuis sept ans.
En 2012, il a rejoint l'équipe en tant que responsable graphique, implémentant leurs sous-ensembles d'API graphiques propriétaires respectifs de l'API graphique GLES pour PlayStation 3, PlayStation 4 et WiiU.
Il a également conçu la pile de rendu graphique Cobalt pour permettre des fréquences d'images d'animation plus rapides sur les appareils intégrés que Chrome.
Les autres contributions d'Andrew incluent:
-Conception d'une mise en page de haut niveau des principaux composants du navigateur, du moteur Java, de l'API Web (y compris DOM), du moteur réseau et des graphiques.
Conception et mise en œuvre d'une solution Web multiplateforme à faible latence pour regarder les vidéos sphériques 3D 360 de YouTube sur des téléviseurs et des casques VR.
Systèmes conçus pour surveiller et analyser les problèmes de performance.
Nick Cooper
Nick Cooper a travaillé chez Artifact, Ins, Google.
Ian Silver
Selon sa page d'accueil, Ian Silber a également travaillé dans Artifact et Ins.
Brandon Wang
Le seul chercheur chinois de l'équipe, qui a travaillé sur la recherche d'animation de jeux chez Riot Games et Pixar.
Il est également très doué pour le rendu en temps réel, le rendu physique et le jeu en réseau.
Voici quelques-uns des projets conçus par Brandon Wang.
Version open source de "My World", vous pouvez l'exécuter avec un navigateur
"Biomes" est un MMORPG sandbox open source (jeu de rôle en ligne massivement multijoueur) conçu pour le Web.
Ouvrez simplement le navigateur, vous pouvez construire, rassembler, jouer à des mini-jeux et plus encore.
Quant à OpenAI, en effet, dès 2022, un tout nouveau "modèle de pré-formation vidéo" VPT a été proposé, qui permet à l'IA d'apprendre à construire des pioches en pierre à partir de zéro dans "Minecraft".
L'ensemble du processus prend au moins 20 minutes à un joueur hardcore, et un total de 24 000 opérations sont nécessaires.
Adresse de recherche :
Plus précisément, les chercheurs ont d'abord recueilli une vague de sous-traitants d'annotation de données jouant à des jeux, y compris des vidéos et des enregistrements d'opérations au clavier et à la souris.
Présentation de la méthode VPT
Ensuite, utilisez ces données pour créer un modèle de dynamique inverse (modèle de dynamique inverse, IDM), afin de déduire comment le clavier et la souris se déplacent à chaque étape de la vidéo.
De cette façon, toute la tâche devient beaucoup plus simple et ne nécessite que beaucoup moins de données qu'auparavant pour atteindre l'objectif.
L'influence des données de formation du modèle de base sur le réglage fin
Après 70 000 heures d'entraînement, le modèle de clonage comportemental d'OpenAI peut faire des choses que d'autres modèles ne peuvent pas faire.
Par exemple, comment abattre des arbres pour ramasser du bois, comment utiliser du bois pour fabriquer des bâtons et comment utiliser des bâtons pour fabriquer des tables. Et cet ensemble de choses nécessite un joueur plus expérimenté pour fonctionner pendant moins de 50 secondes.
En plus d'être une table, le modèle peut nager, chasser et manger.
Il y a même une opération spectacle de "courir, sauter et construire", c'est-à-dire, lors du décollage, mettez une brique ou un bloc de bois sous vos pieds, et vous pouvez construire un pilier en sautant et en sautant. Il s'agit d'un cours obligatoire pour les joueurs confirmés.
Version simplifiée "Courir et sauter"
La fabrication d'une pioche en diamant, plus difficile, nécessite une série de sous-tâches longues et compliquées.
Pour rendre cette tâche réalisable, les chercheurs récompensent l'agent pour chaque élément de la séquence.
Ils ont constaté que les politiques de RL formées avec des méthodes traditionnelles ne recevaient presque aucune récompense, n'avaient jamais appris à collecter des bûches et collectaient rarement des bâtons.
À l'opposé, le modèle VPT affiné sur les données humaines peut non seulement apprendre à fabriquer une pioche en diamant, mais également réussir au niveau humain dans la collecte de tous les objets.
Fabriquer une pioche en pierre
À cet égard, certains internautes pensent que les terrains de jeux OpenAI Gym sont un "My World".
Avant d'appliquer ces systèmes dans le monde réel, c'est une bonne idée de les pratiquer dans un monde virtuel et de voir ce qui se passe. La vitesse de formation peut également être plus rapide. J'ai hâte de voir des vidéos incroyables de Minecraft qui s'accélèrent dans quelques mois.
L'équipe d'ingénierie de la startup est issue d'une équipe de conception de haut niveau, et je pense que ChatGPT sera bientôt considérablement amélioré.
D'autres pensent que d'après ce que Global Illumination a fait. OpenAI a grand besoin de leurs capacités de produit, mais combiné avec la ville de l'IA de Stanford il y a quelques jours, ce type de jeu de bac à sable avec un degré élevé de liberté et un faible coût d'exploitation combiné à l'IA aura des possibilités infinies, donc OpenAI peut valoriser ses membres Les capacités du produit peuvent également être purement basées sur ce jeu à haut degré de liberté.
Les références: