OpenAI a publié le jour 2 de sa nouvelle fonctionnalité de "réglage fin de l'apprentissage par renforcement", renforçant la précision de l'apprentissage dans des domaines professionnels d'IA incroyablement difficiles.

Création du résumé en cours

Lors de l'événement de lancement de nouveaux produits Day2, OpenAI a introduit la fonction de "fine-tuning par renforcement" (RFT) pour permettre aux utilisateurs d'améliorer les capacités de raisonnement des modèles personnalisés dans des domaines spécifiques, augmentant ainsi leur précision. Cette fonction peut être appliquée dans de nombreux domaines tels que la recherche scientifique, le droit, la finance, l'assurance, l'ingénierie, etc. (Contexte préalable : OpenAI lance la version complète du modèle o1 et le nouveau programme d'abonnement ChatGPT Pro, vaut-il les 200 $ par mois ?) (Contexte supplémentaire : OpenAI annonce 12 jours de diffusion en continu : de nombreuses nouvelles fonctionnalités seront-elles exposées à une embuscade par le jeton d'IA ?) Le développeur de ChatGPT, OpenAI, a annoncé le 5ème jour que le lancement de nouveaux produits se déroulera sur 12 jours à partir de 2 heures du matin. Le premier jour a présenté la version complète du modèle de raisonnement o1, remplaçant la version de prévisualisation précédente. Les utilisateurs de ChatGPT Plus, Team et Pro peuvent déjà l'utiliser, et un programme d'abonnement illimité au modèle o1 a également été lancé - "ChatGPT Pro". Pour en savoir plus : OpenAI lance la version complète du modèle o1 et le nouveau programme d'abonnement ChatGPT Pro, vaut-il les 200 $ par mois ? Aujourd'hui (jour 7) est le jour 2 de l'événement, quels sont les surprises préparées par OpenAI ? Introduction de la nouvelle fonction "fine-tuning par renforcement" Lors du deuxième jour de lancement des produits, OpenAI a introduit la nouvelle fonction "fine-tuning par renforcement" (Reinforcement Fine-Tuning, RFT), permettant aux utilisateurs d'utiliser leurs propres ensembles de données pour personnaliser l'entraînement du modèle o1 via un algorithme d'apprentissage par renforcement. De plus, l'animateur de l'événement a déclaré que le fine-tuning par renforcement ne nécessite que quelques dizaines d'exemples de haute qualité pour améliorer rapidement les capacités de raisonnement du modèle dans ce domaine spécifique. Il convient de noter que cette fonction peut être appliquée dans de nombreux domaines tels que la recherche scientifique, le droit, la finance, l'assurance, l'ingénierie, etc. De plus, dans la vidéo de présentation, Justin Reese, biologiste computationnel du Berkeley National Lab, a également participé à la démonstration en direct du modèle, partageant comment le "fine-tuning par renforcement" aide au diagnostic de maladies rares. Sur les images présentées par Reese, la précision d'identification initiale du modèle o1 était de 25 % ; la précision d'identification initiale du modèle o1 mini était de 17 %, et après le fine-tuning par renforcement, la précision du modèle o1 mini a augmenté à 31 %, soit une augmentation de la précision de 82 %. Bien que la fonction de "fine-tuning par renforcement" améliore considérablement la précision et la spécialisation du modèle dans des domaines spécifiques, l'animateur a également indiqué que cette fonction est actuellement en phase de prévisualisation et qu'elle sera lancée au grand public l'année prochaine. De plus, OpenaAI a déjà lancé le projet alpha RFT, appelant les universités, les institutions de recherche, les entreprises, etc., à participer aux tests de cette fonction. Rapports connexes : ChatGPT accusé de "refuser de répondre à David Mayer" et d'autres noms, OpenAI suspecté de bloquer délibérément des informations OpenAI annonce 12 jours de diffusion en continu : de nombreuses nouvelles fonctionnalités seront-elles exposées à une embuscade par le jeton d'IA ? OpenAI lance la version complète du modèle o1 et le nouveau programme d'abonnement ChatGPT Pro, vaut-il les 200 $ par mois ? "OpenAI lance le Day2" : la nouvelle fonction "fine-tuning par renforcement" renverse l'apprentissage de pointe dans des domaines d'expertise en IA

RFT1.21%

Voir l'original

Récompense
J'aime
Commentaire
Partager

Commentaire

0/400

Aucun commentaire

Rubrique
#BTC#
125k publications
#ETH#
74k publications
#GateioInto11#
67k publications
4#ContentStar#
59k publications
5#BOME#
56k publications
6#SLERF#
49k publications
7#PIGCOIN#
45k publications
8#比特币#
45k publications
9#MAGA#
44k publications
10#DOGE#
44k publications