🤩 Communauté exclusive pour les détenteurs de GT est maintenant en direct!
✨ Rejoignez-nous et partagez 15 000 USDT Futures Bonus + 2000 MOVE !
Comment rejoindre :
1️⃣ Soumettez votre UID: https://www.gate.io/questionnaire/5695
2️⃣ Les 1 000 premiers membres obtiennent un bonus sur les contrats à terme - ne manquez pas ça !
3️⃣ Rejoignez des événements exclusifs pour avoir une chance de gagner des jetons MOVE, des récompenses tendance, des articles promotionnels et obtenez un accès anticipé aux largages et aux actualités !
💡 Seulement pour les détenteurs de GT, avec des avantages incroyables
Dialogue | 79 modèles de base à grande échelle sont nés en trois mois, de quel type de modèles à grande échelle la Chine a-t-elle besoin ?
Texte : Wu Junyu Éditeur : Xie Lirong
Source : Finance Onze
Source de l'image : générée par l'IA illimitée
Après la sortie de ChatGPT à la fin de l'année dernière, les entreprises chinoises ont publié au moins 79 grands modèles de base. Cependant, la plupart des grands modèles sont considérés par le monde extérieur comme ayant un écart technique avec ChatGPT. L'industrie du modèle à grande échelle est imminente. De quel type de modèle à grande échelle la Chine a-t-elle besoin ?
En décembre 2022, OpenAI, une start-up d'IA investie par Microsoft, a lancé un ChatGPT d'IA conversationnel. ChatGPT est essentiellement un grand modèle de langage GPT développé indépendamment par OpenAI, qui contient près de 180 milliards de paramètres. En février de cette année, le PDG de Nvidia, Huang Renxun, a déclaré que "ChatGPT a inauguré le moment de l'iPhone pour l'IA". Huang Renxun pense que les grands modèles abaissent le seuil de développement d'applications et que toutes les applications valent la peine d'être refaites avec de grands modèles.
Ce ne sont pas les mots de la famille de Huang Renxun, tout le monde voit l'opportunité. À partir de mars de cette année, les entreprises chinoises se font également concurrence pour lancer des modèles de produits à grande échelle. Il s'agit notamment de grandes entreprises, telles que le modèle Wenxin de Baidu, le modèle Tongyi d'Ali et le modèle industriel de Tencent, ainsi que des entreprises industrielles telles que Xunfei et SenseTime, ainsi qu'un certain nombre de start-up. En mai, l'Institut chinois de l'information scientifique et technologique relevant du ministère de la Science et de la Technologie a publié le "Rapport de recherche sur la carte grand modèle de l'intelligence artificielle en Chine". Selon le rapport, au 28 mai, au moins 79 modèles de base à grande échelle avec des paramètres supérieurs à 1 milliard ont été publiés en Chine.
Le nombre de paramètres du modèle est important. À l'heure actuelle, des sociétés de premier plan telles que Baidu et Ali annoncent que le volume de paramètres de Wenxin et Tongyi est généralement au niveau de 100 milliards, comme le volume de paramètres du grand modèle Wenxin est de 260 milliards. Les paramètres des grands modèles d'autres entreprises ou de start-up se situent généralement au niveau de 10 milliards ou 1 milliard.
**Bien que les modèles d'IA actuellement sortis sur le marché soient tous appelés "grands modèles", le nombre de paramètres est par défaut considéré comme l'un des facteurs déterminants pour les grands modèles et les petits modèles. ** Hou Zhenyu, vice-président du groupe Baidu, a déclaré au journaliste de Caijing qu'un modèle avec 1 milliard de paramètres en 2022 est appelé un grand modèle. Mais les grands paramètres actuels du modèle sont souvent des centaines de milliards. Parce que l'effet «d'émergence intelligente» apparaîtra avec plus de 100 milliards de paramètres, la capacité de généralisation sera formée et la capacité universelle dans divers scénarios sera formée. Le modèle affiné basé sur ce grand modèle a un meilleur effet d'application industrielle.
** L'effet "d'émergence intelligente" fait référence au fait qu'après que l'échelle du modèle et le niveau de puissance de calcul dépassent un certain seuil de paramètre, l'effet de l'IA ne sera plus un événement de probabilité aléatoire. ** Dans le domaine général, plus le nombre de paramètres est élevé, plus la possibilité d'émergence générale d'intelligence est grande et plus la précision de l'IA est élevée. Dans le champ vertical dédié, il est plus facile d'obtenir des résultats précis après le recadrage et l'optimisation du modèle à grands paramètres.
Bien qu'au moins 79 modèles à grande échelle soient apparus en Chine, de nombreux professionnels de l'industrie interrogés par Caijing pensent que les modèles à grande échelle nécessitent une puissance de calcul, des algorithmes et une accumulation de données. En raison de la pénurie de puces GPU hautes performances, des coûts d'approvisionnement en matériel et des coûts d'exploitation élevés, très peu d'entreprises en Chine disposent de réserves de capital, d'une volonté stratégique et de capacités pratiques pour gérer la commercialisation de grands modèles. Dans la "guerre des cent modèles", il existe en effet un fossé entre la plupart des produits et ChatGPT.
Après le tumulte, la grande manie des modèles revient lentement à la réalité. Une pensée plus rationnelle émerge sur le marché des modèles à grande échelle au pays et à l'étranger - ChatGPT qui ne peut pas être commercialisé ne peut être qu'un jouet, et un modèle à grande échelle qui peut devenir une application d'entreprise a une valeur industrielle.
Des entreprises telles qu'Apple, Samsung et JPMorgan Chase ont interdit aux employés d'utiliser ChatGPT pour des raisons de sécurité. D'autre part, la croissance et la rétention des utilisateurs de ChatGPT ont également atteint un goulot d'étranglement. Selon les données de l'outil d'analyse de site Web SimilarWeb, les taux de croissance du trafic de ChatGPT de janvier à mai étaient de 131,6 %, 62,5 %, 55,8 %, 12,6 % et 2,8 %. Début juin, une enquête de Morgan Stanley a montré que seulement 19 % des personnes interrogées ont déclaré avoir utilisé ChatGPT, et seulement 4 % ont déclaré s'appuyer sur ChatGPT.
Hou Zhenyu a déclaré: "En mars de cette année, lorsque les clients ont commencé à nous parler des besoins des modèles à grande échelle, ils utilisaient tous leur imagination, demandant plus de science-fiction. Mais après avril, les limites des grands- des modèles à l'échelle ont été révélés, et tout le monde a ralenti, a lentement vu des besoins plus réels.
**La commercialisation des gros modèles côté To C est lente. ** À l'heure actuelle, nous sommes confrontés à des problèmes tels que le coût élevé de la puissance de calcul, et plus l'échelle des utilisateurs est grande, plus les pertes des entreprises sont importantes. Il est également inévitable de produire un "bruit" erroné, et il existe même des défis éthiques tels que la fuite d'informations et la supervision des politiques. Même Microsoft ne déploie de grands modèles que dans des produits outils (suites bureautiques, navigateurs web, outils de retouche photo comme Photoshop). L'essence de la vente de services de Microsoft aux sociétés d'outils est toujours la commercialisation To B.
** Il s'agit d'une approche pragmatique pour mettre en œuvre de grands modèles pour les entreprises clientes To B-end. **Sur le marché de l'industrie, les besoins des clients sont vigoureux et clairs. Partout dans le monde, la vente au détail, la finance, la fabrication, le gouvernement et d'autres domaines s'appuient sur de grands modèles pour des mises à niveau intelligentes. Le consensus de l'industrie est qu'un modèle qui a été affiné sur la base des connaissances de l'industrie sur la base d'un grand modèle fonctionnera mieux qu'un grand modèle à usage général non optimisé.
Selon les données publiées par la société d'études de marché IDC en mai de cette année, la taille totale du marché chinois de l'intelligence artificielle en 2022 sera de 12,2 milliards de dollars, dont 8,13 milliards de dollars pour le matériel, 2,69 milliards de dollars pour les logiciels et 1,41 milliard de dollars pour les services. IDC prévoit qu'en 2026, le marché chinois de l'intelligence artificielle atteindra 26,9 milliards de dollars, dont 14,85 milliards de dollars pour le matériel, 7,69 milliards de dollars pour les logiciels et 3,89 milliards de dollars pour les services. Les taux de croissance annuels composés du matériel, des logiciels et des services sont respectivement de 15,1 %, 32,0 % et 28,5 %.
Le fanatisme revient toujours à la réalité. En juin, "Finance" a eu un dialogue avec Hou Zhenyu, vice-président de Baidu Group, et Zhu Yong, vice-président de Baidu Smart Cloud, sur le thème "De quel type de modèle la Chine a-t-elle vraiment besoin ?" Hou Zhenyu et Zhu Yong profondément participé à Baidu Wenxin Qianfan Dans cette conversation, nous avons discuté de trois questions majeures : la création d'une plateforme de modèles et la mise en forme d'une écologie commerciale : Un grand modèle est-il un jeu de luxe ? De quel type de grand modèle l'entreprise a-t-elle besoin ? Y a-t-il une bulle sur le marché des gros modèles ?
Profil de l'interlocuteur :
Hou Zhenyu, vice-président de Baidu Group (responsable de l'équipe de recherche sur la production de cloud computing et de l'équipe d'ingénierie des technologies de base de Baidu Smart Cloud Business Group)
Zhu Yong, vice-président de Baidu Smart Cloud (en charge de Baidu Smart Cloud Application Product Center)
Animateur : Xie Lirong, rédacteur en chef adjoint du magazine Caijing
Voici une version condensée de l'enregistrement du dialogue :
**Le grand modèle est-il un jeu de luxe ? **
** "Financial" Xie Lirong : La Chine a déclenché une vague d'entrepreneuriat à grande échelle, et le seuil des modèles à grande échelle est très élevé, mais la situation actuelle du marché chinois ne semble pas être le cas en termes de la vitesse et l'ampleur de l'entrée ? **
Zhu Yong : Le seuil pour les grands modèles est relatif, et il y aura différents types de joueurs. La première catégorie est la même que Baidu, créant un grand modèle de base à partir de rien. Cela a des exigences très élevées en matière de puissance de calcul, d'algorithmes, de données et de talents.
En prenant les données comme exemple, le grand modèle de base nécessite une formation massive sur les données, y compris les données Internet, les données de terrain professionnelles, les données d'information sur les actualités et les données de haute qualité étiquetées par des professionnels. Prenant l'exemple de la puissance de calcul, un grand modèle avec des centaines de milliards de paramètres tels que ChatGPT doit être formé en continu pendant 100 jours avec le GPU A100/H100 le plus haut de gamme de NVIDIA. Les algorithmes et les talents sont également essentiels. Les ingénieurs ont des méthodes de formation différentes, tout comme différents chefs cuisinent des plats aux goûts différents à partir des mêmes matières premières. Cela nécessite l'accumulation d'une expérience pratique à long terme, de sorte que le seuil est très élevé.
La deuxième catégorie est le grand modèle industriel, qui nécessite des ajustements et une personnalisation ciblée basés sur les capacités du grand modèle de base. C'est bien inférieur au coût de l'étiquetage des données et du réglage fin des algorithmes à partir de zéro dans le passé. La troisième catégorie développe des applications basées sur les deux premiers grands modèles. Baidu, d'autres sociétés et même certaines plates-formes open source fournissent des outils de développement pour abaisser le seuil de développement de logiciels.
** "Financière" Xie Lirong : Quel est le niveau des modèles à grande échelle de la Chine sur le marché mondial ? **
** Hou Zhenyu : ** Personnellement, je pense que les modèles chinois à grande échelle sont toujours en tête sur le marché mondial. Le développement de modèles à grande échelle et le développement de moteurs de recherche sont en fait similaires et nécessitent tous deux une accumulation technique très approfondie. D'un point de vue mondial, il n'y a que quelques pays avec une recherche et un développement indépendants de la technologie des moteurs de recherche. À l'heure actuelle, la Chine et les États-Unis sont peut-être les deux seuls pays à pouvoir développer de manière totalement indépendante une technologie de modélisation à grande échelle.
** "Finance" Xie Lirong : Y a-t-il des progrès et des retards absolus dans les grands modèles ? **
**Hou Zhenyu : **Les grands modèles ne sont pas absolument bons ou mauvais. Bien qu'il puisse y avoir certaines différences dans différents domaines, c'est comme choisir un smartphone. Certaines personnes utilisent Apple, certaines personnes utilisent Android, le plus adapté est le meilleur. Lorsque le grand modèle a été lancé pour la première fois, les gens posaient souvent des questions délicates à son sujet. Mais en fait, dans un environnement d'entreprise vraiment sérieux, il existe très peu de scénarios de ce type. Les entreprises doivent choisir un grand modèle qui leur convient mieux en fonction de leurs scénarios commerciaux. Les entreprises chinoises, en particulier, doivent choisir des produits qui ont une meilleure compréhension du chinois et sont adaptés aux caractéristiques des entreprises chinoises.
** "Finance" Xie Lirong : Combien de ressources et de talents Baidu a-t-il investis dans le modèle à grande échelle ? **
**Hou Zhenyu : **Le modèle à grande échelle d'IA est la stratégie de base de Baidu, qui nécessite un investissement continu et complet à haute intensité. Prenant l'exemple de la puissance de calcul, l'accumulation du nombre de GPU que nous avons accumulés dans le passé se mesure en dizaines de milliers, ce qui représente un investissement énorme. Baidu a également développé un ensemble complet de chaînes d'outils au fil des ans pour former des modèles plus rapidement et mieux.
Au cours des 10 dernières années, Baidu a investi plus de 100 milliards de yuans dans l'IA. En tant qu'entreprise technologique, Baidu consacre chaque année plus de 20 % de son chiffre d'affaires à la R&D. (Remarques : après 2019, les dépenses de R&D de base de Baidu ont longtemps représenté plus de 20 % des revenus. En 2022, le taux de dépenses de R&D de Baidu était de 24 %, juste derrière les 25 % de Huawei parmi les entreprises technologiques chinoises. Le noyau de Baidu fait référence à l'exclusion Aiqi Baidu a sa propre entreprise après les arts), mais le gros modèle n'est pas aussi simple que d'investir une somme d'argent pour faire un modèle. Il faut de la puissance de calcul, des données et des ingénieurs expérimentés en IA pour accumuler longtemps sur un bon Plateforme R&D.
**"Finance" Xie Lirong : Outre l'argent, les cartes et les données, quels sont les défis pour une start-up de créer un modèle de base à grande échelle ? **
** Hou Zhenyu : ** L'argent, les cartes et les données sont très difficiles en soi. Les start-up fabriquent des modèles de base à grande échelle. En plus d'une puissance de calcul minimale, de données suffisantes et de haute qualité et d'un personnel expérimenté en R&D en IA, elles ont également besoin d'une plate-forme de développement d'IA capable de bien gérer les modèles et la puissance de calcul. À l'heure actuelle, les grandes entreprises utiliseront ces plates-formes pour fournir des services externes sous forme de nuages. Par exemple, Baidu Smart Cloud fournit des services externes via la plate-forme de modèles à grande échelle Wenxin Qianfan. Cependant, le seuil pour former un grand modèle de base à partir de zéro est encore très élevé. Car le grand modèle ne suffit pas à être formé, mais nécessite aussi des itérations agiles continues, et les grandes entreprises seront relativement plus matures.
** "Financière" Xie Lirong : Certaines entreprises commencent à construire leurs propres grands modèles. Est-il nécessaire de construire un grand modèle par vous-même ? Alors que le cloud public émergeait en 2014, certains clients s'inquiétaient de la sécurité des données, se préoccupent-ils également de ce problème lorsqu'ils utilisent de gros modèles ? **
**Hou Zhenyu :**Chaque entreprise doit utiliser un modèle à grande échelle, mais chaque entreprise doit-elle créer elle-même un modèle à grande échelle ? Je ne pense pas. Il est très coûteux de fabriquer soi-même un grand modèle de base à partir de zéro. Les entreprises peuvent utiliser leurs propres données pour affiner les modèles de base d'autres personnes, et elles peuvent également obtenir de très bons résultats.
Zhu Yong : Je pense que les entreprises devraient réfléchir davantage à la façon d'utiliser les grands modèles et à faire bon usage des grands modèles. Chaque entreprise peut avoir sa propre maquette, mais il n'est pas nécessaire de recommencer. Parce que des entreprises comme Baidu ont fourni une bonne base technique. Vous pouvez compter sur Baidu pour fabriquer des produits personnalisés, ce qui constitue un choix plus rentable pour les clients. La problématique de la sécurité des données n'est pas une problématique nouvelle amenée par l'émergence des grands modèles. Si on le compare au cloud computing, il existe un cloud public, un cloud privé, un hébergement, etc. Dans le modèle commercial à grande échelle, nous avons pleinement pris en compte les produits et solutions correspondants.
** "Financière" Xie Lirong : La popularité des smartphones et des clouds est due à leur faible prix. Quand le grand modèle chinois entrera-t-il dans le stade de la généralisation ? **
Hou Zhenyu : Le grand modèle lui-même apporte beaucoup d'économies. Dans le passé, lorsque les entreprises développaient des applications d'IA, elles devaient procéder au nettoyage des données, à l'étiquetage, à la formation de modèles, au raisonnement et à l'optimisation en fonction des scénarios d'application. Peu importe la taille de la scène, tout le processus doit être fait et le coût est très élevé. Mais sur la base du grand modèle, il n'est pas nécessaire d'avoir autant de données, de temps, de ressources et de main-d'œuvre dans le passé. Je suggère aux entreprises de prêter attention et d'utiliser la technologie des modèles à grande échelle dès que possible, car elle peut réduire considérablement le seuil d'application de l'IA.
**De quels grands modèles les entreprises chinoises ont-elles besoin ? **
** "Finance" Xie Lirong : le modèle à grande échelle Wenxin de Baidu a commencé les tests internes en mars. Lors du test interne, l'entreprise peut-elle clairement mettre en avant ses propres besoins ? Où sont concentrés leurs besoins ? **
**Zhu Yong :**Depuis le test interne en mars, nous avons successivement reçu des demandes d'accès de plus de 150 000 clients. Dans le même temps, des centaines de partenaires mènent des tests de recherche et développement avec nous sur les lieux. Cela couvre différentes industries telles qu'Internet, la fabrication et la finance, et de nombreux scénarios sont de grande valeur. Pour résumer, il existe plusieurs catégories de scénarios à fréquence élevée : gestion des connaissances, création de contenu (y compris rédaction marketing, informations sur les médias), service client intelligent, génération de code et amélioration de l'efficacité du bureau.
** "Financial" Xie Lirong : Il existe un problème de longue date sur le marché de la transformation numérique, de nombreux clients ne savent pas ce qu'ils veulent. Dans le domaine des grands modèles, cette contradiction existe-t-elle aussi ? **
**Zhu Yong : **Il existe en effet des différences entre les différentes industries et les différents clients. Après la sortie du grand modèle, l'industrie Internet a porté une attention particulière à ses derniers développements. Leur compréhension technique et leur connaissance des produits sont très avancées, ce qui nous permet de réaliser rapidement des tests de recherche et développement ensemble, de faire des démonstrations et des innovations de produits.
La base numérique de certaines industries traditionnelles est relativement faible, donc Baidu aura un grand nombre d'ingénieurs pour co-créer avec les clients, combiner les capacités d'IA avec leurs points faibles de l'industrie et produire de nombreux concepts de produits très innovants. Lorsque la technologie de l'IA est associée à l'industrie, il est nécessaire de comprendre la technologie et l'IA d'une part, et de comprendre l'industrie d'autre part. Par conséquent, lorsque nous nous connectons avec des clients et des partenaires, nous avons souvent besoin que les deux parties créent ensemble.
** "Finance" Xie Lirong : Comment Baidu fournit-il des services de modélisation à grande échelle à différentes industries et à différents types de clients ? Comment évaluer la performance des coûts du point de vue du client ? **
Zhu Yong : En termes de prix, si l'entreprise essaie juste et est sensible au prix, elle peut utiliser les services de cloud public. Selon le volume d'appels, Pay-as-you-go (autant que vous utilisez ) ne nécessite pas de base ponctuelle L'investissement dans les installations est également un avantage du cloud public. Certaines entreprises sont prêtes à faire d'importants investissements dans l'infrastructure et à créer leurs propres applications intelligentes. Baidu peut fournir un ensemble complet de modèles d'IA et de bases d'IA, et les entreprises peuvent développer des applications basées sur les modèles d'IA et les bases d'IA.
** « Financière » Xie Lirong : Comment les entreprises choisissent-elles un grand modèle qui leur convient ? **
Hou Zhenyu : Premièrement, ce doit être l'effet de modèle, qui est la base pour choisir un grand modèle. Les entreprises doivent évaluer la valeur que les grands modèles peuvent jouer dans les scénarios d'utilisation. Deuxièmement, concentrez-vous sur la vitesse d'itération. Cela dépend non seulement de la vitalité du grand modèle de base lui-même, mais aussi du fait que la plate-forme dispose d'une chaîne d'outils complète, prend en charge un développement secondaire et un recyclage de modèle pratiques, et prend en charge une meilleure itération des grands modèles. Troisièmement, le coût d'atterrissage réel et le formulaire de livraison du grand modèle. Les entreprises peuvent choisir le mode de livraison du cloud public et du cloud privé en fonction de leurs besoins.
** "Financière" Xie Lirong : Wenxin Qianfan se positionne comme une plate-forme de modèle à grande échelle au niveau de l'entreprise à guichet unique, comment comprendre "guichet unique" et "niveau de l'entreprise" ? **
Hou Zhenyu : Tout d'abord, "one-stop", l'IA est une technologie pilotée par les données. Dès le début de sa naissance, l'IA doit collecter, nettoyer et étiqueter les données, puis effectuer une formation basée sur des modèles existants. Après la formation, elle doit gérer des données et des versions de modèles affinées, et enfin les mettre en pratique. . C'est tout un processus. Baidu fournit ces capacités, et il est très facile à utiliser, ce qui peut répondre aux besoins des clients tout au long du cycle de vie de la recherche et du développement de l'IA jusqu'à l'application.
Outre le "niveau entreprise", les applications de niveau entreprise ne sont pas des applications personnelles, pas aussi simples que le téléchargement de photos. Les applications au niveau de l'entreprise seront plus raffinées et complexes, et des facteurs tels que l'échelle, l'évolutivité, les coûts de mise en œuvre, la stabilité et la robustesse doivent être pris en compte.
** "Finance" Xie Lirong : Selon Baidu, la plate-forme de modèles à grande échelle Wenxin Qianfan présente six caractéristiques : facile à utiliser, sûre, complète, efficace, ouverte et intégrée. Pourquoi la facilité d'utilisation doit-elle primer ? Est-il vrai que seules les technologies utiles seront vulgarisées ? **
**Hou Zhenyu : **La facilité d'utilisation est très importante. Le grand modèle en langage naturel peut fournir aux clients une interface plus facile à utiliser, ce qui permet à chacun d'interagir avec la machine. "L'intégration du cloud et de l'intelligence, l'inclusivité de l'IA" est la stratégie de Baidu Smart Cloud, et "l'inclusivité de l'IA" a toujours été l'un de nos idéaux. L'IA ne peut pas être simplement une technologie haut dans la tour d'ivoire. Le seuil d'utilisation de l'IA doit être abaissé, y compris le seuil d'utilisation des données, l'utilisation des ressources et l'utilisation humaine de l'IA. Par conséquent, la facilité d'utilisation est très importante.
**"Finance" Xie Lirong : Au cours des trois derniers mois, le public a été largement popularisé par les modèles d'intelligence artificielle. Pour des milliers d'industries, l'opportunité commerciale des grands modèles est-elle arrivée ? A quoi doit ressembler un bon rythme commercial ? **
**Zhu Yong : **Le grand modèle de l'intelligence artificielle a des changements très clairs dans les paradigmes de R&D et d'application. Plus tôt vous adopterez et comprendrez le grand modèle, plus il aura un impact sur l'entreprise. Ce n'est pas une question oui ou non. En ce qui concerne le rythme, différentes entreprises adoptent les grands modèles de différentes manières. Certaines entreprises peuvent démarrer à partir d'un essai d'application unique et utiliser le cloud public pour appeler des services, afin de pouvoir rapidement vérifier et effectuer un développement de démonstration à moindre coût.
D'autre part, qu'il s'agisse d'une grande ou d'une petite entreprise, il est nécessaire de cultiver la pensée native de l'IA. Par exemple, certaines applications peuvent être transformées et mises à niveau de manière progressive. Une autre approche est appelée refactoring.Selon la déclaration interne de Baidu, tous les produits à l'avenir seront refaits sur la base du grand modèle.
** Y a-t-il une bulle sur le marché des gros modèles ? **
** "Financial" Xie Lirong : Avez-vous vraiment besoin d'autant de gros modèles sur le marché B-end orienté business ? **
**Hou Zhenyu :**Mon opinion personnelle est que le grand modèle de base n'en a pas besoin d'autant. Bien sûr, c'est juste hâte de la fin. Mais au début du développement de toute industrie, le marché devient prospère et mousseux. Du point de vue du développement industriel, nous devrions permettre quelques bulles maintenant. Nous devons également faire face à cela. Mais je crois toujours qu'après que les grosses vagues ont emporté le sable, ce sont encore quelques entreprises qui fournissent finalement des services de modèles de base.
**Zhu Yong : **En ce qui concerne le grand modèle de base, bien qu'il y ait maintenant de nombreux acteurs, il est vraiment difficile de maintenir une itération rapide, de développer en permanence une chaîne d'outils plus complète et plus complète et d'améliorer en permanence les capacités du produit en fonction du client. choses de rétroaction. Par conséquent, bien que le grand modèle soit très chaud actuellement, il s'agit d'une course de longue distance.En fin de compte, ce sera comme le paysage actuel du cloud computing et le marché convergera progressivement.
** "Financière" Xie Lirong : De nombreuses entreprises qui fabriquent du matériel serveur souhaitent également créer des modèles industriels à grande échelle. Baidu était leur client, mais maintenant ils sont en concurrence les uns avec les autres. Comment vivre ensemble sereinement ? **
Hou Zhenyu : Je ne pense pas que nous puissions directement parler de concurrence. Nous sommes toujours une relation de coopération avant tout. Les deux parties auront en effet des services similaires et feront face à des industries similaires en même temps, mais nous et les fabricants de matériel traditionnels sommes plus complémentaires. Baidu est une entreprise d'IA avec des gènes Internet. Elle a accumulé une grande quantité de données à usage général et un grand modèle à usage général. Ses avantages résident dans l'IA, les logiciels, la technologie et d'autres domaines. Les fabricants de matériel traditionnels ont accumulé des données sur l'industrie et développé un savoir-faire dans des domaines verticaux tels que les industries traditionnelles du gouvernement et des entreprises. Les deux parties ont des forces différentes dans la construction de grands modèles. Des entreprises telles que Baidu et H3C ne sont pas seulement partenaires dans l'achat de serveurs et de commutateurs, mais construisent également conjointement de grands modèles.
** "Financière" Xie Lirong : Baidu fait généralement attention aux progrès des grands modèles des concurrents ? **
Zhu Yong : Tout d'abord, la technologie et l'effet global. Deuxièmement, les outils de support. Troisièmement, le modèle d'affaires. Si vous remontez il y a trois ou quatre ans, le marché de l'intelligence artificielle était encore relativement éloigné, mais aujourd'hui, la technologie d'apprentissage en profondeur, la commercialisation des produits, les investissements et l'écologie open source s'accélèrent.
** "Financière" Xie Lirong : Dans les prochaines années, les modèles à grande échelle seront-ils la direction clé du cœur de Baidu ? Pourquoi? **
**Hou Zhenyu : **Les grands modèles seront au cœur de Baidu. Baidu est une société d'IA, et les grands modèles sont une direction de développement importante de l'IA. Que ce soit du côté To C ou du côté To B, cela apportera d'énormes changements aux produits et services de Baidu. Pour Baidu, les grands modèles sont très excitants, ce qui est à la fois une opportunité et un défi. Baidu continuera à investir dans de grands modèles. Je pense que les grands modèles accéléreront le cloud computing dans l'ère de l'IA et remodeleront le paysage du cloud computing. Le statut du MaaS (modèle en tant que service) deviendra de plus en plus important, et il permettra également d'accélérer la réalisation de Baidu La stratégie "d'intégration du cloud et de l'intelligence" et l'idéal d'"inclusivité de l'IA" proposé par Smart Cloud.
** "Financial" Xie Lirong : Le dernier cycle de commercialisation de l'intelligence artificielle qui a débuté en 2016 a rencontré quelques problèmes, et les entreprises d'IA ont dû réaliser de nombreux projets de personnalisation fastidieux et détaillés. Comment les grands modèles peuvent-ils éviter les problèmes rencontrés lors du dernier cycle de commercialisation de l'intelligence artificielle ? **
Hou Zhenyu : Ce cycle d'atterrissage de l'industrie du modèle à grande échelle est différent de l'industrie de l'IA représentée par l'apprentissage en profondeur il y a dix ans. Il s'agit d'un nouveau paradigme pour la recherche et le développement de l'IA, qui est différent des investissements précédents. Avant l'émergence des modèles à grande échelle, l'IA était la plus critiquée et la plus difficile à mettre en œuvre était que l'environnement industriel réel était fragmenté. Par exemple, la reconnaissance faciale des portails et la reconnaissance faciale du paiement sont différentes. Parce que la lumière et l'environnement sont différents, il doit être orienté vers différentes applications, et la formation doit être faite à partir de zéro en fonction des données accumulées par les clients, puis adaptée à la scène. Ce type de livraison personnalisée est très lourd.
Mais avec le grand modèle de base, de très bons résultats peuvent être obtenus sans trop de données de réglage fin et sans trop de cycles de formation. Les grands modèles de base résolvent de nombreux scénarios beaucoup plus facilement qu'auparavant. La capacité de généralisation des grands modèles est beaucoup plus forte qu'auparavant. Ceci est différent du dernier tour d'atterrissage de l'IA. L'année dernière, un modèle avec 1 milliard de paramètres était appelé un grand modèle, mais maintenant les paramètres du modèle sont souvent des centaines de milliards. Avec plus de 100 milliards de paramètres, l'intelligence émergera, des capacités de généralisation plus fortes et des capacités générales dans divers scénarios.
** "Financière" Xie Lirong : Lorsque de nombreuses personnes affluent dans une industrie, les bulles peuvent être inévitables. Si le grand modèle doit être développé de manière saine, quelles suggestions avez-vous ? **
Hou Zhenyu : Mon conseil aux pratiquants de grands modèles est de faire ce que vous pouvez. Vous n'avez pas à tout faire par vous-même. Envisagez plutôt la commercialisation de l'IA et trouvez les scénarios et les chaînes qui conviennent le mieux à vos capacités. Nous espérons que lorsque l'industrie se développera rapidement au début, certaines bulles seront autorisées. Cependant, la politique peut parvenir à un consensus sur la supervision de l'application de la technologie et les normes de l'industrie pour évaluer la qualité de la technologie. Il y a des normes à suivre et des règles à suivre, pour que nous puissions nous développer de manière saine.
Zhu Yong : Nous devons également changer notre façon de penser. Le grand modèle est une technologie de bassin versant, une technologie subversive. Gardez l'esprit ouvert et continuez à apprendre.