🤩 La comunidad exclusiva para los titulares de GT ya está en vivo!
✨ ¡Únete a nosotros y comparte 15,000 USDT Futures Bonus + 2000 MOVE!
Cómo unirse:
1️⃣ Envía tu UID: https://www.gate.io/questionnaire/5695
2️⃣ ¡Los primeros 1,000 miembros obtendrán un Bono de Futuros, no te lo pierdas!
3️⃣ Únete a eventos exclusivos para tener la oportunidad de ganar tokens MOVE, recompensas populares, mercancía y obtener acceso anticipado a lanzamientos aéreos y noticias!
💡 Solo para titulares de GT, con increíbles ventajas para disfrutar.
#GTHolders# #Gateio# #MOVE#
Diálogo | 79 modelos básicos a gran escala nacieron en tres meses ¿Qué tipo de modelos a gran escala necesita China?
Texto: Wu Junyu Editor: Xie Lirong
Fuente: Finanzas Eleven
Fuente de la imagen: Generada por Unbounded AI
Después del lanzamiento de ChatGPT a fines del año pasado, las empresas chinas lanzaron al menos 79 modelos grandes básicos. Sin embargo, el mundo exterior considera que la mayoría de los modelos grandes tienen una brecha técnica con ChatGPT. El negocio modelo a gran escala es inminente. ¿Qué tipo de modelo a gran escala necesita China?
En diciembre de 2022, OpenAI, una empresa emergente de IA en la que Microsoft invirtió, lanzó un AI ChatGPT conversacional. ChatGPT es esencialmente un modelo grande de lenguaje GPT desarrollado de forma independiente por OpenAI, que contiene casi 180 mil millones de parámetros. En febrero de este año, el CEO de Nvidia, Huang Renxun, comentó que "ChatGPT marcó el comienzo del momento del iPhone para la IA". Huang Renxun cree que los modelos grandes están reduciendo el umbral para el desarrollo de aplicaciones, y vale la pena rehacer todas las aplicaciones con modelos grandes.
Estas no son las palabras de la familia de Huang Renxun, todos ven la oportunidad. A partir de marzo de este año, las empresas chinas también compiten para lanzar modelos de productos a gran escala. Estas incluyen empresas líderes, como el modelo Wenxin de Baidu, el modelo Tongyi de Ali y el modelo industrial de Tencent, así como empresas industriales como Xunfei y SenseTime, así como una serie de empresas emergentes. En mayo, el Instituto de Información Científica y Tecnológica de China, dependiente del Ministerio de Ciencia y Tecnología, publicó el "Informe de investigación sobre el mapa modelo grande de inteligencia artificial de China". Según el informe, hasta el 28 de mayo, se han lanzado en China al menos 79 modelos básicos a gran escala con parámetros superiores a los mil millones.
El número de parámetros del modelo es importante. En la actualidad, empresas líderes como Baidu y Ali anuncian que el volumen de parámetros de Wenxin y Tongyi suele estar en el nivel de 100 mil millones, como el volumen de parámetros del modelo grande de Wenxin es de 260 mil millones. Los parámetros de modelos grandes de otras empresas o empresas de nueva creación suelen estar en el nivel de 10 mil millones o 1 mil millones.
**Aunque todos los modelos de IA lanzados actualmente en el mercado se denominan "modelos grandes", la cantidad de parámetros se considera por defecto como uno de los factores definitorios para modelos grandes y modelos pequeños. **Hou Zhenyu, vicepresidente de Baidu Group, le dijo al reportero de Caijing que un modelo con mil millones de parámetros en 2022 se llama modelo grande. Pero los parámetros actuales del modelo grande son a menudo cientos de miles de millones. Debido a que el efecto de "emergencia inteligente" aparecerá con más de 100 mil millones de parámetros, se formará la capacidad de generalización y se formará la capacidad universal en varios escenarios. El modelo ajustado basado en este modelo grande tiene un mejor efecto de aplicación industrial.
**El efecto de "emergencia inteligente" se refiere al hecho de que después de que la escala del modelo y el nivel de potencia informática excedan un cierto umbral de parámetros, el efecto de IA ya no será un evento de probabilidad aleatoria. **En el campo general, cuanto mayor sea la cantidad de parámetros, mayor será la posibilidad de que surja inteligencia en general, y mayor será la precisión de la IA. En el campo vertical dedicado, es más fácil obtener resultados precisos después de recortar y optimizar el modelo de parámetros grandes.
Aunque han aparecido al menos 79 modelos a gran escala en China, muchos profesionales de la industria entrevistados por Caijing creen que los modelos a gran escala requieren poder de cómputo, algoritmos y acumulación de datos. Debido a la escasez de chips GPU de alto rendimiento, los altos costos de adquisición de hardware y los altos costos operativos, hay muy pocas empresas en China que tengan reservas de capital, voluntad estratégica y capacidades prácticas para ejecutar la comercialización de modelos grandes. En la "Guerra de los Cien Modelos", de hecho existe una brecha entre la mayoría de los productos y ChatGPT.
Después del alboroto, la manía de las grandes modelos está volviendo lentamente a la realidad. Está surgiendo un pensamiento más racional en el mercado de modelos a gran escala en el país y en el extranjero: ChatGPT que no se puede comercializar solo puede ser un juguete, y un modelo a gran escala que puede convertirse en una aplicación empresarial tiene valor industrial.
Compañías como Apple, Samsung y JPMorgan Chase han prohibido a los empleados usar ChatGPT debido a problemas de seguridad. Por otro lado, el crecimiento y retención de usuarios de ChatGPT también ha llegado a un cuello de botella. Según los datos de la herramienta de análisis de sitios web SimilarWeb, las tasas de crecimiento del tráfico de ChatGPT de enero a mayo fueron del 131,6 %, 62,5 %, 55,8 %, 12,6 % y 2,8 %. A principios de junio, una encuesta de Morgan Stanley mostró que solo el 19 % de los encuestados dijo que había usado ChatGPT, y solo el 4 % dijo que confiaba en ChatGPT.
Hou Zhenyu dijo: "En marzo de este año, cuando los clientes comenzaron a hablarnos sobre las necesidades de los modelos a gran escala, todos usaban su imaginación y pedían más ciencia ficción. Pero después de abril, las limitaciones de los modelos a gran escala Se revelaron modelos a escala, y todos disminuyeron la velocidad. Lentamente vieron más necesidades reales ". Bajo la influencia de factores subjetivos y objetivos, los modelos básicos globales a gran escala están orientados principalmente al mercado de la industria To B.
**La comercialización de modelos grandes en el extremo A C es lenta. **En la actualidad, nos enfrentamos a problemas como el alto costo de la potencia de cómputo y cuanto mayor sea la escala de usuarios, mayores serán las pérdidas de las empresas. También es inevitable generar un "ruido" incorrecto, e incluso existen desafíos éticos como la fuga de información y la supervisión de políticas. Incluso Microsoft solo implementa modelos grandes en productos de herramientas (oficinas, navegadores web, herramientas de edición de fotos como Photoshop). La esencia de la venta de servicios de Microsoft a las empresas de herramientas sigue siendo la comercialización de To B.
**Es un enfoque pragmático para implementar modelos grandes para clientes empresariales finales. **En el mercado industrial, las necesidades de los clientes son vigorosas y claras. En todo el mundo, el comercio minorista, las finanzas, la fabricación, el gobierno y otros campos confían en modelos grandes para actualizaciones inteligentes. El consenso de la industria es que un modelo que ha sido ajustado en base al conocimiento de la industria sobre la base de un modelo grande funcionará mejor que un modelo grande de uso general no optimizado.
Según los datos publicados por la firma de investigación de mercado IDC en mayo de este año, el tamaño total del mercado de inteligencia artificial de China en 2022 será de 12 200 millones de dólares, incluidos 8 130 millones de dólares para hardware, 2 690 millones de dólares para software y 1 410 millones de dólares para servicios. IDC predice que en 2026, el mercado de inteligencia artificial de China alcanzará los 26 900 millones de dólares, incluidos 14 850 millones de dólares para hardware, 7 690 millones de dólares para software y 3 890 millones de dólares para servicios. Las tasas de crecimiento anual compuesto de hardware, software y servicios son 15,1%, 32,0% y 28,5% respectivamente.
El fanatismo siempre vuelve a la realidad. En junio, "Finanzas" sostuvo un diálogo con Hou Zhenyu, vicepresidente de Baidu Group, y Zhu Yong, vicepresidente de Baidu Smart Cloud, con el tema "¿Qué tipo de modelo necesita realmente China?" Hou Zhenyu y Zhu Yong participó profundamente en Baidu Wenxin Qianfan En esta conversación, discutimos tres temas principales: la creación de una plataforma modelo y la configuración de una ecología comercial: ¿Es un modelo grande un juego de lujo? ¿Qué tipo de modelo grande necesita la empresa? ¿Hay una burbuja en el mercado de modelos grandes?
Perfil del Interlocutor:
Hou Zhenyu, vicepresidente de Baidu Group (a cargo del equipo de investigación de producción de computación en la nube y el equipo de ingeniería de tecnología básica de Baidu Smart Cloud Business Group)
Zhu Yong, vicepresidente de Baidu Smart Cloud (a cargo del Centro de productos de aplicaciones de Baidu Smart Cloud)
Anfitrión: Xie Lirong, editor en jefe adjunto de la revista Caijing
La siguiente es una versión condensada del registro del diálogo:
**¿Es el modelo grande un juego de lujo? **
** "Financiero" Xie Lirong: China ha desencadenado una ola de emprendimiento de modelos a gran escala, y el umbral para los modelos a gran escala es muy alto, pero la situación actual del mercado chino no parece ser el caso en términos de la velocidad y la escala de entrada? **
Zhu Yong: El umbral para los modelos grandes es relativo y habrá diferentes tipos de jugadores. La primera categoría es la misma que Baidu, haciendo un modelo grande básico desde cero. Esto tiene requisitos muy altos para el poder de cómputo, algoritmos, datos y talentos.
Tomando los datos como ejemplo, el modelo grande básico requiere un entrenamiento de datos masivo, incluidos datos de Internet, datos de campo profesional, datos de información de noticias y datos etiquetados profesionalmente de alta calidad. Tomando como ejemplo la potencia informática, un modelo grande con cientos de miles de millones de parámetros, como ChatGPT, debe entrenarse continuamente durante 100 días con la GPU A100/H100 de gama más alta de NVIDIA. Los algoritmos y los talentos también son clave. Los ingenieros tienen diferentes métodos de entrenamiento, al igual que diferentes chefs cocinan platos con diferentes gustos basados en las mismas materias primas. Esto requiere la acumulación de experiencia práctica a largo plazo, por lo que el umbral es muy alto.
La segunda categoría es el modelo de industria grande, que requiere algunos ajustes y una personalización específica basada en las capacidades del modelo grande básico. Esto es mucho más bajo que el costo del etiquetado de datos y el ajuste de algoritmos desde cero en el pasado. La tercera categoría desarrolla aplicaciones basadas en los primeros dos grandes modelos. Baidu, otras empresas e incluso algunas plataformas de código abierto proporcionan herramientas de desarrollo para reducir el umbral para el desarrollo de software.
** "Financiero" Xie Lirong: ¿Cuál es el nivel de los modelos a gran escala de China en el mercado global? **
**Hou Zhenyu:**Personalmente, creo que los modelos chinos a gran escala siguen liderando el mercado mundial. El desarrollo de modelos a gran escala y el desarrollo de motores de búsqueda son realmente similares y ambos requieren una acumulación técnica muy profunda. Desde una perspectiva global, solo hay unos pocos países con investigación y desarrollo independientes de tecnología de motores de búsqueda. En la actualidad, China y los Estados Unidos pueden ser los dos únicos países que pueden desarrollar de forma totalmente independiente una tecnología modelo a gran escala.
** "Finanzas" Xie Lirong: ¿Hay algún avance y atraso absoluto en los modelos grandes? **
**Hou Zhenyu: **Los modelos grandes no son absolutamente buenos o malos. Aunque puede tener ciertas diferencias en distintos campos, es como elegir un smartphone. Algunas personas usan Apple, algunas personas usan Android, lo más adecuado es lo mejor. Cuando se lanzó por primera vez el modelo grande, la gente a menudo hacía algunas preguntas engañosas al respecto. Pero, de hecho, en un entorno de nivel empresarial verdaderamente serio, hay muy pocos escenarios de este tipo. Las empresas deben elegir un modelo grande que sea más adecuado para ellos de acuerdo con sus escenarios comerciales. Las empresas chinas, en particular, necesitan elegir productos que tengan una mejor comprensión del chino y que sean adecuados para las características de las empresas chinas.
** "Finanzas" Xie Lirong: ¿Cuántos recursos y talentos invirtió Baidu en el modelo a gran escala? **
**Hou Zhenyu: **El modelo a gran escala de IA es la estrategia central de Baidu, que requiere una inversión continua e integral de alta intensidad. Tomando como ejemplo el poder de cómputo, la acumulación de la cantidad de GPU que hemos acumulado en el pasado se mide en decenas de miles, lo cual es una gran inversión. Baidu también ha desarrollado un conjunto completo de cadenas de herramientas a lo largo de los años para entrenar modelos más rápido y mejor.
En los últimos 10 años, Baidu ha invertido más de 100 000 millones de yuanes en IA. Como empresa de tecnología, Baidu gasta más del 20 % de sus ingresos en I+D cada año. (Observaciones: después de 2019, el gasto central en I+D de Baidu representó más del 20 % de los ingresos durante mucho tiempo. En 2022, la tasa de gasto en I+D de Baidu fue del 24 %, solo superada por el 25 % de Huawei entre las empresas tecnológicas chinas. El núcleo de Baidu se refiere a la exclusión Aiqi Baidu tiene su propio negocio después de las artes), pero el gran modelo no es tan simple como invertir una suma de dinero para hacer un modelo. Requiere poder de cómputo, datos e ingenieros de inteligencia artificial experimentados para acumular durante mucho tiempo en un buen plataforma de I+D.
**"Finanzas" Xie Lirong: Además del dinero, las tarjetas y los datos, ¿cuáles son los desafíos para que una empresa nueva haga un modelo básico a gran escala? **
**Hou Zhenyu: **El dinero, las tarjetas y los datos son muy desafiantes en sí mismos. Las empresas emergentes fabrican modelos básicos a gran escala. Además de una potencia informática mínima, datos suficientes y de alta calidad y personal experimentado en I+D de IA, también necesitan una plataforma de desarrollo de IA que pueda gestionar bien los modelos y la potencia informática. En la actualidad, las grandes empresas utilizarán estas plataformas para prestar servicios externos en forma de nubes. Por ejemplo, Baidu Smart Cloud proporciona servicios externos a través de la plataforma modelo a gran escala Wenxin Qianfan. Sin embargo, el umbral para entrenar un modelo grande básico desde cero sigue siendo muy alto. Porque el modelo grande no es suficiente para ser entrenado, sino que también requiere iteraciones ágiles continuas, y las grandes empresas serán relativamente más maduras.
** "Financiero" Xie Lirong: Algunas empresas están comenzando a construir sus propios modelos grandes. ¿Es necesario construir un modelo grande por ti mismo? Cuando la nube pública apenas estaba surgiendo en 2014, algunos clientes estaban preocupados por la seguridad de los datos.¿También se preocupan por este problema cuando usan modelos grandes? **
**Hou Zhenyu:**Toda empresa debe usar un modelo a gran escala, pero ¿cada empresa necesita hacer un modelo a gran escala por sí misma? No me parece. Es muy costoso hacer un modelo grande básico desde cero por ti mismo. Las empresas pueden usar sus propios datos para ajustar los modelos básicos de otras personas y también pueden lograr muy buenos resultados.
Zhu Yong: Creo que las empresas deberían pensar más en cómo usar modelos grandes y cómo hacer un buen uso de los modelos grandes. Cada negocio puede tener su propia maqueta, pero no hay necesidad de empezar de nuevo. Porque empresas como Baidu han proporcionado una buena base técnica. Puede confiar en Baidu para fabricar algunos productos personalizados, que es una mejor opción rentable para los clientes. El problema de la seguridad de los datos no es un problema nuevo provocado por la aparición de grandes modelos. Si se compara con la computación en la nube, hay nube pública, nube privada, alojamiento, etc. En el modelo comercial a gran escala, hemos considerado completamente los productos y soluciones correspondientes.
** "Financiero" Xie Lirong: La popularidad de los teléfonos inteligentes y las nubes se debe al bajo precio. ¿Cuándo entrará el gran modelo de China en la etapa de aplicación general? **
Hou Zhenyu: El modelo grande en sí trae muchos ahorros de costos. En el pasado, cuando las empresas desarrollaban aplicaciones de IA, necesitaban limpiar, etiquetar, entrenar modelos, razonar y optimizar los datos de acuerdo con los escenarios de la aplicación. Por pequeña que sea la escena, hay que hacer todo el proceso, y el coste es muy alto. Pero según el modelo grande, no hay necesidad de tantos datos, tiempo, recursos y mano de obra en el pasado. Sugiero que las empresas presten atención y utilicen la tecnología de modelos a gran escala lo antes posible, ya que puede reducir en gran medida el umbral de la aplicación de IA.
**¿Qué modelos grandes necesitan las empresas chinas? **
** "Finanzas" Xie Lirong: el modelo a gran escala Wenxin de Baidu comenzó las pruebas internas en marzo. Durante la prueba interna, ¿puede la empresa presentar claramente sus propias necesidades? ¿Dónde se concentran sus necesidades? **
**Zhu Yong:**Desde la prueba interna en marzo, hemos recibido sucesivamente solicitudes de acceso de más de 150 000 clientes. Al mismo tiempo, cientos de socios están realizando pruebas de investigación y desarrollo con nosotros en la escena. Esto cubre diferentes industrias como Internet, manufactura y finanzas, y muchos escenarios en él son de gran valor. En resumen, hay varias categorías de escenarios de alta frecuencia: gestión del conocimiento, creación de contenido (incluida la redacción publicitaria de marketing, información de medios), servicio al cliente inteligente, generación de código y mejora de la eficiencia de la oficina.
** "Financiero" Xie Lirong: Hay un problema de larga data en el mercado de la transformación digital, muchos clientes no saben lo que quieren. En el campo de los grandes modelos, ¿existe también esta contradicción? **
**Zhu Yong: **De hecho, existen diferencias entre diferentes industrias y diferentes clientes. Después de que salió el gran modelo, la industria de Internet prestó mucha atención a sus últimos desarrollos. Su comprensión técnica y el conocimiento del producto son muy avanzados, por lo que podemos llevar a cabo rápidamente pruebas de investigación y desarrollo juntos, y hacer demostraciones e innovaciones de productos.
La base digital de algunas industrias tradicionales es relativamente débil, por lo que Baidu tendrá una gran cantidad de ingenieros para crear conjuntamente con los clientes, combinar las capacidades de IA con los puntos débiles de la industria y producir muchos conceptos de productos muy novedosos. Cuando la tecnología de IA se combina con la industria, es necesario comprender la tecnología y la IA por un lado, y comprender la industria por el otro. Por lo tanto, cuando nos conectamos con clientes y socios, a menudo necesitamos que ambas partes creen juntas.
** "Financiero" Xie Lirong: ¿Cómo brinda Baidu servicios modelo a gran escala a diferentes industrias y diferentes tipos de clientes? ¿Cómo evaluar el desempeño de costos desde el punto de vista del cliente? **
Zhu Yong: En términos de precio, si la empresa solo está intentando y es sensible al precio, puede usar servicios de nube pública. De acuerdo con el volumen de llamadas, pago por uso (tanto como use ) no requiere una base única La inversión en instalaciones también es una ventaja de la nube pública. Algunas empresas están dispuestas a realizar grandes inversiones en infraestructura y crear sus propias aplicaciones inteligentes. Baidu puede proporcionar un conjunto completo de modelos y bases de IA, y las empresas pueden desarrollar aplicaciones basadas en modelos y bases de IA.
** "Financiero" Xie Lirong: ¿Cómo eligen las empresas un modelo grande que les convenga? **
Hou Zhenyu: Primero, debe ser el efecto del modelo, que es la base para elegir un modelo grande. Las empresas necesitan evaluar el valor que pueden tener los modelos grandes en escenarios de uso. En segundo lugar, céntrese en la velocidad de iteración. Depende no solo de si el modelo grande básico en sí mismo tiene vitalidad, sino también de si la plataforma tiene una cadena de herramientas completa, admite el desarrollo secundario conveniente y el reentrenamiento del modelo, y admite una mejor iteración de modelos grandes. En tercer lugar, el costo real de aterrizaje y la forma de entrega del modelo grande. Las empresas pueden elegir el modo de entrega de nube pública y nube privada según sus necesidades.
** "Financiero" Xie Lirong: Wenxin Qianfan se posiciona como una plataforma de modelo a gran escala de nivel empresarial de ventanilla única, ¿cómo entender "ventanilla única" y "nivel empresarial"? **
Hou Zhenyu: En primer lugar, "todo en uno", la IA es una tecnología impulsada por datos. Desde el comienzo de su nacimiento, la IA necesita recopilar, limpiar y etiquetar datos, y luego realizar capacitación basada en modelos existentes. Después de la capacitación, necesita administrar datos ajustados y versiones de modelos, y finalmente ponerlos en uso comercial. . Es todo un proceso. Baidu proporciona estas capacidades y es muy fácil de usar, lo que puede satisfacer las necesidades de los clientes en todo el ciclo de vida de la investigación y el desarrollo de la IA hasta la aplicación.
Además del "nivel empresarial", las aplicaciones de nivel empresarial no son aplicaciones personales, no son tan simples como cargar fotos. Las aplicaciones de nivel empresarial serán más refinadas y complejas, y es necesario considerar factores como la escala, la escalabilidad, los costos de implementación y la estabilidad y solidez.
** "Finanzas" Xie Lirong: según Baidu, la plataforma modelo a gran escala de Wenxin Qianfan tiene seis características: fácil de usar, segura, completa, eficiente, abierta e integrada. ¿Por qué la facilidad de uso debe ser lo primero? ¿Es cierto que solo se popularizarán tecnologías útiles? **
**Hou Zhenyu: **La facilidad de uso es muy importante. El modelo grande de lenguaje natural puede proporcionar a los clientes una interfaz más fácil de usar, que es conveniente para que todos interactúen con la máquina. "Integración de la nube y la inteligencia, la inclusión de la IA" es la estrategia de Baidu Smart Cloud, y la "inclusión de la IA" siempre ha sido uno de nuestros ideales. La IA no puede ser solo una tecnología en lo alto de la torre de marfil. El umbral para el uso de la IA debe reducirse, incluido el umbral para el uso de datos, el uso de recursos y el uso humano de la IA. Por lo tanto, la facilidad de uso es muy importante.
** "Finanzas" Xie Lirong: En los últimos tres meses, el público se ha popularizado mucho con los modelos de inteligencia artificial. Para miles de industrias, ¿ha llegado la oportunidad comercial de los modelos grandes? ¿Cómo debe ser un buen ritmo empresarial? **
**Zhu Yong: **El gran modelo de inteligencia artificial tiene cambios muy claros en los paradigmas de I+D y aplicación. Cuanto antes adopte y comprenda el gran modelo, mayor será su impacto en el negocio. Esta no es una pregunta de sí o no. Cuando se trata de ritmo, diferentes empresas adoptan grandes modelos de diferentes maneras. Algunas empresas pueden comenzar con una prueba de aplicación de un solo punto y usar la nube pública para llamar a los servicios, de modo que puedan verificar rápidamente y realizar un desarrollo de demostración a un costo menor.
Por otro lado, no importa si es una empresa grande o pequeña, es necesario cultivar el pensamiento nativo de IA. Por ejemplo, algunas aplicaciones se pueden transformar y actualizar de manera gradual. Otro enfoque se llama refactorización.Según la declaración interna de Baidu, todos los productos en el futuro se volverán a fabricar en función del modelo grande.
** ¿Hay una burbuja en el mercado de modelos grandes? **
** "Financiero" Xie Lirong: ¿Realmente necesita tantos modelos grandes en el mercado B-end orientado a los negocios? **
**Hou Zhenyu:**Mi opinión personal es que el modelo grande básico no necesita tantos. Por supuesto, esto es solo mirar hacia adelante desde el final. Pero al principio del desarrollo de cualquier industria, el mercado se vuelve próspero y espumoso. Desde la perspectiva del desarrollo industrial, deberíamos permitir algunas burbujas ahora. También debemos enfrentar esto. Pero sigo creyendo que después de que las grandes olas se hayan llevado la arena, todavía son unas pocas empresas las que finalmente brindan servicios modelo básicos.
**Zhu Yong: **En la dirección del modelo grande básico, aunque ahora hay muchos jugadores, es realmente difícil mantener una iteración rápida, desarrollar continuamente una cadena de herramientas más completa y completa, y mejorar continuamente las capacidades del producto según el cliente. cosas de retroalimentación. Por lo tanto, aunque el modelo grande puede estar muy de moda ahora, es una carrera de larga distancia.Al final, será como el panorama actual de la computación en la nube, y el mercado convergerá gradualmente.
** "Financiero" Xie Lirong: Muchas empresas que fabrican hardware de servidor también quieren hacer modelos industriales a gran escala. Baidu solía ser su cliente, pero ahora compiten entre sí. ¿Cómo debemos vivir juntos en paz? **
Hou Zhenyu: No creo que podamos hablar directamente de competencia. Todavía somos una relación cooperativa primero. De hecho, las dos partes tendrán servicios similares y se enfrentarán a industrias similares al mismo tiempo, pero nosotros y los fabricantes de hardware tradicionales somos más complementarios. Baidu es una empresa de IA con genes de Internet. Ha acumulado una gran cantidad de datos de propósito general y un gran modelo de propósito general. Sus ventajas radican en la IA, el software, la tecnología y otros campos. Los fabricantes de hardware tradicionales han acumulado datos de la industria y han desarrollado conocimientos en campos verticales como las industrias gubernamentales y empresariales tradicionales. Los dos lados tienen diferentes fortalezas en la construcción de modelos grandes. Empresas como Baidu y H3C no solo son socios en la compra de servidores y conmutadores, sino que también construyen modelos grandes en conjunto.
** "Financiero" Xie Lirong: ¿Baidu suele prestar atención al progreso de los modelos grandes de los competidores? **
Zhu Yong: Primero, tecnología y efecto general. En segundo lugar, herramientas de apoyo. En tercer lugar, el modelo de negocio. Si retrocede hace tres o cuatro años, el mercado de la inteligencia artificial todavía estaba relativamente lejos, pero hoy en día la tecnología de aprendizaje profundo, la comercialización de productos, la inversión y la ecología de código abierto se están acelerando.
** "Financiero" Xie Lirong: En los próximos años, ¿serán los modelos a gran escala la dirección clave del núcleo de Baidu? ¿Por qué? **
**Hou Zhenyu: **Los modelos grandes serán el centro de atención de Baidu. Baidu es una empresa de IA, y los modelos grandes son una importante dirección de desarrollo de la IA. Ya sea en el lado A C o en el lado B, traerá grandes cambios a los productos y servicios de Baidu. Para Baidu, los modelos grandes son muy emocionantes, lo cual es tanto una oportunidad como un desafío. Baidu continuará invirtiendo en modelos grandes. Creo que los modelos grandes acelerarán la computación en la nube hacia la era de la IA y remodelarán el panorama de la computación en la nube. El estado de MaaS (Modelo como servicio) será cada vez más importante, y también acelerará la realización de Baidu La estrategia de "integración de la nube y la inteligencia" y el ideal de "inclusividad de la IA" propuesto por Smart Cloud.
** "Financiero" Xie Lirong: La última ronda de comercialización de inteligencia artificial que comenzó en 2016 tuvo algunos problemas, y las empresas de IA tuvieron que realizar muchos proyectos de personalización tediosos y detallados. ¿Cómo pueden los modelos grandes evitar los problemas encontrados en la última ronda de comercialización de inteligencia artificial? **
Hou Zhenyu: Esta ronda de aterrizaje de la industria de modelos a gran escala es diferente de la industria de IA representada por el aprendizaje profundo hace diez años. Este es un nuevo paradigma para la investigación y el desarrollo de IA, que es diferente de las inversiones anteriores. Antes de la aparición de los modelos a gran escala, la IA era la más criticada y lo más difícil de implementar era que el entorno industrial real estaba fragmentado. Por ejemplo, el reconocimiento facial de puertas y el reconocimiento facial de pago son diferentes. Debido a que la luz y el entorno son diferentes, debe orientarse a diferentes aplicaciones, y la capacitación debe realizarse desde cero de acuerdo con los datos acumulados por los clientes y luego adaptarse a la escena. Este tipo de entrega personalizada es muy engorrosa.
Pero bajo el modelo grande básico, se pueden obtener muy buenos resultados sin demasiados datos de ajuste fino y sin demasiadas rondas de entrenamiento. Los modelos base grandes resuelven muchos escenarios mucho más fácilmente que antes. La capacidad de generalización de los modelos grandes es mucho más fuerte que antes. Esto es diferente de la última ronda de aterrizaje de IA. El año pasado, un modelo con mil millones de parámetros se denominaba modelo grande, pero ahora los parámetros del modelo suelen ser cientos de miles de millones. Con más de 100 mil millones de parámetros, surgirá inteligencia, capacidades de generalización más sólidas y capacidades generales en varios escenarios.
** "Financiero" Xie Lirong: Cuando muchas personas entran en una industria, las burbujas pueden ser inevitables. Si el modelo grande se va a desarrollar de manera saludable, ¿qué sugerencias tiene? **
Hou Zhenyu: Mi consejo para los practicantes de modelos grandes es que hagan lo que puedan. No tienes que hacerlo todo tú solo. En su lugar, considere la comercialización de la IA y encuentre los escenarios y las cadenas que mejor se adapten a sus capacidades. Esperamos que cuando la industria se desarrolle rápidamente en la etapa inicial, se permitan ciertas burbujas. Sin embargo, la política puede llegar a un consenso sobre la supervisión de la aplicación de la tecnología y los estándares de la industria para evaluar la calidad de la tecnología. Hay estándares a seguir y reglas a seguir, para que podamos desarrollarnos de manera saludable.
Zhu Yong: También tenemos que cambiar nuestra forma de pensar. El gran modelo es una tecnología divisoria de aguas, una tecnología subversiva. Mantén la mente abierta y sigue aprendiendo.