Diálogo | 79 modelos básicos em grande escala nasceram em três meses De que tipo de modelos em grande escala a China precisa?

Texto: Wu Junyu Editor: Xie Lirong

Fonte: Finance Eleven See More

Fonte da imagem: Gerada por Unbounded AI

Depois que o ChatGPT foi lançado no final do ano passado, as empresas chinesas lançaram pelo menos 79 modelos grandes básicos. No entanto, a maioria dos modelos grandes é considerada pelo mundo exterior como tendo uma lacuna técnica com o ChatGPT. O modelo de negócios em grande escala é iminente. Que tipo de modelo em grande escala a China precisa?

Em dezembro de 2022, a OpenAI, uma startup de IA investida pela Microsoft, lançou um chatGPT de IA conversacional. O ChatGPT é essencialmente um grande modelo de linguagem GPT desenvolvido independentemente pela OpenAI, que contém quase 180 bilhões de parâmetros. Em fevereiro deste ano, o CEO da Nvidia, Huang Renxun, comentou que "o ChatGPT inaugurou o momento do iPhone para IA". Huang Renxun acredita que modelos grandes estão diminuindo o limite para o desenvolvimento de aplicativos, e vale a pena refazer todos os aplicativos com modelos grandes.

Estas não são as palavras da família de Huang Renxun, todos veem a oportunidade. A partir de março deste ano, as empresas chinesas também estão competindo para lançar modelos de produtos em grande escala. Isso inclui empresas importantes, como o modelo Wenxin da Baidu, o modelo Tongyi de Ali e o modelo de indústria da Tencent, bem como empresas do setor como Xunfei e SenseTime, bem como várias empresas iniciantes. Em maio, o Instituto Chinês de Informações Científicas e Tecnológicas do Ministério da Ciência e Tecnologia divulgou o "Relatório de Pesquisa sobre o Grande Modelo de Mapa de Inteligência Artificial da China". Segundo o relatório, até 28 de maio, pelo menos 79 modelos básicos de larga escala com parâmetros acima de 1 bilhão foram lançados na China.

O número de parâmetros do modelo é importante. Atualmente, empresas líderes como Baidu e Ali anunciam que o volume de parâmetros de Wenxin e Tongyi geralmente está no nível de 100 bilhões, como o volume de parâmetros do modelo grande de Wenxin é de 260 bilhões. Os parâmetros de grandes modelos de outras empresas ou empresas iniciantes geralmente estão no nível de 10 bilhões ou 1 bilhão.

**Embora os modelos de IA atualmente lançados no mercado sejam todos chamados de "modelos grandes", o número de parâmetros é considerado por padrão como um dos fatores definidores para modelos grandes e modelos pequenos. ** Hou Zhenyu, vice-presidente do Grupo Baidu, disse ao repórter de Caijing que um modelo com 1 bilhão de parâmetros em 2022 é chamado de modelo grande. Mas os parâmetros atuais do grande modelo são frequentemente centenas de bilhões. Como o efeito "emergência inteligente" aparecerá com mais de 100 bilhões de parâmetros, a capacidade de generalização será formada e a capacidade universal em vários cenários será formada. O modelo ajustado com base neste modelo grande tem melhor efeito de aplicação industrial.

**O efeito "emergência inteligente" refere-se ao fato de que, após a escala do modelo e o nível de poder de computação excederem um determinado limite de parâmetro, o efeito AI não será mais um evento de probabilidade aleatória. **No campo geral, quanto maior a quantidade de parâmetros, maior a possibilidade da inteligência emergir de forma geral, e maior a precisão da IA. No campo vertical dedicado, é mais fácil obter resultados precisos depois que o modelo de parâmetros grandes é cortado e otimizado.

Embora pelo menos 79 modelos de grande escala tenham aparecido na China, muitos profissionais da indústria entrevistados por Caijing acreditam que os modelos de grande escala requerem poder de computação, algoritmos e acúmulo de dados. Devido à escassez de chips GPU de alto desempenho, altos custos de aquisição de hardware e altos custos operacionais, existem muito poucas empresas na China que possuem reservas de capital, vontade estratégica e recursos práticos para executar a comercialização de modelos grandes. Na "Guerra dos Cem Modelos", existe de fato uma lacuna entre a maioria dos produtos e o ChatGPT.

Após o alvoroço, a mania de modelos grandes está lentamente voltando à realidade. Um pensamento mais racional está surgindo no mercado de modelos em grande escala em casa e no exterior - o ChatGPT que não pode ser comercializado pode ser apenas um brinquedo, e um modelo em grande escala que pode se tornar um aplicativo corporativo tem valor industrial.

Empresas como Apple, Samsung e JPMorgan Chase proibiram os funcionários de usar o ChatGPT devido a questões de segurança. Por outro lado, o crescimento e a retenção de usuários do ChatGPT também atingiram um gargalo. Segundo dados da ferramenta de análise de sites SimilarWeb, as taxas de crescimento do tráfego do ChatGPT de janeiro a maio foram de 131,6%, 62,5%, 55,8%, 12,6% e 2,8%. No início de junho, uma pesquisa do Morgan Stanley mostrou que apenas 19% dos entrevistados disseram ter usado o ChatGPT e apenas 4% disseram que confiavam no ChatGPT.

Hou Zhenyu disse: "Em março deste ano, quando os clientes começaram a falar conosco sobre as necessidades de modelos de grande escala, todos eles estavam usando sua imaginação, pedindo mais ficção científica. Mas depois de abril, as limitações de grandes modelos em escala foram revelados e todos desaceleraram. Lentamente viram mais necessidades reais. "Sob a influência de fatores subjetivos e objetivos, os modelos básicos globais de grande escala são orientados principalmente para o mercado da indústria To B.

**A comercialização de modelos grandes na ponta To C é lenta. **Atualmente, enfrentamos problemas como alto custo de poder computacional, e quanto maior a escala de usuários, maiores as perdas das empresas. Também é inevitável emitir "ruídos" errados, e há até mesmo desafios éticos, como vazamento de informações e supervisão de políticas. Mesmo a Microsoft implanta modelos grandes apenas em produtos de ferramentas (pacotes de escritório, navegadores da Web, ferramentas de edição de fotos como o Photoshop). A essência da venda de serviços da Microsoft para empresas de ferramentas ainda é a comercialização To B.

**É uma abordagem pragmática para implementar grandes modelos para clientes corporativos To B-end. **No mercado industrial, as necessidades dos clientes são vigorosas e claras. Em todo o mundo, varejo, finanças, manufatura, governo e outros campos contam com grandes modelos para atualizações inteligentes. O consenso da indústria é que um modelo que foi ajustado com base no conhecimento da indústria com base em um modelo grande terá um desempenho melhor do que um modelo grande de uso geral não otimizado.

De acordo com dados divulgados pela empresa de pesquisa de mercado IDC em maio deste ano, o tamanho total do mercado de inteligência artificial da China em 2022 será de US$ 12,2 bilhões, incluindo US$ 8,13 bilhões para hardware, US$ 2,69 bilhões para software e US$ 1,41 bilhão para serviços. A IDC prevê que, em 2026, o mercado de inteligência artificial da China chegará a US$ 26,9 bilhões, incluindo US$ 14,85 bilhões em hardware, US$ 7,69 bilhões em software e US$ 3,89 bilhões em serviços. As taxas de crescimento anuais compostas de hardware, software e serviços são de 15,1%, 32,0% e 28,5%, respectivamente.

O fanatismo sempre volta à realidade. Em junho, "Finance" manteve um diálogo com Hou Zhenyu, vice-presidente do Baidu Group, e Zhu Yong, vice-presidente do Baidu Smart Cloud, com o tema "Que tipo de modelo a China realmente precisa?" Hou Zhenyu e Zhu Yong participou profundamente no Baidu Wenxin Qianfan Nesta conversa, discutimos três questões principais: a criação de uma plataforma modelo e a formação de uma ecologia comercial: Um modelo grande é um jogo de luxo? Que tipo de grande modelo a empresa precisa? Existe uma bolha no mercado de modelos grandes?

Perfil do Interlocutor:

Hou Zhenyu, vice-presidente do Baidu Group (responsável pela equipe de pesquisa de produção de computação em nuvem e pela equipe de engenharia de tecnologia básica do Baidu Smart Cloud Business Group)

Zhu Yong, vice-presidente da Baidu Smart Cloud (responsável pelo Baidu Smart Cloud Application Product Center)

Anfitrião: Xie Lirong, editor-chefe adjunto da Caijing Magazine

O seguinte é uma versão condensada do registro de diálogo:

**O modelo grande é um jogo de luxo? **

** "Financeiro" Xie Lirong: A China desencadeou uma onda de empreendedorismo em grande escala, e o limite para modelos em grande escala é muito alto, mas a situação atual do mercado chinês não parece ser o caso em termos de a velocidade e escala de entrada? **

Zhu Yong: O limite para modelos grandes é relativo e haverá diferentes tipos de jogadores. A primeira categoria é a mesma do Baidu, criando um modelo grande básico do zero. Isso tem requisitos muito altos para poder de computação, algoritmos, dados e talentos.

Tomando os dados como exemplo, o modelo básico grande requer treinamento massivo de dados, incluindo dados da Internet, dados de campo profissionais, dados de informações de notícias e dados rotulados profissionalmente de alta qualidade. Tomando o poder de computação como exemplo, um grande modelo com centenas de bilhões de parâmetros, como o ChatGPT, precisa ser treinado continuamente por 100 dias com a GPU A100/H100 mais avançada da NVIDIA. Algoritmos e talentos também são fundamentais. Os engenheiros têm diferentes métodos de treinamento, assim como diferentes chefs preparam pratos de diferentes sabores com base nas mesmas matérias-primas. Isso requer o acúmulo de experiência prática de longo prazo, portanto, o limite é muito alto.

A segunda categoria é o modelo de grande indústria, que requer algum ajuste fino e customização direcionada com base nos recursos do modelo básico de grande porte. Isso é muito menor do que o custo da rotulagem de dados e do ajuste fino do algoritmo do zero no passado. A terceira categoria desenvolve aplicativos com base nos dois primeiros grandes modelos. Baidu, outras empresas e até mesmo algumas plataformas de código aberto fornecem ferramentas de desenvolvimento para diminuir o limite para o desenvolvimento de software.

** "Financeiro" Xie Lirong: Qual é o nível dos modelos de grande escala da China no mercado global? **

**Hou Zhenyu:**Pessoalmente, acho que os modelos chineses de grande escala ainda lideram o mercado global. O desenvolvimento de modelos em larga escala e o desenvolvimento de mecanismos de busca são, na verdade, semelhantes, e ambos requerem uma acumulação técnica muito profunda. De uma perspectiva global, existem apenas alguns países com pesquisa e desenvolvimento independentes de tecnologia de mecanismo de busca. Atualmente, a China e os Estados Unidos podem ser os únicos dois países que podem desenvolver de forma totalmente independente a tecnologia de modelos em grande escala.

** "Finanças" Xie Lirong: Existe algum avanço e atraso absolutos em modelos grandes? **

**Hou Zhenyu: **Modelos grandes não são absolutamente bons ou ruins. Embora possa ter algumas diferenças em diferentes campos, é como escolher um smartphone. Algumas pessoas usam Apple, algumas pessoas usam Android, o mais adequado é o melhor. Quando o modelo grande foi lançado pela primeira vez, as pessoas costumavam fazer algumas perguntas complicadas sobre ele. Mas, na verdade, em um ambiente corporativo verdadeiramente sério, existem muito poucos desses cenários. As empresas precisam escolher um modelo grande que seja mais adequado para elas de acordo com seus cenários de negócios. As empresas chinesas, em particular, precisam escolher produtos que entendam melhor o chinês e sejam adequados às características das empresas chinesas.

** "Finance" Xie Lirong: Quantos recursos e talentos o Baidu investiu no modelo de grande escala? **

**Hou Zhenyu: **O modelo de IA em larga escala é a principal estratégia da Baidu, que requer investimento contínuo e abrangente de alta intensidade. Tomando o poder de computação como exemplo, o acúmulo do número de GPUs que acumulamos no passado é medido em dezenas de milhares, o que é um grande investimento. A Baidu também desenvolveu um conjunto completo de cadeias de ferramentas ao longo dos anos para treinar modelos de forma mais rápida e melhor.

Nos últimos 10 anos, a Baidu investiu mais de 100 bilhões de yuans em IA. Como empresa de tecnologia, a Baidu gasta mais de 20% de sua receita em P&D todos os anos. (Observação: depois de 2019, os principais gastos com P&D do Baidu representaram mais de 20% da receita por um longo período. Em 2022, a taxa de gastos com P&D do Baidu foi de 24%, perdendo apenas para os 25% da Huawei entre as empresas de tecnologia chinesas. O núcleo do Baidu refere-se à exclusão Aiqi Baidu tem seu próprio negócio depois das artes), mas o grande modelo não é tão simples quanto investir uma quantia em dinheiro para fazer um modelo. Requer poder de computação, dados e engenheiros de IA experientes para acumular por um longo tempo em um bom plataforma de P&D.

** "Finanças" Xie Lirong: Além de dinheiro, cartões e dados, quais são os desafios para uma empresa iniciante fazer um modelo básico em grande escala? **

**Hou Zhenyu: **Dinheiro, cartões e dados são muito desafiadores em si. As empresas iniciantes criam modelos básicos de grande escala. Além do poder de computação mínimo, dados suficientes e de alta qualidade e pessoal experiente em P&D de IA, eles também precisam de uma plataforma de desenvolvimento de IA que possa gerenciar bem os modelos e o poder de computação. Atualmente, grandes empresas usarão essas plataformas para fornecer serviços externos na forma de nuvens. Por exemplo, o Baidu Smart Cloud fornece serviços externos por meio da plataforma de modelo em larga escala Wenxin Qianfan. No entanto, o limite para treinar um modelo grande básico do zero ainda é muito alto. Porque o modelo grande não é suficiente para ser treinado, mas também requer iterações ágeis contínuas, e as grandes empresas serão relativamente mais maduras.

** "Financeiro" Xie Lirong: Algumas empresas estão começando a construir seus próprios modelos grandes. É necessário construir um modelo grande sozinho? Quando a nuvem pública estava surgindo em 2014, alguns clientes estavam preocupados com a segurança dos dados. Eles também se preocupam com esse problema quando usam modelos grandes? **

**Hou Zhenyu:**Toda empresa deve usar um modelo de grande escala, mas toda empresa precisa fazer um modelo de grande escala sozinha? Eu não acho. É muito caro fazer um modelo grande básico do zero sozinho. As empresas podem usar seus próprios dados para ajustar os modelos básicos de outras pessoas e também podem obter resultados muito bons.

Zhu Yong: Acho que as empresas deveriam pensar mais sobre como usar modelos grandes e como fazer bom uso de modelos grandes. Cada empresa pode ter sua própria maquete, mas não há necessidade de começar de novo. Porque empresas como a Baidu forneceram uma boa base técnica. Você pode confiar no Baidu para fazer alguns produtos personalizados, o que é uma escolha de melhor custo-benefício para os clientes. O problema da segurança de dados não é um problema novo trazido pelo surgimento de grandes modelos. Se for comparado à computação em nuvem, há nuvem pública, nuvem privada, hospedagem e assim por diante. No modelo de negócios em grande escala, consideramos totalmente os produtos e soluções correspondentes.

** "Financeiro" Xie Lirong: A popularidade dos smartphones e das nuvens se deve ao baixo preço. Quando o grande modelo da China entrará no estágio de aplicação geral? **

Hou Zhenyu: O próprio modelo grande traz muita economia de custos. No passado, quando as empresas desenvolviam aplicativos de IA, elas precisavam fazer limpeza de dados, rotulagem, treinamento de modelos, raciocínio e otimização de acordo com os cenários de aplicativos. Por menor que seja a cena, todo o processo tem que ser feito, e o custo é muito alto. Mas com base no modelo grande, não há necessidade de tantos dados, tempo, recursos e mão de obra no passado. Sugiro que as empresas prestem atenção e usem a tecnologia de modelo em larga escala o mais rápido possível, porque ela pode reduzir bastante o limite de aplicação de IA.

**De que grandes modelos as empresas chinesas precisam? **

** "Finanças" Xie Lirong: o modelo de larga escala Wenxin da Baidu começou a ser testado internamente em março. Durante o teste interno, a empresa pode apresentar claramente suas próprias necessidades? Onde estão concentradas suas necessidades? **

**Zhu Yong:**Desde o teste interno em março, recebemos sucessivamente solicitações de acesso de mais de 150.000 clientes. Ao mesmo tempo, centenas de parceiros estão realizando testes de pesquisa e desenvolvimento conosco na cena. Isso abrange diferentes setores, como Internet, manufatura e finanças, e muitos cenários são de alto valor. Para resumir, existem várias categorias de cenários de alta frequência — gerenciamento de conhecimento, criação de conteúdo (incluindo direitos autorais de marketing, informações de mídia), atendimento inteligente ao cliente, geração de código e melhoria da eficiência do escritório.

** "Financeiro" Xie Lirong: Há um problema antigo no mercado de transformação digital, muitos clientes não sabem o que querem. No campo dos grandes modelos, essa contradição também existe? **

**Zhu Yong: **De fato, existem diferenças entre diferentes indústrias e diferentes clientes. Depois que o grande modelo foi lançado, a indústria da Internet prestou muita atenção aos seus desenvolvimentos mais recentes. Seu entendimento técnico e cognição do produto são muito avançados, para que possamos realizar rapidamente testes de pesquisa e desenvolvimento juntos e fazer demonstrações e inovações de produtos.

A base digital de algumas indústrias tradicionais é relativamente fraca, então a Baidu terá um grande número de engenheiros para co-criar com os clientes, combinar recursos de IA com seus pontos fracos da indústria e produzir muitos conceitos de produtos muito inovadores. Quando a tecnologia de IA é combinada com a indústria, é necessário entender a tecnologia e a IA, por um lado, e entender a indústria, por outro lado. Portanto, quando nos conectamos com clientes e parceiros, muitas vezes precisamos que ambas as partes criem juntas.

** "Financeiro" Xie Lirong: Como o Baidu fornece serviços de modelo em larga escala para diferentes setores e diferentes tipos de clientes? Como avaliar o desempenho de custo do ponto de vista do cliente? **

Zhu Yong: Em termos de preço, se a empresa está apenas tentando e é sensível ao preço, pode usar serviços de nuvem pública. De acordo com o volume de chamadas, Pay-as-you-go (quanto usar ) não requer uma única vez O investimento em instalações também é uma vantagem da nuvem pública. Algumas empresas estão dispostas a fazer grandes investimentos em infraestrutura e construir seus próprios aplicativos inteligentes. O Baidu pode fornecer um conjunto completo de modelos e bases de IA, e as empresas podem desenvolver aplicativos com base nos modelos e bases de IA.

** "Financeiro" Xie Lirong: Como as empresas escolhem um modelo de grande porte que lhes convém? **

Hou Zhenyu: Primeiro, deve ser o efeito do modelo, que é a base para a escolha de um modelo grande. As empresas precisam avaliar o valor que modelos grandes podem desempenhar em cenários de uso. Em segundo lugar, concentre-se na velocidade da iteração. Depende não apenas se o próprio modelo básico grande tem vitalidade, mas também se a plataforma possui uma cadeia de ferramentas completa, oferece suporte ao desenvolvimento secundário conveniente e retreinamento do modelo e oferece suporte a uma melhor iteração de modelos grandes. Terceiro, o custo real de pouso e a forma de entrega do modelo grande. As empresas podem escolher o modo de entrega de nuvem pública e nuvem privada de acordo com suas necessidades.

** "Financeiro" Xie Lirong: Wenxin Qianfan está posicionado como uma plataforma de modelo de grande escala de nível empresarial one-stop, como entender "one-stop" e "nível empresarial"? **

Hou Zhenyu: Em primeiro lugar, "one-stop", a IA é uma tecnologia impulsionada por dados. Desde o início, a IA precisa coletar, limpar e rotular dados e, em seguida, conduzir o treinamento com base nos modelos existentes. Após o treinamento, ela precisa gerenciar os dados ajustados e as versões do modelo e, finalmente, colocá-los em uso comercial . É todo um processo. O Baidu fornece esses recursos e é muito fácil de usar, o que pode atender às necessidades dos clientes em todo o ciclo de vida da pesquisa e desenvolvimento de IA até o aplicativo.

Além do "nível empresarial", os aplicativos de nível empresarial não são aplicativos pessoais, nem tão simples quanto o upload de fotos. Os aplicativos de nível corporativo serão mais refinados e complexos, e fatores como escala, escalabilidade, custos de implementação e estabilidade e robustez precisam ser considerados.

** "Finanças" Xie Lirong: De acordo com o Baidu, a plataforma de modelo em grande escala Wenxin Qianfan tem seis características - fácil de usar, segura, abrangente, eficiente, aberta e integrada. Por que a facilidade de uso deve vir em primeiro lugar? É verdade que apenas tecnologias úteis serão popularizadas? **

**Hou Zhenyu: **A facilidade de uso é muito importante. O modelo grande de linguagem natural pode fornecer aos clientes uma interface mais fácil de usar, que é conveniente para todos interagirem com a máquina. "Integração de nuvem e inteligência, inclusão de IA" é a estratégia do Baidu Smart Cloud, e "inclusão de IA" sempre foi um de nossos ideais. A IA não pode ser apenas uma tecnologia no topo da torre de marfim. O limite para o uso da IA deve ser reduzido, incluindo o limite para uso de dados, uso de recursos e uso humano da IA. Portanto, a facilidade de uso é muito importante.

** "Finanças" Xie Lirong: Nos últimos três meses, o público foi bem popularizado com modelos de inteligência artificial. Para milhares de indústrias, chegou a oportunidade comercial para grandes modelos? Como deve ser um bom ritmo de negócios? **

**Zhu Yong: **O grande modelo de inteligência artificial tem mudanças muito claras nos paradigmas de P&D e aplicação. Quanto mais cedo você abraçar e entender o grande modelo, mais ele terá impacto nos negócios. Esta não é uma pergunta de sim ou não. Quando se trata de ritmo, diferentes empresas adotam grandes modelos de maneiras diferentes. Algumas empresas podem começar com um teste de aplicativo de ponto único e usar a nuvem pública para chamar serviços, para que possam verificar rapidamente e fazer o desenvolvimento de demonstração a um custo menor.

Por outro lado, não importa se é uma empresa grande ou pequena, é necessário cultivar o pensamento nativo da IA. Por exemplo, alguns aplicativos podem ser transformados e atualizados de maneira gradual. Outra abordagem é chamada de refatoração.De acordo com a declaração interna da Baidu, todos os produtos no futuro serão refeitos com base no modelo grande.

** Existe uma bolha no mercado de modelos grandes? **

** "Financeiro" Xie Lirong: Você realmente precisa de tantos modelos grandes no mercado B-end voltado para negócios? **

**Hou Zhenyu:**Minha opinião pessoal é que o modelo básico grande não precisa de tantos. Claro, isso é apenas ansioso desde o final. Mas no início do desenvolvimento de qualquer indústria, o mercado se torna próspero e espumoso. Do ponto de vista do desenvolvimento industrial, devemos permitir algumas bolhas agora. Também devemos enfrentar isso. Mas ainda acredito que depois que as grandes ondas lavaram a areia, ainda são poucas as empresas que fornecem serviços básicos de modelagem.

**Zhu Yong: **Na direção do modelo básico grande, embora existam muitos jogadores agora, é realmente difícil manter uma iteração rápida, desenvolver continuamente uma cadeia de ferramentas mais abrangente e completa e melhorar continuamente os recursos do produto com base no cliente coisas de feedback. Portanto, embora o modelo grande possa estar muito quente agora, é uma corrida de longa distância. No final, será como o cenário de computação em nuvem de hoje e o mercado convergirá gradualmente.

** "Financeiro" Xie Lirong: Muitas empresas que fabricam hardware de servidor também desejam fabricar modelos industriais de grande escala. O Baidu costumava ser seu cliente, mas agora eles estão competindo entre si. Como devemos viver juntos pacificamente? **

Hou Zhenyu: Acho que não podemos falar diretamente sobre competição. Ainda somos um relacionamento cooperativo primeiro. As duas partes realmente terão serviços semelhantes e enfrentarão indústrias semelhantes ao mesmo tempo, mas nós e os fabricantes de hardware tradicionais somos mais complementares. Baidu é uma empresa de IA com genes da Internet. Acumulou uma grande quantidade de dados de uso geral e um grande modelo de uso geral. Suas vantagens estão em IA, software, tecnologia e outros campos. Fabricantes de hardware tradicionais acumularam dados da indústria e desenvolveram know-how em campos verticais, como governos tradicionais e indústrias empresariais. Os dois lados têm pontos fortes diferentes na construção de grandes modelos. Empresas como Baidu e H3C não são apenas parceiras na compra de servidores e switches, mas também constroem grandes modelos em conjunto.

** "Financeiro" Xie Lirong: Baidu costuma prestar atenção ao progresso dos grandes modelos dos concorrentes? **

Zhu Yong: Primeiro, tecnologia e efeito geral. Em segundo lugar, ferramentas de apoio. Em terceiro lugar, o modelo de negócios. Se você voltar três ou quatro anos atrás, o mercado de inteligência artificial ainda estava relativamente distante, mas hoje a tecnologia de aprendizado profundo, a comercialização de produtos, o investimento e a ecologia de código aberto estão acelerando.

** "Financeiro" Xie Lirong: Nos próximos anos, os modelos em grande escala serão a direção principal do núcleo do Baidu? Por que? **

**Hou Zhenyu: **Modelos grandes serão o foco principal do Baidu. A Baidu é uma empresa de IA e modelos grandes são uma importante direção de desenvolvimento da IA. Seja no lado To C ou no lado To B, trará grandes mudanças aos produtos e serviços da Baidu. Para o Baidu, modelos grandes são muito empolgantes, o que é uma oportunidade e um desafio. O Baidu continuará investindo em modelos grandes. Acredito que os modelos grandes acelerarão a computação em nuvem para a era da IA e remodelarão o cenário da computação em nuvem. O status do MaaS (Modelo como serviço) se tornará cada vez mais importante e também acelerará a realização do Baidu A estratégia de "integração de nuvem e inteligência" e o ideal de "inclusão de IA" proposto pela Smart Cloud.

** "Financeiro" Xie Lirong: A última rodada de comercialização de inteligência artificial que começou em 2016 teve alguns problemas, e as empresas de IA tiveram que fazer muitos projetos de customização tediosos e detalhados. Como grandes modelos podem evitar os problemas encontrados na última rodada de comercialização de inteligência artificial? **

Hou Zhenyu: Esta rodada de desembarque da indústria de modelos em grande escala é diferente da indústria de IA representada pelo aprendizado profundo dez anos atrás. Este é um novo paradigma para pesquisa e desenvolvimento de IA, diferente dos investimentos anteriores. Antes do surgimento dos modelos em larga escala, a IA era a mais criticada e a mais difícil de implementar era que o ambiente industrial atual era fragmentado. Por exemplo, o reconhecimento facial de portões e o reconhecimento facial de pagamento são diferentes. Porque a luz e o ambiente são diferentes, precisa de ser orientado para diferentes aplicações, devendo o treino ser feito de raiz de acordo com os dados acumulados pelos clientes, e depois adaptados ao cenário. Esse tipo de entrega personalizada é muito complicado.

Mas sob o modelo básico grande, resultados muito bons podem ser obtidos sem muitos dados de ajuste fino e sem muitas rodadas de treinamento. Modelos grandes de base resolvem muitos cenários com muito mais facilidade do que antes. A capacidade de generalização de modelos grandes é muito mais forte do que antes. Isso é diferente da última rodada de pouso de IA. No ano passado, um modelo com 1 bilhão de parâmetros era chamado de modelo grande, mas agora os parâmetros do modelo costumam ser centenas de bilhões. Com mais de 100 bilhões de parâmetros, surgirá inteligência, capacidades de generalização mais fortes e capacidades gerais em vários cenários.

** "Financeiro" Xie Lirong: Quando muitas pessoas entram em uma indústria, as bolhas podem ser inevitáveis. Se o modelo grande for desenvolvido de forma saudável, que sugestões você tem? **

Hou Zhenyu: Meu conselho para os praticantes de modelos grandes é fazer o que puder. Você não precisa fazer tudo sozinho. Em vez disso, considere a comercialização de IA e encontre os cenários e cadeias que melhor se adequam às suas capacidades. Esperamos que, quando a indústria se desenvolver rapidamente no estágio inicial, certas bolhas sejam permitidas. No entanto, a política pode chegar a um consenso sobre a supervisão da aplicação da tecnologia e os padrões da indústria para avaliar a qualidade da tecnologia. Existem padrões a seguir e regras a seguir, para que possamos nos desenvolver de maneira saudável.

Zhu Yong: Também precisamos mudar nossa maneira de pensar. O grande modelo é uma tecnologia divisora de águas, uma tecnologia subversiva. Mantenha a mente aberta e continue aprendendo.

Ver original
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
Sem comentários
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
Escaneie o código para baixar o app da Gate.io
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)