Na era da IA, como as empresas Web3 podem competir com os gigantes tradicionais?

Question

Título Original: "Virando o moeda de IA"

Artigo original de Gagra Ventures

Coletânea original: Fairy, ChainCatcher

Nota do editor: Através da aura da tecnologia, o autor vê os maiores obstáculos, como capital e hardware, enfrentados pelos projetos Web3 na promoção do desenvolvimento de IA. Embora a intenção original da Web3 seja quebrar a centralização e realizar o ideal de descentralização, na prática, ela é frequentemente influenciada por narrativas de mercado e incentivos Token, e se desvia da intenção original.

ChainCatcher compila o texto original da seguinte forma:

O apelo para a combinação de IA e Web3 está ficando mais alto, mas isso não é mais longo um artigo VC otimista. Estamos otimistas quanto à fusão das duas tecnologias, mas o texto abaixo é um apelo. Caso contrário, esse otimismo não será realizado.

Porquê? Como desenvolver e executar os melhores modelos de IA requer enormes despesas de capital, hardware de última geração é muitas vezes difícil de encontrar e requer pesquisa e desenvolvimento em áreas muito específicas. O crowdsourcing desses recursos, como longo projetos de IA Web3 estão fazendo, por meio de incentivos encriptação não é suficiente para compensar as dezenas de bilhões de dólares investidos pelas grandes empresas que controlam o desenvolvimento de IA. Dadas as limitações de hardware, este pode ser o primeiro paradigma de software em grande escala que nenhum engenheiro Satoshi e criativo fora da organização existente pode quebrá-lo.

O software está a "devorar o mundo" a um ritmo cada vez maior e, em breve, irá subir exponencialmente com a aceleração da inteligência artificial. No cenário atual, todo esse "bolo" está indo para os gigantes da tecnologia, e os usuários finais, incluindo governos e grandes corporações, estão mais limitados por seu poder.

Incentivos deslocados

Tudo isso está acontecendo em um momento inoportuno – 90% dos participantes da Rede Descentralização estão ocupados perseguindo o "ovo de ouro" dos rendimentos fáceis de fiat orientados pela narrativa.

Os desenvolvedores estão seguindo os investidores em nosso setor, e não o contrário. Isso se manifesta de várias maneiras, desde o reconhecimento público até motivações subconscientes mais sutis, mas a narrativa e o mercado que se forma em torno deles impulsionam longo decisões na Web3. Tal como acontece com as bolhas reflexivas tradicionais, os participantes estão demasiado focados no mundo interior para perceberem o mundo exterior, a menos que isso ajude a promover a narrativa do ciclo. E a IA é claramente a maior narrativa, pois é por si só.

Conversamos com dezenas de equipes na interseção de IA e Ativos de criptografia, e podemos confirmar que muitas longo delas são construtoras muito capazes, orientadas para missões e apaixonadas. Mas a natureza humana é o que é, e quando confrontados com tentações, tendemos a sucumbir a elas e depois racionalizar essas escolhas depois do fato.

O caminho para a liquidez fácil tem sido uma maldição histórica para a indústria encriptação – e, neste ponto, tem paralisado o desenvolvimento e a adoção digna por mais anos. Isso fez até mesmo os crentes mais leais Ativos de criptografia se voltarem na direção de "puxar Tokens". A lógica para a racionalização é que os construtores que possuem Tokens podem ter melhores oportunidades.

A baixa complexidade do capital institucional e de retalho oferece uma oportunidade para os construtores fazerem reivindicações fora da realidade, ao mesmo tempo que beneficiam de avaliações como se essas reivindicações já tivessem sido realizadas. O resultado desses processos é, na verdade, o risco moral enraizado e a destruição de capital, e poucas estratégias desse tipo funcionam a longo prazo. As necessidades são a mãe de todas as invenções e, quando as necessidades desaparecem, as invenções desaparecem.

O momento não poderia ter sido pior. Enquanto todos os Satoshi empreendedores de tecnologia, atores estatais e grandes e pequenas empresas estão correndo para garantir uma fatia da revolução da IA, Ativos de criptografia fundadores e investidores estão optando por "10x mais rápido". E, na nossa opinião, esse é o verdadeiro custo de oportunidade.

Visão geral do cenário de IA Web3

Dado os incentivos mencionados acima, a classificação dos projetos de IA Web3 pode ser dividida em:

Razoável (também pode ser subdividido em realistas e idealistas)
Semi-razoável
Falsificado

Fundamentalmente, acreditamos que os construtores de projetos devem ter uma ideia clara de como podem acompanhar seus concorrentes Web2 e saber quais áreas são competitivas e quais são delirantes, mesmo que essas áreas delirantes possam ser comercializadas para VCs e o público.

O nosso objetivo é poder competir aqui e agora. Caso contrário, a velocidade do desenvolvimento da IA pode deixar a Web3 para trás, e o mundo saltará para a "Web4" entre a IA corporativa ocidental e a IA nacional chinesa. Aqueles que não conseguem ser competitivos a tempo e dependem da tecnologia distribuída para recuperar o atraso durante um mais longo período de tempo são otimistas demais para serem levados a sério.

Obviamente, esta é apenas uma generalização muito grosseira, e mesmo entre o grupo dos "fakes" há pelo menos algumas equipes sérias (e talvez mais longo apenas delirantes). Mas este artigo é um apelo, pelo que não pretendemos ser objetivos, mas sim apelar ao leitor para que tenha sentido de urgência.

Razoável:

Os fundadores mais antigos de soluções que desenvolvem middleware "AI on the chain" entendem que não é viável ou mesmo impossível descentralizar atualmente o treinamento ou inferência de modelos (ou seja, tecnologias de ponta) que os usuários realmente precisam.

Portanto, encontrar uma maneira de conectar o melhor modelo centralizado ao ambiente na cadeia para que ele possa se beneficiar da automação complexa é um primeiro passo bom o suficiente para eles. Atualmente, TEEs isolados por hardware ("processadores isolados mais curtos") que podem hospedar pontos de acesso API, máquinas Oracle bidirecionais (indexação bidirecional na cadeia e fora da cadeia dados) e arquiteturas de coprocessador que fornecem aos corretores um ambiente de computação fora da cadeia verificável parecem ser as melhores soluções no momento.

Há também uma arquitetura de coprocessador que usa zk-SNARKs (ZKPs) para instantâneo de alterações de estado (em vez de validar a computação completa), o que acreditamos ser também viável no médio prazo.

Para o mesmo problema, uma abordagem mais ideal seria tentar validar fora da cadeia raciocínio para alinhá-lo com na cadeia computação em termos de pressupostos de confiança.

Acreditamos que o objetivo disso deve ser permitir que a IA execute tarefas na cadeia e fora da cadeia em um ambiente operacional unificado. No entanto, os proponentes da verificabilidade da grande inferência de saudade estão falando sobre objetivos complicados como "pesos de modelo de confiança" que realmente se tornam relevantes em alguns anos, se houver. Recentemente, os fundadores deste campo começaram a explorar formas alternativas de verificar o raciocínio, mas inicialmente todas baseadas no ZKP. Enquanto longo Satoshi equipe está trabalhando no ZKML (Zero-Knowledge Machine Learning), eles antecipam que a velocidade da otimização de encriptação excederá a complexidade e os requisitos computacionais dos modelos de IA, correndo muito risco. Por conseguinte, consideramos que, neste momento, não são adequados para a concorrência. Ainda assim, alguns desenvolvimentos recentes são interessantes e não devem ser ignorados.

Semi-razoável:

Os aplicativos de consumo usam wrappers que encapsulam modelos de código fechado e Código aberto (por exemplo, Difusão Estável ou Midjourney para geração de imagens). Algumas destas equipas foram as primeiras a entrar no mercado e foram reconhecidas pelos utilizadores reais. Portanto, é injusto chamá-los de falsificadores, mas apenas um punhado de equipes está pensando profundamente em como evoluir seu modelo subjacente de forma descentralizada e inovar no design de incentivos. Na seção Token, há também alguns projetos interessantes de governança/propriedade. No entanto, a maioria dos longo em tais projetos são apenas uma Token em cima do API OpenAI, que de outra forma é centralizado, a ordem de obter um prêmio de avaliação ou trazer Liquidez mais rápido para a equipe.

O problema que nenhum dos campos acima resolveu é o treinamento e a inferência de grandes modelos em um ambiente Descentralização. Atualmente, não é possível treinar um modelo básico em um período razoável de tempo sem depender de clusters de hardware fortemente conectados. Dado o nível de concorrência, o "calendário razoável" é um factor-chave.

Existem alguns estudos recentes promissores que teoricamente sugerem que métodos como o "Fluxo Diferencial de Dados" podem ser estendidos a redes de computação distribuída no futuro para aumentar sua capacidade (à medida que as capacidades de rede alcançam os requisitos de fluxo de dados). No entanto, o treinamento de modelos competitivos ainda requer comunicação localizada entre clusters, em vez de um único dispositivo distribuído e computação de ponta (GPUs de varejo estão se tornando cada vez menos competitivas).

A pesquisa sobre inferência localizada através da redução do tamanho do modelo (uma das duas abordagens para Descentralização) também fez progressos recentes, mas não há protocolo existentes para aproveitá-la na Web3.

O problema do Descentralização Treinamento e Inferência logicamente nos leva ao último dos três campos, e de longe o mais importante e, portanto, o mais emocionalmente desencadeado para nós.

Falso:

As aplicações de infraestrutura estão concentradas principalmente no campo de servidores descentralizados, fornecendo hardware nu ou ambientes de treinamento / hospedagem de modelos descentralizados. Há também projetos de infraestrutura de software que estão empurrando protocolos como o aprendizado federado (treinamento de modelo descentralizado), ou aqueles que combinam componentes de software e hardware em uma plataforma onde as pessoas podem essencialmente treinar e implantar seus modelos de descentralização de ponta a ponta. Os mais longos deles não têm a complexidade necessária para realmente resolver o problema descrito, e a ideia ingênua de "Token Incentivos + Impulso de Mercado" prevalece aqui. Nenhuma das soluções que vemos nos mercados público e privado pode competir significativamente no aqui e agora. Algumas soluções podem evoluir para produtos viáveis (mas de nicho), mas o que precisamos agora é de soluções novas e competitivas. E isso só pode ser alcançado através de designs inovadores que resolvam os gargalos da computação distribuída. No treinamento, não só a velocidade é um grande problema, mas também a verificabilidade do trabalho realizado e a coordenação da carga de trabalho de treinamento, o que aumenta o gargalo de largura de banda.

Precisamos de um conjunto competitivo e verdadeiramente descentralizado de modelos básicos que exijam Descentralização de treinamento e inferência para serem eficazes. Perder a IA poderia negar completamente tudo o que o "computador mundial da descentralização" alcançou desde o advento da Ethereum. Se o computador se tornar inteligência artificial, e a inteligência artificial for centralizada, então não haverá computador mundial para falar, exceto alguma versão distópica.

O treinamento e a inferência estão no centro da inovação em IA. Enquanto o resto do mundo da IA está se movendo para arquiteturas mais rígidas, a Web3 precisa de algumas soluções ortogonais para competir com ela, já que a concorrência direta está se tornando menos viável.

A dimensão do problema

É tudo uma questão de cálculos. Quanto mais longo investimento em treinamento e inferência, melhores serão os resultados. Sim, pode haver alguns ajustes e otimizações aqui, também pode haver alguns ajustes e otimizações lá, e a computação em si não é homogênea. Existem todos os tipos de novas maneiras de superar os gargalos das unidades de processamento de arquitetura von Neumann tradicionais, mas tudo ainda se resume a quão rápido você pode ir longo e quão rápido você pode ir longo e quão rápido você pode multiplicar a matriz em grandes blocos de memória mais longos.

É por isso que estamos vendo os chamados "hyperscalers" construindo tão fortemente no lado do data center, todos procurando criar uma pilha completa com modelos de IA na parte superior e o hardware que os alimenta na parte inferior: OpenAI (modelos) + Microsoft (computação), Anthropic (modelos) + AWS (computação), Google (ambos) e Meta (ambos estão ficando mais longo ao dobrar a construção de seus próprios data centers). Há nuances mais longas, dinâmicas de interação e partes envolvidas, mas não vamos lista todas. No geral, os hyperscalers estão investindo bilhões de dólares na construção de data centers e criando sinergias entre seus produtos de computação e IA, que devem produzir benefícios significativos à medida que a IA se torna mais amplamente usada na economia global.

Vamos dar uma olhada no nível esperado de construção dessas 4 empresas apenas este ano:

AI时代，Web3企业要如何与传统巨头竞争？

™ Jensen Huang, CEO da NVIDIA ®, propôs um total de US$ 1 trilhão em aceleração de IA nos próximos anos. Recentemente, ele dobrou essa previsão para US$ 20.000, supostamente porque vê interesse de empresas soberanas.

Os analistas da Altimeter esperam que os gastos globais com data centers relacionados à IA atinjam US$ 160 bilhões e US$ 200 bilhões em 2024 e 2025, respectivamente.

Agora, compare esses números com os incentivos que a Web3 oferece aos operadores independentes de data center para pressioná-los a escalar seu capex no hardware de IA mais recente:

Atualmente, o capitalização de mercado total de todos os projetos de infraestrutura física Descentralização (DePIn) é atualmente de cerca de US$ 40 bilhões, composto principalmente por tokens especulativos e de liquidez relativa. Basicamente, o capitalização de mercado dessas redes é igual à estimativa do limite superior do gasto total de capital de seus contribuintes, pois eles incentivam essa construção com tokens. No entanto, o capitalização de mercado atual é de pouca utilidade, uma vez que já foi emitido.

Então, vamos supor que nos próximos 3-5 anos, como incentivo, haverá mais US $ 80 bilhões (2x mais valiosos agora) de capital privado e público DePIn Token, e assumir que esses Tokens serão 100% usados para casos de uso de IA. Mesmo se dividirmos esta estimativa muito aproximada por 3 (anos) e compararmos o seu valor em dólares com o valor em dinheiro dos hiperescaladores que investem apenas em 2024, torna-se claro que impor incentivos Token a um monte de projetos "Descentralização GPU Network" não é suficiente.

Além disso, bilhões de dólares de demanda dos investidores são necessários para absorver esses Tokens, já que os operadores dessas redes vendem grandes quantidades de Tokens minerados para cobrir custos significativos de capital e despesas operacionais. É necessária mais longo financiamento para impulsionar esses Token pump e incentivar a construção expandida para superar os hiperescaladores.

No entanto, alguém com conhecimento profundo de como os servidores Web3 operam atualmente pode argumentar que uma grande parte da "infraestrutura física de descentralização" está realmente sendo executada nos serviços de nuvem desses hiperescaladores. É claro que o aumento na demanda por GPUs e outros hardwares específicos de IA está impulsionando uma oferta mais longo, o que acabará tornando os aluguéis ou compras de nuvem mais baratos. Pelo menos é o que as pessoas esperam.

Mas também é importante considerar: a Nvidia agora precisa priorizar a demanda dos clientes por sua última geração de GPUs. A Nvidia também está começando a competir com os maiores provedores de computação em nuvem em seu próprio território - oferecendo serviços de plataforma de IA para clientes corporativos já bloqueados nesses supercomputadores. Isso acabará levando-a a construir seus próprios data centers ao longo do tempo (essencialmente erodindo os lucros lucrativos de que agora desfrutam, então é improvável) ou limitar significativamente suas vendas de hardware de IA para os provedores de nuvem de rede com os quais trabalha.

Além disso, os concorrentes da Nvidia, que estão lançando hardware adicional específico de IA, estão principalmente longo usando os mesmos chips feitos pela TSMC que a Nvidia. Como resultado, basicamente todas as empresas de hardware de IA estão atualmente competindo pela capacidade de produção da TSMC. A TSMC também precisa priorizar determinados clientes. A Samsung e, potencialmente, a Intel (que está tentando retornar à fabricação de chips de última geração o mais rápido possível para produzir chips para seu próprio hardware) podem ser capazes de absorver a demanda adicional, mas a TSMC está atualmente produzindo chips mais longos relacionados à IA, e escalar e calibrar a fabricação de chips de ponta (3 e 2nm) levará anos.

Finalmente, devido às restrições dos EUA à NVIDIA e TSMC, a China está em grande parte fora do alcance da última geração de hardware de IA. Ao contrário da Web3, as empresas chinesas realmente têm seus próprios modelos competitivos, especialmente LLMs de empresas como Baidu e Alibaba, que exigem um grande número de dispositivos da geração anterior para funcionar.

À medida que a batalha da IA se intensifica e tem precedência sobre o negócio da nuvem por uma ou uma combinação dessas razões, os hiperescaladores são um risco não material de restringir o acesso externo ao seu hardware de IA. Basicamente, é uma situação em que eles tomam toda a capacidade de nuvem relacionada à IA para si e não a dão a ninguém, enquanto também devoram todo o hardware mais recente. Como resultado, outras grandes corporações, incluindo Estados soberanos, exigirão mais da oferta restante de computação. Ao mesmo tempo, as GPUs de consumo restantes estão se tornando cada vez menos competitivas.

Obviamente, este é apenas um caso extremo, mas se o gargalo de hardware persistir, os grandes jogadores vão recuar porque os ganhos são muito altos. Como resultado, operadores de Descentralização, como centros de dados secundários e proprietários de hardware de nível de varejo (representando a maior maioria dos provedores Web3 DePIn) são deixados de fora da concorrência.

O outro lado das moedas duras

Enquanto os fundadores da Ativos de criptografia ainda estão dormindo, os gigantes da IA estão de olho em Ativos de criptografia. A pressão governamental e a concorrência podem levá-los a adotar Ativos de criptografia para evitar serem encerrados ou fortemente regulamentados.

A recente demissão do fundador da Stability AI, em ordem para iniciar a "descentralização" da sua empresa, foi um dos primeiros indícios públicos. Ele já havia feito aparições públicas sem esconder que planejava lançar o Token após a listagem bem-sucedida da empresa, o que de alguma forma expôs o verdadeiro motivo por trás da ação pretendida.

Da mesma forma, embora Sam Altman não esteja envolvido na operação do projeto de encriptação Worldcoin, que ele cofundou, seu Token é, sem dúvida, negociado como um agente para a OpenAI. Se há uma maneira de conectar projetos de Token de internet com projetos de pesquisa e desenvolvimento de IA, só o tempo dirá, mas a equipe da Worldcoin também parece estar ciente de que o mercado está testando essa hipótese.

Para nós, faz todo o sentido que os gigantes da IA explorem diferentes caminhos de descentralização. O problema que estamos vendo aqui novamente é que a Web3 não produziu soluções significativas. A longo de "tokens de governação" era apenas um meme no momento, e agora apenas Token como BTC e ETH que explicitamente evitam uma ligação direta entre os detentores de ativos e seu desenvolvimento e operações de rede são realmente Descentralização Token.

Os incentivos que retardam o desenvolvimento da tecnologia também influenciaram o desenvolvimento de diferentes projetos de governança encriptação rede. As equipes de start-ups simplesmente colocam um "tokens de governação" em seus produtos, na esperança de encontrar um novo caminho no processo de ganhar impulso, apenas para acabar descansando sobre seus louros no "teatro de governança" em torno da alocação de recursos.

Conclusão

A corrida da IA está acontecendo, e todos estão levando isso muito a sério. Não podemos encontrar brechas no pensamento dos gigantes grande tecnologia sobre a expansão do poder de computação – mais computação longo significa melhor IA, e melhor IA significa Gota custos, novas receitas e participação de mercado. Para nós, isto significa que a bolha se justifica, mas todos os falsificadores continuarão a ser eliminados na inevitável remodelação do futuro.

A IA centralizada e de grandes empresas está dominando o campo, e as startups estão tendo dificuldade em acompanhar. O espaço Web3, embora longo atrasado, também está se juntando à briga. As recompensas do mercado para encriptação projetos de IA são muito lucrativas em comparação com startups no espaço Web2, o que levou os fundadores a mudar seu foco da entrega de produtos para impulsionar Token pump de preços em um momento crítico que está se fechando rapidamente. Até agora, não houve inovações que tenham sido capazes de contornar a computação de escala em ordem de competir.

Agora, há um movimento Código aberto credível em torno de modelos voltados para o consumidor e, inicialmente, apenas algumas empresas centralizadas optaram por competir por participação de mercado com concorrentes maiores de código fechado, como Meta e Stability AI. Mas agora, a comunidade está se atualizando, pressionando principal empresas de IA. Essas pressões continuarão a afetar o desenvolvimento de código fechado de produtos de IA, mas não tanto até que Código aberto produtos se recuperem. Esta é outra grande oportunidade no espaço Web3, mas apenas se resolver o problema de treinamento e inferência de modelos descentralizados.

Assim, embora na superfície exista a oportunidade disruptiva "clássica", a realidade está longe disso. A IA tem tudo a ver com computação, e não mudará isso sem inovação revolucionária nos próximos 3-5 anos, que é um momento crítico para decidir quem controla e dirige o desenvolvimento da IA.

Calcular o mercado em si, embora a demanda impulsione os esforços do lado da oferta, também é improvável que seja "uma centena de flores florescendo", já que a concorrência entre os fabricantes é limitada por fatores estruturais, como fabricação de chips e economias de escala.

Continuamos otimistas sobre a engenhosidade Satoshi da humanidade e estamos convencidos de que há pessoas longo Satoshi e nobres suficientes para tentar resolver o quebra-cabeça da IA de uma forma que beneficie o mundo livre, em vez de controle corporativo ou governamental de cima para baixo. No entanto, esta oportunidade parece muito pequena e, na melhor das hipóteses, um lance moeda difícil, mas os fundadores da Web3 estão ocupados jogando moedas duras para fazer benefícios econômicos em vez de causar um impacto real no mundo.

Ver original