Grama - Uma Revolução de Dados

intermediário12/9/2024, 8:36:14 AM
Grass dá acesso a modelos de IA e aplicativos a toda a Internet como um conjunto de dados, que é coletado por meio de uma rede de nós ao redor do mundo que estão contribuindo com sua largura de banda ociosa da Internet. Eles têm uma forte tração inicial com mais de 2,5 milhões de usuários.

Resumo Executivo

A IA generativa é a inovação mais importante na memória recente e está se tornando ainda mais importante à medida que o tempo avança. A IA generativa é basicamente um produto de três elementos:

Algoritmos + Dados + Computação = Inteligência

Isso significa que Dados e Computação provavelmente se tornarão dois dos ativos mais importantes do mundo e o acesso a eles será incrivelmente importante.

Os modelos de IA generativa são famintos por dados. Os dados em que os modelos de IA generativa mais significativos operam são o valor da Internet de dados, que é uma aproximação da soma de todo o conhecimento humano.

A criptografia trata de oferecer acesso a novos recursos digitais em todo o mundo e tornar ativos coisas que antes não eram ativos por meio de tokens. O Grass faz isso para dados.

Grass dá aos modelos de IA e aplicativos acesso a toda a Internet como um conjunto de dados, ao vivo, que é coletado via uma rede de nós ao redor do mundo que estão contribuindo com sua largura de banda ociosa da Internet. Eles têm uma forte tração inicial com mais de 2,5 milhões de usuários.[1]

O mercado potencial de longo prazo para Grass é enorme e está relacionado ao tamanho do mercado de IA e ao seu crescimento futuro. No passado, a coleta de conjuntos de dados dessa escala era relegada apenas aos maiores gigantes da tecnologia. Grass traz novas economias para os dados, reduzindo custos. Isso democratiza o acesso aos dados, não apenas para atender às grandes empresas de elite, mas também para atender a uma gama mais ampla da indústria de IA.

O Problema

O treinamento e ajuste fino do modelo de IA requer enormes quantidades de dados. Historicamente, grande parte desses dados foi obtida por meio da coleta de dados pelos criadores de modelos de IA em sites. Esse processo de coleta de dados apresenta uma série de desafios:

  • A raspagem da web é cara. Apenas algumas grandes organizações são capazes de raspar a web inteira periodicamente. Isso impede que os desenvolvedores menores de IA acessem os dados.
  • Bloqueio de IP. Houve um jogo de gato e rato entre esses serviços de scraping e os criadores de conteúdo. É bastante simples bloquear um endereço de IP para impedir o scraping, tornando difícil alcançar os objetivos de scraping e reunir os dados necessários para o treinamento e ajuste fino da IA.
  • Recursos desperdiçados. Raspar a web é uma tarefa que pode beneficiar muitos clientes. O hardware, largura de banda e poder de processamento necessários para isso são ineficientes se feitos por um único cliente.
  • Atualidade dos dados. É trabalhoso e caro escanear toda a Internet. Isso torna impraticável para a maioria dos usuários escanear com frequência, o que torna os dados menos atualizados, impactando a qualidade dos modelos de IA.

Solução Grass

Grass tem como objetivo resolver esses problemas criando uma rede federada de web scrapers. Cada indivíduo que participa da rede Grass contribui com uma parte da largura de banda da Internet não utilizada para fornecer uma pequena quantidade de scraping a partir de seu endereço IP. A Grass então reúne dados de cada um desses nós para formar um conjunto de dados combinado que é útil para treinamento e ajuste fino de IA. É um uso elegante e adequado de redes distribuídas alimentadas por criptomoeda.

Existem outros casos de uso para a Internet não utilizada, como:

  • Coletando dados locais/geo, como anúncios
  • Realizando pesquisa acadêmica
  • Verificando preços locais

Hoje, a Grass coleta dados usando hardware existente (laptops, desktops, etc.). No futuro, a Grass planeja oferecer um dispositivo de coleta de dados, que é um dispositivo de hardware personalizado exclusivamente dedicado à coleta de dados, criando eficiências devido ao dispositivo ser otimizado para essa tarefa específica.

Benefícios da Grama

Existem várias vantagens em usar uma rede distribuída para coleta de dados:

  • Acesso democratizado aos dados da web que se torna mais barato em escala. Em vez de um único cliente coletar dados para suas próprias necessidades, o Grass coleta dados em nome de muitos clientes. Esses dados podem ser revendidos várias vezes, criando economias de escala nos dados, reduzindo os custos econômicos da raspagem e tornando o mercado mais eficiente. Em escala, o Grass pode hipoteticamente se tornar a solução de coleta de dados mais econômica para os clientes, criando um efeito de rede econômica em torno de seu protocolo. Isso significa que a coleta de dados agora está disponível para qualquer pessoa, não apenas para um par de grandes empresas que têm os recursos para raspar a web.
  • O bloqueio de IP torna-se inviável. Ao distribuir a raspagem, torna-se muito mais difícil detectar e parar a raspagem, já que cada nó só faz uma quantidade relativamente pequena de captura de dados e é difícil de distinguir do tráfego típico da Internet. Isso resulta em conjuntos de dados mais completos para treinamento.
  • A largura de banda da Internet é usada de forma mais eficiente. Uma vez que o Grass é efetivamente uma forma de consumo colaborativo da largura de banda da Internet não utilizada, é mais eficiente do que a provisão de nova largura de banda apenas para raspagem.
  • Os dados são mais precisos e recentes. Torna-se economicamente viável raspar com mais frequência do que um cliente típico poderia fazer por conta própria. Isso resulta em menos dados obsoletos. Isso é importante, já que os modelos de IA resultantes estão mais atualizados.

O Desafio: Criadores de Conteúdo que Monetizam seus Dados

Uma das coisas complicadas de navegar ao raspar dados são os criadores de conteúdo. Isso inclui sites como o NY Times e o Reddit, que começaram a monetizar seus dados, licenciando-os para terceiros para treinar modelos de IA. Naturalmente, eles protegem os dados em seus sites, pois esses dados representam fontes de receita altamente lucrativas para eles. De fato, o Reddit proibiu o uso de sua API de desenvolvedor para aprendizado de máquina para proteger seu modelo de negócios de licenciar seus dados para criadores de modelos de IA (consulte os termos de serviço.aqui).

O que o futuro reserva para criadores de conteúdo? Bem, considere que para o conteúdo gerado pelo usuário (UGC), como o Reddit, existe um argumento de que os usuários possuem seus próprios dados (em vez da plataforma), uma vez que o conteúdo foi criado pelos usuários e deve ser de propriedade desses usuários. Esse argumento ainda precisa ser totalmente explorado do ponto de vista legal. Será interessante ficar de olho nisso no futuro. No entanto, se os usuários realmente possuírem seus dados contribuídos, então o Grass poderia representar um caminho hipotético para ajudar esses usuários a monetizarem seus próprios dados contribuídos. Por exemplo, o Grass poderia recompensar os próprios contribuintes do Reddit por se voluntariarem para contribuir com seus dados que eles criaram no Reddit.

Para criadores de conteúdo remunerado, como o NY Times, o conteúdo é criado por escritores remunerados e, como tal, não há argumento para dados de propriedade do usuário. Assim, o Grass poderia simplesmente excluir esses sites de serem rastreados. Alternativamente, o Grass pode escalar a ponto de se tornar viável para o próprio Grass se tornar um cliente desses sites e pagar taxas de licenciamento. A forma como isso poderia funcionar hipoteticamente é que os clientes do Grass poderiam pagar pelos dados e, em seguida, o Grass poderia compartilhar a receita de volta para os criadores de conteúdo, possibilitando assim a criação de modelos de IA com um orçamento flexível. Alternativamente, o Grass poderia alcançar uma escala tal que pudesse negociar um acordo de licenciamento em massa em nome de todos os seus clientes.

Lançamento da Grass

A Grass teve um lançamento extremamente impressionante no início deste ano:

  • A grama teve o airdrop mais amplamente distribuído na história da Solana.[2]
  • Mais de 2 milhões de carteirasreivindicadoo airdrop, causando a rede da Solana a ceder sob pressão.
  • Há mais de 2,5 milhões de usuários totais da Grass no mundo todo.[3]
  • Grass tem a capacidade e os dados para treinar o modelo ChatGPT 3.5 da OpenAI.
  • Como demonstração de sua plataforma, a Grass disponibilizou gratuitamente um conjunto de dados composto por 600 milhões de postagens e comentários do Reddit a partir de 2024 (ver aquipara o anúncio eaquipara o conjunto de dados).

No momento da escrita, o token Grass tinhaação positiva de preçoapós o lançamento (+115%), o que é incomum, pois a maioria dos tokens cai nos dias/semanas seguintes à listagem. Isso provavelmente reflete sua abordagem inteligente em relação à distribuição do airdrop, bem como a crença no futuro e no potencial da Grass. No geral, este é um ótimo começo para a rede e acreditamos que isso abre caminho para muitos anos prósperos pela frente.

Desempenho do Token Grass desde o lançamento em 28 de outubro de 2024

Fonte: TradingView.

Comece a contribuirAproveite sua largura de banda de internet não utilizada conectando sua carteira Solana e ganhe o token Grass.

Quer usar os conjuntos de dados do Grass para o seu negócio, pesquisa ou projeto? Entre em contato com a equipe em discover@grassfoundation.io.

Notas de rodapé

[1] Fonte: https://www.getgrass.io/.
[2] Fonte: https://www.google.com/url?q=https://www.theblock.co/post/323805/grass-becomes-most-distributed-solana-airdrop-as-nearly-1-5-million-addresses-claim-tokens&sa=D&source=docs&ust=1732646335082707&usg=AOvVaw0oVvhJL661rmE1ABmJqOyP.
[3] Fonte: https://www.getgrass.io/.

Aviso Legal:

  1. Este artigo é reproduzido a partir de [Hack VC], Todos os direitos autorais pertencem ao autor original [Ed Roman]. If there are objections to this reprint, please contact the Gate Learnequipe e eles vão lidar com isso prontamente.
  2. Aviso de responsabilidade: As opiniões expressas neste artigo são exclusivamente do autor e não constituem nenhum conselho de investimento.
  3. As traduções do artigo para outros idiomas são feitas pela equipe gate Learn. Salvo indicação em contrário, é proibido copiar, distribuir ou plagiar os artigos traduzidos.

Grama - Uma Revolução de Dados

intermediário12/9/2024, 8:36:14 AM
Grass dá acesso a modelos de IA e aplicativos a toda a Internet como um conjunto de dados, que é coletado por meio de uma rede de nós ao redor do mundo que estão contribuindo com sua largura de banda ociosa da Internet. Eles têm uma forte tração inicial com mais de 2,5 milhões de usuários.

Resumo Executivo

A IA generativa é a inovação mais importante na memória recente e está se tornando ainda mais importante à medida que o tempo avança. A IA generativa é basicamente um produto de três elementos:

Algoritmos + Dados + Computação = Inteligência

Isso significa que Dados e Computação provavelmente se tornarão dois dos ativos mais importantes do mundo e o acesso a eles será incrivelmente importante.

Os modelos de IA generativa são famintos por dados. Os dados em que os modelos de IA generativa mais significativos operam são o valor da Internet de dados, que é uma aproximação da soma de todo o conhecimento humano.

A criptografia trata de oferecer acesso a novos recursos digitais em todo o mundo e tornar ativos coisas que antes não eram ativos por meio de tokens. O Grass faz isso para dados.

Grass dá aos modelos de IA e aplicativos acesso a toda a Internet como um conjunto de dados, ao vivo, que é coletado via uma rede de nós ao redor do mundo que estão contribuindo com sua largura de banda ociosa da Internet. Eles têm uma forte tração inicial com mais de 2,5 milhões de usuários.[1]

O mercado potencial de longo prazo para Grass é enorme e está relacionado ao tamanho do mercado de IA e ao seu crescimento futuro. No passado, a coleta de conjuntos de dados dessa escala era relegada apenas aos maiores gigantes da tecnologia. Grass traz novas economias para os dados, reduzindo custos. Isso democratiza o acesso aos dados, não apenas para atender às grandes empresas de elite, mas também para atender a uma gama mais ampla da indústria de IA.

O Problema

O treinamento e ajuste fino do modelo de IA requer enormes quantidades de dados. Historicamente, grande parte desses dados foi obtida por meio da coleta de dados pelos criadores de modelos de IA em sites. Esse processo de coleta de dados apresenta uma série de desafios:

  • A raspagem da web é cara. Apenas algumas grandes organizações são capazes de raspar a web inteira periodicamente. Isso impede que os desenvolvedores menores de IA acessem os dados.
  • Bloqueio de IP. Houve um jogo de gato e rato entre esses serviços de scraping e os criadores de conteúdo. É bastante simples bloquear um endereço de IP para impedir o scraping, tornando difícil alcançar os objetivos de scraping e reunir os dados necessários para o treinamento e ajuste fino da IA.
  • Recursos desperdiçados. Raspar a web é uma tarefa que pode beneficiar muitos clientes. O hardware, largura de banda e poder de processamento necessários para isso são ineficientes se feitos por um único cliente.
  • Atualidade dos dados. É trabalhoso e caro escanear toda a Internet. Isso torna impraticável para a maioria dos usuários escanear com frequência, o que torna os dados menos atualizados, impactando a qualidade dos modelos de IA.

Solução Grass

Grass tem como objetivo resolver esses problemas criando uma rede federada de web scrapers. Cada indivíduo que participa da rede Grass contribui com uma parte da largura de banda da Internet não utilizada para fornecer uma pequena quantidade de scraping a partir de seu endereço IP. A Grass então reúne dados de cada um desses nós para formar um conjunto de dados combinado que é útil para treinamento e ajuste fino de IA. É um uso elegante e adequado de redes distribuídas alimentadas por criptomoeda.

Existem outros casos de uso para a Internet não utilizada, como:

  • Coletando dados locais/geo, como anúncios
  • Realizando pesquisa acadêmica
  • Verificando preços locais

Hoje, a Grass coleta dados usando hardware existente (laptops, desktops, etc.). No futuro, a Grass planeja oferecer um dispositivo de coleta de dados, que é um dispositivo de hardware personalizado exclusivamente dedicado à coleta de dados, criando eficiências devido ao dispositivo ser otimizado para essa tarefa específica.

Benefícios da Grama

Existem várias vantagens em usar uma rede distribuída para coleta de dados:

  • Acesso democratizado aos dados da web que se torna mais barato em escala. Em vez de um único cliente coletar dados para suas próprias necessidades, o Grass coleta dados em nome de muitos clientes. Esses dados podem ser revendidos várias vezes, criando economias de escala nos dados, reduzindo os custos econômicos da raspagem e tornando o mercado mais eficiente. Em escala, o Grass pode hipoteticamente se tornar a solução de coleta de dados mais econômica para os clientes, criando um efeito de rede econômica em torno de seu protocolo. Isso significa que a coleta de dados agora está disponível para qualquer pessoa, não apenas para um par de grandes empresas que têm os recursos para raspar a web.
  • O bloqueio de IP torna-se inviável. Ao distribuir a raspagem, torna-se muito mais difícil detectar e parar a raspagem, já que cada nó só faz uma quantidade relativamente pequena de captura de dados e é difícil de distinguir do tráfego típico da Internet. Isso resulta em conjuntos de dados mais completos para treinamento.
  • A largura de banda da Internet é usada de forma mais eficiente. Uma vez que o Grass é efetivamente uma forma de consumo colaborativo da largura de banda da Internet não utilizada, é mais eficiente do que a provisão de nova largura de banda apenas para raspagem.
  • Os dados são mais precisos e recentes. Torna-se economicamente viável raspar com mais frequência do que um cliente típico poderia fazer por conta própria. Isso resulta em menos dados obsoletos. Isso é importante, já que os modelos de IA resultantes estão mais atualizados.

O Desafio: Criadores de Conteúdo que Monetizam seus Dados

Uma das coisas complicadas de navegar ao raspar dados são os criadores de conteúdo. Isso inclui sites como o NY Times e o Reddit, que começaram a monetizar seus dados, licenciando-os para terceiros para treinar modelos de IA. Naturalmente, eles protegem os dados em seus sites, pois esses dados representam fontes de receita altamente lucrativas para eles. De fato, o Reddit proibiu o uso de sua API de desenvolvedor para aprendizado de máquina para proteger seu modelo de negócios de licenciar seus dados para criadores de modelos de IA (consulte os termos de serviço.aqui).

O que o futuro reserva para criadores de conteúdo? Bem, considere que para o conteúdo gerado pelo usuário (UGC), como o Reddit, existe um argumento de que os usuários possuem seus próprios dados (em vez da plataforma), uma vez que o conteúdo foi criado pelos usuários e deve ser de propriedade desses usuários. Esse argumento ainda precisa ser totalmente explorado do ponto de vista legal. Será interessante ficar de olho nisso no futuro. No entanto, se os usuários realmente possuírem seus dados contribuídos, então o Grass poderia representar um caminho hipotético para ajudar esses usuários a monetizarem seus próprios dados contribuídos. Por exemplo, o Grass poderia recompensar os próprios contribuintes do Reddit por se voluntariarem para contribuir com seus dados que eles criaram no Reddit.

Para criadores de conteúdo remunerado, como o NY Times, o conteúdo é criado por escritores remunerados e, como tal, não há argumento para dados de propriedade do usuário. Assim, o Grass poderia simplesmente excluir esses sites de serem rastreados. Alternativamente, o Grass pode escalar a ponto de se tornar viável para o próprio Grass se tornar um cliente desses sites e pagar taxas de licenciamento. A forma como isso poderia funcionar hipoteticamente é que os clientes do Grass poderiam pagar pelos dados e, em seguida, o Grass poderia compartilhar a receita de volta para os criadores de conteúdo, possibilitando assim a criação de modelos de IA com um orçamento flexível. Alternativamente, o Grass poderia alcançar uma escala tal que pudesse negociar um acordo de licenciamento em massa em nome de todos os seus clientes.

Lançamento da Grass

A Grass teve um lançamento extremamente impressionante no início deste ano:

  • A grama teve o airdrop mais amplamente distribuído na história da Solana.[2]
  • Mais de 2 milhões de carteirasreivindicadoo airdrop, causando a rede da Solana a ceder sob pressão.
  • Há mais de 2,5 milhões de usuários totais da Grass no mundo todo.[3]
  • Grass tem a capacidade e os dados para treinar o modelo ChatGPT 3.5 da OpenAI.
  • Como demonstração de sua plataforma, a Grass disponibilizou gratuitamente um conjunto de dados composto por 600 milhões de postagens e comentários do Reddit a partir de 2024 (ver aquipara o anúncio eaquipara o conjunto de dados).

No momento da escrita, o token Grass tinhaação positiva de preçoapós o lançamento (+115%), o que é incomum, pois a maioria dos tokens cai nos dias/semanas seguintes à listagem. Isso provavelmente reflete sua abordagem inteligente em relação à distribuição do airdrop, bem como a crença no futuro e no potencial da Grass. No geral, este é um ótimo começo para a rede e acreditamos que isso abre caminho para muitos anos prósperos pela frente.

Desempenho do Token Grass desde o lançamento em 28 de outubro de 2024

Fonte: TradingView.

Comece a contribuirAproveite sua largura de banda de internet não utilizada conectando sua carteira Solana e ganhe o token Grass.

Quer usar os conjuntos de dados do Grass para o seu negócio, pesquisa ou projeto? Entre em contato com a equipe em discover@grassfoundation.io.

Notas de rodapé

[1] Fonte: https://www.getgrass.io/.
[2] Fonte: https://www.google.com/url?q=https://www.theblock.co/post/323805/grass-becomes-most-distributed-solana-airdrop-as-nearly-1-5-million-addresses-claim-tokens&sa=D&source=docs&ust=1732646335082707&usg=AOvVaw0oVvhJL661rmE1ABmJqOyP.
[3] Fonte: https://www.getgrass.io/.

Aviso Legal:

  1. Este artigo é reproduzido a partir de [Hack VC], Todos os direitos autorais pertencem ao autor original [Ed Roman]. If there are objections to this reprint, please contact the Gate Learnequipe e eles vão lidar com isso prontamente.
  2. Aviso de responsabilidade: As opiniões expressas neste artigo são exclusivamente do autor e não constituem nenhum conselho de investimento.
  3. As traduções do artigo para outros idiomas são feitas pela equipe gate Learn. Salvo indicação em contrário, é proibido copiar, distribuir ou plagiar os artigos traduzidos.
Comece agora
Inscreva-se e ganhe um cupom de
$100
!