Mapeando o cenário de dados Web3

Intermediário12/28/2023, 2:32:07 AM
Este artigo aborda a história da evolução das tecnologias de informação, bem como os modelos de negócio dos dados e as relações entre diferentes papéis na era da Web3.

Este artigo foi publicado originalmente em Decentralised.co. Nós da GCR vamos trazer-lhe formulários longos do Descentralizado duas vezes por mês — todas as quintas-feiras alternadas! O Decentralised.co tem a confiança da administração de mais de 200 empresas para se manter atualizado sobre as tendências, dados e insights que importam. Inscreva-se no boletim informativo abaixo — mais sobre esta colaboração para os nossos membros mais ativos no Discord.

Subscrever Decentralised.co


Olá,

Tínhamos escrito um precursor para esta peça a 18 de julho se quiser um contexto que vá além do que está escrito aqui.

Todos os seres vivos mantêm algum registo. Os animais rastreiam as estações para perceber quando caçar. Roedores e pássaros armazenam comida em lugares únicos. Têm de se lembrar onde o armazenaram quando o acederam para o sustento meses depois. Os lobos criam marcas ao redor do perímetro do seu território para sinalizar outros animais para ficarem de fora. Até as árvores controlam o tempo. Todos os anos, forma-se um anel em troncos. Pode-se estimar a idade de uma árvore com base no número de anéis.

Embora as árvores e os animais controlem o tempo, não podem recuperar ou narrar o passado. Não têm acesso à memória. É o que torna a manutenção de registos humanos diferente. Graças às nossas capacidades de comunicação, sabemos que os sumérios na Mesopotâmia (3400 aC) e os antigos egípcios (3200 aC) usavam escrita cuneiforme e hieróglifos para registar informações.

A humanidade evoluiu quando o conhecimento podia ser transmitido sem exigir que a fonte fosse fisicamente envolvida. Lemos e apreciamos as obras de Platão ou Sócrates muito depois de terem ido embora porque temos os meios para guardar os seus ensinamentos. Escrever era a plataforma AR original.

Escrevendo do Irão, acompanhando os grãos. Fonte: Ligação

Onde escrever deixou as coisas para a imaginação, os dados ajudavam a manter as coisas objetivas. Reduziu a exigência de os indivíduos guardarem coisas na sua memória. É em parte por isso que alguns dos textos humanos mais antigos envolvem registos de dívida, rendimentos ou comércio.

Indo para o digital

Na era pós-industrial, as empresas construíram fosso competitivo para reforçar a sua posição no mercado, tornando-se digitais com os seus registos de vendas. Um exemplo disso é uma empresa indiana chamada Asian Paints. A tinta deles pode não ser a melhor do mercado, mas controlam uma quota de mercado de mais de 50% da indústria de tintas de 8 mil milhões de dólares da Índia.

Porquê? A resposta fácil é que é uma marca familiar e a empresa tem economias de escala. Mas a forma como lá chegaram tem raízes nos dados. Investiram pesadamente na recolha e processamento de dados para otimizar a sua cadeia de abastecimento.

Para contextualizar, o stock da Asian Paints teve um CAGR impressionante de 25% nos últimos 30 anos. Apoiando esse crescimento foi um investimento num computador mainframe na década de 1970. O dispositivo era mais poderoso do que os utilizados nas melhores organizações de investigação da Índia na altura. Recolheu dados de hora em hora sobre a cor e a quantidade de tinta vendida em toda a Índia. Isto permitiu que a Asian Paints construísse um modelo que prevê a procura de tinta em toda a Índia com 98% de precisão.

Este poder preditivo permitiu que a Asian Paints capturasse o valor máximo, uma vez que poderia reduzir drasticamente o seu tempo de reposição. Na altura, a norma para vender bens como tintas era vendê-los a um grossista, que depois os entregava a um distribuidor, que, por sua vez, os venderia a um revendedor. O revendedor interagiria diretamente com o consumidor. A razão para uma cadeia de abastecimento tão complexa era que cada parte mantinha um inventário de ativos e controlava dados sobre a oferta e procura de tinta.

O Sr. Choksey — o fundador das tintas asiáticas, removeu grossistas e distribuidores da cadeia de abastecimento estudando os padrões de consumo do utilizador final e reduzindo a dependência dos intermediários. Através da remoção dos intermediários, a Asian Paints capturou 97% do MRP (3% para os revendedores) em comparação com os 60% capturados pelos seus concorrentes.

O
valor extraível do telégrafo seria a primeira linha das fitas de ticker transmitidas pelo Telegraph.

A transição para o digital não aconteceu da noite para o dia. Parte do que tornou a recolha de dados interessante foi o mundo das finanças e quão interligado tinha se tornado lentamente. Por exemplo, no final do século XX, os dados do mercado de ações eram transmitidos pelo telégrafo usando dispositivos como o acima. Já em 1835, os comerciantes treinavam pombos para carregar pedaços de papel com informações sobre o que estava a acontecer na Europa. Quando os barcos a vapor transportando mercadorias chegavam a 50 milhas de terra, os pombos voavam para locais designados com a informação. Os comerciantes costumavam pagar até $500 por cada hora de antecedência que podiam receber as notícias.

Em 1867, os comerciantes começaram a competir para otimizar a rapidez com que a informação era transmitida através do telégrafo. Um funcionário da Western Union chamado E. A Calahan pagou mais de 200 mil dólares à NYSE pela capacidade de enviar funcionários no seu prego para transmitir dados de ticker aos seus clientes. Um dos indivíduos que trabalhava diligentemente na otimização do sistema era um jovem cientista chamado Thomas Alva Edison. Um século depois, ferramentas como o terminal da Bloomberg escalariam exponencialmente o ritmo e a quantidade de dados financeiros transmitidos num determinado dia.

Moldagem de dados brutos

Os dados, como o petróleo bruto, têm de passar por várias etapas de refinamento antes de poderem ser usados. Aprender como a Bloomberg cresceu lança luz sobre como todo o cenário de dados evoluiu e qual processo. A Bloomberg não foi a primeira tentativa de usar a tecnologia para melhorar os mecanismos de negociação e relatórios. A NASDAQ utilizou os terminais Bunker Ramo para divulgar informações e fazer encomendas de oferta/pedir. No entanto, depender de redes de comunicação telefónica de tempos tempos significava que escalar este modelo seria sempre um desafio.


Fonte — NASDAQ — A Evolução da Negociação Automatizada OTC

Em 1981, Michael Bloomberg, sócio do banco de investimento Solomon Brothers, foi demitido com 10 milhões de dólares pelo seu capital quando a Phibro Corporation adquiriu o banco. Percebeu que os investidores estão dispostos a pagar por informações financeiras simplificadas com a crescente eletrificação dos mercados financeiros de Nova Iorque ao Japão. Ele começou uma empresa de serviços de dados chamada Innovative Market System, que foi rebatizada para Bloomberg em 1986.

Antes de a internet disparar, o Terminal Bloomberg era acedido usando o The Chiclet. Isto foi ligado ao controlador Bloomberg através de um cabo especial ligado ao hub local através de linhas telefónicas dedicadas. A Bloomberg recolhe dados através de parcerias de dados, agências de notícias e comunicados de imprensa, métodos proprietários como entrada manual de dados e recolha de dados por telefone.

Com a internet, abriram-se as comportas de informação. Hoje, a Bloomberg adquire, processa e entrega 200 mil milhões de informações financeiras quase em tempo real. Isso é aproximadamente 23 milhões de pontos de dados por segundo. Algumas das informações disponíveis na Bloomberg são públicas. Pontos de dados como demonstrações financeiras das empresas e preços de ações e obrigações podem ser encontrados em fóruns públicos.

Mas e se for analista de petróleo e gás e quiser perceber o movimento dos contentores de petróleo bruto? É improvável que obtenha esta informação em tempo real se não subscrever uma fonte de dados como a Bloomberg. Nem todos os dados na internet estão disponíveis gratuitamente.

Normalmente, existem duas restrições para os indivíduos quando se trata de dados na Web2: acesso autorizado e uma barreira elevada ao processamento de grandes quantidades de dados. Ao longo dos anos, fornecedores como a Bloomberg construíram efeitos de rede suficientemente fortes para obterem dados através das suas afiliadas, o que os analistas ou investidores não podem dar-se ao luxo de fazer.

É melhor pagar 20.000 dólares à Bloomberg por uma subscrição anual do que tentar obter os dados de uma mistura de plataformas de dados que podem ter diferentes níveis de preços. Mesmo se esforçar o suficiente para ter as suas mãos nos dados, não pode processar e executar análises em tempo real sem gastos significativos em infraestrutura. No lado do retalho, muitas plataformas que eventualmente escalaram — eram motores de correspondência de dados.

Pense desta forma: O Google (o motor de pesquisa) é uma empresa de dados que oferece às empresas acesso aos utilizadores em troca de dólares publicitário. Quando um restaurante ou uma newsletter (como a nossa) deseja segmentar utilizadores que procuram informações no Google, eles combinam a oferta e a procura de informações semelhantes. Alguém que procura informações sobre uma newsletter específica da Web3 está à nossa procura. E estamos à procura dessa pessoa. (Estou a resistir à necessidade de ligar o nosso programa de indicação aqui.)

O Google construiu um monopólio devido à economia de escala em que funciona. O inventário de utilizadores e o número de consultas que os seus utilizadores fazem todos os dias permanecem incomparáveis. O Google construiu essa posição lançando um motor de pesquisa que não tinha anúncios numa altura em que os anúncios eram a norma, depois através da aquisição do YouTube e do Android e, eventualmente, através do pagamento de pares como a Apple para tornar o Google o motor de pesquisa padrão. Só para a Apple, o Google paga 20 mil milhões de dólares por ano para continuar a ser o motor de pesquisa predefinido no Safari.

O Google paga esse prémio porque, na sua essência, a sua oferta é um motor correspondente. O motor de correspondência coloca os utilizadores com uma necessidade em contacto com empresas que têm uma oferta. A maioria dos monopólios da web são, na sua essência, motores correspondentes. A Amazon combina vendedores de produtos com compradores. O Instagram combina um público com criadores. Estes motores de correspondência funcionam porque as interações nestes produtos deixam rastros ricos a partir dos quais o contexto pode ser conduzido.

Ben Evans escreveu em 2022 que não existem dados. Conhecer o meu conteúdo, comida ou preferências de viagem não vale muito para terceiros. Torna-se valioso — para comércio ou investigação — apenas quando é agregado ou enriquecido com contexto.

Contexto no sentido de que as minhas preferências por comer biriyani numa sexta à noite poderiam ser usadas para me anunciar a entrega de biriyani precisamente quando a probabilidade de eu comprá-lo é a mais alta. No conjunto, comparar a probabilidade da minha compra com um par na mesma região ajuda a segmentar melhor os utilizadores.

Os dados precisam de escala (em grande número) ou contexto para serem valiosos. Onde os produtos Web3 e Web2 têm diferido historicamente é nos trilhos que deixam. Só a Amazon sabe quantos controladores Xbox venderiam numa determinada semana. Mas pode ver os padrões em que os comerciantes compram ou vendem NFTs no OpenSea a qualquer dia. A razão é que cada uma dessas transações deixa um rastro público.

Os produtos de dados na Web3 usam esses trilhos para criar contexto.

Blockchains como Ethereum e Bitcoin produzem blocos a cada 12 segundos e ~10 minutos, respectivamente. Cada bloco contém transações que alteram o estado da cadeia de blocos. Bloquear exploradores como o Etherscan capturam dados relacionados com todas as transações. Por exemplo, se for ao Etherscan e vir um bloco, a imagem abaixo é o que poderá ver.

As transações na cadeia de blocos são ricas em contexto. Produtos como Arkham e Nansen são motores de interpretação para os investigadores perceberem o que está a acontecer quando ocorre uma transação.

Pode ver todos os blocos desde o início do Ethereum. Mas o que pode fazer com esta informação? Quase nada. Então, precisa de uma maneira de capturar esses dados em várias tabelas. Por exemplo, sempre que um contrato NFT de um mercado é chamado num bloco, os dados relacionados com essa transação devem ser anexados a tabelas relacionadas com NFT, ou quando um contrato Uniswap é chamado, os dados relacionados devem ser armazenados em tabelas relacionadas com o DEX. (Dune faz isso como um serviço.)

Não pode analisar os dados brutos sem incorrer em custos significativos de infra-estrutura. Portanto, embora os dados estejam disponíveis gratuitamente, tem os mesmos problemas. Confiou em dados externos como investidor ou construtor de DApps. Mas a sua função principal não está relacionada com a recolha e gestão de dados. Despender recursos em atividades essenciais mas não essenciais não é um luxo que todas as organizações podem desfrutar.

O contexto impulsiona o valor

Para produtos de dados, o contexto em torno dos dados torna o produto único. A Bloomberg aplica a sua compreensão financeira e transforma os dados numa forma que inventores e comerciantes podem facilmente consumir. Sites como a Similarweb ou publicações de investigação como o Newzoo usam as suas competências essenciais para aplicar o contexto social ou relacionado com jogos aos dados que rastreiam.

Os produtos de dados nativos do Blockchain diferenciam-se fornecendo contexto de utilizador através de consultas que respondem a perguntas relevantes para subconjuntos de utilizadores específicos. Por exemplo, o TokTerminal calcula os fundamentos económicos dos protocolos. A Nansen ajuda os participantes do mercado a etiquetar e compreender o movimento dos ativos. A Parsec consulta dados na cadeia para ajudar os comerciantes a analisar melhor as posições DeFi.

Todos estes produtos funcionam com um bem público: dados em cadeia. A diferença é a forma como estes produtos apresentam os seus dados, o que os torna apelativos para diferentes públicos.

A divisão da categoria de produto na nossa indústria baseia-se nos dados que vão em cadeia e que informação é derivada de fontes fora da cadeia. (Alguns costumam usar os dois.) Os fornecedores de dados utilizam os seus filtros de contexto para criar produtos. Assim como os dados Web2 têm os seus nichos, as empresas de dados Web3 construíram ou estão a construir gradualmente fossos usando as suas competências essenciais.

Como tal, os antecedentes dos fundadores ditam frequentemente a natureza dos produtos lançados. Quando uma equipa principal passa um tempo significativo nos mercados de capitais antes da cripto, os seus produtos tendem a imitar a Bloomberg, enquanto os produtos nativos das criptomoedas parecem Nansen. Diferentes produtos atendem a diferentes necessidades, mesmo ao consultar os mesmos dados.

Por exemplo, as trocas normalmente descartam dados após intervalos fixos. Não estão no negócio de dados e armazenar dados antigos exige servidores e gestão adicionais. Alguns fornecedores de dados, como Kaiko e Amberdata, mantêm dados históricos de livros de encomendas de trocas. Esses dados permitem que os comerciantes e investidores construam modelos para testar as suas hipóteses. Mas se quiser perceber quais contratos DeFi estão a ser descartados com uma entrada de ETH ou stablecoins ou analisar o comportamento na cadeia de endereços ou entidades específicas, vai precisar de um produto da Nansen ou Arkham.

O Market-Map não é representativo de todos os jogadores em todas as categorias.

Uma forma de perceber como os produtos foram posicionados nos mercados é através das lentes das personas de consumo em cripto. Estas personas podem ser classificadas nas seguintes quatro categorias principais.

Instituições Financeiras

A maioria dos dólares que fluem através de produtos de cripto-dados vem de instituições financeiras durante um mercado em “bear market”. Estes são clientes de grande valor com ciclos de vendas mais longos e requisitos de dados muito mais complexos. Uma maneira de saber se um produto está orientado para instituições financeiras é se um cliente tem de ser submetido a uma chamada de vendas para determinar quanto custa. No mundo Web2, não consegue descobrir quanto custa o PitchBook ou o CB Insights. Em cripto, não sabe quanto custaria um produto como o Chainerysis.

Brincadeiras à parte, parte da razão para tal processo de vendas é o serviço prático e de luvas brancas oferecido por produtos de dados orientados para este segmento de consumo. Estes utilizadores geralmente optam por dados altamente granulares e frequentes. Exigem dados não só para decisões pré-negociação mas também para usos pós-negociação para cumprir requisitos de conformidade e tributação.

Por exemplo, precisam de produtos que lhes digam qual era o valor da sua carteira historicamente, ajudá-los com cálculos de impostos, e assim por diante. Empresas como Amberdata, Kaiko, CoinMetrics, CryptoCompare e, até certo ponto, Nansen, servem esses clientes.

Na minha experiência, apenas fundadores com formação a trabalhar em instituições ou equipas com grandes rondas de financiamento conseguiram abrir o mercado institucional de dados. A barreira à entrada é relativamente alta aqui, como seria o caso de qualquer produto empresarial.

Desenvolvedores

Muitas vezes nos deparamos com a funcionalidade de composição da Web3, o que significa que as aplicações Web3 podem ser interdependentes. Podem exigir dados uns dos outros. Então, eles precisam constantemente ler dados uns dos outros. Por exemplo, uma plataforma como a Yann Finance precisa ler dados do Aave e do Compound, e um agregador NFT como o Tensor precisa ler dados do Magic Eden e de outros mercados.

Mas estes dados são armazenados em blocos em cadeias como Ethereum e Solana. O Ethereum cria um bloco em 12 segundos e a Solana faz isso em 400 ms. Ordenar os dados da blockchain em tabelas e armazená-los para acesso rápido é uma tarefa não trivial. É aqui que entram em cena indexadores como Covalent, Graph, Chainlink e Powerloom. Eles garantem que os dados brutos do blockchain são armazenados no formato desejado para que os desenvolvedores possam buscá-los através de chamadas simples de API.

Um segmento emergente nesta persona de consumidor envolve ferramentas utilizadas para compreender o comportamento do utilizador. Por exemplo, o ArcX permite que os programadores mapeiem dados fora da cadeia (como o comportamento do navegador) com dados na cadeia (como endereços de carteira) para capturar a informação demográfica dos utilizadores que interagem com um dApp. Estão num nicho relativamente pequeno mas relevante, pois ajudam os programadores a identificar quem são os seus utilizadores.

Investigadores e Publicações

Os produtos de dados em cripto encontram frequentemente distribuição colaborando com investigadores e publicações. CCDATA, por exemplo, é frequentemente citado na Bloomberg. Os investigadores são incentivados a apoiar-se nos produtos de dados, uma vez que ajudam a poupar tempo e esforço na recolha, limpeza ou curadoria de dados. Produtos como o Dune construíram um fosso construindo uma comunidade de analistas que competem entre si para ter uma classificação mais elevada na sua lista.

Publicações como The Block e Delphi apresentam painéis construídos com dados de fornecedores terceiros. Aqui no Decentralised.co, dependemos inteiramente de fornecedores de dados externos, pois ajudam a manter a equipa enxuto enquanto utilizam recursos externos ao recolher dados.

O desafio de dar resposta a este segmento de consumidores é que os investigadores mais pequenos podem não ter o orçamento necessário para justificar o gasto de recursos tremendos para apresentar insights de nicho que podem ser relevantes apenas para uma única pessoa. Por outro lado, as empresas estão bem incentivadas a gastar esforço e recursos em parceria com publicações significativas como o Financial Times, uma vez que ajuda na distribuição.

Investidores de retalho

Os produtos orientados para investidores de retalho normalmente têm menor granularidade e frequência de dados. Mas são nichos altamente rentáveis para construir à medida que vêem economias de escala. Dez mil utilizadores que pagam 100 dólares cada um é um negócio de ARR de 1 milhão de dólares num mundo onde a rotatividade não existe. É mais fácil dizer do que fazer, mas essa economia explica porque temos tantos produtos de cripto-dados orientados para o retalho.

Uma grande parte dos produtos orientados para o retalho são gratuitos ou suportados por anúncios. Por exemplo, um recurso gratuito como o DeFillama não lhe dirá como pode encaminhar a sua encomenda através de diferentes trocas (CEXs e DEXs) para evitar derrapagens, uma vez que não tira instantâneos do livro de encomendas, mas mostra informações sobre desbloqueios de token ou desbloqueios de rendimento.

Uma mudança neste segmento de consumidores é a forma como o meio de entrega abre uma nova categoria de mercado — por exemplo, a Cielo entrega dados como notificações através do Telegram. Escalou-se para mais de 40.000 utilizadores ao transmitir informações de uma forma fácil de consumir para um segmento de consumidores que preferiria não lidar com interfaces de desktop. Quando bem feito, mesmo os meios de distribuição podem ser diferenciadores para empreendimentos em fase inicial. Mesmo em dados.

Embora a classificação se desfoque em alguns pontos, as empresas de dados podem ser divididas em orientações B2B ou B2C.

Empresas como a Amberdata e a Kaiko têm produtos que atendem a atores sofisticados. Estes produtos são mais granulares (detalhes em que os dados estão disponíveis) e frequentes (ex. tick-by-tick e dados do livro de encomendas em tempo real) e satisfazem exigências como modelos de construção e teste, análise pré-negociação, relatórios pós-negociação, tributação e conformidade. Os dados são fornecidos num formato que permite aos clientes realizar análises proprietárias e construir visualizações ao seu gosto. Estas empresas normalmente oferecem os seus produtos atrás de um paywall.

O custo é geralmente uma função da granularidade devido aos requisitos de infraestrutura, à natureza da clientela envolvida e à duração do ciclo de vendas.

A imagem acima mapeia diferentes produtos em dois eixos — profundidade e granularidade vs. preços dos produtos. Por favor, note que estas parcelas não são exatas. Alguns pontos podem ser extraviados. A ideia é desenvolver um modelo mental para pensar em vários produtos e a sua posição no mercado.

Produtos focados no retalho como o Dune ou o CoinGecko exibem quase todos os dados gratuitamente. Os clientes têm de pagar para aceder a alguns dados ou se quiserem dados através de APIs para executar as suas análises. Por exemplo, pode ver todos os gráficos criados por vários assistentes do Dune, mas eles limitam quantas linhas pode descarregar em formato CSV. Pode descarregar ficheiros CSV maiores e ver consultas privadas à medida que paga mais.

As empresas focadas no retalho tendem a ter receitas baixas por cliente e poucos clientes pagantes como percentagem de utilizadores gratuitos. Compare isso com as taxas de conversão para os modelos freemium de empresas de internet. Tipicamente, a taxa de conversão é 2%–5%. Uma taxa de conversão de 10% seria um outlier. O manual deles é ter o maior número possível de clientes gratuitos para que uma taxa de conversão de 4% contribua significativamente para a receita. Isto é o que chamamos o topo do funil.

Portanto, as empresas de dados precisam que o topo do funil seja grande o suficiente para gerar receita suficiente para se sustentar a uma taxa de conversão mais baixa. As empresas também podem considerar a geração de receitas a partir de anúncios quando o site tem muitos visitantes. A CoinGecko usa a receita de anúncios como alavanca para continuar a fornecer a maioria dos dados gratuitamente.

Ao longo dos anos, as empresas preencheram vagas em ambas as extremidades do espectro (B2B e B2C), deixando algumas lacunas no meio. Se alguém quiser ver como os livros de encomendas estão a mudar nas bolsas centralizadas ou como os rácios de chamada de venda, IVs e distorções estão a mudar, não há muitos produtos que ajudem nas visualizações. Há espaço para um produto mais granular do que os CoinGeckos do mundo mas menos granular do que os produtos de jogadores B2B puros.

Em fosso

Encontrar fosso em empresas onde a matéria-prima é gratuita não é fácil. Os dados da Blockchain estão disponíveis gratuitamente. Não há nada de proprietário nos dados que pode recolher. Portanto, os fossos nos negócios de dados não se baseiam apenas no facto de ter alguns dados que outros não têm. Em vez disso, baseiam-se na capacidade de uma equipa fornecer os dados num formato perspicaz e consumível, a tempo e sem erros.

Muitas empresas afirmam ter os mesmos dados, mas a qualidade dos dados e a sua apresentação são diferentes. Por exemplo, muitas empresas afirmam ter dados de livros de encomendas fora da cadeia. No entanto, fatores como o número de pedidos de oferta/pedido, a duração da série temporal e o número de trocas e pares disponíveis diferem de fornecedor para fornecedor. AAmberdata e a Kaiko têm os dados de livros de encomendas mais abrangentes para os mercados de cripto.

Por que, porém, apenas alguns fornecedores podem fornecer este tipo de dados? A explicação para onde surgem fosso nos dados da Web3 está aqui.

Talento — Corre o risco de dizer o óbvio, quando a matéria-prima é gratuita, a forma como a molda determina o valor do produto. Transformar dados brutos em informações úteis requer experiência de domínio em muitos nichos dentro das criptomoedas e dos mercados financeiros tradicionais. Equipas como a Velo Data, com experiência em mercados tradicionais, têm uma vantagem sobre outras que tentam construir produtos B2C semelhantes. Encontrar programadores talentosos que compreendam as estruturas de dados blockchain e tenham experiência relevante nos mercados financeiros é raro.

Infraestrutura — A recolha e entrega de grandes quantidades de dados requer uma infra-estrutura que não é fácil. Este tipo de operação requer capital e talento. Porque é que a infraestrutura é um fosso? Pense nos dados do pool de memória. Os blocos contêm dados para transações confirmadas. E as transações não confirmadas?

Diferentes nós de rede (por exemplo, nós conectados ao mesmo pool) veem diferentes transações não confirmadas. Executar apenas um nó não dará uma visão global das transações concorrentes. Manter vários nós em várias cadeias de blocos aumenta os custos de infraestrutura. Assim como com a IA (e redes de conteúdo no passado), a capacidade de manter os custos de hardware baixos durante a escalabilidade determinará os vencedores e perdedores no setor ao longo do tempo.

Efeitos de rede — Pode-se hipotetizar que existem efeitos de rede em muitos produtos de dados criptoativos. Tome o Chainlink como exemplo. Foi um dos primeiros oráculos que permitiu às aplicações ler dados de outras aplicações ou cadeias. Conseguiu angariar o apoio da comunidade e tem uma das comunidades mais fortes. Outro exemplo é o Nansen. A sua reivindicação à fama eram rótulos de endereço que lhe permitiam atribuir o movimento de ativos a entidades reais em vez de endereços hexanuméricos.

Posteriormente, lançou funcionalidades como o NFT Paradise e o Token God Mode, permitindo aos utilizadores rastrear NFTs e tokens de forma mais eficaz. A Arkham lançou um produto semelhante aos rótulos da Nansen, mas o investimento em dashboards e investigação permitiu à Nansen manobrar para clientes empresariais e oferecer produtos sob medida para eles. Vale a pena mencionar que os efeitos de rede não são possíveis sem os dois primeiros pontos (talento e infraestrutura).

Um sítio onde isto funciona é com indexadores. Quanto maior o número de cadeias que um produto suporta, maior a probabilidade de um programador usar o produto em vez de depender de várias fontes. Equipas como a Covalent têm uma vantagem aqui, pois otimizaram a amplitude das cadeias suportadas há algum tempo. Mas lembre-se que a profundidade é tão importante como a largura.

É muito cedo para dizer se algum produto tem um fosso significativo na cripto. Testemunhamos vantagens precocemente no grande esquema das coisas. À medida que categorias como o Web3 social e a sobreposição entre IA e cripto continuam a crescer, os produtos de dados da indústria podem crescer e ser o próximo Alfabeto. Mas isso será uma história de várias décadas; ainda estamos nos seus primeiros anos.

Para além da especulação

Muitos dos casos de uso que mencionamos para este artigo olham para a especulação financeira de uma forma ou de outra. Até os programadores que utilizam APIs para consultar dados estão a construir produtos financeiros. Pode parecer estranho, mas as blockchains (como uma nova rede) seguem a mesma tendência que o Telegraph e a Internet seguiram.

A chegada de um novo meio e o surgimento de uma nova rede acelera os casos de uso financeiro. Com a internet, demorou até ao início dos anos 2000 para as pessoas perceberrem que os utilizadores podiam ser segmentados com base na sua localização. Com blockchains, ainda estamos a descobrir como construir modelos de negócio a partir de trilhas de dados disponíveis publicamente.

Vimos uma mudança fundamental no nosso uso diário destas plataformas — Dune Analytics incorporando IA no seu produto. O Dune fornece uma interface baseada em SQL para os utilizadores consultam dados de blockchains como Ethereum e Solana. O mercado para um produto deste tipo é normalmente restrito aos utilizadores que percebem como escrever consultas SQL. Recentemente começaram a usar a IA para ajudar os analistas a gerar consultas sem serem especialistas em SQL. Não é tão funcional como se esperaria que fosse. Mas ainda é um passo para o futuro. Pode não demorar muito para pedirmos à IA (como o ChatGPT) para consultar dados de uma blockchain e oferecer a sua análise.

Uma maneira de pensar em “dados” no contexto da Web3 é através das lentes do Google Maps. O GPS existe desde pelo menos os anos 80. O Google realizou o trabalho necessário para mapear o mundo. Ao disponibilizar as sobreposições de mapas para aplicações de terceiros (usando APIs), a empresa permitiu a construção de uma nova geração de aplicações. Tudo, desde a entrega até o ride-hailing, estourou porque um único jogador especializado em dados assumiu esse fardo dos programadores.

Os produtos de dados na Web3 têm um papel semelhante. Ainda não sabemos a natureza exata das aplicações que poderiam ser construídas sobre este recurso disponível publicamente, mas está a tornar-se evidente que existe uma oportunidade do tamanho do Alfabeto dentro do cenário de dados.

Isenção de responsabilidade:

  1. Este artigo foi reimpresso de [GCR]. Todos os direitos de autor pertencem ao autor original [Saurabh Deshpande、Siddharth、Joel]. Se houver objeções a esta reimpressão, contacte a equipa do Gate Learn, e eles tratarão disso imediatamente.
  2. Isenção de responsabilidade: As opiniões e opiniões expressas neste artigo são exclusivamente do autor e não constituem nenhum conselho de investimento.
  3. As traduções do artigo para outras línguas são feitas pela equipa do Gate Learn. A menos que mencionado, é proibido copiar, distribuir ou plagiar os artigos traduzidos.

Mapeando o cenário de dados Web3

Intermediário12/28/2023, 2:32:07 AM
Este artigo aborda a história da evolução das tecnologias de informação, bem como os modelos de negócio dos dados e as relações entre diferentes papéis na era da Web3.

Este artigo foi publicado originalmente em Decentralised.co. Nós da GCR vamos trazer-lhe formulários longos do Descentralizado duas vezes por mês — todas as quintas-feiras alternadas! O Decentralised.co tem a confiança da administração de mais de 200 empresas para se manter atualizado sobre as tendências, dados e insights que importam. Inscreva-se no boletim informativo abaixo — mais sobre esta colaboração para os nossos membros mais ativos no Discord.

Subscrever Decentralised.co


Olá,

Tínhamos escrito um precursor para esta peça a 18 de julho se quiser um contexto que vá além do que está escrito aqui.

Todos os seres vivos mantêm algum registo. Os animais rastreiam as estações para perceber quando caçar. Roedores e pássaros armazenam comida em lugares únicos. Têm de se lembrar onde o armazenaram quando o acederam para o sustento meses depois. Os lobos criam marcas ao redor do perímetro do seu território para sinalizar outros animais para ficarem de fora. Até as árvores controlam o tempo. Todos os anos, forma-se um anel em troncos. Pode-se estimar a idade de uma árvore com base no número de anéis.

Embora as árvores e os animais controlem o tempo, não podem recuperar ou narrar o passado. Não têm acesso à memória. É o que torna a manutenção de registos humanos diferente. Graças às nossas capacidades de comunicação, sabemos que os sumérios na Mesopotâmia (3400 aC) e os antigos egípcios (3200 aC) usavam escrita cuneiforme e hieróglifos para registar informações.

A humanidade evoluiu quando o conhecimento podia ser transmitido sem exigir que a fonte fosse fisicamente envolvida. Lemos e apreciamos as obras de Platão ou Sócrates muito depois de terem ido embora porque temos os meios para guardar os seus ensinamentos. Escrever era a plataforma AR original.

Escrevendo do Irão, acompanhando os grãos. Fonte: Ligação

Onde escrever deixou as coisas para a imaginação, os dados ajudavam a manter as coisas objetivas. Reduziu a exigência de os indivíduos guardarem coisas na sua memória. É em parte por isso que alguns dos textos humanos mais antigos envolvem registos de dívida, rendimentos ou comércio.

Indo para o digital

Na era pós-industrial, as empresas construíram fosso competitivo para reforçar a sua posição no mercado, tornando-se digitais com os seus registos de vendas. Um exemplo disso é uma empresa indiana chamada Asian Paints. A tinta deles pode não ser a melhor do mercado, mas controlam uma quota de mercado de mais de 50% da indústria de tintas de 8 mil milhões de dólares da Índia.

Porquê? A resposta fácil é que é uma marca familiar e a empresa tem economias de escala. Mas a forma como lá chegaram tem raízes nos dados. Investiram pesadamente na recolha e processamento de dados para otimizar a sua cadeia de abastecimento.

Para contextualizar, o stock da Asian Paints teve um CAGR impressionante de 25% nos últimos 30 anos. Apoiando esse crescimento foi um investimento num computador mainframe na década de 1970. O dispositivo era mais poderoso do que os utilizados nas melhores organizações de investigação da Índia na altura. Recolheu dados de hora em hora sobre a cor e a quantidade de tinta vendida em toda a Índia. Isto permitiu que a Asian Paints construísse um modelo que prevê a procura de tinta em toda a Índia com 98% de precisão.

Este poder preditivo permitiu que a Asian Paints capturasse o valor máximo, uma vez que poderia reduzir drasticamente o seu tempo de reposição. Na altura, a norma para vender bens como tintas era vendê-los a um grossista, que depois os entregava a um distribuidor, que, por sua vez, os venderia a um revendedor. O revendedor interagiria diretamente com o consumidor. A razão para uma cadeia de abastecimento tão complexa era que cada parte mantinha um inventário de ativos e controlava dados sobre a oferta e procura de tinta.

O Sr. Choksey — o fundador das tintas asiáticas, removeu grossistas e distribuidores da cadeia de abastecimento estudando os padrões de consumo do utilizador final e reduzindo a dependência dos intermediários. Através da remoção dos intermediários, a Asian Paints capturou 97% do MRP (3% para os revendedores) em comparação com os 60% capturados pelos seus concorrentes.

O
valor extraível do telégrafo seria a primeira linha das fitas de ticker transmitidas pelo Telegraph.

A transição para o digital não aconteceu da noite para o dia. Parte do que tornou a recolha de dados interessante foi o mundo das finanças e quão interligado tinha se tornado lentamente. Por exemplo, no final do século XX, os dados do mercado de ações eram transmitidos pelo telégrafo usando dispositivos como o acima. Já em 1835, os comerciantes treinavam pombos para carregar pedaços de papel com informações sobre o que estava a acontecer na Europa. Quando os barcos a vapor transportando mercadorias chegavam a 50 milhas de terra, os pombos voavam para locais designados com a informação. Os comerciantes costumavam pagar até $500 por cada hora de antecedência que podiam receber as notícias.

Em 1867, os comerciantes começaram a competir para otimizar a rapidez com que a informação era transmitida através do telégrafo. Um funcionário da Western Union chamado E. A Calahan pagou mais de 200 mil dólares à NYSE pela capacidade de enviar funcionários no seu prego para transmitir dados de ticker aos seus clientes. Um dos indivíduos que trabalhava diligentemente na otimização do sistema era um jovem cientista chamado Thomas Alva Edison. Um século depois, ferramentas como o terminal da Bloomberg escalariam exponencialmente o ritmo e a quantidade de dados financeiros transmitidos num determinado dia.

Moldagem de dados brutos

Os dados, como o petróleo bruto, têm de passar por várias etapas de refinamento antes de poderem ser usados. Aprender como a Bloomberg cresceu lança luz sobre como todo o cenário de dados evoluiu e qual processo. A Bloomberg não foi a primeira tentativa de usar a tecnologia para melhorar os mecanismos de negociação e relatórios. A NASDAQ utilizou os terminais Bunker Ramo para divulgar informações e fazer encomendas de oferta/pedir. No entanto, depender de redes de comunicação telefónica de tempos tempos significava que escalar este modelo seria sempre um desafio.


Fonte — NASDAQ — A Evolução da Negociação Automatizada OTC

Em 1981, Michael Bloomberg, sócio do banco de investimento Solomon Brothers, foi demitido com 10 milhões de dólares pelo seu capital quando a Phibro Corporation adquiriu o banco. Percebeu que os investidores estão dispostos a pagar por informações financeiras simplificadas com a crescente eletrificação dos mercados financeiros de Nova Iorque ao Japão. Ele começou uma empresa de serviços de dados chamada Innovative Market System, que foi rebatizada para Bloomberg em 1986.

Antes de a internet disparar, o Terminal Bloomberg era acedido usando o The Chiclet. Isto foi ligado ao controlador Bloomberg através de um cabo especial ligado ao hub local através de linhas telefónicas dedicadas. A Bloomberg recolhe dados através de parcerias de dados, agências de notícias e comunicados de imprensa, métodos proprietários como entrada manual de dados e recolha de dados por telefone.

Com a internet, abriram-se as comportas de informação. Hoje, a Bloomberg adquire, processa e entrega 200 mil milhões de informações financeiras quase em tempo real. Isso é aproximadamente 23 milhões de pontos de dados por segundo. Algumas das informações disponíveis na Bloomberg são públicas. Pontos de dados como demonstrações financeiras das empresas e preços de ações e obrigações podem ser encontrados em fóruns públicos.

Mas e se for analista de petróleo e gás e quiser perceber o movimento dos contentores de petróleo bruto? É improvável que obtenha esta informação em tempo real se não subscrever uma fonte de dados como a Bloomberg. Nem todos os dados na internet estão disponíveis gratuitamente.

Normalmente, existem duas restrições para os indivíduos quando se trata de dados na Web2: acesso autorizado e uma barreira elevada ao processamento de grandes quantidades de dados. Ao longo dos anos, fornecedores como a Bloomberg construíram efeitos de rede suficientemente fortes para obterem dados através das suas afiliadas, o que os analistas ou investidores não podem dar-se ao luxo de fazer.

É melhor pagar 20.000 dólares à Bloomberg por uma subscrição anual do que tentar obter os dados de uma mistura de plataformas de dados que podem ter diferentes níveis de preços. Mesmo se esforçar o suficiente para ter as suas mãos nos dados, não pode processar e executar análises em tempo real sem gastos significativos em infraestrutura. No lado do retalho, muitas plataformas que eventualmente escalaram — eram motores de correspondência de dados.

Pense desta forma: O Google (o motor de pesquisa) é uma empresa de dados que oferece às empresas acesso aos utilizadores em troca de dólares publicitário. Quando um restaurante ou uma newsletter (como a nossa) deseja segmentar utilizadores que procuram informações no Google, eles combinam a oferta e a procura de informações semelhantes. Alguém que procura informações sobre uma newsletter específica da Web3 está à nossa procura. E estamos à procura dessa pessoa. (Estou a resistir à necessidade de ligar o nosso programa de indicação aqui.)

O Google construiu um monopólio devido à economia de escala em que funciona. O inventário de utilizadores e o número de consultas que os seus utilizadores fazem todos os dias permanecem incomparáveis. O Google construiu essa posição lançando um motor de pesquisa que não tinha anúncios numa altura em que os anúncios eram a norma, depois através da aquisição do YouTube e do Android e, eventualmente, através do pagamento de pares como a Apple para tornar o Google o motor de pesquisa padrão. Só para a Apple, o Google paga 20 mil milhões de dólares por ano para continuar a ser o motor de pesquisa predefinido no Safari.

O Google paga esse prémio porque, na sua essência, a sua oferta é um motor correspondente. O motor de correspondência coloca os utilizadores com uma necessidade em contacto com empresas que têm uma oferta. A maioria dos monopólios da web são, na sua essência, motores correspondentes. A Amazon combina vendedores de produtos com compradores. O Instagram combina um público com criadores. Estes motores de correspondência funcionam porque as interações nestes produtos deixam rastros ricos a partir dos quais o contexto pode ser conduzido.

Ben Evans escreveu em 2022 que não existem dados. Conhecer o meu conteúdo, comida ou preferências de viagem não vale muito para terceiros. Torna-se valioso — para comércio ou investigação — apenas quando é agregado ou enriquecido com contexto.

Contexto no sentido de que as minhas preferências por comer biriyani numa sexta à noite poderiam ser usadas para me anunciar a entrega de biriyani precisamente quando a probabilidade de eu comprá-lo é a mais alta. No conjunto, comparar a probabilidade da minha compra com um par na mesma região ajuda a segmentar melhor os utilizadores.

Os dados precisam de escala (em grande número) ou contexto para serem valiosos. Onde os produtos Web3 e Web2 têm diferido historicamente é nos trilhos que deixam. Só a Amazon sabe quantos controladores Xbox venderiam numa determinada semana. Mas pode ver os padrões em que os comerciantes compram ou vendem NFTs no OpenSea a qualquer dia. A razão é que cada uma dessas transações deixa um rastro público.

Os produtos de dados na Web3 usam esses trilhos para criar contexto.

Blockchains como Ethereum e Bitcoin produzem blocos a cada 12 segundos e ~10 minutos, respectivamente. Cada bloco contém transações que alteram o estado da cadeia de blocos. Bloquear exploradores como o Etherscan capturam dados relacionados com todas as transações. Por exemplo, se for ao Etherscan e vir um bloco, a imagem abaixo é o que poderá ver.

As transações na cadeia de blocos são ricas em contexto. Produtos como Arkham e Nansen são motores de interpretação para os investigadores perceberem o que está a acontecer quando ocorre uma transação.

Pode ver todos os blocos desde o início do Ethereum. Mas o que pode fazer com esta informação? Quase nada. Então, precisa de uma maneira de capturar esses dados em várias tabelas. Por exemplo, sempre que um contrato NFT de um mercado é chamado num bloco, os dados relacionados com essa transação devem ser anexados a tabelas relacionadas com NFT, ou quando um contrato Uniswap é chamado, os dados relacionados devem ser armazenados em tabelas relacionadas com o DEX. (Dune faz isso como um serviço.)

Não pode analisar os dados brutos sem incorrer em custos significativos de infra-estrutura. Portanto, embora os dados estejam disponíveis gratuitamente, tem os mesmos problemas. Confiou em dados externos como investidor ou construtor de DApps. Mas a sua função principal não está relacionada com a recolha e gestão de dados. Despender recursos em atividades essenciais mas não essenciais não é um luxo que todas as organizações podem desfrutar.

O contexto impulsiona o valor

Para produtos de dados, o contexto em torno dos dados torna o produto único. A Bloomberg aplica a sua compreensão financeira e transforma os dados numa forma que inventores e comerciantes podem facilmente consumir. Sites como a Similarweb ou publicações de investigação como o Newzoo usam as suas competências essenciais para aplicar o contexto social ou relacionado com jogos aos dados que rastreiam.

Os produtos de dados nativos do Blockchain diferenciam-se fornecendo contexto de utilizador através de consultas que respondem a perguntas relevantes para subconjuntos de utilizadores específicos. Por exemplo, o TokTerminal calcula os fundamentos económicos dos protocolos. A Nansen ajuda os participantes do mercado a etiquetar e compreender o movimento dos ativos. A Parsec consulta dados na cadeia para ajudar os comerciantes a analisar melhor as posições DeFi.

Todos estes produtos funcionam com um bem público: dados em cadeia. A diferença é a forma como estes produtos apresentam os seus dados, o que os torna apelativos para diferentes públicos.

A divisão da categoria de produto na nossa indústria baseia-se nos dados que vão em cadeia e que informação é derivada de fontes fora da cadeia. (Alguns costumam usar os dois.) Os fornecedores de dados utilizam os seus filtros de contexto para criar produtos. Assim como os dados Web2 têm os seus nichos, as empresas de dados Web3 construíram ou estão a construir gradualmente fossos usando as suas competências essenciais.

Como tal, os antecedentes dos fundadores ditam frequentemente a natureza dos produtos lançados. Quando uma equipa principal passa um tempo significativo nos mercados de capitais antes da cripto, os seus produtos tendem a imitar a Bloomberg, enquanto os produtos nativos das criptomoedas parecem Nansen. Diferentes produtos atendem a diferentes necessidades, mesmo ao consultar os mesmos dados.

Por exemplo, as trocas normalmente descartam dados após intervalos fixos. Não estão no negócio de dados e armazenar dados antigos exige servidores e gestão adicionais. Alguns fornecedores de dados, como Kaiko e Amberdata, mantêm dados históricos de livros de encomendas de trocas. Esses dados permitem que os comerciantes e investidores construam modelos para testar as suas hipóteses. Mas se quiser perceber quais contratos DeFi estão a ser descartados com uma entrada de ETH ou stablecoins ou analisar o comportamento na cadeia de endereços ou entidades específicas, vai precisar de um produto da Nansen ou Arkham.

O Market-Map não é representativo de todos os jogadores em todas as categorias.

Uma forma de perceber como os produtos foram posicionados nos mercados é através das lentes das personas de consumo em cripto. Estas personas podem ser classificadas nas seguintes quatro categorias principais.

Instituições Financeiras

A maioria dos dólares que fluem através de produtos de cripto-dados vem de instituições financeiras durante um mercado em “bear market”. Estes são clientes de grande valor com ciclos de vendas mais longos e requisitos de dados muito mais complexos. Uma maneira de saber se um produto está orientado para instituições financeiras é se um cliente tem de ser submetido a uma chamada de vendas para determinar quanto custa. No mundo Web2, não consegue descobrir quanto custa o PitchBook ou o CB Insights. Em cripto, não sabe quanto custaria um produto como o Chainerysis.

Brincadeiras à parte, parte da razão para tal processo de vendas é o serviço prático e de luvas brancas oferecido por produtos de dados orientados para este segmento de consumo. Estes utilizadores geralmente optam por dados altamente granulares e frequentes. Exigem dados não só para decisões pré-negociação mas também para usos pós-negociação para cumprir requisitos de conformidade e tributação.

Por exemplo, precisam de produtos que lhes digam qual era o valor da sua carteira historicamente, ajudá-los com cálculos de impostos, e assim por diante. Empresas como Amberdata, Kaiko, CoinMetrics, CryptoCompare e, até certo ponto, Nansen, servem esses clientes.

Na minha experiência, apenas fundadores com formação a trabalhar em instituições ou equipas com grandes rondas de financiamento conseguiram abrir o mercado institucional de dados. A barreira à entrada é relativamente alta aqui, como seria o caso de qualquer produto empresarial.

Desenvolvedores

Muitas vezes nos deparamos com a funcionalidade de composição da Web3, o que significa que as aplicações Web3 podem ser interdependentes. Podem exigir dados uns dos outros. Então, eles precisam constantemente ler dados uns dos outros. Por exemplo, uma plataforma como a Yann Finance precisa ler dados do Aave e do Compound, e um agregador NFT como o Tensor precisa ler dados do Magic Eden e de outros mercados.

Mas estes dados são armazenados em blocos em cadeias como Ethereum e Solana. O Ethereum cria um bloco em 12 segundos e a Solana faz isso em 400 ms. Ordenar os dados da blockchain em tabelas e armazená-los para acesso rápido é uma tarefa não trivial. É aqui que entram em cena indexadores como Covalent, Graph, Chainlink e Powerloom. Eles garantem que os dados brutos do blockchain são armazenados no formato desejado para que os desenvolvedores possam buscá-los através de chamadas simples de API.

Um segmento emergente nesta persona de consumidor envolve ferramentas utilizadas para compreender o comportamento do utilizador. Por exemplo, o ArcX permite que os programadores mapeiem dados fora da cadeia (como o comportamento do navegador) com dados na cadeia (como endereços de carteira) para capturar a informação demográfica dos utilizadores que interagem com um dApp. Estão num nicho relativamente pequeno mas relevante, pois ajudam os programadores a identificar quem são os seus utilizadores.

Investigadores e Publicações

Os produtos de dados em cripto encontram frequentemente distribuição colaborando com investigadores e publicações. CCDATA, por exemplo, é frequentemente citado na Bloomberg. Os investigadores são incentivados a apoiar-se nos produtos de dados, uma vez que ajudam a poupar tempo e esforço na recolha, limpeza ou curadoria de dados. Produtos como o Dune construíram um fosso construindo uma comunidade de analistas que competem entre si para ter uma classificação mais elevada na sua lista.

Publicações como The Block e Delphi apresentam painéis construídos com dados de fornecedores terceiros. Aqui no Decentralised.co, dependemos inteiramente de fornecedores de dados externos, pois ajudam a manter a equipa enxuto enquanto utilizam recursos externos ao recolher dados.

O desafio de dar resposta a este segmento de consumidores é que os investigadores mais pequenos podem não ter o orçamento necessário para justificar o gasto de recursos tremendos para apresentar insights de nicho que podem ser relevantes apenas para uma única pessoa. Por outro lado, as empresas estão bem incentivadas a gastar esforço e recursos em parceria com publicações significativas como o Financial Times, uma vez que ajuda na distribuição.

Investidores de retalho

Os produtos orientados para investidores de retalho normalmente têm menor granularidade e frequência de dados. Mas são nichos altamente rentáveis para construir à medida que vêem economias de escala. Dez mil utilizadores que pagam 100 dólares cada um é um negócio de ARR de 1 milhão de dólares num mundo onde a rotatividade não existe. É mais fácil dizer do que fazer, mas essa economia explica porque temos tantos produtos de cripto-dados orientados para o retalho.

Uma grande parte dos produtos orientados para o retalho são gratuitos ou suportados por anúncios. Por exemplo, um recurso gratuito como o DeFillama não lhe dirá como pode encaminhar a sua encomenda através de diferentes trocas (CEXs e DEXs) para evitar derrapagens, uma vez que não tira instantâneos do livro de encomendas, mas mostra informações sobre desbloqueios de token ou desbloqueios de rendimento.

Uma mudança neste segmento de consumidores é a forma como o meio de entrega abre uma nova categoria de mercado — por exemplo, a Cielo entrega dados como notificações através do Telegram. Escalou-se para mais de 40.000 utilizadores ao transmitir informações de uma forma fácil de consumir para um segmento de consumidores que preferiria não lidar com interfaces de desktop. Quando bem feito, mesmo os meios de distribuição podem ser diferenciadores para empreendimentos em fase inicial. Mesmo em dados.

Embora a classificação se desfoque em alguns pontos, as empresas de dados podem ser divididas em orientações B2B ou B2C.

Empresas como a Amberdata e a Kaiko têm produtos que atendem a atores sofisticados. Estes produtos são mais granulares (detalhes em que os dados estão disponíveis) e frequentes (ex. tick-by-tick e dados do livro de encomendas em tempo real) e satisfazem exigências como modelos de construção e teste, análise pré-negociação, relatórios pós-negociação, tributação e conformidade. Os dados são fornecidos num formato que permite aos clientes realizar análises proprietárias e construir visualizações ao seu gosto. Estas empresas normalmente oferecem os seus produtos atrás de um paywall.

O custo é geralmente uma função da granularidade devido aos requisitos de infraestrutura, à natureza da clientela envolvida e à duração do ciclo de vendas.

A imagem acima mapeia diferentes produtos em dois eixos — profundidade e granularidade vs. preços dos produtos. Por favor, note que estas parcelas não são exatas. Alguns pontos podem ser extraviados. A ideia é desenvolver um modelo mental para pensar em vários produtos e a sua posição no mercado.

Produtos focados no retalho como o Dune ou o CoinGecko exibem quase todos os dados gratuitamente. Os clientes têm de pagar para aceder a alguns dados ou se quiserem dados através de APIs para executar as suas análises. Por exemplo, pode ver todos os gráficos criados por vários assistentes do Dune, mas eles limitam quantas linhas pode descarregar em formato CSV. Pode descarregar ficheiros CSV maiores e ver consultas privadas à medida que paga mais.

As empresas focadas no retalho tendem a ter receitas baixas por cliente e poucos clientes pagantes como percentagem de utilizadores gratuitos. Compare isso com as taxas de conversão para os modelos freemium de empresas de internet. Tipicamente, a taxa de conversão é 2%–5%. Uma taxa de conversão de 10% seria um outlier. O manual deles é ter o maior número possível de clientes gratuitos para que uma taxa de conversão de 4% contribua significativamente para a receita. Isto é o que chamamos o topo do funil.

Portanto, as empresas de dados precisam que o topo do funil seja grande o suficiente para gerar receita suficiente para se sustentar a uma taxa de conversão mais baixa. As empresas também podem considerar a geração de receitas a partir de anúncios quando o site tem muitos visitantes. A CoinGecko usa a receita de anúncios como alavanca para continuar a fornecer a maioria dos dados gratuitamente.

Ao longo dos anos, as empresas preencheram vagas em ambas as extremidades do espectro (B2B e B2C), deixando algumas lacunas no meio. Se alguém quiser ver como os livros de encomendas estão a mudar nas bolsas centralizadas ou como os rácios de chamada de venda, IVs e distorções estão a mudar, não há muitos produtos que ajudem nas visualizações. Há espaço para um produto mais granular do que os CoinGeckos do mundo mas menos granular do que os produtos de jogadores B2B puros.

Em fosso

Encontrar fosso em empresas onde a matéria-prima é gratuita não é fácil. Os dados da Blockchain estão disponíveis gratuitamente. Não há nada de proprietário nos dados que pode recolher. Portanto, os fossos nos negócios de dados não se baseiam apenas no facto de ter alguns dados que outros não têm. Em vez disso, baseiam-se na capacidade de uma equipa fornecer os dados num formato perspicaz e consumível, a tempo e sem erros.

Muitas empresas afirmam ter os mesmos dados, mas a qualidade dos dados e a sua apresentação são diferentes. Por exemplo, muitas empresas afirmam ter dados de livros de encomendas fora da cadeia. No entanto, fatores como o número de pedidos de oferta/pedido, a duração da série temporal e o número de trocas e pares disponíveis diferem de fornecedor para fornecedor. AAmberdata e a Kaiko têm os dados de livros de encomendas mais abrangentes para os mercados de cripto.

Por que, porém, apenas alguns fornecedores podem fornecer este tipo de dados? A explicação para onde surgem fosso nos dados da Web3 está aqui.

Talento — Corre o risco de dizer o óbvio, quando a matéria-prima é gratuita, a forma como a molda determina o valor do produto. Transformar dados brutos em informações úteis requer experiência de domínio em muitos nichos dentro das criptomoedas e dos mercados financeiros tradicionais. Equipas como a Velo Data, com experiência em mercados tradicionais, têm uma vantagem sobre outras que tentam construir produtos B2C semelhantes. Encontrar programadores talentosos que compreendam as estruturas de dados blockchain e tenham experiência relevante nos mercados financeiros é raro.

Infraestrutura — A recolha e entrega de grandes quantidades de dados requer uma infra-estrutura que não é fácil. Este tipo de operação requer capital e talento. Porque é que a infraestrutura é um fosso? Pense nos dados do pool de memória. Os blocos contêm dados para transações confirmadas. E as transações não confirmadas?

Diferentes nós de rede (por exemplo, nós conectados ao mesmo pool) veem diferentes transações não confirmadas. Executar apenas um nó não dará uma visão global das transações concorrentes. Manter vários nós em várias cadeias de blocos aumenta os custos de infraestrutura. Assim como com a IA (e redes de conteúdo no passado), a capacidade de manter os custos de hardware baixos durante a escalabilidade determinará os vencedores e perdedores no setor ao longo do tempo.

Efeitos de rede — Pode-se hipotetizar que existem efeitos de rede em muitos produtos de dados criptoativos. Tome o Chainlink como exemplo. Foi um dos primeiros oráculos que permitiu às aplicações ler dados de outras aplicações ou cadeias. Conseguiu angariar o apoio da comunidade e tem uma das comunidades mais fortes. Outro exemplo é o Nansen. A sua reivindicação à fama eram rótulos de endereço que lhe permitiam atribuir o movimento de ativos a entidades reais em vez de endereços hexanuméricos.

Posteriormente, lançou funcionalidades como o NFT Paradise e o Token God Mode, permitindo aos utilizadores rastrear NFTs e tokens de forma mais eficaz. A Arkham lançou um produto semelhante aos rótulos da Nansen, mas o investimento em dashboards e investigação permitiu à Nansen manobrar para clientes empresariais e oferecer produtos sob medida para eles. Vale a pena mencionar que os efeitos de rede não são possíveis sem os dois primeiros pontos (talento e infraestrutura).

Um sítio onde isto funciona é com indexadores. Quanto maior o número de cadeias que um produto suporta, maior a probabilidade de um programador usar o produto em vez de depender de várias fontes. Equipas como a Covalent têm uma vantagem aqui, pois otimizaram a amplitude das cadeias suportadas há algum tempo. Mas lembre-se que a profundidade é tão importante como a largura.

É muito cedo para dizer se algum produto tem um fosso significativo na cripto. Testemunhamos vantagens precocemente no grande esquema das coisas. À medida que categorias como o Web3 social e a sobreposição entre IA e cripto continuam a crescer, os produtos de dados da indústria podem crescer e ser o próximo Alfabeto. Mas isso será uma história de várias décadas; ainda estamos nos seus primeiros anos.

Para além da especulação

Muitos dos casos de uso que mencionamos para este artigo olham para a especulação financeira de uma forma ou de outra. Até os programadores que utilizam APIs para consultar dados estão a construir produtos financeiros. Pode parecer estranho, mas as blockchains (como uma nova rede) seguem a mesma tendência que o Telegraph e a Internet seguiram.

A chegada de um novo meio e o surgimento de uma nova rede acelera os casos de uso financeiro. Com a internet, demorou até ao início dos anos 2000 para as pessoas perceberrem que os utilizadores podiam ser segmentados com base na sua localização. Com blockchains, ainda estamos a descobrir como construir modelos de negócio a partir de trilhas de dados disponíveis publicamente.

Vimos uma mudança fundamental no nosso uso diário destas plataformas — Dune Analytics incorporando IA no seu produto. O Dune fornece uma interface baseada em SQL para os utilizadores consultam dados de blockchains como Ethereum e Solana. O mercado para um produto deste tipo é normalmente restrito aos utilizadores que percebem como escrever consultas SQL. Recentemente começaram a usar a IA para ajudar os analistas a gerar consultas sem serem especialistas em SQL. Não é tão funcional como se esperaria que fosse. Mas ainda é um passo para o futuro. Pode não demorar muito para pedirmos à IA (como o ChatGPT) para consultar dados de uma blockchain e oferecer a sua análise.

Uma maneira de pensar em “dados” no contexto da Web3 é através das lentes do Google Maps. O GPS existe desde pelo menos os anos 80. O Google realizou o trabalho necessário para mapear o mundo. Ao disponibilizar as sobreposições de mapas para aplicações de terceiros (usando APIs), a empresa permitiu a construção de uma nova geração de aplicações. Tudo, desde a entrega até o ride-hailing, estourou porque um único jogador especializado em dados assumiu esse fardo dos programadores.

Os produtos de dados na Web3 têm um papel semelhante. Ainda não sabemos a natureza exata das aplicações que poderiam ser construídas sobre este recurso disponível publicamente, mas está a tornar-se evidente que existe uma oportunidade do tamanho do Alfabeto dentro do cenário de dados.

Isenção de responsabilidade:

  1. Este artigo foi reimpresso de [GCR]. Todos os direitos de autor pertencem ao autor original [Saurabh Deshpande、Siddharth、Joel]. Se houver objeções a esta reimpressão, contacte a equipa do Gate Learn, e eles tratarão disso imediatamente.
  2. Isenção de responsabilidade: As opiniões e opiniões expressas neste artigo são exclusivamente do autor e não constituem nenhum conselho de investimento.
  3. As traduções do artigo para outras línguas são feitas pela equipa do Gate Learn. A menos que mencionado, é proibido copiar, distribuir ou plagiar os artigos traduzidos.
Comece agora
Registe-se e ganhe um cupão de
100 USD
!