Este artículo se publicó originalmente en Decentralised.co. Nosotros en GCR le traeremos formularios largos de Descentralizado dos veces al mes, ¡cada jueves alterno! La gerencia de más de 200 empresas confía en Decentralised.co para mantenerse actualizado sobre las tendencias, los datos y los conocimientos importantes. Suscríbase a su boletín informativo a continuación: más información sobre esta colaboración para nuestros miembros más activos en Discord.
Hola,
Habíamos escrito un precursor de este artículo el 18 de julio si desea un contexto que vaya más allá de lo que está escrito aquí.
Todos los seres vivos llevan algún registro. Los animales rastrean las estaciones para saber cuándo cazar. Los roedores y pájaros almacenan comida en lugares únicos. Necesitan recordar dónde lo almacenaron cuando accedan a él para obtener sustento meses después. Los lobos crean marcas alrededor del perímetro de su territorio para indicar a otros animales que se mantengan alejados. Incluso los árboles registran el tiempo. Cada año se forma un anillo en los troncos. Se puede estimar la edad de un árbol basándose en el número de anillos.
Aunque los árboles y los animales registran el tiempo, no pueden recuperar ni narrar el pasado. No tienen acceso a la memoria. Es lo que hace que el mantenimiento de registros humanos sea diferente. Gracias a nuestras capacidades comunicativas, sabemos que los sumerios en Mesopotamia (3400 a. C.) y los antiguos egipcios (3200 a. C.) usaban escritura cuneiforme y jeroglíficos para registrar información.
La humanidad evolucionó cuando el conocimiento podía transmitirse sin necesidad de que la fuente estuviera físicamente involucrada. Leemos y disfrutamos las obras de Platón o Sócrates mucho después de que desaparecieron porque tenemos los medios para almacenar sus enseñanzas. La escritura fue la plataforma AR original.
Escribiendo desde Irán siguiendo la pista del grano. Fuente: Enlace
Mientras que la escritura dejaba las cosas a la imaginación, los datos ayudaban a mantener las cosas objetivas. Redujo la necesidad de que las personas almacenen cosas en su memoria. Esta es en parte la razón por la que algunos de los textos humanos más antiguos involucran deudas, ingresos o registros comerciales.
En la era postindustrial, las empresas construyeron fosos competitivos para fortalecer su posición en el mercado digitalizando sus registros de ventas. Un ejemplo de esto es una empresa india llamada Asian Paints. Puede que su pintura no sea la mejor del mercado, pero controlan una participación de mercado de más del 50% de la industria de pinturas de la India, valorada en 8 mil millones de dólares.
¿Por qué? La respuesta fácil es que es una marca familiar y la empresa tiene economías de escala. Pero la forma en que llegaron allí tiene sus raíces en los datos. Invirtieron mucho en la recopilación y el procesamiento de datos para optimizar su cadena de suministro.
En contexto, las acciones de Asian Paints han tenido una asombrosa CAGR del 25% en los últimos 30 años. Respaldar ese crecimiento fue una inversión en una computadora central en la década de 1970. El dispositivo era más potente que los utilizados en las mejores organizaciones de investigación de la India en ese momento. Recopiló datos horarios sobre el color y la cantidad de pintura vendida en toda la India. Esto permitió a Asian Paints construir un modelo que predice la demanda de pintura en toda la India con una precisión del 98%.
Este poder predictivo permitió a Asian Paints capturar el máximo valor, ya que podría reducir drásticamente su tiempo de reposición. En ese momento, la norma para vender productos como pinturas era venderlos a un mayorista, quien luego se los entregaba a un distribuidor, quien a su vez los vendía a un comerciante. El comerciante interactuaría directamente con el consumidor. La razón de una cadena de suministro tan compleja fue que cada parte tenía un inventario de activos y datos controlados sobre la oferta y la demanda de pintura.
Choksey, fundador de pinturas asiáticas, eliminó a mayoristas y distribuidores de la cadena de suministro al estudiar los patrones de consumo del usuario final y reducir la dependencia de los intermediarios. Al eliminar a los intermediarios, Asian Paints captó el 97% del MRP (3% para los distribuidores) en comparación con el 60% captado por sus competidores.
El valor extraíble del Telegraph estaría en las cintas de teletipo transmitidas por el Telegraph.
La transición a lo digital no se produjo de la noche a la mañana. Parte de lo que hizo interesante la recopilación de datos fue el mundo de las finanzas y lo interconectado que se había vuelto poco a poco. Por ejemplo, a finales del siglo XX, los datos del mercado de valores se transmitían por telégrafo utilizando dispositivos como el que se muestra arriba. Ya en 1835, los comerciantes entrenaban palomas para que llevaran trozos de papel con información sobre lo que estaba sucediendo en Europa. Cuando los barcos de vapor que transportaban mercancías llegaban a 50 millas de tierra, las palomas volaban a los lugares designados con la información. Los comerciantes solían pagar hasta 500 dólares por cada hora de antelación para recibir la noticia.
En 1867, los comerciantes comenzaron a competir para optimizar la velocidad de transmisión de la información a través del telégrafo. Un empleado de Western Union llamado E. A Calahan pagó más de 200.000 dólares a la Bolsa de Nueva York por la posibilidad de enviar empleados a su parqué para transmitir datos de cotización a sus clientes. Una de las personas que trabajó diligentemente para optimizar el sistema fue un joven científico llamado Thomas Alva Edison. Un siglo después, herramientas como la terminal Bloomberg aumentarían exponencialmente el ritmo y la cantidad de datos financieros transmitidos en un día determinado.
Los datos, al igual que el petróleo crudo, deben pasar por varios pasos de refinamiento antes de poder utilizarse. Aprender cómo creció Bloomberg arroja luz sobre cómo evolucionó todo el panorama de datos y qué proceso. Bloomberg no fue el primer intento de utilizar la tecnología para mejorar los mecanismos comerciales y de presentación de informes. NASDAQ utilizó terminales Bunker Ramo para difundir información y realizar órdenes de oferta y demanda. Sin embargo, depender de antiguas redes de comunicación telefónica significaba que ampliar este modelo siempre sería un desafío.
Fuente - NASDAQ - La evolución del comercio OTC automatizado
En 1981, Michael Bloomberg, socio del banco de inversión Solomon Brothers, fue despedido con 10 millones de dólares por su capital cuando Phibro Corporation adquirió el banco. Se dio cuenta de que los inversores están dispuestos a pagar por información financiera simplificada con la creciente electrificación de los mercados financieros desde Nueva York hasta Japón. Fundó una empresa de servicios de datos llamada Innovative Market System, que pasó a llamarse Bloomberg en 1986.
Antes de que Internet despegara, se accedía a la Terminal Bloomberg mediante The Chiclet. Este se conectó al controlador Bloomberg mediante un cable especial conectado al concentrador local mediante líneas telefónicas dedicadas. Bloomberg recopiló datos a través de asociaciones de datos, agencias de noticias y comunicados de prensa, métodos patentados como el ingreso manual de datos y la recopilación de datos por teléfono.
Con Internet se abrieron las compuertas de información. Hoy, Bloomberg obtiene, procesa y entrega 200 mil millones de datos financieros casi en tiempo real. Eso es aproximadamente 23 millones de puntos de datos por segundo. Parte de la información disponible en Bloomberg es pública. En foros públicos se pueden encontrar datos como los estados financieros de las empresas y los precios de acciones y bonos.
Pero, ¿qué pasa si usted es analista de petróleo y gas y quiere comprender el movimiento de los contenedores de petróleo crudo? Es poco probable que obtenga esta información en tiempo real si no se suscribe a una fuente de datos como Bloomberg. No todos los datos en Internet están disponibles gratuitamente.
Normalmente existen dos limitaciones para los individuos cuando se trata de datos en Web2: acceso autorizado y una alta barrera para procesar grandes cantidades de datos. A lo largo de los años, proveedores como Bloomberg han creado efectos de red lo suficientemente fuertes como para obtener datos a través de sus afiliados, algo que los analistas o inversores no pueden permitirse.
Es mejor pagar 20.000 dólares a Bloomberg por una suscripción anual que intentar obtener los datos de una combinación de plataformas de datos que pueden tener diferentes niveles de precios. Incluso si se esfuerza lo suficiente para tener en sus manos los datos, no puede procesar y ejecutar análisis en tiempo real sin un gasto significativo en infraestructura. En el sector minorista, muchas plataformas que eventualmente escalaron fueron motores de comparación de datos.
Piénselo de esta manera: Google (el motor de búsqueda) es una empresa de datos que ofrece a las empresas acceso a los usuarios a cambio de dinero en publicidad. Cuando un restaurante o un boletín (como el nuestro) desea dirigirse a los usuarios que buscan información en Google, igualan la oferta y la demanda de información similar. Alguien que busca información en un boletín específico de Web3 nos está buscando. Y estamos buscando a esa persona. (Estoy resistiendo la tentación de incluir nuestro programa de referencias aquí).
Google construyó un monopolio debido a la economía de escala en la que funciona. Su inventario de usuarios y la cantidad de consultas que sus usuarios realizan cada día no tienen rival. Google construyó esa posición lanzando un motor de búsqueda que no tenía anuncios en un momento en que los anuncios eran la norma, luego adquiriendo YouTube y Android y, finalmente, pagando a pares como Apple para que Google fuera el motor de búsqueda predeterminado. Sólo para Apple, Google paga 20 mil millones de dólares al año para seguir siendo el motor de búsqueda predeterminado en Safari.
Google paga esa prima porque, en esencia, su oferta es un motor de comparación. El motor de correspondencia pone a los usuarios que tienen una necesidad en contacto con empresas que tienen una oferta. La mayoría de los monopolios de la web son, en esencia, motores de búsqueda de coincidencias. Amazon pone en contacto a vendedores de productos con compradores. Instagram relaciona una audiencia con los creadores. Estos motores de coincidencia funcionan porque las interacciones en estos productos dejan pistas ricas a partir de las cuales se puede generar contexto.
Ben Evans escribió en 2022 que no existen los datos. Conocer mis preferencias de contenido, comida o viajes no tiene mucho valor para un tercero. Se vuelve valioso –para el comercio o la investigación– sólo cuando se agrega o se enriquece con el contexto.
Contexto en el sentido de que mis preferencias por comer biriyani un viernes por la noche podrían usarse para anunciarme la entrega de biriyani precisamente cuando la probabilidad de que lo compre sea mayor. En conjunto, comparar la probabilidad de mi compra con la de un par en la misma región ayuda a dirigirme mejor a los usuarios.
Los datos necesitan escala (en grandes cantidades) o contexto para ser valiosos. Donde los productos Web3 y Web2 se han diferenciado históricamente es en los rastros que dejan. Sólo Amazon sabe cuántos controladores de Xbox se venderían en una semana determinada. Pero puedes ver los patrones en los que los comerciantes compran o venden NFT en OpenSea cualquier día. La razón es que cada una de esas transacciones deja un rastro público.
Los productos de datos en Web3 utilizan esos senderos para crear contexto.
Las cadenas de bloques como Ethereum y Bitcoin producen bloques cada 12 segundos y ~10 minutos, respectivamente. Cada bloque contiene transacciones que cambian el estado de la cadena de bloques. Los exploradores de bloques como Etherscan capturan datos relacionados con todas las transacciones. Por ejemplo, si va a Etherscan y ve un bloque, la imagen a continuación es lo que puede ver.
Las transacciones en blockchain son ricas en contexto. Productos como Arkham y Nansen son motores de interpretación para que los investigadores comprendan qué sucede cuando ocurre una transacción.
Puede ver todos los bloques desde que comenzó Ethereum. Pero ¿qué puedes hacer con esta información? Casi nada. Por lo tanto, necesita una forma de capturar estos datos en varias tablas. Por ejemplo, cada vez que se llama a un contrato NFT de un mercado en un bloque, los datos relacionados con esa transacción deben agregarse a tablas relacionadas con NFT, o cuando se llama a un contrato Uniswap, los datos relacionados deben almacenarse en tablas relacionadas con DEX. . (Dune hace esto como un servicio).
No se pueden analizar los datos sin procesar sin incurrir en costos de infraestructura significativos. Entonces, aunque los datos están disponibles gratuitamente, te encuentras con los mismos problemas. Usted depende de datos externos como inversor o creador de dApps. Pero su función principal no está relacionada con la recopilación y gestión de datos. Gastar recursos en actividades esenciales pero no básicas no es un lujo que todas las organizaciones puedan disfrutar.
Para los productos de datos, el contexto alrededor de los datos hace que el producto sea único. Bloomberg aplica su conocimiento financiero y transforma los datos en una forma que los inventores y comerciantes puedan consumir fácilmente. Sitios web como Similarweb o publicaciones de investigación como Newzoo utilizan sus competencias básicas para aplicar un contexto social o relacionado con los juegos a los datos que rastrean.
Los productos de datos nativos de Blockchain se diferencian al proporcionar contexto de usuario a través de consultas que responden preguntas relevantes para subconjuntos de usuarios específicos. Por ejemplo, TokenTerminal calcula los fundamentos económicos de los protocolos. Nansen ayuda a los participantes del mercado a etiquetar y comprender el movimiento de activos. Parsec consulta datos en cadena para ayudar a los comerciantes a analizar mejor las posiciones de DeFi.
Todos estos productos funcionan con un bien público: los datos en cadena. La diferencia es cómo estos productos presentan sus datos, lo que los hace atractivos para diferentes audiencias.
La división de categorías de productos en nuestra industria se basa en qué datos entran en la cadena y qué información se deriva de fuentes fuera de la cadena. (Algunos suelen utilizar ambos). Los proveedores de datos utilizan sus filtros de contexto para crear productos. Así como los datos Web2 tienen sus nichos, las empresas de datos Web3 han construido o están construyendo gradualmente fosos utilizando sus competencias básicas.
Como tal, los antecedentes de los fundadores a menudo dictan la naturaleza de los productos lanzados. Cuando un equipo central ha pasado mucho tiempo en los mercados de capitales antes de las criptomonedas, sus productos tienden a imitar a Bloomberg, mientras que los productos cripto nativos se parecen a Nansen. Diferentes productos satisfacen diferentes necesidades, incluso cuando se consultan los mismos datos.
Por ejemplo, los intercambios suelen descartar datos después de intervalos fijos. No están en el negocio de los datos y el almacenamiento de datos antiguos exige servidores y administración adicionales. Algunos proveedores de datos, como Kaiko y Amberdata, mantienen datos históricos de la cartera de pedidos de los intercambios. Estos datos permiten a los comerciantes e inversores construir modelos para probar sus hipótesis. Pero si desea comprender qué contratos DeFi están recibiendo una afluencia de ETH o monedas estables o analizar el comportamiento en cadena de direcciones o entidades específicas, necesitará un producto de Nansen o Arkham.
El mapa de mercado no es representativo de todos los jugadores en todas las categorías.
Una forma de comprender cómo se han posicionado los productos en los mercados es a través de la lente de los consumidores en criptografía. Estas personas se pueden clasificar en las siguientes cuatro categorías clave.
La mayoría de los dólares que fluyen a través de productos de criptodatos provienen de instituciones financieras durante un mercado bajista. Se trata de clientes importantes con ciclos de ventas más largos y requisitos de datos mucho más complejos. Una forma de saber si un producto está orientado a instituciones financieras es si un cliente debe someterse a una llamada de ventas para determinar cuánto cuesta. En el mundo Web2, no se puede saber cuánto cuesta PitchBook o CB Insights. En criptografía, no se sabe cuánto costaría un producto como Chainalysis.
Bromas aparte, parte del motivo de este proceso de ventas es el servicio práctico y de primera que ofrecen los productos de datos orientados a este segmento de consumidores. Estos usuarios suelen optar por datos muy granulares y frecuentes. Requieren datos no sólo para decisiones previas a la comercialización, sino también para usos posteriores a la comercialización, a fin de cumplir con los requisitos tributarios y de cumplimiento.
Por ejemplo, necesitan productos que les indiquen cuál fue el valor histórico de su cartera, les ayuden con los cálculos de impuestos, etc. Empresas como Amberdata, Kaiko, CoinMetrics, CryptoCompare y, hasta cierto punto, Nansen, atienden a estos clientes.
En mi experiencia, sólo los fundadores con experiencia trabajando en instituciones o equipos con grandes rondas de financiación han podido abrir el mercado institucional de datos. La barrera de entrada es relativamente alta aquí, como sería el caso con cualquier producto empresarial.
A menudo nos encontramos con la característica de componibilidad de Web3, lo que significa que las aplicaciones Web3 pueden ser interdependientes. Podrían requerir datos unos de otros. Por lo tanto, necesitan leer datos unos de otros constantemente. Por ejemplo, una plataforma como Yearn Finance necesita leer datos de Aave y Compound, y un agregador de NFT como Tensor necesita leer datos de Magic Eden y otros mercados.
Pero estos datos se almacenan en bloques de cadenas como Ethereum y Solana. Ethereum crea un bloque en 12 segundos y Solana lo hace en 400 ms. Clasificar los datos de blockchain en tablas y almacenarlos para un acceso rápido no es una tarea trivial. Aquí es donde entran en escena indexadores como Covalent, Graph, Chainlink y Powerloom. Garantizan que los datos sin procesar de blockchain se almacenen en el formato deseado para que los desarrolladores puedan recuperarlos mediante simples llamadas API.
Un segmento emergente en esta personalidad del consumidor involucra herramientas utilizadas para comprender el comportamiento del usuario. Por ejemplo, ARCx permite a los desarrolladores mapear datos fuera de la cadena (como el comportamiento del navegador) con datos dentro de la cadena (como direcciones de billetera) para capturar la información demográfica de los usuarios que interactúan con una dApp. Se encuentran en un nicho relativamente pequeño pero relevante, ya que ayudan a los desarrolladores a identificar quiénes son sus usuarios.
Los productos de datos en criptografía a menudo encuentran distribución colaborando con investigadores y publicaciones. CCData, por ejemplo, se cita a menudo en Bloomberg. Se incentiva a los investigadores a confiar en los productos de datos, ya que ayudan a ahorrar tiempo y esfuerzo al recopilar, limpiar o seleccionar datos. Productos como Dune han construido un foso al crear una comunidad de analistas que compiten entre sí para ocupar un lugar más alto en su lista.
Publicaciones como The Block y Delphi muestran paneles creados con datos de proveedores externos. Aquí en Decentralised.co, dependemos completamente de proveedores de datos externos, ya que ayudan a mantener el equipo ágil mientras utilizan recursos externos al recopilar datos.
El desafío de atender a este segmento de consumidores es que los investigadores más pequeños pueden no tener el presupuesto necesario para justificar el gasto de enormes recursos para sacar a la luz conocimientos especializados que pueden ser relevantes sólo para una sola persona. Por el contrario, las empresas están bien incentivadas a invertir esfuerzos y recursos en asociarse con publicaciones importantes como el Financial Times, ya que ayudan con la distribución.
Los productos orientados a inversores minoristas suelen tener una menor granularidad y frecuencia de datos. Pero son nichos altamente rentables para construir, ya que ven economías de escala. Diez mil usuarios que pagan 100 dólares cada uno es un negocio de ARR de 1 millón de dólares en un mundo donde la deserción no existe. Es más fácil decirlo que hacerlo, pero esos aspectos económicos explican por qué tenemos tantos productos de criptodatos orientados al comercio minorista.
Una gran parte de los productos orientados al comercio minorista son gratuitos o están respaldados por anuncios. Por ejemplo, un recurso gratuito como DefiLlama no le dirá cómo puede enrutar su pedido a través de diferentes intercambios (CEX y DEX) para evitar deslizamientos, ya que no toma instantáneas del libro de pedidos, pero muestra información sobre desbloqueos de tokens o desbloqueos de rendimiento.
Un cambio en este segmento de consumidores es cómo el medio de entrega abre una nueva categoría de mercado; por ejemplo, Cielo entrega datos como notificaciones a través de Telegram. Ha llegado a más de 40.000 usuarios al transmitir información de una manera fácil de consumir para un segmento de consumidores que preferiría no lidiar con interfaces de escritorio. Cuando se hace correctamente, incluso los medios de distribución pueden ser diferenciadores para las empresas en etapa inicial. Incluso en datos.
Aunque la clasificación se vuelve borrosa en algunos puntos, las empresas de datos se pueden dividir en orientaciones B2B o B2C.
Empresas como Amberdata y Kaiko tienen productos dirigidos a actores sofisticados. Estos productos son más granulares (detalles en los que están disponibles los datos) y frecuentes (p. ej. datos de la cartera de pedidos tick a tick y en tiempo real), y satisfacen demandas como la creación y prueba de modelos, análisis previos a la negociación, informes posteriores a la negociación, impuestos y cumplimiento. Los datos se proporcionan en un formato que permite a los clientes realizar análisis propios y crear visualizaciones según sus gustos. Estas empresas suelen ofrecer sus productos detrás de un muro de pago.
El costo generalmente es una función de la granularidad debido a los requisitos de infraestructura, la naturaleza de la clientela involucrada y la duración del ciclo de ventas.
La imagen de arriba representa diferentes productos en dos ejes: profundidad y granularidad versus precios de los productos. Tenga en cuenta que estos gráficos no son exactos. Es posible que algunos puntos estén fuera de lugar. La idea es desarrollar un modelo mental para pensar en varios productos y su posición en el mercado.
Los productos centrados en el comercio minorista como Dune o CoinGecko muestran casi todos los datos de forma gratuita. Los clientes deben pagar para acceder a algunos datos o si desean datos a través de API para ejecutar sus análisis. Por ejemplo, puede ver todos los gráficos creados por varios asistentes de Dune, pero limitan la cantidad de filas que puede descargar en formato CSV. Puede descargar archivos CSV más grandes y ver consultas privadas a medida que paga más.
Las empresas centradas en el comercio minorista tienden a tener bajos ingresos por cliente y pocos clientes de pago como porcentaje de los usuarios gratuitos. Compare esto con las tasas de conversión de los modelos freemium de las empresas de Internet. Normalmente, la tasa de conversión es 2%–5%. Una tasa de conversión del 10% sería un valor atípico. Su manual es tener tantos clientes gratuitos como sea posible para que una tasa de conversión del 4% contribuya significativamente a los ingresos. Esto es lo que llamamos la parte superior del embudo.
Por lo tanto, las empresas de datos necesitan que la parte superior del embudo sea lo suficientemente grande como para generar suficientes ingresos para mantenerse con una tasa de conversión más baja. Las empresas también pueden considerar generar ingresos a partir de anuncios cuando el sitio tiene muchos visitantes. CoinGecko utiliza los ingresos publicitarios como palanca para seguir proporcionando la mayoría de los datos de forma gratuita.
A lo largo de los años, las empresas han llenado espacios en ambos extremos del espectro (B2B y B2C), dejando algunos vacíos en el medio. Si alguien quiere ver cómo están cambiando los libros de pedidos en los intercambios centralizados o cómo están cambiando los índices de llamadas de venta, los IV y los sesgos, no hay muchos productos que ayuden con las visualizaciones. Hay espacio para un producto más granular que los CoinGeckos del mundo, pero menos granular que los productos de jugadores B2B puros.
Encontrar fosos en negocios donde la materia prima es gratuita no es fácil. Los datos de Blockchain están disponibles gratuitamente. No hay nada de propiedad en los datos que puede recopilar. Por lo tanto, los obstáculos en las empresas de datos no se basan simplemente en que usted tenga algunos datos que otros no tienen. Más bien, se basan en la capacidad de un equipo para proporcionar los datos en un formato útil y revelador, a tiempo y sin errores.
Muchas empresas afirman tener los mismos datos, pero la calidad de los datos y su presentación difieren. Por ejemplo, muchas empresas afirman tener datos de la cartera de pedidos fuera de la cadena. Sin embargo, factores como la cantidad de órdenes de oferta y demanda, la duración de la serie temporal y la cantidad de intercambios y pares disponibles difieren de un proveedor a otro. Amberdata y Kaiko tienen los datos de cartera de pedidos más completos para los mercados de cifrado.
Pero ¿por qué sólo unos pocos proveedores pueden proporcionar este tipo de datos? La explicación de dónde surgen los fosos en los datos de Web3 radica aquí.
Talento – A riesgo de decir lo obvio, cuando la materia prima es gratuita, la forma en que se moldea determina el valor del producto. Convertir datos sin procesar en información útil requiere experiencia en muchos nichos dentro de los mercados financieros tradicionales y criptográficos. Equipos como Velo Data, con experiencia en mercados tradicionales, tienen una ventaja sobre otros que intentan crear productos B2C similares. Es raro encontrar desarrolladores talentosos que comprendan las estructuras de datos de blockchain y tengan experiencia relevante en los mercados financieros.
Infraestructura: recopilar y entregar grandes cantidades de datos requiere una infraestructura que no resulta fácil. Este tipo de operación requiere capital y talento. ¿Por qué la infraestructura es un foso? Piense en los datos del grupo de memoria. Los bloques contienen datos de transacciones confirmadas. ¿Qué pasa con las transacciones no confirmadas?
Diferentes nodos de red (por ejemplo, nodos conectados al mismo grupo) ven diferentes transacciones no confirmadas. Ejecutar un solo nodo no brindará una visión global de las transacciones en competencia. Mantener múltiples nodos en varias cadenas de bloques aumenta los costos de infraestructura. Al igual que con la IA (y las redes de contenido en el pasado), la capacidad de mantener bajos los costos de hardware mientras se escala determinará los ganadores y perdedores en el sector con el tiempo.
Efectos de red: se puede plantear la hipótesis de que existen efectos de red en muchos productos de datos criptográficos. Tomemos como ejemplo Chainlink. Fue uno de los primeros oráculos que permitió a las aplicaciones leer datos de otras aplicaciones o cadenas. Logró obtener el apoyo de la comunidad y tiene una de las comunidades más fuertes. Otro ejemplo es Nansen. Su fama eran las etiquetas de direcciones que le permitían atribuir el movimiento de activos a entidades reales en lugar de direcciones hexanuméricas.
Posteriormente, lanzó funciones como NFT Paradise y Token God Mode, que permiten a los usuarios rastrear NFT y tokens de manera más efectiva. Arkham lanzó un producto similar a las etiquetas de Nansen, pero la inversión en paneles de control e investigación permitió a Nansen maniobrar hacia clientes empresariales y ofrecer productos personalizados para ellos. Cabe mencionar que los efectos de red no son posibles sin los dos primeros puntos (talento e infraestructura).
Un lugar donde esto funciona es con los indexadores. Cuanto mayor sea el número de cadenas que admite un producto, mayor será la probabilidad de que un desarrollador utilice el producto en lugar de depender de múltiples fuentes. Equipos como Covalent tienen una ventaja aquí, ya que han estado optimizando la amplitud de las cadenas admitidas durante bastante tiempo. Pero recuerda que la profundidad es tan importante como la amplitud.
Es demasiado pronto para decir si algún producto tiene un foso significativo en criptografía. Hemos sido testigos de las ventajas de los pioneros en el gran esquema de las cosas. A medida que categorías como Web3 social y la superposición entre IA y criptografía continúan escalando, los productos de datos de la industria pueden convertirse en el próximo Alphabet. Pero esa será una historia que durará varias décadas; todavía estamos en sus primeros años.
Muchos de los casos de uso que mencionamos en este artículo analizan la especulación financiera de una forma u otra. Incluso los desarrolladores que utilizan API para consultar datos están creando productos financieros. Puede parecer extraño, pero las cadenas de bloques (como nueva red) siguen la misma tendencia que Telegraph e Internet.
La llegada de un nuevo medio y el surgimiento de una nueva red acelera los casos de uso financiero. Con Internet, hubo que esperar hasta principios de la década de 2000 para que la gente se diera cuenta de que se podía seleccionar a los usuarios en función de su ubicación. Con las cadenas de bloques, todavía estamos descubriendo cómo construir modelos de negocio a partir de rastros de datos disponibles públicamente.
Hemos visto un cambio clave en nuestro uso diario de estas plataformas: Dune Analytics incorpora IA en su producto. Dune proporciona una interfaz basada en SQL para que los usuarios consulten datos de cadenas de bloques como Ethereum y Solana. El mercado de un producto de este tipo suele estar restringido a usuarios que saben cómo escribir consultas SQL. Recientemente comenzaron a utilizar IA para ayudar a los analistas a generar consultas sin ser expertos en SQL. No es tan funcional como cabría esperar. Pero sigue siendo un paso hacia el futuro. Puede que no pase mucho tiempo antes de que le pidamos a la IA (como ChatGPT) que consulte datos de una cadena de bloques y ofrezca su análisis.
Una forma de pensar en los “datos” en el contexto de la Web3 es a través de la lente de Google Maps. El GPS existe al menos desde la década de 1980. Google hizo el trabajo necesario para mapear el mundo. Al hacer que las superposiciones de mapas estén disponibles para aplicaciones de terceros (mediante API), la empresa permitió crear una nueva generación de aplicaciones. Todo, desde la entrega hasta el transporte compartido, prosperó porque un solo jugador especializado en datos asumió esa carga de los desarrolladores.
Los productos de datos en Web3 desempeñarán un papel similar. Todavía no conocemos la naturaleza exacta de las aplicaciones que podrían construirse sobre este recurso disponible públicamente, pero cada vez es más evidente que existe una oportunidad del tamaño de Alphabet dentro del panorama de los datos.
Este artículo se publicó originalmente en Decentralised.co. Nosotros en GCR le traeremos formularios largos de Descentralizado dos veces al mes, ¡cada jueves alterno! La gerencia de más de 200 empresas confía en Decentralised.co para mantenerse actualizado sobre las tendencias, los datos y los conocimientos importantes. Suscríbase a su boletín informativo a continuación: más información sobre esta colaboración para nuestros miembros más activos en Discord.
Hola,
Habíamos escrito un precursor de este artículo el 18 de julio si desea un contexto que vaya más allá de lo que está escrito aquí.
Todos los seres vivos llevan algún registro. Los animales rastrean las estaciones para saber cuándo cazar. Los roedores y pájaros almacenan comida en lugares únicos. Necesitan recordar dónde lo almacenaron cuando accedan a él para obtener sustento meses después. Los lobos crean marcas alrededor del perímetro de su territorio para indicar a otros animales que se mantengan alejados. Incluso los árboles registran el tiempo. Cada año se forma un anillo en los troncos. Se puede estimar la edad de un árbol basándose en el número de anillos.
Aunque los árboles y los animales registran el tiempo, no pueden recuperar ni narrar el pasado. No tienen acceso a la memoria. Es lo que hace que el mantenimiento de registros humanos sea diferente. Gracias a nuestras capacidades comunicativas, sabemos que los sumerios en Mesopotamia (3400 a. C.) y los antiguos egipcios (3200 a. C.) usaban escritura cuneiforme y jeroglíficos para registrar información.
La humanidad evolucionó cuando el conocimiento podía transmitirse sin necesidad de que la fuente estuviera físicamente involucrada. Leemos y disfrutamos las obras de Platón o Sócrates mucho después de que desaparecieron porque tenemos los medios para almacenar sus enseñanzas. La escritura fue la plataforma AR original.
Escribiendo desde Irán siguiendo la pista del grano. Fuente: Enlace
Mientras que la escritura dejaba las cosas a la imaginación, los datos ayudaban a mantener las cosas objetivas. Redujo la necesidad de que las personas almacenen cosas en su memoria. Esta es en parte la razón por la que algunos de los textos humanos más antiguos involucran deudas, ingresos o registros comerciales.
En la era postindustrial, las empresas construyeron fosos competitivos para fortalecer su posición en el mercado digitalizando sus registros de ventas. Un ejemplo de esto es una empresa india llamada Asian Paints. Puede que su pintura no sea la mejor del mercado, pero controlan una participación de mercado de más del 50% de la industria de pinturas de la India, valorada en 8 mil millones de dólares.
¿Por qué? La respuesta fácil es que es una marca familiar y la empresa tiene economías de escala. Pero la forma en que llegaron allí tiene sus raíces en los datos. Invirtieron mucho en la recopilación y el procesamiento de datos para optimizar su cadena de suministro.
En contexto, las acciones de Asian Paints han tenido una asombrosa CAGR del 25% en los últimos 30 años. Respaldar ese crecimiento fue una inversión en una computadora central en la década de 1970. El dispositivo era más potente que los utilizados en las mejores organizaciones de investigación de la India en ese momento. Recopiló datos horarios sobre el color y la cantidad de pintura vendida en toda la India. Esto permitió a Asian Paints construir un modelo que predice la demanda de pintura en toda la India con una precisión del 98%.
Este poder predictivo permitió a Asian Paints capturar el máximo valor, ya que podría reducir drásticamente su tiempo de reposición. En ese momento, la norma para vender productos como pinturas era venderlos a un mayorista, quien luego se los entregaba a un distribuidor, quien a su vez los vendía a un comerciante. El comerciante interactuaría directamente con el consumidor. La razón de una cadena de suministro tan compleja fue que cada parte tenía un inventario de activos y datos controlados sobre la oferta y la demanda de pintura.
Choksey, fundador de pinturas asiáticas, eliminó a mayoristas y distribuidores de la cadena de suministro al estudiar los patrones de consumo del usuario final y reducir la dependencia de los intermediarios. Al eliminar a los intermediarios, Asian Paints captó el 97% del MRP (3% para los distribuidores) en comparación con el 60% captado por sus competidores.
El valor extraíble del Telegraph estaría en las cintas de teletipo transmitidas por el Telegraph.
La transición a lo digital no se produjo de la noche a la mañana. Parte de lo que hizo interesante la recopilación de datos fue el mundo de las finanzas y lo interconectado que se había vuelto poco a poco. Por ejemplo, a finales del siglo XX, los datos del mercado de valores se transmitían por telégrafo utilizando dispositivos como el que se muestra arriba. Ya en 1835, los comerciantes entrenaban palomas para que llevaran trozos de papel con información sobre lo que estaba sucediendo en Europa. Cuando los barcos de vapor que transportaban mercancías llegaban a 50 millas de tierra, las palomas volaban a los lugares designados con la información. Los comerciantes solían pagar hasta 500 dólares por cada hora de antelación para recibir la noticia.
En 1867, los comerciantes comenzaron a competir para optimizar la velocidad de transmisión de la información a través del telégrafo. Un empleado de Western Union llamado E. A Calahan pagó más de 200.000 dólares a la Bolsa de Nueva York por la posibilidad de enviar empleados a su parqué para transmitir datos de cotización a sus clientes. Una de las personas que trabajó diligentemente para optimizar el sistema fue un joven científico llamado Thomas Alva Edison. Un siglo después, herramientas como la terminal Bloomberg aumentarían exponencialmente el ritmo y la cantidad de datos financieros transmitidos en un día determinado.
Los datos, al igual que el petróleo crudo, deben pasar por varios pasos de refinamiento antes de poder utilizarse. Aprender cómo creció Bloomberg arroja luz sobre cómo evolucionó todo el panorama de datos y qué proceso. Bloomberg no fue el primer intento de utilizar la tecnología para mejorar los mecanismos comerciales y de presentación de informes. NASDAQ utilizó terminales Bunker Ramo para difundir información y realizar órdenes de oferta y demanda. Sin embargo, depender de antiguas redes de comunicación telefónica significaba que ampliar este modelo siempre sería un desafío.
Fuente - NASDAQ - La evolución del comercio OTC automatizado
En 1981, Michael Bloomberg, socio del banco de inversión Solomon Brothers, fue despedido con 10 millones de dólares por su capital cuando Phibro Corporation adquirió el banco. Se dio cuenta de que los inversores están dispuestos a pagar por información financiera simplificada con la creciente electrificación de los mercados financieros desde Nueva York hasta Japón. Fundó una empresa de servicios de datos llamada Innovative Market System, que pasó a llamarse Bloomberg en 1986.
Antes de que Internet despegara, se accedía a la Terminal Bloomberg mediante The Chiclet. Este se conectó al controlador Bloomberg mediante un cable especial conectado al concentrador local mediante líneas telefónicas dedicadas. Bloomberg recopiló datos a través de asociaciones de datos, agencias de noticias y comunicados de prensa, métodos patentados como el ingreso manual de datos y la recopilación de datos por teléfono.
Con Internet se abrieron las compuertas de información. Hoy, Bloomberg obtiene, procesa y entrega 200 mil millones de datos financieros casi en tiempo real. Eso es aproximadamente 23 millones de puntos de datos por segundo. Parte de la información disponible en Bloomberg es pública. En foros públicos se pueden encontrar datos como los estados financieros de las empresas y los precios de acciones y bonos.
Pero, ¿qué pasa si usted es analista de petróleo y gas y quiere comprender el movimiento de los contenedores de petróleo crudo? Es poco probable que obtenga esta información en tiempo real si no se suscribe a una fuente de datos como Bloomberg. No todos los datos en Internet están disponibles gratuitamente.
Normalmente existen dos limitaciones para los individuos cuando se trata de datos en Web2: acceso autorizado y una alta barrera para procesar grandes cantidades de datos. A lo largo de los años, proveedores como Bloomberg han creado efectos de red lo suficientemente fuertes como para obtener datos a través de sus afiliados, algo que los analistas o inversores no pueden permitirse.
Es mejor pagar 20.000 dólares a Bloomberg por una suscripción anual que intentar obtener los datos de una combinación de plataformas de datos que pueden tener diferentes niveles de precios. Incluso si se esfuerza lo suficiente para tener en sus manos los datos, no puede procesar y ejecutar análisis en tiempo real sin un gasto significativo en infraestructura. En el sector minorista, muchas plataformas que eventualmente escalaron fueron motores de comparación de datos.
Piénselo de esta manera: Google (el motor de búsqueda) es una empresa de datos que ofrece a las empresas acceso a los usuarios a cambio de dinero en publicidad. Cuando un restaurante o un boletín (como el nuestro) desea dirigirse a los usuarios que buscan información en Google, igualan la oferta y la demanda de información similar. Alguien que busca información en un boletín específico de Web3 nos está buscando. Y estamos buscando a esa persona. (Estoy resistiendo la tentación de incluir nuestro programa de referencias aquí).
Google construyó un monopolio debido a la economía de escala en la que funciona. Su inventario de usuarios y la cantidad de consultas que sus usuarios realizan cada día no tienen rival. Google construyó esa posición lanzando un motor de búsqueda que no tenía anuncios en un momento en que los anuncios eran la norma, luego adquiriendo YouTube y Android y, finalmente, pagando a pares como Apple para que Google fuera el motor de búsqueda predeterminado. Sólo para Apple, Google paga 20 mil millones de dólares al año para seguir siendo el motor de búsqueda predeterminado en Safari.
Google paga esa prima porque, en esencia, su oferta es un motor de comparación. El motor de correspondencia pone a los usuarios que tienen una necesidad en contacto con empresas que tienen una oferta. La mayoría de los monopolios de la web son, en esencia, motores de búsqueda de coincidencias. Amazon pone en contacto a vendedores de productos con compradores. Instagram relaciona una audiencia con los creadores. Estos motores de coincidencia funcionan porque las interacciones en estos productos dejan pistas ricas a partir de las cuales se puede generar contexto.
Ben Evans escribió en 2022 que no existen los datos. Conocer mis preferencias de contenido, comida o viajes no tiene mucho valor para un tercero. Se vuelve valioso –para el comercio o la investigación– sólo cuando se agrega o se enriquece con el contexto.
Contexto en el sentido de que mis preferencias por comer biriyani un viernes por la noche podrían usarse para anunciarme la entrega de biriyani precisamente cuando la probabilidad de que lo compre sea mayor. En conjunto, comparar la probabilidad de mi compra con la de un par en la misma región ayuda a dirigirme mejor a los usuarios.
Los datos necesitan escala (en grandes cantidades) o contexto para ser valiosos. Donde los productos Web3 y Web2 se han diferenciado históricamente es en los rastros que dejan. Sólo Amazon sabe cuántos controladores de Xbox se venderían en una semana determinada. Pero puedes ver los patrones en los que los comerciantes compran o venden NFT en OpenSea cualquier día. La razón es que cada una de esas transacciones deja un rastro público.
Los productos de datos en Web3 utilizan esos senderos para crear contexto.
Las cadenas de bloques como Ethereum y Bitcoin producen bloques cada 12 segundos y ~10 minutos, respectivamente. Cada bloque contiene transacciones que cambian el estado de la cadena de bloques. Los exploradores de bloques como Etherscan capturan datos relacionados con todas las transacciones. Por ejemplo, si va a Etherscan y ve un bloque, la imagen a continuación es lo que puede ver.
Las transacciones en blockchain son ricas en contexto. Productos como Arkham y Nansen son motores de interpretación para que los investigadores comprendan qué sucede cuando ocurre una transacción.
Puede ver todos los bloques desde que comenzó Ethereum. Pero ¿qué puedes hacer con esta información? Casi nada. Por lo tanto, necesita una forma de capturar estos datos en varias tablas. Por ejemplo, cada vez que se llama a un contrato NFT de un mercado en un bloque, los datos relacionados con esa transacción deben agregarse a tablas relacionadas con NFT, o cuando se llama a un contrato Uniswap, los datos relacionados deben almacenarse en tablas relacionadas con DEX. . (Dune hace esto como un servicio).
No se pueden analizar los datos sin procesar sin incurrir en costos de infraestructura significativos. Entonces, aunque los datos están disponibles gratuitamente, te encuentras con los mismos problemas. Usted depende de datos externos como inversor o creador de dApps. Pero su función principal no está relacionada con la recopilación y gestión de datos. Gastar recursos en actividades esenciales pero no básicas no es un lujo que todas las organizaciones puedan disfrutar.
Para los productos de datos, el contexto alrededor de los datos hace que el producto sea único. Bloomberg aplica su conocimiento financiero y transforma los datos en una forma que los inventores y comerciantes puedan consumir fácilmente. Sitios web como Similarweb o publicaciones de investigación como Newzoo utilizan sus competencias básicas para aplicar un contexto social o relacionado con los juegos a los datos que rastrean.
Los productos de datos nativos de Blockchain se diferencian al proporcionar contexto de usuario a través de consultas que responden preguntas relevantes para subconjuntos de usuarios específicos. Por ejemplo, TokenTerminal calcula los fundamentos económicos de los protocolos. Nansen ayuda a los participantes del mercado a etiquetar y comprender el movimiento de activos. Parsec consulta datos en cadena para ayudar a los comerciantes a analizar mejor las posiciones de DeFi.
Todos estos productos funcionan con un bien público: los datos en cadena. La diferencia es cómo estos productos presentan sus datos, lo que los hace atractivos para diferentes audiencias.
La división de categorías de productos en nuestra industria se basa en qué datos entran en la cadena y qué información se deriva de fuentes fuera de la cadena. (Algunos suelen utilizar ambos). Los proveedores de datos utilizan sus filtros de contexto para crear productos. Así como los datos Web2 tienen sus nichos, las empresas de datos Web3 han construido o están construyendo gradualmente fosos utilizando sus competencias básicas.
Como tal, los antecedentes de los fundadores a menudo dictan la naturaleza de los productos lanzados. Cuando un equipo central ha pasado mucho tiempo en los mercados de capitales antes de las criptomonedas, sus productos tienden a imitar a Bloomberg, mientras que los productos cripto nativos se parecen a Nansen. Diferentes productos satisfacen diferentes necesidades, incluso cuando se consultan los mismos datos.
Por ejemplo, los intercambios suelen descartar datos después de intervalos fijos. No están en el negocio de los datos y el almacenamiento de datos antiguos exige servidores y administración adicionales. Algunos proveedores de datos, como Kaiko y Amberdata, mantienen datos históricos de la cartera de pedidos de los intercambios. Estos datos permiten a los comerciantes e inversores construir modelos para probar sus hipótesis. Pero si desea comprender qué contratos DeFi están recibiendo una afluencia de ETH o monedas estables o analizar el comportamiento en cadena de direcciones o entidades específicas, necesitará un producto de Nansen o Arkham.
El mapa de mercado no es representativo de todos los jugadores en todas las categorías.
Una forma de comprender cómo se han posicionado los productos en los mercados es a través de la lente de los consumidores en criptografía. Estas personas se pueden clasificar en las siguientes cuatro categorías clave.
La mayoría de los dólares que fluyen a través de productos de criptodatos provienen de instituciones financieras durante un mercado bajista. Se trata de clientes importantes con ciclos de ventas más largos y requisitos de datos mucho más complejos. Una forma de saber si un producto está orientado a instituciones financieras es si un cliente debe someterse a una llamada de ventas para determinar cuánto cuesta. En el mundo Web2, no se puede saber cuánto cuesta PitchBook o CB Insights. En criptografía, no se sabe cuánto costaría un producto como Chainalysis.
Bromas aparte, parte del motivo de este proceso de ventas es el servicio práctico y de primera que ofrecen los productos de datos orientados a este segmento de consumidores. Estos usuarios suelen optar por datos muy granulares y frecuentes. Requieren datos no sólo para decisiones previas a la comercialización, sino también para usos posteriores a la comercialización, a fin de cumplir con los requisitos tributarios y de cumplimiento.
Por ejemplo, necesitan productos que les indiquen cuál fue el valor histórico de su cartera, les ayuden con los cálculos de impuestos, etc. Empresas como Amberdata, Kaiko, CoinMetrics, CryptoCompare y, hasta cierto punto, Nansen, atienden a estos clientes.
En mi experiencia, sólo los fundadores con experiencia trabajando en instituciones o equipos con grandes rondas de financiación han podido abrir el mercado institucional de datos. La barrera de entrada es relativamente alta aquí, como sería el caso con cualquier producto empresarial.
A menudo nos encontramos con la característica de componibilidad de Web3, lo que significa que las aplicaciones Web3 pueden ser interdependientes. Podrían requerir datos unos de otros. Por lo tanto, necesitan leer datos unos de otros constantemente. Por ejemplo, una plataforma como Yearn Finance necesita leer datos de Aave y Compound, y un agregador de NFT como Tensor necesita leer datos de Magic Eden y otros mercados.
Pero estos datos se almacenan en bloques de cadenas como Ethereum y Solana. Ethereum crea un bloque en 12 segundos y Solana lo hace en 400 ms. Clasificar los datos de blockchain en tablas y almacenarlos para un acceso rápido no es una tarea trivial. Aquí es donde entran en escena indexadores como Covalent, Graph, Chainlink y Powerloom. Garantizan que los datos sin procesar de blockchain se almacenen en el formato deseado para que los desarrolladores puedan recuperarlos mediante simples llamadas API.
Un segmento emergente en esta personalidad del consumidor involucra herramientas utilizadas para comprender el comportamiento del usuario. Por ejemplo, ARCx permite a los desarrolladores mapear datos fuera de la cadena (como el comportamiento del navegador) con datos dentro de la cadena (como direcciones de billetera) para capturar la información demográfica de los usuarios que interactúan con una dApp. Se encuentran en un nicho relativamente pequeño pero relevante, ya que ayudan a los desarrolladores a identificar quiénes son sus usuarios.
Los productos de datos en criptografía a menudo encuentran distribución colaborando con investigadores y publicaciones. CCData, por ejemplo, se cita a menudo en Bloomberg. Se incentiva a los investigadores a confiar en los productos de datos, ya que ayudan a ahorrar tiempo y esfuerzo al recopilar, limpiar o seleccionar datos. Productos como Dune han construido un foso al crear una comunidad de analistas que compiten entre sí para ocupar un lugar más alto en su lista.
Publicaciones como The Block y Delphi muestran paneles creados con datos de proveedores externos. Aquí en Decentralised.co, dependemos completamente de proveedores de datos externos, ya que ayudan a mantener el equipo ágil mientras utilizan recursos externos al recopilar datos.
El desafío de atender a este segmento de consumidores es que los investigadores más pequeños pueden no tener el presupuesto necesario para justificar el gasto de enormes recursos para sacar a la luz conocimientos especializados que pueden ser relevantes sólo para una sola persona. Por el contrario, las empresas están bien incentivadas a invertir esfuerzos y recursos en asociarse con publicaciones importantes como el Financial Times, ya que ayudan con la distribución.
Los productos orientados a inversores minoristas suelen tener una menor granularidad y frecuencia de datos. Pero son nichos altamente rentables para construir, ya que ven economías de escala. Diez mil usuarios que pagan 100 dólares cada uno es un negocio de ARR de 1 millón de dólares en un mundo donde la deserción no existe. Es más fácil decirlo que hacerlo, pero esos aspectos económicos explican por qué tenemos tantos productos de criptodatos orientados al comercio minorista.
Una gran parte de los productos orientados al comercio minorista son gratuitos o están respaldados por anuncios. Por ejemplo, un recurso gratuito como DefiLlama no le dirá cómo puede enrutar su pedido a través de diferentes intercambios (CEX y DEX) para evitar deslizamientos, ya que no toma instantáneas del libro de pedidos, pero muestra información sobre desbloqueos de tokens o desbloqueos de rendimiento.
Un cambio en este segmento de consumidores es cómo el medio de entrega abre una nueva categoría de mercado; por ejemplo, Cielo entrega datos como notificaciones a través de Telegram. Ha llegado a más de 40.000 usuarios al transmitir información de una manera fácil de consumir para un segmento de consumidores que preferiría no lidiar con interfaces de escritorio. Cuando se hace correctamente, incluso los medios de distribución pueden ser diferenciadores para las empresas en etapa inicial. Incluso en datos.
Aunque la clasificación se vuelve borrosa en algunos puntos, las empresas de datos se pueden dividir en orientaciones B2B o B2C.
Empresas como Amberdata y Kaiko tienen productos dirigidos a actores sofisticados. Estos productos son más granulares (detalles en los que están disponibles los datos) y frecuentes (p. ej. datos de la cartera de pedidos tick a tick y en tiempo real), y satisfacen demandas como la creación y prueba de modelos, análisis previos a la negociación, informes posteriores a la negociación, impuestos y cumplimiento. Los datos se proporcionan en un formato que permite a los clientes realizar análisis propios y crear visualizaciones según sus gustos. Estas empresas suelen ofrecer sus productos detrás de un muro de pago.
El costo generalmente es una función de la granularidad debido a los requisitos de infraestructura, la naturaleza de la clientela involucrada y la duración del ciclo de ventas.
La imagen de arriba representa diferentes productos en dos ejes: profundidad y granularidad versus precios de los productos. Tenga en cuenta que estos gráficos no son exactos. Es posible que algunos puntos estén fuera de lugar. La idea es desarrollar un modelo mental para pensar en varios productos y su posición en el mercado.
Los productos centrados en el comercio minorista como Dune o CoinGecko muestran casi todos los datos de forma gratuita. Los clientes deben pagar para acceder a algunos datos o si desean datos a través de API para ejecutar sus análisis. Por ejemplo, puede ver todos los gráficos creados por varios asistentes de Dune, pero limitan la cantidad de filas que puede descargar en formato CSV. Puede descargar archivos CSV más grandes y ver consultas privadas a medida que paga más.
Las empresas centradas en el comercio minorista tienden a tener bajos ingresos por cliente y pocos clientes de pago como porcentaje de los usuarios gratuitos. Compare esto con las tasas de conversión de los modelos freemium de las empresas de Internet. Normalmente, la tasa de conversión es 2%–5%. Una tasa de conversión del 10% sería un valor atípico. Su manual es tener tantos clientes gratuitos como sea posible para que una tasa de conversión del 4% contribuya significativamente a los ingresos. Esto es lo que llamamos la parte superior del embudo.
Por lo tanto, las empresas de datos necesitan que la parte superior del embudo sea lo suficientemente grande como para generar suficientes ingresos para mantenerse con una tasa de conversión más baja. Las empresas también pueden considerar generar ingresos a partir de anuncios cuando el sitio tiene muchos visitantes. CoinGecko utiliza los ingresos publicitarios como palanca para seguir proporcionando la mayoría de los datos de forma gratuita.
A lo largo de los años, las empresas han llenado espacios en ambos extremos del espectro (B2B y B2C), dejando algunos vacíos en el medio. Si alguien quiere ver cómo están cambiando los libros de pedidos en los intercambios centralizados o cómo están cambiando los índices de llamadas de venta, los IV y los sesgos, no hay muchos productos que ayuden con las visualizaciones. Hay espacio para un producto más granular que los CoinGeckos del mundo, pero menos granular que los productos de jugadores B2B puros.
Encontrar fosos en negocios donde la materia prima es gratuita no es fácil. Los datos de Blockchain están disponibles gratuitamente. No hay nada de propiedad en los datos que puede recopilar. Por lo tanto, los obstáculos en las empresas de datos no se basan simplemente en que usted tenga algunos datos que otros no tienen. Más bien, se basan en la capacidad de un equipo para proporcionar los datos en un formato útil y revelador, a tiempo y sin errores.
Muchas empresas afirman tener los mismos datos, pero la calidad de los datos y su presentación difieren. Por ejemplo, muchas empresas afirman tener datos de la cartera de pedidos fuera de la cadena. Sin embargo, factores como la cantidad de órdenes de oferta y demanda, la duración de la serie temporal y la cantidad de intercambios y pares disponibles difieren de un proveedor a otro. Amberdata y Kaiko tienen los datos de cartera de pedidos más completos para los mercados de cifrado.
Pero ¿por qué sólo unos pocos proveedores pueden proporcionar este tipo de datos? La explicación de dónde surgen los fosos en los datos de Web3 radica aquí.
Talento – A riesgo de decir lo obvio, cuando la materia prima es gratuita, la forma en que se moldea determina el valor del producto. Convertir datos sin procesar en información útil requiere experiencia en muchos nichos dentro de los mercados financieros tradicionales y criptográficos. Equipos como Velo Data, con experiencia en mercados tradicionales, tienen una ventaja sobre otros que intentan crear productos B2C similares. Es raro encontrar desarrolladores talentosos que comprendan las estructuras de datos de blockchain y tengan experiencia relevante en los mercados financieros.
Infraestructura: recopilar y entregar grandes cantidades de datos requiere una infraestructura que no resulta fácil. Este tipo de operación requiere capital y talento. ¿Por qué la infraestructura es un foso? Piense en los datos del grupo de memoria. Los bloques contienen datos de transacciones confirmadas. ¿Qué pasa con las transacciones no confirmadas?
Diferentes nodos de red (por ejemplo, nodos conectados al mismo grupo) ven diferentes transacciones no confirmadas. Ejecutar un solo nodo no brindará una visión global de las transacciones en competencia. Mantener múltiples nodos en varias cadenas de bloques aumenta los costos de infraestructura. Al igual que con la IA (y las redes de contenido en el pasado), la capacidad de mantener bajos los costos de hardware mientras se escala determinará los ganadores y perdedores en el sector con el tiempo.
Efectos de red: se puede plantear la hipótesis de que existen efectos de red en muchos productos de datos criptográficos. Tomemos como ejemplo Chainlink. Fue uno de los primeros oráculos que permitió a las aplicaciones leer datos de otras aplicaciones o cadenas. Logró obtener el apoyo de la comunidad y tiene una de las comunidades más fuertes. Otro ejemplo es Nansen. Su fama eran las etiquetas de direcciones que le permitían atribuir el movimiento de activos a entidades reales en lugar de direcciones hexanuméricas.
Posteriormente, lanzó funciones como NFT Paradise y Token God Mode, que permiten a los usuarios rastrear NFT y tokens de manera más efectiva. Arkham lanzó un producto similar a las etiquetas de Nansen, pero la inversión en paneles de control e investigación permitió a Nansen maniobrar hacia clientes empresariales y ofrecer productos personalizados para ellos. Cabe mencionar que los efectos de red no son posibles sin los dos primeros puntos (talento e infraestructura).
Un lugar donde esto funciona es con los indexadores. Cuanto mayor sea el número de cadenas que admite un producto, mayor será la probabilidad de que un desarrollador utilice el producto en lugar de depender de múltiples fuentes. Equipos como Covalent tienen una ventaja aquí, ya que han estado optimizando la amplitud de las cadenas admitidas durante bastante tiempo. Pero recuerda que la profundidad es tan importante como la amplitud.
Es demasiado pronto para decir si algún producto tiene un foso significativo en criptografía. Hemos sido testigos de las ventajas de los pioneros en el gran esquema de las cosas. A medida que categorías como Web3 social y la superposición entre IA y criptografía continúan escalando, los productos de datos de la industria pueden convertirse en el próximo Alphabet. Pero esa será una historia que durará varias décadas; todavía estamos en sus primeros años.
Muchos de los casos de uso que mencionamos en este artículo analizan la especulación financiera de una forma u otra. Incluso los desarrolladores que utilizan API para consultar datos están creando productos financieros. Puede parecer extraño, pero las cadenas de bloques (como nueva red) siguen la misma tendencia que Telegraph e Internet.
La llegada de un nuevo medio y el surgimiento de una nueva red acelera los casos de uso financiero. Con Internet, hubo que esperar hasta principios de la década de 2000 para que la gente se diera cuenta de que se podía seleccionar a los usuarios en función de su ubicación. Con las cadenas de bloques, todavía estamos descubriendo cómo construir modelos de negocio a partir de rastros de datos disponibles públicamente.
Hemos visto un cambio clave en nuestro uso diario de estas plataformas: Dune Analytics incorpora IA en su producto. Dune proporciona una interfaz basada en SQL para que los usuarios consulten datos de cadenas de bloques como Ethereum y Solana. El mercado de un producto de este tipo suele estar restringido a usuarios que saben cómo escribir consultas SQL. Recientemente comenzaron a utilizar IA para ayudar a los analistas a generar consultas sin ser expertos en SQL. No es tan funcional como cabría esperar. Pero sigue siendo un paso hacia el futuro. Puede que no pase mucho tiempo antes de que le pidamos a la IA (como ChatGPT) que consulte datos de una cadena de bloques y ofrezca su análisis.
Una forma de pensar en los “datos” en el contexto de la Web3 es a través de la lente de Google Maps. El GPS existe al menos desde la década de 1980. Google hizo el trabajo necesario para mapear el mundo. Al hacer que las superposiciones de mapas estén disponibles para aplicaciones de terceros (mediante API), la empresa permitió crear una nueva generación de aplicaciones. Todo, desde la entrega hasta el transporte compartido, prosperó porque un solo jugador especializado en datos asumió esa carga de los desarrolladores.
Los productos de datos en Web3 desempeñarán un papel similar. Todavía no conocemos la naturaleza exacta de las aplicaciones que podrían construirse sobre este recurso disponible públicamente, pero cada vez es más evidente que existe una oportunidad del tamaño de Alphabet dentro del panorama de los datos.