Cet article a été publié à l'origine sur Decentralised.co. Le GCR vous propose deux fois par mois - un jeudi sur deux - des textes longs de Décentralisé. Les dirigeants de plus de 200 entreprises font confiance à Decentralised.co pour se tenir au courant des tendances, des données et des idées qui comptent. Inscrivez-vous à leur lettre d'information ci-dessous - plus d'informations sur cette collaboration pour nos membres les plus actifs sur Discord.
Bonjour à tous,
Nous avons écrit un pré-curseur à cet article le 18 juillet si vous souhaitez un contexte qui va au-delà de ce qui est écrit ici.
Tous les êtres vivants conservent des traces de leur passage. Les animaux suivent les saisons pour savoir quand chasser. Les rongeurs et les oiseaux stockent leur nourriture dans des endroits uniques. Ils doivent se souvenir de l'endroit où ils l'ont stocké lorsqu'ils y accèdent pour se nourrir des mois plus tard. Les loups créent des marques autour du périmètre de leur territoire pour indiquer aux autres animaux qu'ils ne doivent pas s'en approcher. Même les arbres gardent la notion du temps. Chaque année, un anneau se forme dans les troncs. On peut estimer l'âge d'un arbre en se basant sur le nombre de cernes.
Bien que les arbres et les animaux gardent la trace du temps, ils ne peuvent pas retrouver ou raconter le passé. Ils n'ont pas accès à la mémoire. C'est ce qui différencie l'archivage humain. Grâce à nos capacités de communication, nous savons que les Sumériens de Mésopotamie (3400 avant notre ère) et les Égyptiens de l'Antiquité (3200 avant notre ère) utilisaient l'écriture cunéiforme et les hiéroglyphes pour enregistrer des informations.
L'humanité a évolué lorsque le savoir a pu être transmis sans que la source ne soit physiquement impliquée. Nous lisons et apprécions les œuvres de Platon ou de Socrate longtemps après leur disparition parce que nous avons les moyens de stocker leurs enseignements. L'écriture était la plateforme AR originale.
Écrire depuis l'Iran pour suivre l'évolution des céréales. Source : Lien
Là où l'écriture laissait place à l'imagination, les données permettaient de rester objectif. Il a réduit la nécessité pour les individus de stocker des choses dans leur mémoire. C'est en partie pour cette raison que certains des textes humains les plus anciens concernent des dettes, des revenus ou des échanges commerciaux.
À l'ère post-industrielle, les entreprises ont construit des fossés concurrentiels pour renforcer leur position sur le marché en numérisant leurs registres de vente. L'entreprise indienne Asian Paints en est un exemple. Leur peinture n'est peut-être pas la meilleure du marché, mais ils contrôlent plus de 50 % des parts de marché de l'industrie indienne de la peinture, qui pèse 8 milliards de dollars.
Pourquoi ? La réponse la plus simple est qu'il s'agit d'une marque connue de tous et que l'entreprise réalise des économies d'échelle. Mais la manière dont ils y sont parvenus est basée sur des données. Ils ont investi massivement dans la collecte et le traitement de données afin d'optimiser leur chaîne d'approvisionnement.
À titre de comparaison, l'action Asian Paints a enregistré un taux de croissance annuel moyen de 25 % au cours des 30 dernières années. Cette croissance a été soutenue par un investissement dans un ordinateur central dans les années 1970. L'appareil était plus puissant que ceux utilisés dans les meilleures organisations de recherche en Inde à l'époque. Elle a recueilli des données horaires sur la couleur et la quantité de peinture vendue en Inde. Cela a permis à Asian Paints de construire un modèle qui prédit la demande de peinture dans toute l'Inde avec une précision de 98 %.
Ce pouvoir prédictif a permis à Asian Paints d'obtenir une valeur maximale, car elle a pu réduire considérablement ses délais de réapprovisionnement. À l'époque, la norme pour la vente de produits tels que les peintures consistait à les vendre à un grossiste, qui les remettait ensuite à un distributeur, qui les vendait à son tour à un revendeur. Le distributeur interagit directement avec le consommateur. La raison d'une chaîne d'approvisionnement aussi complexe était que chaque partie détenait un inventaire des actifs et contrôlait les données relatives à l'offre et à la demande de peinture.
M. Choksey, fondateur d'Asian Paints, a supprimé les grossistes et les distributeurs de la chaîne d'approvisionnement en étudiant les habitudes de consommation de l'utilisateur final et en réduisant la dépendance à l'égard des intermédiaires. En supprimant les intermédiaires, Asian Paints s'est emparé de 97 % du prix de vente conseillé (3 % pour les revendeurs), contre 60 % pour ses concurrents.
La valeur extraite du télégraphe serait les bandes de téléscripteurs de la course à l'avant relayées par le télégraphe.
Le passage au numérique ne s'est pas fait du jour au lendemain. Ce qui rendait la collecte de données intéressante, c'était en partie le monde de la finance et la façon dont il était peu à peu interconnecté. Par exemple, à la fin du XXe siècle, les données boursières étaient transmises par télégraphe à l'aide d'appareils tels que celui présenté ci-dessus. Dès 1835, les commerçants dressaient des pigeons pour qu'ils transportent des bouts de papier contenant des informations sur ce qui se passait en Europe. Lorsque les bateaux à vapeur transportant des marchandises s'approchaient à moins de 80 km de la terre, les pigeons s'envolaient vers des endroits désignés pour transmettre les informations. Les traders avaient l'habitude de payer jusqu'à 500 dollars pour chaque heure d'avance où ils pouvaient obtenir les informations.
Dès 1867, les commerçants ont commencé à rivaliser pour optimiser la vitesse de transmission des informations par le télégraphe. Un employé de Western Union nommé E. A Calahan a payé plus de 200 000 dollars à la Bourse de New York pour avoir la possibilité d'envoyer des employés sur leur parquet afin de relayer les données des téléscripteurs à ses clients. L'une des personnes qui a travaillé avec diligence à l'optimisation du système était un jeune scientifique nommé Thomas Alva Edison. Un siècle plus tard, des outils tels que le terminal Bloomberg allaient augmenter de façon exponentielle le rythme et la quantité de données financières relayées chaque jour.
Les données, comme le pétrole brut, doivent subir plusieurs étapes de raffinage avant de pouvoir être utilisées. Apprendre comment Bloomberg s'est développé nous éclaire sur l'évolution de l'ensemble du paysage des données et sur le processus à suivre. Bloomberg n'a pas été la première tentative d'utiliser la technologie pour améliorer les mécanismes de négociation et d'information. Le NASDAQ utilisait les terminaux Bunker Ramo pour diffuser des informations et passer des ordres d'achat et de vente. Toutefois, le fait de s'appuyer sur les anciens réseaux de communication téléphonique signifiait que l'extension de ce modèle serait toujours un défi.
Source - NASDAQ - L'évolution de la négociation automatisée de gré à gré
En 1981, Michael Bloomberg, associé de la banque d'investissement Solomon Brothers, a été licencié avec 10 millions de dollars pour ses actions lorsque Phibro Corporation a racheté la banque. Il s'est rendu compte que les investisseurs sont prêts à payer pour des informations financières rationalisées, compte tenu de l'électronisation croissante des marchés financiers, de New York au Japon. Il a créé une société de services de données appelée Innovative Market System, rebaptisée Bloomberg en 1986.
Avant que l'internet ne prenne son essor, l'accès au terminal Bloomberg s'effectuait à l'aide du Chiclet. Celui-ci était relié au contrôleur Bloomberg par un câble spécial connecté au concentrateur local via des lignes téléphoniques dédiées. Bloomberg a recueilli des données par le biais de partenariats, d'agences de presse et de communiqués de presse, de méthodes exclusives telles que la saisie manuelle de données et la collecte de données par téléphone.
Avec l'internet, les vannes de l'information se sont ouvertes. Aujourd'hui, Bloomberg fournit, traite et délivre 200 milliards d'informations financières en temps quasi réel. Cela représente environ 23 millions de points de données par seconde. Certaines des informations disponibles sur Bloomberg sont publiques. Des données telles que les états financiers des entreprises et les cours des actions et des obligations peuvent être trouvées sur des forums publics.
Mais qu'en est-il si vous êtes un analyste du pétrole et du gaz et que vous souhaitez comprendre les mouvements des conteneurs de pétrole brut ? Il est peu probable que vous obteniez ces informations en temps réel si vous ne vous abonnez pas à une source de données telle que Bloomberg. Toutes les données présentes sur l'internet ne sont pas librement accessibles.
Dans le Web2, les individus sont généralement confrontés à deux contraintes en matière de données : l'accès avec autorisation et une barrière élevée pour le traitement de grandes quantités de données. Au fil des ans, des fournisseurs comme Bloomberg ont créé des effets de réseau suffisamment puissants pour s'approvisionner en données par l'intermédiaire de leurs affiliés, ce que les analystes ou les investisseurs ne peuvent pas se permettre de faire.
Il vaut mieux payer 20 000 dollars à Bloomberg pour un abonnement annuel que d'essayer d'obtenir les données à partir d'un mélange de plateformes de données qui peuvent chacune avoir des niveaux de prix différents. Même si vous vous acharnez à mettre la main sur les données, vous ne pouvez pas les traiter et les analyser en temps réel sans dépenser des sommes considérables pour l'infrastructure. Dans le secteur de la vente au détail, de nombreuses plateformes qui ont fini par s'étendre étaient des moteurs d'appariement de données.
Pensez-y de la manière suivante : Google (le moteur de recherche) est une société de données qui offre aux entreprises l'accès aux utilisateurs en échange de publicité. Lorsqu'un restaurant ou une lettre d'information (comme la nôtre) souhaite cibler les utilisateurs qui recherchent des informations sur Google, ils font correspondre l'offre et la demande d'informations similaires. Quelqu'un qui cherche des informations sur une lettre d'information spécifique à Web3 s'adresse à nous. Et nous sommes à la recherche de cette personne. (Je résiste à l'envie de parler de notre programme de parrainage).
Google a construit un monopole grâce à l'économie d'échelle dans laquelle il fonctionne. Leur inventaire d'utilisateurs et le nombre de requêtes qu'ils effectuent chaque jour restent inégalés. Google a construit cette position en lançant un moteur de recherche sans publicité à une époque où les publicités étaient la norme, puis en acquérant YouTube et Android, et enfin en payant des pairs comme Apple pour faire de Google le moteur de recherche par défaut. Rien que pour Apple, Google paie 20 milliards de dollars par an pour rester le moteur de recherche par défaut de Safari.
Google paie cette prime parce qu'il s'agit essentiellement d'un moteur de recherche. Le moteur de mise en relation met les utilisateurs ayant un besoin en contact avec les entreprises qui proposent une offre. La plupart des monopoles du web sont, à la base, des moteurs de recherche. Amazon met en relation les vendeurs de produits et les acheteurs. Instagram met en relation un public et des créateurs. Ces moteurs de correspondance fonctionnent parce que les interactions sur ces produits laissent de riches traces à partir desquelles le contexte peut être déterminé.
Ben Evans a écrit en 2022 que les données n' existent pas. Connaître mes préférences en matière de contenu, d'alimentation ou de voyage n'a pas beaucoup de valeur pour un tiers. Elles ne prennent de la valeur - pour le commerce ou la recherche - que lorsqu'elles sont agrégées ou enrichies d'un contexte.
Contexte dans le sens où mes préférences pour manger du biriyani un vendredi soir pourraient être utilisées pour annoncer la livraison de biriyani au moment précis où la probabilité que je l'achète est la plus élevée. Dans l'ensemble, la comparaison de la probabilité de mon achat avec celui d'un homologue de la même région permet de mieux cibler les utilisateurs.
Pour être utiles, les données ont besoin d'une échelle (de grands nombres) ou d'un contexte. Les produits Web3 et Web2 se distinguent historiquement par les traces qu'ils laissent. Seul Amazon sait combien de manettes Xbox seront vendues au cours d'une semaine donnée. Mais vous pouvez voir les schémas selon lesquels les traders achètent ou vendent des NFT sur OpenSea n'importe quel jour. La raison en est que chacune de ces transactions laisse une trace publique.
Les produits de données dans Web3 utilisent ces pistes pour créer un contexte.
Les blockchains comme Ethereum et Bitcoin produisent des blocs toutes les 12 secondes et ~10 minutes, respectivement. Chaque bloc contient des transactions qui modifient l'état de la blockchain. Les explorateurs de blocs comme Etherscan capturent les données relatives à toutes les transactions. Par exemple, si vous allez sur Etherscan et que vous voyez un bloc, l'image ci-dessous est ce que vous pouvez voir.
Les transactions sur la blockchain sont riches en contexte. Des produits comme Arkham et Nansen sont des moteurs d'interprétation permettant aux chercheurs de comprendre ce qui se passe lors d'une transaction.
Vous pouvez consulter tous les blocs depuis la création d'Ethereum. Mais que pouvez-vous faire de ces informations ? Presque rien. Vous devez donc trouver un moyen de capturer ces données dans plusieurs tableaux. Par exemple, lorsqu'un contrat NFT d'une place de marché est appelé dans un bloc, les données relatives à cette transaction doivent être ajoutées aux tables liées au NFT, ou lorsqu'un contrat Uniswap est appelé, les données correspondantes doivent être stockées dans les tables liées au DEX. (Dune rend ce service).
Vous ne pouvez pas analyser les données brutes sans encourir des coûts d'infrastructure importants. Ainsi, bien que les données soient librement accessibles, vous rencontrez les mêmes problèmes. En tant qu'investisseur ou créateur de dApp, vous vous appuyez sur des données externes. Mais votre fonction principale n'est pas liée à la collecte et à la gestion de données. Dépenser des ressources pour des activités essentielles mais non fondamentales n'est pas un luxe que toutes les organisations peuvent s'offrir.
Pour les produits de données, le contexte autour des données rend le produit unique. Bloomberg applique ses connaissances financières et transforme les données sous une forme que les inventeurs et les négociants peuvent facilement utiliser. Des sites web comme Similarweb ou des publications de recherche comme Newzoo utilisent leurs compétences de base pour appliquer un contexte social ou lié au jeu aux données qu'ils suivent.
Les produits de données natifs de la blockchain se différencient en fournissant un contexte utilisateur grâce à des requêtes qui répondent à des questions pertinentes pour des sous-ensembles d'utilisateurs spécifiques. Par exemple, TokenTerminal calcule les fondamentaux économiques des protocoles. Nansen aide les acteurs du marché à étiqueter et à comprendre les mouvements d'actifs. Parsec interroge les données de la chaîne pour aider les traders à mieux analyser les positions de DeFi.
Tous ces produits fonctionnent grâce à un bien public : les données de la chaîne. La différence réside dans la manière dont ces produits présentent leurs données, ce qui les rend attrayants pour des publics différents.
Dans notre secteur, la répartition des catégories de produits est basée sur les données qui entrent dans la chaîne et sur les informations qui sont dérivées de sources extérieures à la chaîne. (Certains utilisent souvent les deux). Les fournisseurs de données utilisent leurs filtres contextuels pour créer des produits. Tout comme les données du Web2 ont leurs niches, les entreprises de données du Web3 ont construit ou construisent progressivement des fossés en utilisant leurs compétences de base.
Ainsi, les antécédents des fondateurs déterminent souvent la nature des produits mis sur le marché. Lorsqu'une équipe de base a passé beaucoup de temps sur les marchés des capitaux avant la cryptographie, ses produits ont tendance à imiter Bloomberg, alors que les produits nés de la cryptographie ressemblent à Nansen. Différents produits répondent à des besoins différents, même lorsqu'il s'agit d'interroger les mêmes données.
Par exemple, les échanges éliminent généralement les données après des intervalles fixes. Elles ne sont pas actives dans le domaine des données, et le stockage d'anciennes données nécessite des serveurs et une gestion supplémentaires. Certains fournisseurs de données, comme Kaiko et Amberdata, conservent les données historiques des carnets d'ordres des bourses. Ces données permettent aux traders et aux investisseurs de construire des modèles pour tester leurs hypothèses. Mais si vous voulez comprendre quels contrats DeFi sont touchés par un afflux d'ETH ou de stablecoins ou analyser le comportement sur la chaîne d'adresses ou d'entités spécifiques, vous aurez besoin d'un produit de Nansen ou d'Arkham.
La carte du marché n'est pas représentative de tous les acteurs dans toutes les catégories.
Une façon de comprendre comment les produits ont été positionnés sur les marchés est d'examiner les profils des consommateurs de crypto-monnaies. Ces personas peuvent être classés dans les quatre catégories clés suivantes.
La plupart des dollars qui transitent par les produits de crypto-données proviennent d'institutions financières en période de marché baissier. Il s'agit de clients importants dont les cycles de vente sont plus longs et dont les exigences en matière de données sont beaucoup plus complexes. Pour savoir si un produit est orienté vers les institutions financières, il suffit que le client doive se soumettre à un appel de vente pour en connaître le coût. Dans le monde du Web2, vous ne pouvez pas savoir combien coûte PitchBook ou CB Insights. En crypto-monnaie, vous ne savez pas ce que coûterait un produit comme Chainalysis.
Blague à part, ce processus de vente s'explique en partie par le service de proximité offert par les produits de données destinés à ce segment de consommateurs. Ces utilisateurs optent généralement pour des données très granulaires et fréquentes. Ils ont besoin de données non seulement pour prendre des décisions avant les transactions, mais aussi pour les utiliser après les transactions afin de satisfaire aux exigences en matière de conformité et de fiscalité.
Par exemple, ils ont besoin de produits qui leur indiquent la valeur historique de leur portefeuille, qui les aident à calculer leurs impôts, etc. Des entreprises comme Amberdata, Kaiko, CoinMetrics, CryptoCompare et, dans une certaine mesure, Nansen, servent ces clients.
D'après mon expérience, seuls les fondateurs ayant travaillé dans des institutions ou les équipes ayant bénéficié d'un financement important ont été en mesure d'ouvrir le marché institutionnel des données. La barrière à l'entrée est relativement élevée, comme c'est le cas pour tout produit d'entreprise.
Nous rencontrons souvent la caractéristique de composabilité de Web3, qui signifie que les applications Web3 peuvent être interdépendantes. Ils pourraient se demander des données l'un à l'autre. Ils doivent donc constamment lire des données l'un de l'autre. Par exemple, une plateforme comme Yearn Finance doit lire les données d'Aave et de Compound, et un agrégateur de NFT comme Tensor doit lire les données de Magic Eden et d'autres places de marché.
Mais ces données sont stockées dans des blocs sur des chaînes comme Ethereum et Solana. Ethereum crée un bloc en 12 secondes, et Solana le fait en 400 ms. Trier les données de la blockchain dans des tableaux et les stocker pour un accès rapide est une tâche non triviale. C'est là que les indexeurs tels que Covalent, Graph, Chainlink et Powerloom entrent en jeu. Ils veillent à ce que les données brutes de la blockchain soient stockées dans le format souhaité afin que les développeurs puissent les récupérer via de simples appels d'API.
Un segment émergent de ce type de consommateur concerne les outils utilisés pour comprendre le comportement des utilisateurs. Par exemple, ARCx permet aux développeurs de mettre en correspondance des données hors chaîne (comme le comportement du navigateur) avec des données sur chaîne (comme les adresses des portefeuilles) afin d'obtenir des informations démographiques sur les utilisateurs qui interagissent avec une dApp. Ils occupent un créneau relativement restreint mais pertinent, car ils aident les développeurs à identifier leurs utilisateurs.
Les produits de données dans le domaine de la cryptographie sont souvent distribués en collaborant avec des chercheurs et des publications. CCData, par exemple, est souvent citée par Bloomberg. Les chercheurs sont incités à s'appuyer sur les produits de données, qui leur permettent de gagner du temps et d'économiser des efforts lors de la collecte, du nettoyage ou de la conservation des données. Des produits comme Dune ont construit un fossé en créant une communauté d'analystes qui rivalisent les uns avec les autres pour être mieux classés dans leur liste.
Des publications telles que The Block et Delphi présentent des tableaux de bord élaborés à partir de données provenant de fournisseurs tiers. Ici, à Decentralised.co, nous nous appuyons entièrement sur des fournisseurs de données externes, car ils permettent à l'équipe de rester légère tout en utilisant des ressources externes lors de la collecte des données.
La difficulté de répondre aux besoins de ce segment de consommateurs réside dans le fait que les petits chercheurs n'ont pas toujours le budget nécessaire pour justifier l'utilisation de ressources considérables afin de faire émerger des informations de niche qui peuvent n'être pertinentes que pour une seule personne. Inversement, les entreprises ont tout intérêt à consacrer des efforts et des ressources à des partenariats avec des publications importantes comme le Financial Times, car cela facilite la distribution.
Les produits destinés aux investisseurs de détail ont généralement une granularité et une fréquence de données plus faibles. Mais il s'agit de niches très rentables dans lesquelles il est possible de réaliser des économies d'échelle. Dix mille utilisateurs payant 100 dollars chacun représentent un chiffre d'affaires d'un million de dollars dans un monde où le taux de désabonnement n'existe pas. C'est plus facile à dire qu'à faire, mais ces considérations économiques expliquent pourquoi nous avons tant de produits de crypto-données orientés vers la vente au détail.
Une grande partie des produits destinés à la vente au détail sont gratuits ou soutenus par des publicités. Par exemple, une ressource gratuite comme DefiLlama ne vous dira pas comment acheminer votre ordre via différentes bourses (CEX et DEX) pour éviter les dérapages, car elle ne prend pas d'instantanés du carnet d'ordres, mais elle présente des informations sur les déblocages de jetons ou les déblocages de rendement.
L'un des changements dans ce segment de consommateurs est la façon dont le moyen de livraison ouvre une nouvelle catégorie de marché - par exemple, Cielo fournit des données sous forme de notifications par l'intermédiaire de Telegram. Il s'est étendu à plus de 40 000 utilisateurs en relayant des informations de manière facile à consommer pour un segment de consommateurs qui préfèrent ne pas avoir affaire à des interfaces de bureau. Lorsqu'ils sont bien utilisés, même les moyens de distribution peuvent être des facteurs de différenciation pour les entreprises en phase de démarrage. Même dans les données.
Bien que la classification soit parfois floue, les entreprises de données peuvent être divisées en orientations B2B ou B2C.
Des entreprises comme Amberdata et Kaiko proposent des produits destinés aux acteurs sophistiqués. Ces produits sont plus granulaires (détails dans lesquels les données sont disponibles) et plus fréquents (par ex. Ils répondent à des besoins tels que la construction et le test de modèles, l'analyse pré-négociation, le reporting post-négociation, la fiscalité et la conformité. Les données sont fournies dans un format qui permet aux clients d'effectuer des analyses propriétaires et de créer des visualisations à leur goût. Ces entreprises proposent généralement leurs produits derrière un mur payant.
Le coût est généralement fonction de la granularité due aux exigences de l'infrastructure, de la nature de la clientèle concernée et de la durée du cycle de vente.
L'image ci-dessus présente différents produits sur deux axes - la profondeur et la granularité par rapport aux prix des produits. Veuillez noter que ces tracés ne sont pas exacts. Quelques points peuvent être déplacés. L'idée est de développer un modèle mental pour réfléchir à plusieurs produits et à leur position sur le marché.
Des produits axés sur le commerce de détail comme Dune ou CoinGecko affichent gratuitement la quasi-totalité des données. Les clients doivent payer pour accéder à certaines données ou s'ils souhaitent obtenir des données via des API pour effectuer leurs analyses. Par exemple, vous pouvez visualiser tous les graphiques créés par plusieurs assistants Dune, mais ils limitent le nombre de lignes que vous pouvez télécharger au format CSV. Vous pouvez télécharger des fichiers CSV plus volumineux et consulter des requêtes privées lorsque vous payez davantage.
Les entreprises axées sur la vente au détail ont tendance à avoir un faible revenu par client et peu de clients payants par rapport aux utilisateurs gratuits. Comparez cela aux taux de conversion des modèles freemium des sociétés Internet. En général, le taux de conversion est de 2%–5%. Un taux de conversion de 10 % serait une aberration. Leur stratégie consiste à avoir autant de clients gratuits que possible afin qu'un taux de conversion de 4 % contribue de manière significative au chiffre d'affaires. C'est ce que nous appelons le haut de l'entonnoir.
Les entreprises de données ont donc besoin que le haut de l'entonnoir soit suffisamment important pour générer assez de revenus pour se maintenir avec un taux de conversion plus faible. Les entreprises peuvent également envisager de générer des revenus à partir de publicités lorsque le site est très fréquenté. CoinGecko utilise les revenus publicitaires comme levier pour continuer à fournir la plupart des données gratuitement.
Au fil des ans, les entreprises ont occupé les deux extrémités du spectre (B2B et B2C), laissant quelques vides entre les deux. Si quelqu'un veut voir comment les carnets d'ordres évoluent dans les bourses centralisées ou comment les ratios put call, les IV et les skews changent, il n'y a pas beaucoup de produits qui aident à la visualisation. Il y a de la place pour un produit plus granulaire que les CoinGeckos du monde, mais moins granulaire que les produits des pure players B2B.
Il n'est pas facile de trouver des marges de manœuvre dans les entreprises où la matière première est gratuite. Les données de la blockchain sont librement accessibles. Il n'y a rien de propriétaire dans les données que vous pouvez collecter. Ainsi, les fossés dans les entreprises de données ne reposent pas uniquement sur le fait que vous possédez des données que d'autres n'ont pas. Ils sont plutôt basés sur la capacité d'une équipe à fournir les données dans un format perspicace et consommable, dans les délais et sans erreurs.
De nombreuses entreprises prétendent disposer des mêmes données, mais la qualité des données et leur présentation diffèrent. Par exemple, de nombreuses entreprises prétendent disposer de données sur le carnet de commandes hors chaîne. Toutefois, des facteurs tels que le nombre d'ordres d'achat et de vente, la longueur des séries chronologiques et le nombre de bourses et de paires disponibles diffèrent d'un fournisseur à l'autre. Amberdata et Kaiko disposent des données les plus complètes sur le carnet d'ordres des marchés cryptographiques.
Pourquoi, cependant, seuls quelques fournisseurs peuvent-ils fournir ce type de données ? C'est là que se trouve l'explication de l'apparition de fossés dans les données Web3.
Talent - Au risque d'énoncer une évidence, lorsque la matière première est gratuite, la façon dont vous la moulez détermine la valeur du produit. Transformer des données brutes en informations utiles nécessite une expertise dans de nombreuses niches au sein des marchés financiers cryptographiques et traditionnels. Les équipes comme Velo Data, qui ont l'expérience des marchés traditionnels, ont une longueur d'avance sur les autres équipes qui tentent de créer des produits B2C similaires. Il est rare de trouver des développeurs talentueux qui comprennent les structures de données de la blockchain et qui ont une expérience pertinente des marchés financiers.
Infrastructure - La collecte et la fourniture de grandes quantités de données nécessitent une infrastructure qui n'est pas facile à mettre en place. Ce type d'opération nécessite des capitaux et des talents. Pourquoi l'infrastructure est-elle un fossé ? Pensez aux données du pool de mémoire. Les blocs contiennent des données relatives aux transactions confirmées. Qu'en est-il des transactions non confirmées ?
Différents nœuds du réseau (par exemple, des nœuds connectés au même pool) voient différentes transactions non confirmées. L'exécution d'un seul nœud ne permet pas d'obtenir une vue d'ensemble des transactions concurrentes. Le maintien de plusieurs nœuds sur plusieurs blockchains augmente les coûts d'infrastructure. Comme pour l'IA (et les réseaux de contenu dans le passé), la capacité à maintenir les coûts de matériel à un niveau bas tout en augmentant l'échelle déterminera les gagnants et les perdants du secteur au fil du temps.
Effets de réseau - On peut supposer que des effets de réseau existent dans de nombreux produits de crypto-données. Prenez l'exemple de Chainlink. Il s'agit de l'un des premiers oracles permettant aux applications de lire des données provenant d'autres applications ou chaînes. Il a réussi à obtenir le soutien de la communauté et possède l'une des communautés les plus fortes. Un autre exemple est celui de Nansen. Son titre de gloire était les étiquettes d'adresses qui lui permettaient d'attribuer les mouvements d'actifs à des entités réelles plutôt qu'à des adresses hexanumériques.
Par la suite, elle a lancé des fonctionnalités telles que NFT Paradise et Token God Mode, permettant aux utilisateurs de suivre les NFT et les jetons de manière plus efficace. Arkham a lancé un produit similaire aux labels de Nansen, mais les investissements dans les tableaux de bord et la recherche ont permis à Nansen de s'orienter vers les entreprises clientes et de leur proposer des produits adaptés. Il convient de mentionner que les effets de réseau ne sont pas possibles sans les deux premiers points (talent et infrastructure).
Cela fonctionne notamment avec les indexeurs. Plus le nombre de chaînes prises en charge par un produit est élevé, plus la probabilité qu'un développeur utilise le produit au lieu de s'appuyer sur de multiples sources est grande. Des équipes comme Covalent ont un avantage dans ce domaine, car elles ont optimisé l'étendue des chaînes prises en charge depuis un certain temps. Mais n'oubliez pas que la profondeur est aussi importante que l'étendue.
Il est trop tôt pour dire si un produit possède un fossé significatif dans le domaine des crypto-monnaies. Nous avons été témoins de l'avantage des pionniers dans le grand ordre des choses. À mesure que des catégories telles que le Web3 social et le chevauchement entre l'IA et les crypto-monnaies continuent de se développer, les produits de données du secteur pourraient devenir le prochain Alphabet. Mais il s'agira d'une histoire qui s'étendra sur plusieurs décennies ; nous n'en sommes qu'aux premières années.
De nombreux cas d'utilisation mentionnés dans cet article concernent la spéculation financière sous une forme ou une autre. Même les développeurs qui utilisent les API pour interroger les données créent des produits financiers. Cela peut sembler étrange, mais les blockchains (en tant que nouveau réseau) suivent la même tendance que le télégraphe et l'internet.
L'arrivée d'un nouveau support et l'émergence d'un nouveau réseau accélèrent les cas d'utilisation financière. Avec l'internet, il a fallu attendre le début des années 2000 pour que l'on se rende compte que les utilisateurs pouvaient être ciblés en fonction de leur localisation. Avec les blockchains, nous sommes encore en train de comprendre comment construire des modèles commerciaux à partir de pistes de données accessibles au public.
Nous avons constaté un changement majeur dans notre utilisation quotidienne de ces plateformes : Dune Analytics a intégré l'IA dans son produit. Dune fournit une interface SQL permettant aux utilisateurs d'interroger les données des blockchains telles qu'Ethereum et Solana. Le marché de ce produit est généralement limité aux utilisateurs qui savent comment écrire des requêtes SQL. Ils ont récemment commencé à utiliser l'IA pour aider les analystes à générer des requêtes sans être des experts en SQL. Il n'est pas aussi fonctionnel qu'on le souhaiterait. Mais il s'agit toujours d'un pas vers l'avenir. Il ne faudra peut-être pas attendre longtemps avant que nous demandions à l'IA (comme ChatGPT) d'interroger les données d'une blockchain et de proposer son analyse.
Une façon d'envisager les "données" dans le contexte du Web3 est de les considérer sous l'angle de Google Maps. Le GPS existe depuis au moins les années 1980. Google a effectué le travail nécessaire pour cartographier le monde. En mettant les superpositions de cartes à la disposition d'applications tierces (à l'aide d'API), l'entreprise a permis la création d'une nouvelle génération d'applications. Tout ce qui va de la livraison au covoiturage a connu un essor considérable parce qu'un acteur unique spécialisé dans les données a pris en charge cette charge des développeurs.
Les produits de données de Web3 sont appelés à jouer un rôle similaire. Nous ne connaissons pas encore la nature exacte des applications qui pourraient être créées à partir de cette ressource publique, mais il devient évident qu'il existe une opportunité de la taille d'Alphabet dans le paysage des données.
Cet article a été publié à l'origine sur Decentralised.co. Le GCR vous propose deux fois par mois - un jeudi sur deux - des textes longs de Décentralisé. Les dirigeants de plus de 200 entreprises font confiance à Decentralised.co pour se tenir au courant des tendances, des données et des idées qui comptent. Inscrivez-vous à leur lettre d'information ci-dessous - plus d'informations sur cette collaboration pour nos membres les plus actifs sur Discord.
Bonjour à tous,
Nous avons écrit un pré-curseur à cet article le 18 juillet si vous souhaitez un contexte qui va au-delà de ce qui est écrit ici.
Tous les êtres vivants conservent des traces de leur passage. Les animaux suivent les saisons pour savoir quand chasser. Les rongeurs et les oiseaux stockent leur nourriture dans des endroits uniques. Ils doivent se souvenir de l'endroit où ils l'ont stocké lorsqu'ils y accèdent pour se nourrir des mois plus tard. Les loups créent des marques autour du périmètre de leur territoire pour indiquer aux autres animaux qu'ils ne doivent pas s'en approcher. Même les arbres gardent la notion du temps. Chaque année, un anneau se forme dans les troncs. On peut estimer l'âge d'un arbre en se basant sur le nombre de cernes.
Bien que les arbres et les animaux gardent la trace du temps, ils ne peuvent pas retrouver ou raconter le passé. Ils n'ont pas accès à la mémoire. C'est ce qui différencie l'archivage humain. Grâce à nos capacités de communication, nous savons que les Sumériens de Mésopotamie (3400 avant notre ère) et les Égyptiens de l'Antiquité (3200 avant notre ère) utilisaient l'écriture cunéiforme et les hiéroglyphes pour enregistrer des informations.
L'humanité a évolué lorsque le savoir a pu être transmis sans que la source ne soit physiquement impliquée. Nous lisons et apprécions les œuvres de Platon ou de Socrate longtemps après leur disparition parce que nous avons les moyens de stocker leurs enseignements. L'écriture était la plateforme AR originale.
Écrire depuis l'Iran pour suivre l'évolution des céréales. Source : Lien
Là où l'écriture laissait place à l'imagination, les données permettaient de rester objectif. Il a réduit la nécessité pour les individus de stocker des choses dans leur mémoire. C'est en partie pour cette raison que certains des textes humains les plus anciens concernent des dettes, des revenus ou des échanges commerciaux.
À l'ère post-industrielle, les entreprises ont construit des fossés concurrentiels pour renforcer leur position sur le marché en numérisant leurs registres de vente. L'entreprise indienne Asian Paints en est un exemple. Leur peinture n'est peut-être pas la meilleure du marché, mais ils contrôlent plus de 50 % des parts de marché de l'industrie indienne de la peinture, qui pèse 8 milliards de dollars.
Pourquoi ? La réponse la plus simple est qu'il s'agit d'une marque connue de tous et que l'entreprise réalise des économies d'échelle. Mais la manière dont ils y sont parvenus est basée sur des données. Ils ont investi massivement dans la collecte et le traitement de données afin d'optimiser leur chaîne d'approvisionnement.
À titre de comparaison, l'action Asian Paints a enregistré un taux de croissance annuel moyen de 25 % au cours des 30 dernières années. Cette croissance a été soutenue par un investissement dans un ordinateur central dans les années 1970. L'appareil était plus puissant que ceux utilisés dans les meilleures organisations de recherche en Inde à l'époque. Elle a recueilli des données horaires sur la couleur et la quantité de peinture vendue en Inde. Cela a permis à Asian Paints de construire un modèle qui prédit la demande de peinture dans toute l'Inde avec une précision de 98 %.
Ce pouvoir prédictif a permis à Asian Paints d'obtenir une valeur maximale, car elle a pu réduire considérablement ses délais de réapprovisionnement. À l'époque, la norme pour la vente de produits tels que les peintures consistait à les vendre à un grossiste, qui les remettait ensuite à un distributeur, qui les vendait à son tour à un revendeur. Le distributeur interagit directement avec le consommateur. La raison d'une chaîne d'approvisionnement aussi complexe était que chaque partie détenait un inventaire des actifs et contrôlait les données relatives à l'offre et à la demande de peinture.
M. Choksey, fondateur d'Asian Paints, a supprimé les grossistes et les distributeurs de la chaîne d'approvisionnement en étudiant les habitudes de consommation de l'utilisateur final et en réduisant la dépendance à l'égard des intermédiaires. En supprimant les intermédiaires, Asian Paints s'est emparé de 97 % du prix de vente conseillé (3 % pour les revendeurs), contre 60 % pour ses concurrents.
La valeur extraite du télégraphe serait les bandes de téléscripteurs de la course à l'avant relayées par le télégraphe.
Le passage au numérique ne s'est pas fait du jour au lendemain. Ce qui rendait la collecte de données intéressante, c'était en partie le monde de la finance et la façon dont il était peu à peu interconnecté. Par exemple, à la fin du XXe siècle, les données boursières étaient transmises par télégraphe à l'aide d'appareils tels que celui présenté ci-dessus. Dès 1835, les commerçants dressaient des pigeons pour qu'ils transportent des bouts de papier contenant des informations sur ce qui se passait en Europe. Lorsque les bateaux à vapeur transportant des marchandises s'approchaient à moins de 80 km de la terre, les pigeons s'envolaient vers des endroits désignés pour transmettre les informations. Les traders avaient l'habitude de payer jusqu'à 500 dollars pour chaque heure d'avance où ils pouvaient obtenir les informations.
Dès 1867, les commerçants ont commencé à rivaliser pour optimiser la vitesse de transmission des informations par le télégraphe. Un employé de Western Union nommé E. A Calahan a payé plus de 200 000 dollars à la Bourse de New York pour avoir la possibilité d'envoyer des employés sur leur parquet afin de relayer les données des téléscripteurs à ses clients. L'une des personnes qui a travaillé avec diligence à l'optimisation du système était un jeune scientifique nommé Thomas Alva Edison. Un siècle plus tard, des outils tels que le terminal Bloomberg allaient augmenter de façon exponentielle le rythme et la quantité de données financières relayées chaque jour.
Les données, comme le pétrole brut, doivent subir plusieurs étapes de raffinage avant de pouvoir être utilisées. Apprendre comment Bloomberg s'est développé nous éclaire sur l'évolution de l'ensemble du paysage des données et sur le processus à suivre. Bloomberg n'a pas été la première tentative d'utiliser la technologie pour améliorer les mécanismes de négociation et d'information. Le NASDAQ utilisait les terminaux Bunker Ramo pour diffuser des informations et passer des ordres d'achat et de vente. Toutefois, le fait de s'appuyer sur les anciens réseaux de communication téléphonique signifiait que l'extension de ce modèle serait toujours un défi.
Source - NASDAQ - L'évolution de la négociation automatisée de gré à gré
En 1981, Michael Bloomberg, associé de la banque d'investissement Solomon Brothers, a été licencié avec 10 millions de dollars pour ses actions lorsque Phibro Corporation a racheté la banque. Il s'est rendu compte que les investisseurs sont prêts à payer pour des informations financières rationalisées, compte tenu de l'électronisation croissante des marchés financiers, de New York au Japon. Il a créé une société de services de données appelée Innovative Market System, rebaptisée Bloomberg en 1986.
Avant que l'internet ne prenne son essor, l'accès au terminal Bloomberg s'effectuait à l'aide du Chiclet. Celui-ci était relié au contrôleur Bloomberg par un câble spécial connecté au concentrateur local via des lignes téléphoniques dédiées. Bloomberg a recueilli des données par le biais de partenariats, d'agences de presse et de communiqués de presse, de méthodes exclusives telles que la saisie manuelle de données et la collecte de données par téléphone.
Avec l'internet, les vannes de l'information se sont ouvertes. Aujourd'hui, Bloomberg fournit, traite et délivre 200 milliards d'informations financières en temps quasi réel. Cela représente environ 23 millions de points de données par seconde. Certaines des informations disponibles sur Bloomberg sont publiques. Des données telles que les états financiers des entreprises et les cours des actions et des obligations peuvent être trouvées sur des forums publics.
Mais qu'en est-il si vous êtes un analyste du pétrole et du gaz et que vous souhaitez comprendre les mouvements des conteneurs de pétrole brut ? Il est peu probable que vous obteniez ces informations en temps réel si vous ne vous abonnez pas à une source de données telle que Bloomberg. Toutes les données présentes sur l'internet ne sont pas librement accessibles.
Dans le Web2, les individus sont généralement confrontés à deux contraintes en matière de données : l'accès avec autorisation et une barrière élevée pour le traitement de grandes quantités de données. Au fil des ans, des fournisseurs comme Bloomberg ont créé des effets de réseau suffisamment puissants pour s'approvisionner en données par l'intermédiaire de leurs affiliés, ce que les analystes ou les investisseurs ne peuvent pas se permettre de faire.
Il vaut mieux payer 20 000 dollars à Bloomberg pour un abonnement annuel que d'essayer d'obtenir les données à partir d'un mélange de plateformes de données qui peuvent chacune avoir des niveaux de prix différents. Même si vous vous acharnez à mettre la main sur les données, vous ne pouvez pas les traiter et les analyser en temps réel sans dépenser des sommes considérables pour l'infrastructure. Dans le secteur de la vente au détail, de nombreuses plateformes qui ont fini par s'étendre étaient des moteurs d'appariement de données.
Pensez-y de la manière suivante : Google (le moteur de recherche) est une société de données qui offre aux entreprises l'accès aux utilisateurs en échange de publicité. Lorsqu'un restaurant ou une lettre d'information (comme la nôtre) souhaite cibler les utilisateurs qui recherchent des informations sur Google, ils font correspondre l'offre et la demande d'informations similaires. Quelqu'un qui cherche des informations sur une lettre d'information spécifique à Web3 s'adresse à nous. Et nous sommes à la recherche de cette personne. (Je résiste à l'envie de parler de notre programme de parrainage).
Google a construit un monopole grâce à l'économie d'échelle dans laquelle il fonctionne. Leur inventaire d'utilisateurs et le nombre de requêtes qu'ils effectuent chaque jour restent inégalés. Google a construit cette position en lançant un moteur de recherche sans publicité à une époque où les publicités étaient la norme, puis en acquérant YouTube et Android, et enfin en payant des pairs comme Apple pour faire de Google le moteur de recherche par défaut. Rien que pour Apple, Google paie 20 milliards de dollars par an pour rester le moteur de recherche par défaut de Safari.
Google paie cette prime parce qu'il s'agit essentiellement d'un moteur de recherche. Le moteur de mise en relation met les utilisateurs ayant un besoin en contact avec les entreprises qui proposent une offre. La plupart des monopoles du web sont, à la base, des moteurs de recherche. Amazon met en relation les vendeurs de produits et les acheteurs. Instagram met en relation un public et des créateurs. Ces moteurs de correspondance fonctionnent parce que les interactions sur ces produits laissent de riches traces à partir desquelles le contexte peut être déterminé.
Ben Evans a écrit en 2022 que les données n' existent pas. Connaître mes préférences en matière de contenu, d'alimentation ou de voyage n'a pas beaucoup de valeur pour un tiers. Elles ne prennent de la valeur - pour le commerce ou la recherche - que lorsqu'elles sont agrégées ou enrichies d'un contexte.
Contexte dans le sens où mes préférences pour manger du biriyani un vendredi soir pourraient être utilisées pour annoncer la livraison de biriyani au moment précis où la probabilité que je l'achète est la plus élevée. Dans l'ensemble, la comparaison de la probabilité de mon achat avec celui d'un homologue de la même région permet de mieux cibler les utilisateurs.
Pour être utiles, les données ont besoin d'une échelle (de grands nombres) ou d'un contexte. Les produits Web3 et Web2 se distinguent historiquement par les traces qu'ils laissent. Seul Amazon sait combien de manettes Xbox seront vendues au cours d'une semaine donnée. Mais vous pouvez voir les schémas selon lesquels les traders achètent ou vendent des NFT sur OpenSea n'importe quel jour. La raison en est que chacune de ces transactions laisse une trace publique.
Les produits de données dans Web3 utilisent ces pistes pour créer un contexte.
Les blockchains comme Ethereum et Bitcoin produisent des blocs toutes les 12 secondes et ~10 minutes, respectivement. Chaque bloc contient des transactions qui modifient l'état de la blockchain. Les explorateurs de blocs comme Etherscan capturent les données relatives à toutes les transactions. Par exemple, si vous allez sur Etherscan et que vous voyez un bloc, l'image ci-dessous est ce que vous pouvez voir.
Les transactions sur la blockchain sont riches en contexte. Des produits comme Arkham et Nansen sont des moteurs d'interprétation permettant aux chercheurs de comprendre ce qui se passe lors d'une transaction.
Vous pouvez consulter tous les blocs depuis la création d'Ethereum. Mais que pouvez-vous faire de ces informations ? Presque rien. Vous devez donc trouver un moyen de capturer ces données dans plusieurs tableaux. Par exemple, lorsqu'un contrat NFT d'une place de marché est appelé dans un bloc, les données relatives à cette transaction doivent être ajoutées aux tables liées au NFT, ou lorsqu'un contrat Uniswap est appelé, les données correspondantes doivent être stockées dans les tables liées au DEX. (Dune rend ce service).
Vous ne pouvez pas analyser les données brutes sans encourir des coûts d'infrastructure importants. Ainsi, bien que les données soient librement accessibles, vous rencontrez les mêmes problèmes. En tant qu'investisseur ou créateur de dApp, vous vous appuyez sur des données externes. Mais votre fonction principale n'est pas liée à la collecte et à la gestion de données. Dépenser des ressources pour des activités essentielles mais non fondamentales n'est pas un luxe que toutes les organisations peuvent s'offrir.
Pour les produits de données, le contexte autour des données rend le produit unique. Bloomberg applique ses connaissances financières et transforme les données sous une forme que les inventeurs et les négociants peuvent facilement utiliser. Des sites web comme Similarweb ou des publications de recherche comme Newzoo utilisent leurs compétences de base pour appliquer un contexte social ou lié au jeu aux données qu'ils suivent.
Les produits de données natifs de la blockchain se différencient en fournissant un contexte utilisateur grâce à des requêtes qui répondent à des questions pertinentes pour des sous-ensembles d'utilisateurs spécifiques. Par exemple, TokenTerminal calcule les fondamentaux économiques des protocoles. Nansen aide les acteurs du marché à étiqueter et à comprendre les mouvements d'actifs. Parsec interroge les données de la chaîne pour aider les traders à mieux analyser les positions de DeFi.
Tous ces produits fonctionnent grâce à un bien public : les données de la chaîne. La différence réside dans la manière dont ces produits présentent leurs données, ce qui les rend attrayants pour des publics différents.
Dans notre secteur, la répartition des catégories de produits est basée sur les données qui entrent dans la chaîne et sur les informations qui sont dérivées de sources extérieures à la chaîne. (Certains utilisent souvent les deux). Les fournisseurs de données utilisent leurs filtres contextuels pour créer des produits. Tout comme les données du Web2 ont leurs niches, les entreprises de données du Web3 ont construit ou construisent progressivement des fossés en utilisant leurs compétences de base.
Ainsi, les antécédents des fondateurs déterminent souvent la nature des produits mis sur le marché. Lorsqu'une équipe de base a passé beaucoup de temps sur les marchés des capitaux avant la cryptographie, ses produits ont tendance à imiter Bloomberg, alors que les produits nés de la cryptographie ressemblent à Nansen. Différents produits répondent à des besoins différents, même lorsqu'il s'agit d'interroger les mêmes données.
Par exemple, les échanges éliminent généralement les données après des intervalles fixes. Elles ne sont pas actives dans le domaine des données, et le stockage d'anciennes données nécessite des serveurs et une gestion supplémentaires. Certains fournisseurs de données, comme Kaiko et Amberdata, conservent les données historiques des carnets d'ordres des bourses. Ces données permettent aux traders et aux investisseurs de construire des modèles pour tester leurs hypothèses. Mais si vous voulez comprendre quels contrats DeFi sont touchés par un afflux d'ETH ou de stablecoins ou analyser le comportement sur la chaîne d'adresses ou d'entités spécifiques, vous aurez besoin d'un produit de Nansen ou d'Arkham.
La carte du marché n'est pas représentative de tous les acteurs dans toutes les catégories.
Une façon de comprendre comment les produits ont été positionnés sur les marchés est d'examiner les profils des consommateurs de crypto-monnaies. Ces personas peuvent être classés dans les quatre catégories clés suivantes.
La plupart des dollars qui transitent par les produits de crypto-données proviennent d'institutions financières en période de marché baissier. Il s'agit de clients importants dont les cycles de vente sont plus longs et dont les exigences en matière de données sont beaucoup plus complexes. Pour savoir si un produit est orienté vers les institutions financières, il suffit que le client doive se soumettre à un appel de vente pour en connaître le coût. Dans le monde du Web2, vous ne pouvez pas savoir combien coûte PitchBook ou CB Insights. En crypto-monnaie, vous ne savez pas ce que coûterait un produit comme Chainalysis.
Blague à part, ce processus de vente s'explique en partie par le service de proximité offert par les produits de données destinés à ce segment de consommateurs. Ces utilisateurs optent généralement pour des données très granulaires et fréquentes. Ils ont besoin de données non seulement pour prendre des décisions avant les transactions, mais aussi pour les utiliser après les transactions afin de satisfaire aux exigences en matière de conformité et de fiscalité.
Par exemple, ils ont besoin de produits qui leur indiquent la valeur historique de leur portefeuille, qui les aident à calculer leurs impôts, etc. Des entreprises comme Amberdata, Kaiko, CoinMetrics, CryptoCompare et, dans une certaine mesure, Nansen, servent ces clients.
D'après mon expérience, seuls les fondateurs ayant travaillé dans des institutions ou les équipes ayant bénéficié d'un financement important ont été en mesure d'ouvrir le marché institutionnel des données. La barrière à l'entrée est relativement élevée, comme c'est le cas pour tout produit d'entreprise.
Nous rencontrons souvent la caractéristique de composabilité de Web3, qui signifie que les applications Web3 peuvent être interdépendantes. Ils pourraient se demander des données l'un à l'autre. Ils doivent donc constamment lire des données l'un de l'autre. Par exemple, une plateforme comme Yearn Finance doit lire les données d'Aave et de Compound, et un agrégateur de NFT comme Tensor doit lire les données de Magic Eden et d'autres places de marché.
Mais ces données sont stockées dans des blocs sur des chaînes comme Ethereum et Solana. Ethereum crée un bloc en 12 secondes, et Solana le fait en 400 ms. Trier les données de la blockchain dans des tableaux et les stocker pour un accès rapide est une tâche non triviale. C'est là que les indexeurs tels que Covalent, Graph, Chainlink et Powerloom entrent en jeu. Ils veillent à ce que les données brutes de la blockchain soient stockées dans le format souhaité afin que les développeurs puissent les récupérer via de simples appels d'API.
Un segment émergent de ce type de consommateur concerne les outils utilisés pour comprendre le comportement des utilisateurs. Par exemple, ARCx permet aux développeurs de mettre en correspondance des données hors chaîne (comme le comportement du navigateur) avec des données sur chaîne (comme les adresses des portefeuilles) afin d'obtenir des informations démographiques sur les utilisateurs qui interagissent avec une dApp. Ils occupent un créneau relativement restreint mais pertinent, car ils aident les développeurs à identifier leurs utilisateurs.
Les produits de données dans le domaine de la cryptographie sont souvent distribués en collaborant avec des chercheurs et des publications. CCData, par exemple, est souvent citée par Bloomberg. Les chercheurs sont incités à s'appuyer sur les produits de données, qui leur permettent de gagner du temps et d'économiser des efforts lors de la collecte, du nettoyage ou de la conservation des données. Des produits comme Dune ont construit un fossé en créant une communauté d'analystes qui rivalisent les uns avec les autres pour être mieux classés dans leur liste.
Des publications telles que The Block et Delphi présentent des tableaux de bord élaborés à partir de données provenant de fournisseurs tiers. Ici, à Decentralised.co, nous nous appuyons entièrement sur des fournisseurs de données externes, car ils permettent à l'équipe de rester légère tout en utilisant des ressources externes lors de la collecte des données.
La difficulté de répondre aux besoins de ce segment de consommateurs réside dans le fait que les petits chercheurs n'ont pas toujours le budget nécessaire pour justifier l'utilisation de ressources considérables afin de faire émerger des informations de niche qui peuvent n'être pertinentes que pour une seule personne. Inversement, les entreprises ont tout intérêt à consacrer des efforts et des ressources à des partenariats avec des publications importantes comme le Financial Times, car cela facilite la distribution.
Les produits destinés aux investisseurs de détail ont généralement une granularité et une fréquence de données plus faibles. Mais il s'agit de niches très rentables dans lesquelles il est possible de réaliser des économies d'échelle. Dix mille utilisateurs payant 100 dollars chacun représentent un chiffre d'affaires d'un million de dollars dans un monde où le taux de désabonnement n'existe pas. C'est plus facile à dire qu'à faire, mais ces considérations économiques expliquent pourquoi nous avons tant de produits de crypto-données orientés vers la vente au détail.
Une grande partie des produits destinés à la vente au détail sont gratuits ou soutenus par des publicités. Par exemple, une ressource gratuite comme DefiLlama ne vous dira pas comment acheminer votre ordre via différentes bourses (CEX et DEX) pour éviter les dérapages, car elle ne prend pas d'instantanés du carnet d'ordres, mais elle présente des informations sur les déblocages de jetons ou les déblocages de rendement.
L'un des changements dans ce segment de consommateurs est la façon dont le moyen de livraison ouvre une nouvelle catégorie de marché - par exemple, Cielo fournit des données sous forme de notifications par l'intermédiaire de Telegram. Il s'est étendu à plus de 40 000 utilisateurs en relayant des informations de manière facile à consommer pour un segment de consommateurs qui préfèrent ne pas avoir affaire à des interfaces de bureau. Lorsqu'ils sont bien utilisés, même les moyens de distribution peuvent être des facteurs de différenciation pour les entreprises en phase de démarrage. Même dans les données.
Bien que la classification soit parfois floue, les entreprises de données peuvent être divisées en orientations B2B ou B2C.
Des entreprises comme Amberdata et Kaiko proposent des produits destinés aux acteurs sophistiqués. Ces produits sont plus granulaires (détails dans lesquels les données sont disponibles) et plus fréquents (par ex. Ils répondent à des besoins tels que la construction et le test de modèles, l'analyse pré-négociation, le reporting post-négociation, la fiscalité et la conformité. Les données sont fournies dans un format qui permet aux clients d'effectuer des analyses propriétaires et de créer des visualisations à leur goût. Ces entreprises proposent généralement leurs produits derrière un mur payant.
Le coût est généralement fonction de la granularité due aux exigences de l'infrastructure, de la nature de la clientèle concernée et de la durée du cycle de vente.
L'image ci-dessus présente différents produits sur deux axes - la profondeur et la granularité par rapport aux prix des produits. Veuillez noter que ces tracés ne sont pas exacts. Quelques points peuvent être déplacés. L'idée est de développer un modèle mental pour réfléchir à plusieurs produits et à leur position sur le marché.
Des produits axés sur le commerce de détail comme Dune ou CoinGecko affichent gratuitement la quasi-totalité des données. Les clients doivent payer pour accéder à certaines données ou s'ils souhaitent obtenir des données via des API pour effectuer leurs analyses. Par exemple, vous pouvez visualiser tous les graphiques créés par plusieurs assistants Dune, mais ils limitent le nombre de lignes que vous pouvez télécharger au format CSV. Vous pouvez télécharger des fichiers CSV plus volumineux et consulter des requêtes privées lorsque vous payez davantage.
Les entreprises axées sur la vente au détail ont tendance à avoir un faible revenu par client et peu de clients payants par rapport aux utilisateurs gratuits. Comparez cela aux taux de conversion des modèles freemium des sociétés Internet. En général, le taux de conversion est de 2%–5%. Un taux de conversion de 10 % serait une aberration. Leur stratégie consiste à avoir autant de clients gratuits que possible afin qu'un taux de conversion de 4 % contribue de manière significative au chiffre d'affaires. C'est ce que nous appelons le haut de l'entonnoir.
Les entreprises de données ont donc besoin que le haut de l'entonnoir soit suffisamment important pour générer assez de revenus pour se maintenir avec un taux de conversion plus faible. Les entreprises peuvent également envisager de générer des revenus à partir de publicités lorsque le site est très fréquenté. CoinGecko utilise les revenus publicitaires comme levier pour continuer à fournir la plupart des données gratuitement.
Au fil des ans, les entreprises ont occupé les deux extrémités du spectre (B2B et B2C), laissant quelques vides entre les deux. Si quelqu'un veut voir comment les carnets d'ordres évoluent dans les bourses centralisées ou comment les ratios put call, les IV et les skews changent, il n'y a pas beaucoup de produits qui aident à la visualisation. Il y a de la place pour un produit plus granulaire que les CoinGeckos du monde, mais moins granulaire que les produits des pure players B2B.
Il n'est pas facile de trouver des marges de manœuvre dans les entreprises où la matière première est gratuite. Les données de la blockchain sont librement accessibles. Il n'y a rien de propriétaire dans les données que vous pouvez collecter. Ainsi, les fossés dans les entreprises de données ne reposent pas uniquement sur le fait que vous possédez des données que d'autres n'ont pas. Ils sont plutôt basés sur la capacité d'une équipe à fournir les données dans un format perspicace et consommable, dans les délais et sans erreurs.
De nombreuses entreprises prétendent disposer des mêmes données, mais la qualité des données et leur présentation diffèrent. Par exemple, de nombreuses entreprises prétendent disposer de données sur le carnet de commandes hors chaîne. Toutefois, des facteurs tels que le nombre d'ordres d'achat et de vente, la longueur des séries chronologiques et le nombre de bourses et de paires disponibles diffèrent d'un fournisseur à l'autre. Amberdata et Kaiko disposent des données les plus complètes sur le carnet d'ordres des marchés cryptographiques.
Pourquoi, cependant, seuls quelques fournisseurs peuvent-ils fournir ce type de données ? C'est là que se trouve l'explication de l'apparition de fossés dans les données Web3.
Talent - Au risque d'énoncer une évidence, lorsque la matière première est gratuite, la façon dont vous la moulez détermine la valeur du produit. Transformer des données brutes en informations utiles nécessite une expertise dans de nombreuses niches au sein des marchés financiers cryptographiques et traditionnels. Les équipes comme Velo Data, qui ont l'expérience des marchés traditionnels, ont une longueur d'avance sur les autres équipes qui tentent de créer des produits B2C similaires. Il est rare de trouver des développeurs talentueux qui comprennent les structures de données de la blockchain et qui ont une expérience pertinente des marchés financiers.
Infrastructure - La collecte et la fourniture de grandes quantités de données nécessitent une infrastructure qui n'est pas facile à mettre en place. Ce type d'opération nécessite des capitaux et des talents. Pourquoi l'infrastructure est-elle un fossé ? Pensez aux données du pool de mémoire. Les blocs contiennent des données relatives aux transactions confirmées. Qu'en est-il des transactions non confirmées ?
Différents nœuds du réseau (par exemple, des nœuds connectés au même pool) voient différentes transactions non confirmées. L'exécution d'un seul nœud ne permet pas d'obtenir une vue d'ensemble des transactions concurrentes. Le maintien de plusieurs nœuds sur plusieurs blockchains augmente les coûts d'infrastructure. Comme pour l'IA (et les réseaux de contenu dans le passé), la capacité à maintenir les coûts de matériel à un niveau bas tout en augmentant l'échelle déterminera les gagnants et les perdants du secteur au fil du temps.
Effets de réseau - On peut supposer que des effets de réseau existent dans de nombreux produits de crypto-données. Prenez l'exemple de Chainlink. Il s'agit de l'un des premiers oracles permettant aux applications de lire des données provenant d'autres applications ou chaînes. Il a réussi à obtenir le soutien de la communauté et possède l'une des communautés les plus fortes. Un autre exemple est celui de Nansen. Son titre de gloire était les étiquettes d'adresses qui lui permettaient d'attribuer les mouvements d'actifs à des entités réelles plutôt qu'à des adresses hexanumériques.
Par la suite, elle a lancé des fonctionnalités telles que NFT Paradise et Token God Mode, permettant aux utilisateurs de suivre les NFT et les jetons de manière plus efficace. Arkham a lancé un produit similaire aux labels de Nansen, mais les investissements dans les tableaux de bord et la recherche ont permis à Nansen de s'orienter vers les entreprises clientes et de leur proposer des produits adaptés. Il convient de mentionner que les effets de réseau ne sont pas possibles sans les deux premiers points (talent et infrastructure).
Cela fonctionne notamment avec les indexeurs. Plus le nombre de chaînes prises en charge par un produit est élevé, plus la probabilité qu'un développeur utilise le produit au lieu de s'appuyer sur de multiples sources est grande. Des équipes comme Covalent ont un avantage dans ce domaine, car elles ont optimisé l'étendue des chaînes prises en charge depuis un certain temps. Mais n'oubliez pas que la profondeur est aussi importante que l'étendue.
Il est trop tôt pour dire si un produit possède un fossé significatif dans le domaine des crypto-monnaies. Nous avons été témoins de l'avantage des pionniers dans le grand ordre des choses. À mesure que des catégories telles que le Web3 social et le chevauchement entre l'IA et les crypto-monnaies continuent de se développer, les produits de données du secteur pourraient devenir le prochain Alphabet. Mais il s'agira d'une histoire qui s'étendra sur plusieurs décennies ; nous n'en sommes qu'aux premières années.
De nombreux cas d'utilisation mentionnés dans cet article concernent la spéculation financière sous une forme ou une autre. Même les développeurs qui utilisent les API pour interroger les données créent des produits financiers. Cela peut sembler étrange, mais les blockchains (en tant que nouveau réseau) suivent la même tendance que le télégraphe et l'internet.
L'arrivée d'un nouveau support et l'émergence d'un nouveau réseau accélèrent les cas d'utilisation financière. Avec l'internet, il a fallu attendre le début des années 2000 pour que l'on se rende compte que les utilisateurs pouvaient être ciblés en fonction de leur localisation. Avec les blockchains, nous sommes encore en train de comprendre comment construire des modèles commerciaux à partir de pistes de données accessibles au public.
Nous avons constaté un changement majeur dans notre utilisation quotidienne de ces plateformes : Dune Analytics a intégré l'IA dans son produit. Dune fournit une interface SQL permettant aux utilisateurs d'interroger les données des blockchains telles qu'Ethereum et Solana. Le marché de ce produit est généralement limité aux utilisateurs qui savent comment écrire des requêtes SQL. Ils ont récemment commencé à utiliser l'IA pour aider les analystes à générer des requêtes sans être des experts en SQL. Il n'est pas aussi fonctionnel qu'on le souhaiterait. Mais il s'agit toujours d'un pas vers l'avenir. Il ne faudra peut-être pas attendre longtemps avant que nous demandions à l'IA (comme ChatGPT) d'interroger les données d'une blockchain et de proposer son analyse.
Une façon d'envisager les "données" dans le contexte du Web3 est de les considérer sous l'angle de Google Maps. Le GPS existe depuis au moins les années 1980. Google a effectué le travail nécessaire pour cartographier le monde. En mettant les superpositions de cartes à la disposition d'applications tierces (à l'aide d'API), l'entreprise a permis la création d'une nouvelle génération d'applications. Tout ce qui va de la livraison au covoiturage a connu un essor considérable parce qu'un acteur unique spécialisé dans les données a pris en charge cette charge des développeurs.
Les produits de données de Web3 sont appelés à jouer un rôle similaire. Nous ne connaissons pas encore la nature exacte des applications qui pourraient être créées à partir de cette ressource publique, mais il devient évident qu'il existe une opportunité de la taille d'Alphabet dans le paysage des données.