Dieser Artikel wurde ursprünglich auf Decentralised.co veröffentlicht. Wir von GCR stellen Ihnen zweimal im Monat Langformulare von Decentralized zur Verfügung – jeden zweiten Donnerstag! Das Management von über 200 Unternehmen vertraut Decentralised.co, wenn es darum geht, über wichtige Trends, Daten und Erkenntnisse auf dem Laufenden zu bleiben. Melden Sie sich unten für den Newsletter an – mehr über diese Zusammenarbeit für unsere aktivsten Mitglieder auf Discord.
Abonnieren Sie Decentralised.co
Hallo,
Wir hatten am 18. Juli einen Vorläufer zu diesem Artikel geschrieben, falls Sie einen Kontext wünschen, der über das hier Geschriebene hinausgeht.
Alle Lebewesen führen Aufzeichnungen. Tiere verfolgen die Jahreszeiten, um zu verstehen, wann sie jagen müssen. Nagetiere und Vögel lagern Nahrung an einzigartigen Orten. Sie müssen sich daran erinnern, wo sie es gespeichert haben, wenn sie Monate später darauf zugreifen, um sich zu ernähren. Wölfe markieren den Rand ihres Reviers, um anderen Tieren zu signalisieren, dass sie sich fernhalten sollen. Sogar Bäume behalten die Zeit im Auge. Jedes Jahr bildet sich in Stämmen ein Ring. Anhand der Anzahl der Jahresringe kann man das Alter eines Baumes abschätzen.
Obwohl Bäume und Tiere die Zeit verfolgen, können sie die Vergangenheit nicht abrufen oder erzählen. Sie haben keinen Zugriff auf den Speicher. Das ist es, was die Führung menschlicher Aufzeichnungen anders macht. Dank unserer Kommunikationsfähigkeiten wissen wir, dass die Sumerer in Mesopotamien (3400 v. Chr.) und die alten Ägypter (3200 v. Chr.) Keilschrift und Hieroglyphen verwendeten, um Informationen aufzuzeichnen.
Die Menschheit entwickelte sich, als Wissen weitergegeben werden konnte, ohne dass die Quelle physisch beteiligt sein musste. Wir lesen und genießen die Werke von Platon oder Sokrates, lange nachdem sie verschwunden sind, weil wir die Möglichkeit haben, ihre Lehren zu speichern. Schreiben war die ursprüngliche AR-Plattform.
Schreiben aus dem Iran, um den Überblick über Getreide zu behalten. Quelle: Link
Während das Schreiben die Dinge der Fantasie überließ, halfen Daten dabei, die Dinge objektiv zu halten. Es reduzierte die Notwendigkeit für den Einzelnen, Dinge in seinem Gedächtnis zu speichern. Dies ist zum Teil der Grund, warum es in einigen der ältesten menschlichen Texte um Schulden-, Einkommens- oder Handelsaufzeichnungen geht.
Im postindustriellen Zeitalter bauten Unternehmen Wettbewerbsgräben auf, um ihre Marktposition zu stärken, indem sie ihre Verkaufsunterlagen digitalisierten. Ein Beispiel hierfür ist ein indisches Unternehmen namens Asian Paints. Ihre Farben sind vielleicht nicht die besten auf dem Markt, aber sie kontrollieren einen Marktanteil von über 50 % an Indiens 8-Milliarden-Dollar-Farbenindustrie.
Warum? Die einfache Antwort ist, dass es sich um eine bekannte Marke handelt und das Unternehmen über Skaleneffekte verfügt. Aber wie sie dorthin gelangten, hat ihre Wurzeln in Daten. Sie investierten stark in die Datenerfassung und -verarbeitung, um ihre Lieferkette zu optimieren.
Zum Vergleich: Die Aktie von Asian Paints verzeichnete in den letzten 30 Jahren eine erstaunliche jährliche Wachstumsrate von 25 %. Dieses Wachstum wurde in den 1970er Jahren durch die Investition in einen Großrechner unterstützt. Das Gerät war leistungsstärker als die Geräte, die damals in den besten Forschungseinrichtungen Indiens eingesetzt wurden. Es sammelte stündlich Daten über die Farbe und Menge der in ganz Indien verkauften Farbe. Dadurch konnte Asian Paints ein Modell erstellen, das die Farbnachfrage in ganz Indien mit einer Genauigkeit von 98 % vorhersagt.
Diese Vorhersagekraft ermöglichte es Asian Paints, den größtmöglichen Nutzen zu erzielen, da die Wiederbeschaffungszeit drastisch verkürzt werden konnte. Damals bestand die Norm für den Verkauf von Waren wie Farben darin, sie an einen Großhändler zu verkaufen, der sie dann an einen Großhändler weitergab, der sie wiederum an einen Händler verkaufte. Der Händler würde direkt mit dem Verbraucher interagieren. Der Grund für eine so komplexe Lieferkette lag darin, dass jede Partei über einen Bestand an Vermögenswerten verfügte und Daten über Angebot und Nachfrage nach Farbe kontrollierte.
Herr Choksey – der Gründer von Asian Paints – entfernte Großhändler und Händler aus der Lieferkette, indem er die Konsummuster des Endverbrauchers untersuchte und die Abhängigkeit von Zwischenhändlern verringerte. Durch den Wegfall der Zwischenhändler konnte sich Asian Paints 97 % des MRP (3 % an die Händler) sichern, verglichen mit 60 % der Konkurrenz.
Der vom Telegraphen extrahierbare Wert wären die über den Telegraphen übertragenen Tickerbänder.
Der Übergang zur Digitalisierung erfolgte nicht über Nacht. Ein Teil dessen, was die Datenerhebung interessant machte, war die Finanzwelt und ihre langsame Vernetzung. Beispielsweise wurden Ende des 20. Jahrhunderts Börsendaten mithilfe von Geräten wie dem oben genannten über den Telegrafen übermittelt. Bereits 1835 brachten Händler Tauben bei, Zettel mit Informationen über die Geschehnisse in Europa zu tragen. Wenn Dampfschiffe, die Waren transportierten, sich dem Land in einer Entfernung von bis zu 50 Meilen näherten, flogen die Tauben mit der Information zu bestimmten Orten. Früher zahlten Händler bis zu 500 US-Dollar für jede Stunde im Voraus, in der sie die Nachrichten erhalten konnten.
Ab 1867 begannen Händler miteinander zu konkurrieren, um die Geschwindigkeit der Informationsübermittlung über den Telegrafen zu optimieren. Ein Mitarbeiter von Western Union namens E. A. Calahan zahlte über 200.000 US-Dollar an die NYSE für die Möglichkeit, Mitarbeiter auf ihren Handelsplatz zu schicken, um Tickerdaten an seine Kunden weiterzuleiten. Einer der Personen, die fleißig an der Optimierung des Systems arbeiteten, war ein junger Wissenschaftler namens Thomas Alva Edison. Ein Jahrhundert später würden Tools wie das Bloomberg-Terminal das Tempo und die Menge der an einem bestimmten Tag übermittelten Finanzdaten exponentiell steigern.
Daten müssen wie Rohöl mehrere Veredelungsschritte durchlaufen, bevor sie verwendet werden können. Zu erfahren, wie Bloomberg gewachsen ist, gibt Aufschluss darüber, wie sich die gesamte Datenlandschaft entwickelt hat und welcher Prozess. Bloomberg war nicht der erste Versuch, Technologie zur Verbesserung von Handels- und Berichtsmechanismen einzusetzen. NASDAQ nutzte Bunker Ramo- Terminals, um Informationen zu verbreiten und Geld-/Briefaufträge zu erteilen. Allerdings würde die Skalierung dieses Modells immer eine Herausforderung darstellen, wenn man sich auf frühere Telefonkommunikationsnetze verlassen würde.
Quelle – NASDAQ – Die Entwicklung des automatisierten OTC-Handels
Im Jahr 1981 wurde Michael Bloomberg, Partner der Investmentbank Solomon Brothers, mit 10 Millionen US-Dollar für sein Eigenkapital entlassen, als die Phibro Corporation die Bank übernahm. Er erkannte, dass Anleger angesichts der zunehmenden Elektronisierung der Finanzmärkte von New York bis Japan bereit sind, für optimierte Finanzinformationen zu zahlen. Er gründete ein Datendienstleistungsunternehmen namens Innovative Market System, das 1986 in Bloomberg umbenannt wurde.
Bevor das Internet aufkam, wurde das Bloomberg-Terminal über The Chiclet erreicht. Diese wurde über ein spezielles Kabel mit dem Bloomberg-Controller verbunden und über dedizierte Telefonleitungen mit dem lokalen Hub verbunden. Bloomberg sammelte Daten über Datenpartnerschaften, Nachrichtenagenturen und Pressemitteilungen sowie proprietäre Methoden wie manuelle Dateneingabe und telefonische Datenerfassung.
Mit dem Internet öffneten sich die Informationsschleusen. Heute beschafft, verarbeitet und liefert Bloomberg 200 Milliarden Finanzinformationen nahezu in Echtzeit. Das sind etwa 23 Millionen Datenpunkte pro Sekunde. Einige der auf Bloomberg verfügbaren Informationen sind öffentlich. Datenpunkte wie Unternehmensabschlüsse sowie Aktien- und Anleihekurse können in öffentlichen Foren gefunden werden.
Was aber, wenn Sie Öl- und Gasanalyst sind und die Bewegung von Rohölbehältern verstehen möchten? Es ist unwahrscheinlich, dass Sie diese Informationen in Echtzeit erhalten, wenn Sie keine Datenquelle wie Bloomberg abonnieren. Nicht alle Daten im Internet sind frei verfügbar.
Wenn es um Daten in Web2 geht, gibt es für Einzelpersonen typischerweise zwei Einschränkungen: berechtigten Zugriff und eine hohe Hürde bei der Verarbeitung großer Datenmengen. Im Laufe der Jahre haben Anbieter wie Bloomberg Netzwerkeffekte aufgebaut, die stark genug sind, um Daten über ihre Tochtergesellschaften zu beziehen, was sich Analysten oder Investoren nicht leisten können.
Es ist besser, Bloomberg 20.000 US-Dollar für ein Jahresabonnement zu zahlen, als zu versuchen, die Daten von einer Mischung aus Datenplattformen zu beziehen, die jeweils unterschiedliche Preisstufen haben können. Selbst wenn Sie hart genug arbeiten, um an die Daten zu gelangen, können Sie ohne erhebliche Infrastrukturausgaben keine Analysen in Echtzeit verarbeiten und ausführen. Auf der Einzelhandelsseite handelte es sich bei vielen Plattformen, die schließlich skalierten, um Datenabgleichs-Engines.
Stellen Sie sich das so vor: Google (die Suchmaschine) ist ein Datenunternehmen, das Unternehmen gegen Werbegelder Zugang zu Nutzern bietet. Wenn ein Restaurant oder ein Newsletter (wie unseres) Nutzer ansprechen möchte, die bei Google nach Informationen suchen, gleichen sie Angebot und Nachfrage nach ähnlichen Informationen ab. Jemand, der nach Informationen zu einem Newsletter speziell für Web3 sucht, sucht nach uns. Und wir suchen diese Person. (Ich widerstehe dem Drang, unser Empfehlungsprogramm hier anzuschließen.)
Google hat aufgrund der Skaleneffekte, in denen es agiert, ein Monopol aufgebaut. Ihr Bestand an Benutzern und die Anzahl der Anfragen, die ihre Benutzer jeden Tag stellen, sind nach wie vor konkurrenzlos. Google baute diese Position aus, indem es zu einer Zeit, als Werbung die Norm war, eine Suchmaschine einführte, die keine Anzeigen enthielt, dann durch die Übernahme von YouTube und Android und schließlich durch die Bezahlung von Konkurrenten wie Apple, um Google zur Standardsuchmaschine zu machen. Allein für Apple zahlt Google 20 Milliarden US-Dollar pro Jahr , um die Standardsuchmaschine in Safari zu bleiben.
Google zahlt diese Prämie, weil sein Angebot im Kern eine Matching-Engine ist. Die Matching-Engine bringt Benutzer mit Bedarf mit Unternehmen in Kontakt, die ein Angebot haben. Die meisten Monopole im Internet sind im Kern Matching-Engines. Amazon bringt Produktverkäufer mit Käufern zusammen. Instagram bringt ein Publikum mit YouTubern zusammen. Diese Matching-Engines funktionieren, weil Interaktionen mit diesen Produkten reichhaltige Spuren hinterlassen, aus denen der Kontext abgeleitet werden kann.
Ben Evans schrieb im Jahr 2022 bekanntlich, dass es keine Daten gebe. Für Dritte ist es nicht viel wert, meine Inhalte, Essens- oder Reisepräferenzen zu kennen. Wertvoll – für Handel oder Forschung – wird es erst dann, wenn es aggregiert oder mit Kontext angereichert wird.
Kontext in dem Sinne, dass meine Vorlieben, Biriyani an einem Freitagabend zu essen, genutzt werden könnten, um mir die Lieferung von Biriyani genau dann anzukündigen, wenn die Wahrscheinlichkeit, dass ich es kaufe, am höchsten ist. Insgesamt trägt der Vergleich der Wahrscheinlichkeit meines Kaufs mit der eines Konkurrenten in derselben Region dazu bei, Benutzer besser anzusprechen.
Um wertvoll zu sein, müssen Daten entweder skaliert (in großer Zahl) oder kontextbezogen sein. Der Unterschied zwischen Web3- und Web2-Produkten liegt in der Vergangenheit in den Spuren, die sie hinterlassen. Nur Amazon weiß, wie viele Xbox-Controller in einer bestimmten Woche verkauft würden. Aber Sie können die Muster erkennen, nach denen Händler an jedem Tag NFTs auf OpenSea kaufen oder verkaufen. Der Grund dafür ist, dass jede dieser Transaktionen eine öffentliche Spur hinterlässt.
Datenprodukte in Web3 nutzen diese Trails, um Kontext zu erstellen.
Blockchains wie Ethereum und Bitcoin produzieren alle 12 Sekunden bzw. etwa 10 Minuten Blöcke. Jeder Block enthält Transaktionen, die den Zustand der Blockchain ändern. Block-Explorer wie Etherscan erfassen Daten zu allen Transaktionen. Wenn Sie beispielsweise zu Etherscan gehen und einen Block sehen, sehen Sie möglicherweise das Bild unten.
Transaktionen auf der Blockchain sind reich an Kontext. Produkte wie Arkham und Nansen sind Interpretationsmaschinen, mit denen Forscher verstehen können, was bei einer Transaktion vor sich geht.
Sie können alle Blöcke seit dem Start von Ethereum anzeigen. Doch was kann man mit diesen Informationen anfangen? Fast nichts. Sie benötigen also eine Möglichkeit, diese Daten in mehreren Tabellen zu erfassen. Wenn beispielsweise ein NFT-Vertrag eines Marktplatzes in einem Block aufgerufen wird, sollten die mit dieser Transaktion verbundenen Daten an NFT-bezogene Tabellen angehängt werden, oder wenn ein Uniswap-Vertrag aufgerufen wird, sollten die zugehörigen Daten in DEX-bezogenen Tabellen gespeichert werden . (Dune macht dies als Service.)
Sie können die Rohdaten nicht analysieren, ohne dass erhebliche Infrastrukturkosten anfallen. Obwohl die Daten frei verfügbar sind, treten dieselben Probleme auf. Als Investor oder dApp-Entwickler sind Sie auf externe Daten angewiesen. Ihre Kernaufgabe besteht jedoch nicht darin, Daten zu sammeln und zu verwalten. Ressourcen für wesentliche, aber nicht zum Kerngeschäft gehörende Aktivitäten aufzuwenden, ist kein Luxus, den sich jedes Unternehmen leisten kann.
Bei Datenprodukten macht der Kontext rund um die Daten das Produkt einzigartig. Bloomberg nutzt sein finanzielles Verständnis und wandelt Daten in eine Form um, die Erfinder und Händler leicht nutzen können. Websites wie Similarweb oder Forschungspublikationen wie Newzoo nutzen ihre Kernkompetenzen, um sozialen oder spielbezogenen Kontext auf die von ihnen erfassten Daten anzuwenden.
Native Blockchain-Datenprodukte zeichnen sich dadurch aus, dass sie Benutzerkontext durch Abfragen bereitstellen, die Fragen beantworten, die für bestimmte Benutzeruntergruppen relevant sind. TokenTerminal berechnet beispielsweise die wirtschaftlichen Grundlagen von Protokollen. Nansen hilft Marktteilnehmern, die Bewegung von Vermögenswerten zu kennzeichnen und zu verstehen. Parsec fragt On-Chain-Daten ab, um Händlern dabei zu helfen, DeFi-Positionen besser zu analysieren.
Alle diese Produkte basieren auf einem öffentlichen Gut: On-Chain-Daten. Der Unterschied besteht darin, wie diese Produkte ihre Daten präsentieren, was sie für unterschiedliche Zielgruppen attraktiv macht.
Die Aufteilung der Produktkategorien in unserer Branche basiert darauf, welche Daten in die Kette gelangen und welche Informationen aus Quellen außerhalb der Kette stammen. (Einige verwenden oft beides.) Datenanbieter verwenden ihre Kontextfilter, um Produkte zu erstellen. So wie Web2-Daten ihre Nischen haben, haben Web3-Datenunternehmen mithilfe ihrer Kernkompetenzen Gräben errichtet oder bauen diese nach und nach aus.
Daher bestimmt häufig der Hintergrund der Gründer die Art der veröffentlichten Produkte. Wenn ein Kernteam vor der Krypto-Währung viel Zeit auf den Kapitalmärkten verbracht hat, neigen seine Produkte dazu, Bloomberg nachzuahmen, während krypto-native Produkte wie Nansen aussehen. Unterschiedliche Produkte erfüllen unterschiedliche Anforderungen, selbst wenn dieselben Daten abgefragt werden.
Beispielsweise verwerfen Börsen Daten normalerweise in festgelegten Zeitabständen. Sie sind nicht im Datengeschäft tätig und die Speicherung alter Daten erfordert zusätzliche Server und Verwaltungsaufwand. Einige Datenanbieter wie Kaiko und Amberdata verwalten historische Orderbuchdaten von Börsen. Solche Daten ermöglichen es Händlern und Investoren, Modelle zu erstellen, um ihre Hypothesen zu testen. Wenn Sie jedoch verstehen möchten, welche DeFi-Verträge durch den Zufluss von ETH oder Stablecoins gelöscht werden, oder das On-Chain-Verhalten bestimmter Adressen oder Einheiten analysieren möchten, benötigen Sie ein Produkt von Nansen oder Arkham.
Die Marktkarte ist nicht für jeden Spieler in jeder Kategorie repräsentativ.
Eine Möglichkeit zu verstehen, wie Produkte auf den Märkten positioniert wurden, ist die Betrachtung von Verbraucherpersönlichkeiten in Krypto. Diese Personas können in die folgenden vier Schlüsselkategorien eingeteilt werden.
Während eines Bärenmarktes kommen die meisten Dollars, die über Krypto-Datenprodukte fließen, von Finanzinstituten. Dabei handelt es sich um Großkunden mit längeren Verkaufszyklen und weitaus komplexeren Datenanforderungen. Eine Möglichkeit herauszufinden, ob ein Produkt für Finanzinstitute bestimmt ist, besteht darin, dass ein Kunde ein Verkaufsgespräch führen muss, um festzustellen, wie viel es kostet. In der Web2-Welt können Sie nicht herausfinden, wie viel PitchBook oder CB Insights kostet. Im Krypto-Bereich weiß man nicht, was ein Produkt wie Chainalysis kosten würde.
Spaß beiseite: Einer der Gründe für einen solchen Verkaufsprozess ist der praktische, erstklassige Service, den Datenprodukte bieten, die sich an dieses Verbrauchersegment richten. Diese Benutzer entscheiden sich normalerweise für hochgranulare und häufige Daten. Sie benötigen Daten nicht nur für Entscheidungen vor dem Handel, sondern auch für die Verwendung nach dem Handel, um Compliance- und Steueranforderungen zu erfüllen.
Sie benötigen beispielsweise Produkte, die ihnen den historischen Wert ihres Portfolios verraten, ihnen bei Steuerberechnungen helfen und so weiter. Firmen wie Amberdata, Kaiko, CoinMetrics, CryptoCompare und teilweise auch Nansen bedienen diese Kunden.
Meiner Erfahrung nach ist es nur Gründern mit Erfahrung in Institutionen oder Teams mit großen Finanzierungsrunden gelungen, den institutionellen Markt für Daten zu erschließen. Die Eintrittsbarriere ist hier, wie bei jedem Unternehmensprodukt, relativ hoch.
Wir stoßen häufig auf die Composability-Funktion von Web3, was bedeutet, dass Web3-Anwendungen voneinander abhängig sein können. Sie könnten Daten voneinander verlangen. Daher müssen sie ständig Daten voneinander lesen. Beispielsweise muss eine Plattform wie Yearn Finance Daten von Aave und Compound lesen, und ein NFT-Aggregator wie Tensor muss Daten von Magic Eden und anderen Marktplätzen lesen.
Aber diese Daten werden blockübergreifend auf Ketten wie Ethereum und Solana gespeichert. Ethereum erstellt einen Block in 12 Sekunden und Solana in 400 ms. Blockchain-Daten in Tabellen zu sortieren und für einen schnellen Zugriff zu speichern, ist keine triviale Aufgabe. Hier kommen Indexer wie Covalent, Graph, Chainlink und Powerloom ins Spiel. Sie stellen sicher, dass die Rohdaten der Blockchain in einem gewünschten Format gespeichert werden, sodass Entwickler sie über einfache API-Aufrufe abrufen können.
Ein aufstrebendes Segment dieser Verbraucherpersönlichkeit sind Tools zum Verständnis des Benutzerverhaltens. Mit ARCx können Entwickler beispielsweise Off-Chain-Daten (wie Browserverhalten) mit On-Chain-Daten (wie Wallet-Adressen) abbilden, um die demografischen Informationen von Benutzern zu erfassen, die mit einer dApp interagieren. Sie befinden sich in einer relativ kleinen, aber relevanten Nische, da sie Entwicklern dabei helfen, herauszufinden, wer ihre Benutzer sind.
Datenprodukte in Krypto finden häufig Verbreitung durch die Zusammenarbeit mit Forschern und Publikationen. CCData beispielsweise wird häufig auf Bloomberg zitiert. Forscher werden dazu angeregt, auf Datenprodukte zurückzugreifen, da diese dabei helfen, beim Sammeln, Bereinigen oder Kuratieren von Daten Zeit und Aufwand zu sparen. Produkte wie Dune haben einen Burggraben geschaffen, indem sie eine Community von Analysten aufgebaut haben, die miteinander konkurrieren, um einen höheren Rang auf ihrer Liste zu erreichen.
Veröffentlichungen wie The Block und Delphi präsentieren Dashboards, die mit Daten von Drittanbietern erstellt wurden. Hier bei Decentralised.co verlassen wir uns vollständig auf externe Datenanbieter, da diese dazu beitragen, das Team schlank zu halten und gleichzeitig externe Ressourcen bei der Datenerfassung einzusetzen.
Die Herausforderung bei der Betreuung dieses Verbrauchersegments besteht darin, dass kleinere Forscher möglicherweise nicht über das erforderliche Budget verfügen, um die Aufwendung enormer Ressourcen für die Entdeckung von Nischenerkenntnissen zu rechtfertigen, die möglicherweise nur für eine einzelne Person relevant sind. Umgekehrt besteht für Unternehmen ein guter Anreiz, Aufwand und Ressourcen in die Zusammenarbeit mit bedeutenden Publikationen wie der Financial Times zu investieren, da dies bei der Verbreitung hilft.
Produkte, die sich an Privatanleger richten, weisen in der Regel eine geringere Granularität und Häufigkeit der Daten auf. Aber es handelt sich um äußerst profitable Nischen, die man erschließen kann, da sie Skaleneffekte erzielen. Zehntausend Benutzer, die jeweils 100 US-Dollar zahlen, sind ein ARR-Geschäft von 1 Million US-Dollar in einer Welt, in der es keine Abwanderung gibt. Das ist leichter gesagt als getan, aber diese wirtschaftlichen Aspekte erklären, warum wir so viele einzelhandelsorientierte Kryptodatenprodukte haben.
Ein großer Teil der einzelhandelsorientierten Produkte ist kostenlos oder wird durch Werbung unterstützt. Eine kostenlose Ressource wie DefiLlama sagt Ihnen beispielsweise nicht, wie Sie Ihre Order über verschiedene Börsen (CEXs und DEXs) weiterleiten können, um Slippage zu vermeiden, da sie keine Orderbuch-Snapshots erstellt, sondern zeigt Informationen über Token-Freischaltungen oder Ertrags-Freischaltungen an.
Eine Änderung in diesem Verbrauchersegment besteht darin, wie das Liefermedium eine neue Marktkategorie eröffnet – Cielo liefert beispielsweise Daten als Benachrichtigungen über Telegram. Es hat sich auf über 40.000 Benutzer ausgeweitet, indem es Informationen auf benutzerfreundliche Weise für ein Verbrauchersegment weitergibt, das sich lieber nicht mit Desktop-Schnittstellen befassen möchte. Wenn es richtig gemacht wird, können sogar Vertriebsmedien ein Unterscheidungsmerkmal für Unternehmen in der Anfangsphase sein. Sogar in Daten.
Obwohl die Klassifizierung stellenweise unscharf ist, können Datenunternehmen in B2B- oder B2C-Ausrichtungen unterteilt werden.
Unternehmen wie Amberdata und Kaiko verfügen über Produkte, die sich an anspruchsvolle Schauspieler richten. Diese Produkte sind detaillierter (Details, in denen die Daten verfügbar sind) und häufiger (z. B (Tick-by-Tick- und Echtzeit-Orderbuchdaten) und sie erfüllen Anforderungen wie die Erstellung und Prüfung von Modellen, Pre-Trade-Analysen, Post-Trade-Reporting, Besteuerung und Compliance. Die Daten werden in einem Format bereitgestellt, das es Kunden ermöglicht, eigene Analysen durchzuführen und Visualisierungen nach ihrem Geschmack zu erstellen. Diese Unternehmen bieten ihre Produkte typischerweise hinter einer Paywall an.
Die Kosten hängen im Allgemeinen von der Granularität aufgrund der Infrastrukturanforderungen, der Art der beteiligten Kundschaft und der Länge des Verkaufszyklus ab.
Das Bild oben stellt verschiedene Produkte auf zwei Achsen dar – Tiefe und Granularität im Vergleich zu den Produktpreisen. Bitte beachten Sie, dass diese Darstellungen nicht exakt sind. Ein paar Punkte könnten fehl am Platz sein. Die Idee besteht darin, ein mentales Modell zu entwickeln, um mehrere Produkte und deren Stellung auf dem Markt zu durchdenken.
Einzelhandelsorientierte Produkte wie Dune oder CoinGecko zeigen fast alle Daten kostenlos an. Kunden müssen für den Zugriff auf bestimmte Daten bezahlen oder wenn sie Daten über APIs zum Ausführen ihrer Analysen benötigen. Sie können beispielsweise alle Diagramme anzeigen, die von mehreren Dune-Assistenten erstellt wurden, diese begrenzen jedoch die Anzahl der Zeilen, die Sie im CSV-Format herunterladen können. Sie können größere CSV-Dateien herunterladen und private Abfragen anzeigen, wenn Sie mehr bezahlen.
Einzelhandelsorientierte Unternehmen haben tendenziell einen geringen Umsatz pro Kunde und einen geringen Anteil zahlender Kunden im Verhältnis zu den kostenlosen Nutzern. Vergleichen Sie dies mit den Umrechnungskursen für die Freemium-Modelle von Internetunternehmen. Normalerweise beträgt die Conversion-Rate 2%–5%. Eine Conversion-Rate von 10 % wäre ein Ausreißer. Ihr Ziel ist es, so viele kostenlose Kunden wie möglich zu haben, sodass eine Conversion-Rate von 4 % erheblich zum Umsatz beiträgt. Dies ist, was wir die Spitze des Trichters nennen.
Daher müssen Datenunternehmen die Spitze des Trichters groß genug sein, um genügend Umsatz zu generieren und sich bei einer niedrigeren Conversion-Rate behaupten zu können. Unternehmen können auch erwägen, Einnahmen aus Werbung zu erzielen, wenn die Website viele Besucher hat. CoinGecko nutzt Werbeeinnahmen als Druckmittel, um die meisten Daten weiterhin kostenlos bereitzustellen.
Im Laufe der Jahre haben Unternehmen an beiden Enden des Spektrums (B2B und B2C) Plätze besetzt und dazwischen einige Lücken hinterlassen. Wenn jemand sehen möchte, wie sich die Auftragsbücher an zentralisierten Börsen ändern oder wie sich die Put-Call-Verhältnisse, IVs und Skews ändern, gibt es nicht viele Produkte, die bei der Visualisierung helfen. Es gibt Platz für ein detaillierteres Produkt als die CoinGeckos dieser Welt, aber weniger detailliertes Produkt als Produkte von reinen B2B-Spielern.
Es ist nicht einfach, in Unternehmen, in denen der Rohstoff kostenlos ist, Gräben zu finden. Blockchain-Daten sind frei verfügbar. Die Daten, die Sie sammeln können, sind nicht proprietär. Die Gräben in Datengeschäften basieren also nicht nur darauf, dass Sie über einige Daten verfügen, die andere nicht haben. Stattdessen basieren sie auf der Fähigkeit eines Teams, die Daten in einem aufschlussreichen, nutzbaren Format pünktlich und fehlerfrei bereitzustellen.
Viele Unternehmen behaupten, über die gleichen Daten zu verfügen, die Datenqualität und deren Darstellung unterscheiden sich jedoch. Viele Unternehmen behaupten beispielsweise, über Off-Chain-Auftragsbuchdaten zu verfügen. Allerdings unterscheiden sich Faktoren wie die Anzahl der Geld-/Briefaufträge, die Länge der Zeitreihen und die Anzahl der verfügbaren Börsen und Paare von Anbieter zu Anbieter. Amberdata und Kaiko verfügen über die umfassendsten Orderbuchdaten für Kryptomärkte.
Warum aber können nur wenige Anbieter solche Daten bereitstellen? Die Erklärung dafür, wo Gräben in Web3-Daten entstehen, liegt hier.
Talent – Auf die Gefahr hin, das Offensichtliche zu sagen: Wenn das Rohmaterial kostenlos ist, bestimmt die Art und Weise, wie man es formt, den Wert des Produkts. Um Rohdaten in nützliche Informationen umzuwandeln, ist Fachwissen in vielen Nischen der Krypto- und traditionellen Finanzmärkte erforderlich. Teams wie Velo Data mit Erfahrung in traditionellen Märkten haben einen Vorteil gegenüber anderen, die versuchen, ähnliche B2C-Produkte zu entwickeln. Es ist selten, talentierte Entwickler zu finden, die Blockchain-Datenstrukturen verstehen und über einschlägige Erfahrung auf den Finanzmärkten verfügen.
Infrastruktur – Das Sammeln und Bereitstellen großer Datenmengen erfordert eine Infrastruktur, die nicht einfach zu beschaffen ist. Diese Art von Operation erfordert Kapital und Talent. Warum ist Infrastruktur ein Wassergraben? Denken Sie an Speicherpooldaten. Blöcke enthalten Daten für bestätigte Transaktionen. Was ist mit unbestätigten Transaktionen?
Verschiedene Netzwerkknoten (z. B. Knoten, die mit demselben Pool verbunden sind) sehen unterschiedliche unbestätigte Transaktionen. Wenn Sie nur einen Knoten ausführen, erhalten Sie keinen globalen Überblick über konkurrierende Transaktionen. Die Verwaltung mehrerer Knoten auf mehreren Blockchains erhöht die Infrastrukturkosten. Ähnlich wie bei KI (und Content-Netzwerken in der Vergangenheit) wird die Fähigkeit, die Hardwarekosten bei gleichzeitiger Skalierung niedrig zu halten, im Laufe der Zeit über die Gewinner und Verlierer in der Branche entscheiden.
Netzwerkeffekte – Man kann die Hypothese aufstellen, dass es in vielen Krypto-Datenprodukten Netzwerkeffekte gibt. Nehmen Sie Chainlink als Beispiel. Es war eines der ersten Orakel, das es Anwendungen ermöglichte, Daten aus anderen Anwendungen oder Ketten zu lesen. Es gelang ihr, die Unterstützung der Community zu gewinnen und verfügt über eine der stärksten Communities. Ein weiteres Beispiel ist Nansen. Berühmtheit erlangte das Unternehmen durch Adressetiketten, die es ihm ermöglichten, Vermögensbewegungen realen Entitäten statt hexanumerischen Adressen zuzuordnen.
Anschließend wurden Funktionen wie NFT Paradise und Token God Mode eingeführt, die es Benutzern ermöglichen, NFTs und Token effektiver zu verfolgen. Arkham brachte ein Produkt auf den Markt, das den Marken von Nansen ähnelte, aber die Investition in Dashboards und Forschung ermöglichte es Nansen, auf Unternehmenskunden zuzugehen und auf sie zugeschnittene Produkte anzubieten. Erwähnenswert ist, dass Netzwerkeffekte ohne die ersten beiden Punkte (Talent und Infrastruktur) nicht möglich sind.
Dies funktioniert beispielsweise bei Indexern. Je mehr Ketten ein Produkt unterstützt, desto höher ist die Wahrscheinlichkeit, dass ein Entwickler das Produkt verwendet, anstatt sich auf mehrere Quellen zu verlassen. Teams wie Covalent haben hier einen Vorteil, da sie seit geraumer Zeit die Breite der unterstützten Ketten optimieren. Aber denken Sie daran, dass Tiefe genauso wichtig ist wie Breite.
Es ist noch zu früh, um zu sagen, ob ein Produkt einen bedeutenden Vorsprung im Kryptobereich hat. Wir haben im Großen und Ganzen die Vorteile von Early-Mover-Unternehmen gesehen. Da Kategorien wie Web3 Social und die Überschneidung zwischen KI und Krypto weiter zunehmen, könnten sich Datenprodukte in der Branche zum nächsten Alphabet entwickeln. Aber das wird eine Geschichte von mehreren Jahrzehnten sein; wir stecken noch in den Anfängen.
Viele der Anwendungsfälle, die wir für diesen Artikel erwähnt haben, befassen sich mit Finanzspekulationen in irgendeiner Form. Sogar die Entwickler, die APIs zum Abfragen von Daten verwenden, entwickeln Finanzprodukte. Es mag seltsam erscheinen, aber Blockchains (als neues Netzwerk) folgen demselben Trend wie der Telegraph und das Internet.
Die Einführung eines neuen Mediums und die Entstehung eines neuen Netzwerks beschleunigen finanzielle Anwendungsfälle. Mit dem Internet dauerte es bis in die frühen 2000er Jahre, bis den Menschen klar wurde, dass Benutzer anhand ihres Standorts gezielt angesprochen werden können. Mit Blockchains überlegen wir immer noch, wie wir Geschäftsmodelle auf der Grundlage öffentlich zugänglicher Datenspuren aufbauen können.
Wir haben eine wesentliche Veränderung in unserer täglichen Nutzung dieser Plattformen festgestellt: Dune Analytics integriert KI in sein Produkt. Dune bietet Benutzern eine SQL-basierte Schnittstelle zum Abfragen von Daten aus Blockchains wie Ethereum und Solana. Der Markt für ein solches Produkt ist normalerweise auf Benutzer beschränkt, die wissen, wie man SQL-Abfragen schreibt. Sie haben vor kurzem damit begonnen, KI zu nutzen, um Analysten bei der Generierung von Abfragen zu helfen, ohne SQL-Experten zu sein. Es ist nicht so funktional, wie man es sich erhoffen würde. Aber es ist immer noch ein Schritt in die Zukunft. Es wird möglicherweise nicht lange dauern, bis wir KI (wie ChatGPT) bitten, Daten aus einer Blockchain abzufragen und deren Analyse anzubieten.
Eine Möglichkeit, „Daten“ im Kontext von Web3 zu betrachten, ist die Betrachtung von Google Maps. GPS gibt es mindestens seit den 1980er Jahren. Google hat die nötige Arbeit investiert, um die Welt zu kartieren. Durch die Bereitstellung der Overlays für Karten für Apps von Drittanbietern (unter Verwendung von APIs) ermöglichte das Unternehmen die Entwicklung einer neuen Generation von Anwendungen. Alles, von der Lieferung bis zum Ride-Hailing, boomte, weil ein auf Daten spezialisierter Einzelanbieter diese Last von den Entwicklern übernommen hat.
Datenprodukte in Web3 dürften eine ähnliche Rolle spielen. Wir kennen die genaue Art der Anwendungen, die auf dieser öffentlich zugänglichen Ressource erstellt werden könnten, noch nicht, aber es zeichnet sich ab, dass es in der Datenlandschaft eine Chance in Alphabet-Größe gibt.
Dieser Artikel wurde ursprünglich auf Decentralised.co veröffentlicht. Wir von GCR stellen Ihnen zweimal im Monat Langformulare von Decentralized zur Verfügung – jeden zweiten Donnerstag! Das Management von über 200 Unternehmen vertraut Decentralised.co, wenn es darum geht, über wichtige Trends, Daten und Erkenntnisse auf dem Laufenden zu bleiben. Melden Sie sich unten für den Newsletter an – mehr über diese Zusammenarbeit für unsere aktivsten Mitglieder auf Discord.
Abonnieren Sie Decentralised.co
Hallo,
Wir hatten am 18. Juli einen Vorläufer zu diesem Artikel geschrieben, falls Sie einen Kontext wünschen, der über das hier Geschriebene hinausgeht.
Alle Lebewesen führen Aufzeichnungen. Tiere verfolgen die Jahreszeiten, um zu verstehen, wann sie jagen müssen. Nagetiere und Vögel lagern Nahrung an einzigartigen Orten. Sie müssen sich daran erinnern, wo sie es gespeichert haben, wenn sie Monate später darauf zugreifen, um sich zu ernähren. Wölfe markieren den Rand ihres Reviers, um anderen Tieren zu signalisieren, dass sie sich fernhalten sollen. Sogar Bäume behalten die Zeit im Auge. Jedes Jahr bildet sich in Stämmen ein Ring. Anhand der Anzahl der Jahresringe kann man das Alter eines Baumes abschätzen.
Obwohl Bäume und Tiere die Zeit verfolgen, können sie die Vergangenheit nicht abrufen oder erzählen. Sie haben keinen Zugriff auf den Speicher. Das ist es, was die Führung menschlicher Aufzeichnungen anders macht. Dank unserer Kommunikationsfähigkeiten wissen wir, dass die Sumerer in Mesopotamien (3400 v. Chr.) und die alten Ägypter (3200 v. Chr.) Keilschrift und Hieroglyphen verwendeten, um Informationen aufzuzeichnen.
Die Menschheit entwickelte sich, als Wissen weitergegeben werden konnte, ohne dass die Quelle physisch beteiligt sein musste. Wir lesen und genießen die Werke von Platon oder Sokrates, lange nachdem sie verschwunden sind, weil wir die Möglichkeit haben, ihre Lehren zu speichern. Schreiben war die ursprüngliche AR-Plattform.
Schreiben aus dem Iran, um den Überblick über Getreide zu behalten. Quelle: Link
Während das Schreiben die Dinge der Fantasie überließ, halfen Daten dabei, die Dinge objektiv zu halten. Es reduzierte die Notwendigkeit für den Einzelnen, Dinge in seinem Gedächtnis zu speichern. Dies ist zum Teil der Grund, warum es in einigen der ältesten menschlichen Texte um Schulden-, Einkommens- oder Handelsaufzeichnungen geht.
Im postindustriellen Zeitalter bauten Unternehmen Wettbewerbsgräben auf, um ihre Marktposition zu stärken, indem sie ihre Verkaufsunterlagen digitalisierten. Ein Beispiel hierfür ist ein indisches Unternehmen namens Asian Paints. Ihre Farben sind vielleicht nicht die besten auf dem Markt, aber sie kontrollieren einen Marktanteil von über 50 % an Indiens 8-Milliarden-Dollar-Farbenindustrie.
Warum? Die einfache Antwort ist, dass es sich um eine bekannte Marke handelt und das Unternehmen über Skaleneffekte verfügt. Aber wie sie dorthin gelangten, hat ihre Wurzeln in Daten. Sie investierten stark in die Datenerfassung und -verarbeitung, um ihre Lieferkette zu optimieren.
Zum Vergleich: Die Aktie von Asian Paints verzeichnete in den letzten 30 Jahren eine erstaunliche jährliche Wachstumsrate von 25 %. Dieses Wachstum wurde in den 1970er Jahren durch die Investition in einen Großrechner unterstützt. Das Gerät war leistungsstärker als die Geräte, die damals in den besten Forschungseinrichtungen Indiens eingesetzt wurden. Es sammelte stündlich Daten über die Farbe und Menge der in ganz Indien verkauften Farbe. Dadurch konnte Asian Paints ein Modell erstellen, das die Farbnachfrage in ganz Indien mit einer Genauigkeit von 98 % vorhersagt.
Diese Vorhersagekraft ermöglichte es Asian Paints, den größtmöglichen Nutzen zu erzielen, da die Wiederbeschaffungszeit drastisch verkürzt werden konnte. Damals bestand die Norm für den Verkauf von Waren wie Farben darin, sie an einen Großhändler zu verkaufen, der sie dann an einen Großhändler weitergab, der sie wiederum an einen Händler verkaufte. Der Händler würde direkt mit dem Verbraucher interagieren. Der Grund für eine so komplexe Lieferkette lag darin, dass jede Partei über einen Bestand an Vermögenswerten verfügte und Daten über Angebot und Nachfrage nach Farbe kontrollierte.
Herr Choksey – der Gründer von Asian Paints – entfernte Großhändler und Händler aus der Lieferkette, indem er die Konsummuster des Endverbrauchers untersuchte und die Abhängigkeit von Zwischenhändlern verringerte. Durch den Wegfall der Zwischenhändler konnte sich Asian Paints 97 % des MRP (3 % an die Händler) sichern, verglichen mit 60 % der Konkurrenz.
Der vom Telegraphen extrahierbare Wert wären die über den Telegraphen übertragenen Tickerbänder.
Der Übergang zur Digitalisierung erfolgte nicht über Nacht. Ein Teil dessen, was die Datenerhebung interessant machte, war die Finanzwelt und ihre langsame Vernetzung. Beispielsweise wurden Ende des 20. Jahrhunderts Börsendaten mithilfe von Geräten wie dem oben genannten über den Telegrafen übermittelt. Bereits 1835 brachten Händler Tauben bei, Zettel mit Informationen über die Geschehnisse in Europa zu tragen. Wenn Dampfschiffe, die Waren transportierten, sich dem Land in einer Entfernung von bis zu 50 Meilen näherten, flogen die Tauben mit der Information zu bestimmten Orten. Früher zahlten Händler bis zu 500 US-Dollar für jede Stunde im Voraus, in der sie die Nachrichten erhalten konnten.
Ab 1867 begannen Händler miteinander zu konkurrieren, um die Geschwindigkeit der Informationsübermittlung über den Telegrafen zu optimieren. Ein Mitarbeiter von Western Union namens E. A. Calahan zahlte über 200.000 US-Dollar an die NYSE für die Möglichkeit, Mitarbeiter auf ihren Handelsplatz zu schicken, um Tickerdaten an seine Kunden weiterzuleiten. Einer der Personen, die fleißig an der Optimierung des Systems arbeiteten, war ein junger Wissenschaftler namens Thomas Alva Edison. Ein Jahrhundert später würden Tools wie das Bloomberg-Terminal das Tempo und die Menge der an einem bestimmten Tag übermittelten Finanzdaten exponentiell steigern.
Daten müssen wie Rohöl mehrere Veredelungsschritte durchlaufen, bevor sie verwendet werden können. Zu erfahren, wie Bloomberg gewachsen ist, gibt Aufschluss darüber, wie sich die gesamte Datenlandschaft entwickelt hat und welcher Prozess. Bloomberg war nicht der erste Versuch, Technologie zur Verbesserung von Handels- und Berichtsmechanismen einzusetzen. NASDAQ nutzte Bunker Ramo- Terminals, um Informationen zu verbreiten und Geld-/Briefaufträge zu erteilen. Allerdings würde die Skalierung dieses Modells immer eine Herausforderung darstellen, wenn man sich auf frühere Telefonkommunikationsnetze verlassen würde.
Quelle – NASDAQ – Die Entwicklung des automatisierten OTC-Handels
Im Jahr 1981 wurde Michael Bloomberg, Partner der Investmentbank Solomon Brothers, mit 10 Millionen US-Dollar für sein Eigenkapital entlassen, als die Phibro Corporation die Bank übernahm. Er erkannte, dass Anleger angesichts der zunehmenden Elektronisierung der Finanzmärkte von New York bis Japan bereit sind, für optimierte Finanzinformationen zu zahlen. Er gründete ein Datendienstleistungsunternehmen namens Innovative Market System, das 1986 in Bloomberg umbenannt wurde.
Bevor das Internet aufkam, wurde das Bloomberg-Terminal über The Chiclet erreicht. Diese wurde über ein spezielles Kabel mit dem Bloomberg-Controller verbunden und über dedizierte Telefonleitungen mit dem lokalen Hub verbunden. Bloomberg sammelte Daten über Datenpartnerschaften, Nachrichtenagenturen und Pressemitteilungen sowie proprietäre Methoden wie manuelle Dateneingabe und telefonische Datenerfassung.
Mit dem Internet öffneten sich die Informationsschleusen. Heute beschafft, verarbeitet und liefert Bloomberg 200 Milliarden Finanzinformationen nahezu in Echtzeit. Das sind etwa 23 Millionen Datenpunkte pro Sekunde. Einige der auf Bloomberg verfügbaren Informationen sind öffentlich. Datenpunkte wie Unternehmensabschlüsse sowie Aktien- und Anleihekurse können in öffentlichen Foren gefunden werden.
Was aber, wenn Sie Öl- und Gasanalyst sind und die Bewegung von Rohölbehältern verstehen möchten? Es ist unwahrscheinlich, dass Sie diese Informationen in Echtzeit erhalten, wenn Sie keine Datenquelle wie Bloomberg abonnieren. Nicht alle Daten im Internet sind frei verfügbar.
Wenn es um Daten in Web2 geht, gibt es für Einzelpersonen typischerweise zwei Einschränkungen: berechtigten Zugriff und eine hohe Hürde bei der Verarbeitung großer Datenmengen. Im Laufe der Jahre haben Anbieter wie Bloomberg Netzwerkeffekte aufgebaut, die stark genug sind, um Daten über ihre Tochtergesellschaften zu beziehen, was sich Analysten oder Investoren nicht leisten können.
Es ist besser, Bloomberg 20.000 US-Dollar für ein Jahresabonnement zu zahlen, als zu versuchen, die Daten von einer Mischung aus Datenplattformen zu beziehen, die jeweils unterschiedliche Preisstufen haben können. Selbst wenn Sie hart genug arbeiten, um an die Daten zu gelangen, können Sie ohne erhebliche Infrastrukturausgaben keine Analysen in Echtzeit verarbeiten und ausführen. Auf der Einzelhandelsseite handelte es sich bei vielen Plattformen, die schließlich skalierten, um Datenabgleichs-Engines.
Stellen Sie sich das so vor: Google (die Suchmaschine) ist ein Datenunternehmen, das Unternehmen gegen Werbegelder Zugang zu Nutzern bietet. Wenn ein Restaurant oder ein Newsletter (wie unseres) Nutzer ansprechen möchte, die bei Google nach Informationen suchen, gleichen sie Angebot und Nachfrage nach ähnlichen Informationen ab. Jemand, der nach Informationen zu einem Newsletter speziell für Web3 sucht, sucht nach uns. Und wir suchen diese Person. (Ich widerstehe dem Drang, unser Empfehlungsprogramm hier anzuschließen.)
Google hat aufgrund der Skaleneffekte, in denen es agiert, ein Monopol aufgebaut. Ihr Bestand an Benutzern und die Anzahl der Anfragen, die ihre Benutzer jeden Tag stellen, sind nach wie vor konkurrenzlos. Google baute diese Position aus, indem es zu einer Zeit, als Werbung die Norm war, eine Suchmaschine einführte, die keine Anzeigen enthielt, dann durch die Übernahme von YouTube und Android und schließlich durch die Bezahlung von Konkurrenten wie Apple, um Google zur Standardsuchmaschine zu machen. Allein für Apple zahlt Google 20 Milliarden US-Dollar pro Jahr , um die Standardsuchmaschine in Safari zu bleiben.
Google zahlt diese Prämie, weil sein Angebot im Kern eine Matching-Engine ist. Die Matching-Engine bringt Benutzer mit Bedarf mit Unternehmen in Kontakt, die ein Angebot haben. Die meisten Monopole im Internet sind im Kern Matching-Engines. Amazon bringt Produktverkäufer mit Käufern zusammen. Instagram bringt ein Publikum mit YouTubern zusammen. Diese Matching-Engines funktionieren, weil Interaktionen mit diesen Produkten reichhaltige Spuren hinterlassen, aus denen der Kontext abgeleitet werden kann.
Ben Evans schrieb im Jahr 2022 bekanntlich, dass es keine Daten gebe. Für Dritte ist es nicht viel wert, meine Inhalte, Essens- oder Reisepräferenzen zu kennen. Wertvoll – für Handel oder Forschung – wird es erst dann, wenn es aggregiert oder mit Kontext angereichert wird.
Kontext in dem Sinne, dass meine Vorlieben, Biriyani an einem Freitagabend zu essen, genutzt werden könnten, um mir die Lieferung von Biriyani genau dann anzukündigen, wenn die Wahrscheinlichkeit, dass ich es kaufe, am höchsten ist. Insgesamt trägt der Vergleich der Wahrscheinlichkeit meines Kaufs mit der eines Konkurrenten in derselben Region dazu bei, Benutzer besser anzusprechen.
Um wertvoll zu sein, müssen Daten entweder skaliert (in großer Zahl) oder kontextbezogen sein. Der Unterschied zwischen Web3- und Web2-Produkten liegt in der Vergangenheit in den Spuren, die sie hinterlassen. Nur Amazon weiß, wie viele Xbox-Controller in einer bestimmten Woche verkauft würden. Aber Sie können die Muster erkennen, nach denen Händler an jedem Tag NFTs auf OpenSea kaufen oder verkaufen. Der Grund dafür ist, dass jede dieser Transaktionen eine öffentliche Spur hinterlässt.
Datenprodukte in Web3 nutzen diese Trails, um Kontext zu erstellen.
Blockchains wie Ethereum und Bitcoin produzieren alle 12 Sekunden bzw. etwa 10 Minuten Blöcke. Jeder Block enthält Transaktionen, die den Zustand der Blockchain ändern. Block-Explorer wie Etherscan erfassen Daten zu allen Transaktionen. Wenn Sie beispielsweise zu Etherscan gehen und einen Block sehen, sehen Sie möglicherweise das Bild unten.
Transaktionen auf der Blockchain sind reich an Kontext. Produkte wie Arkham und Nansen sind Interpretationsmaschinen, mit denen Forscher verstehen können, was bei einer Transaktion vor sich geht.
Sie können alle Blöcke seit dem Start von Ethereum anzeigen. Doch was kann man mit diesen Informationen anfangen? Fast nichts. Sie benötigen also eine Möglichkeit, diese Daten in mehreren Tabellen zu erfassen. Wenn beispielsweise ein NFT-Vertrag eines Marktplatzes in einem Block aufgerufen wird, sollten die mit dieser Transaktion verbundenen Daten an NFT-bezogene Tabellen angehängt werden, oder wenn ein Uniswap-Vertrag aufgerufen wird, sollten die zugehörigen Daten in DEX-bezogenen Tabellen gespeichert werden . (Dune macht dies als Service.)
Sie können die Rohdaten nicht analysieren, ohne dass erhebliche Infrastrukturkosten anfallen. Obwohl die Daten frei verfügbar sind, treten dieselben Probleme auf. Als Investor oder dApp-Entwickler sind Sie auf externe Daten angewiesen. Ihre Kernaufgabe besteht jedoch nicht darin, Daten zu sammeln und zu verwalten. Ressourcen für wesentliche, aber nicht zum Kerngeschäft gehörende Aktivitäten aufzuwenden, ist kein Luxus, den sich jedes Unternehmen leisten kann.
Bei Datenprodukten macht der Kontext rund um die Daten das Produkt einzigartig. Bloomberg nutzt sein finanzielles Verständnis und wandelt Daten in eine Form um, die Erfinder und Händler leicht nutzen können. Websites wie Similarweb oder Forschungspublikationen wie Newzoo nutzen ihre Kernkompetenzen, um sozialen oder spielbezogenen Kontext auf die von ihnen erfassten Daten anzuwenden.
Native Blockchain-Datenprodukte zeichnen sich dadurch aus, dass sie Benutzerkontext durch Abfragen bereitstellen, die Fragen beantworten, die für bestimmte Benutzeruntergruppen relevant sind. TokenTerminal berechnet beispielsweise die wirtschaftlichen Grundlagen von Protokollen. Nansen hilft Marktteilnehmern, die Bewegung von Vermögenswerten zu kennzeichnen und zu verstehen. Parsec fragt On-Chain-Daten ab, um Händlern dabei zu helfen, DeFi-Positionen besser zu analysieren.
Alle diese Produkte basieren auf einem öffentlichen Gut: On-Chain-Daten. Der Unterschied besteht darin, wie diese Produkte ihre Daten präsentieren, was sie für unterschiedliche Zielgruppen attraktiv macht.
Die Aufteilung der Produktkategorien in unserer Branche basiert darauf, welche Daten in die Kette gelangen und welche Informationen aus Quellen außerhalb der Kette stammen. (Einige verwenden oft beides.) Datenanbieter verwenden ihre Kontextfilter, um Produkte zu erstellen. So wie Web2-Daten ihre Nischen haben, haben Web3-Datenunternehmen mithilfe ihrer Kernkompetenzen Gräben errichtet oder bauen diese nach und nach aus.
Daher bestimmt häufig der Hintergrund der Gründer die Art der veröffentlichten Produkte. Wenn ein Kernteam vor der Krypto-Währung viel Zeit auf den Kapitalmärkten verbracht hat, neigen seine Produkte dazu, Bloomberg nachzuahmen, während krypto-native Produkte wie Nansen aussehen. Unterschiedliche Produkte erfüllen unterschiedliche Anforderungen, selbst wenn dieselben Daten abgefragt werden.
Beispielsweise verwerfen Börsen Daten normalerweise in festgelegten Zeitabständen. Sie sind nicht im Datengeschäft tätig und die Speicherung alter Daten erfordert zusätzliche Server und Verwaltungsaufwand. Einige Datenanbieter wie Kaiko und Amberdata verwalten historische Orderbuchdaten von Börsen. Solche Daten ermöglichen es Händlern und Investoren, Modelle zu erstellen, um ihre Hypothesen zu testen. Wenn Sie jedoch verstehen möchten, welche DeFi-Verträge durch den Zufluss von ETH oder Stablecoins gelöscht werden, oder das On-Chain-Verhalten bestimmter Adressen oder Einheiten analysieren möchten, benötigen Sie ein Produkt von Nansen oder Arkham.
Die Marktkarte ist nicht für jeden Spieler in jeder Kategorie repräsentativ.
Eine Möglichkeit zu verstehen, wie Produkte auf den Märkten positioniert wurden, ist die Betrachtung von Verbraucherpersönlichkeiten in Krypto. Diese Personas können in die folgenden vier Schlüsselkategorien eingeteilt werden.
Während eines Bärenmarktes kommen die meisten Dollars, die über Krypto-Datenprodukte fließen, von Finanzinstituten. Dabei handelt es sich um Großkunden mit längeren Verkaufszyklen und weitaus komplexeren Datenanforderungen. Eine Möglichkeit herauszufinden, ob ein Produkt für Finanzinstitute bestimmt ist, besteht darin, dass ein Kunde ein Verkaufsgespräch führen muss, um festzustellen, wie viel es kostet. In der Web2-Welt können Sie nicht herausfinden, wie viel PitchBook oder CB Insights kostet. Im Krypto-Bereich weiß man nicht, was ein Produkt wie Chainalysis kosten würde.
Spaß beiseite: Einer der Gründe für einen solchen Verkaufsprozess ist der praktische, erstklassige Service, den Datenprodukte bieten, die sich an dieses Verbrauchersegment richten. Diese Benutzer entscheiden sich normalerweise für hochgranulare und häufige Daten. Sie benötigen Daten nicht nur für Entscheidungen vor dem Handel, sondern auch für die Verwendung nach dem Handel, um Compliance- und Steueranforderungen zu erfüllen.
Sie benötigen beispielsweise Produkte, die ihnen den historischen Wert ihres Portfolios verraten, ihnen bei Steuerberechnungen helfen und so weiter. Firmen wie Amberdata, Kaiko, CoinMetrics, CryptoCompare und teilweise auch Nansen bedienen diese Kunden.
Meiner Erfahrung nach ist es nur Gründern mit Erfahrung in Institutionen oder Teams mit großen Finanzierungsrunden gelungen, den institutionellen Markt für Daten zu erschließen. Die Eintrittsbarriere ist hier, wie bei jedem Unternehmensprodukt, relativ hoch.
Wir stoßen häufig auf die Composability-Funktion von Web3, was bedeutet, dass Web3-Anwendungen voneinander abhängig sein können. Sie könnten Daten voneinander verlangen. Daher müssen sie ständig Daten voneinander lesen. Beispielsweise muss eine Plattform wie Yearn Finance Daten von Aave und Compound lesen, und ein NFT-Aggregator wie Tensor muss Daten von Magic Eden und anderen Marktplätzen lesen.
Aber diese Daten werden blockübergreifend auf Ketten wie Ethereum und Solana gespeichert. Ethereum erstellt einen Block in 12 Sekunden und Solana in 400 ms. Blockchain-Daten in Tabellen zu sortieren und für einen schnellen Zugriff zu speichern, ist keine triviale Aufgabe. Hier kommen Indexer wie Covalent, Graph, Chainlink und Powerloom ins Spiel. Sie stellen sicher, dass die Rohdaten der Blockchain in einem gewünschten Format gespeichert werden, sodass Entwickler sie über einfache API-Aufrufe abrufen können.
Ein aufstrebendes Segment dieser Verbraucherpersönlichkeit sind Tools zum Verständnis des Benutzerverhaltens. Mit ARCx können Entwickler beispielsweise Off-Chain-Daten (wie Browserverhalten) mit On-Chain-Daten (wie Wallet-Adressen) abbilden, um die demografischen Informationen von Benutzern zu erfassen, die mit einer dApp interagieren. Sie befinden sich in einer relativ kleinen, aber relevanten Nische, da sie Entwicklern dabei helfen, herauszufinden, wer ihre Benutzer sind.
Datenprodukte in Krypto finden häufig Verbreitung durch die Zusammenarbeit mit Forschern und Publikationen. CCData beispielsweise wird häufig auf Bloomberg zitiert. Forscher werden dazu angeregt, auf Datenprodukte zurückzugreifen, da diese dabei helfen, beim Sammeln, Bereinigen oder Kuratieren von Daten Zeit und Aufwand zu sparen. Produkte wie Dune haben einen Burggraben geschaffen, indem sie eine Community von Analysten aufgebaut haben, die miteinander konkurrieren, um einen höheren Rang auf ihrer Liste zu erreichen.
Veröffentlichungen wie The Block und Delphi präsentieren Dashboards, die mit Daten von Drittanbietern erstellt wurden. Hier bei Decentralised.co verlassen wir uns vollständig auf externe Datenanbieter, da diese dazu beitragen, das Team schlank zu halten und gleichzeitig externe Ressourcen bei der Datenerfassung einzusetzen.
Die Herausforderung bei der Betreuung dieses Verbrauchersegments besteht darin, dass kleinere Forscher möglicherweise nicht über das erforderliche Budget verfügen, um die Aufwendung enormer Ressourcen für die Entdeckung von Nischenerkenntnissen zu rechtfertigen, die möglicherweise nur für eine einzelne Person relevant sind. Umgekehrt besteht für Unternehmen ein guter Anreiz, Aufwand und Ressourcen in die Zusammenarbeit mit bedeutenden Publikationen wie der Financial Times zu investieren, da dies bei der Verbreitung hilft.
Produkte, die sich an Privatanleger richten, weisen in der Regel eine geringere Granularität und Häufigkeit der Daten auf. Aber es handelt sich um äußerst profitable Nischen, die man erschließen kann, da sie Skaleneffekte erzielen. Zehntausend Benutzer, die jeweils 100 US-Dollar zahlen, sind ein ARR-Geschäft von 1 Million US-Dollar in einer Welt, in der es keine Abwanderung gibt. Das ist leichter gesagt als getan, aber diese wirtschaftlichen Aspekte erklären, warum wir so viele einzelhandelsorientierte Kryptodatenprodukte haben.
Ein großer Teil der einzelhandelsorientierten Produkte ist kostenlos oder wird durch Werbung unterstützt. Eine kostenlose Ressource wie DefiLlama sagt Ihnen beispielsweise nicht, wie Sie Ihre Order über verschiedene Börsen (CEXs und DEXs) weiterleiten können, um Slippage zu vermeiden, da sie keine Orderbuch-Snapshots erstellt, sondern zeigt Informationen über Token-Freischaltungen oder Ertrags-Freischaltungen an.
Eine Änderung in diesem Verbrauchersegment besteht darin, wie das Liefermedium eine neue Marktkategorie eröffnet – Cielo liefert beispielsweise Daten als Benachrichtigungen über Telegram. Es hat sich auf über 40.000 Benutzer ausgeweitet, indem es Informationen auf benutzerfreundliche Weise für ein Verbrauchersegment weitergibt, das sich lieber nicht mit Desktop-Schnittstellen befassen möchte. Wenn es richtig gemacht wird, können sogar Vertriebsmedien ein Unterscheidungsmerkmal für Unternehmen in der Anfangsphase sein. Sogar in Daten.
Obwohl die Klassifizierung stellenweise unscharf ist, können Datenunternehmen in B2B- oder B2C-Ausrichtungen unterteilt werden.
Unternehmen wie Amberdata und Kaiko verfügen über Produkte, die sich an anspruchsvolle Schauspieler richten. Diese Produkte sind detaillierter (Details, in denen die Daten verfügbar sind) und häufiger (z. B (Tick-by-Tick- und Echtzeit-Orderbuchdaten) und sie erfüllen Anforderungen wie die Erstellung und Prüfung von Modellen, Pre-Trade-Analysen, Post-Trade-Reporting, Besteuerung und Compliance. Die Daten werden in einem Format bereitgestellt, das es Kunden ermöglicht, eigene Analysen durchzuführen und Visualisierungen nach ihrem Geschmack zu erstellen. Diese Unternehmen bieten ihre Produkte typischerweise hinter einer Paywall an.
Die Kosten hängen im Allgemeinen von der Granularität aufgrund der Infrastrukturanforderungen, der Art der beteiligten Kundschaft und der Länge des Verkaufszyklus ab.
Das Bild oben stellt verschiedene Produkte auf zwei Achsen dar – Tiefe und Granularität im Vergleich zu den Produktpreisen. Bitte beachten Sie, dass diese Darstellungen nicht exakt sind. Ein paar Punkte könnten fehl am Platz sein. Die Idee besteht darin, ein mentales Modell zu entwickeln, um mehrere Produkte und deren Stellung auf dem Markt zu durchdenken.
Einzelhandelsorientierte Produkte wie Dune oder CoinGecko zeigen fast alle Daten kostenlos an. Kunden müssen für den Zugriff auf bestimmte Daten bezahlen oder wenn sie Daten über APIs zum Ausführen ihrer Analysen benötigen. Sie können beispielsweise alle Diagramme anzeigen, die von mehreren Dune-Assistenten erstellt wurden, diese begrenzen jedoch die Anzahl der Zeilen, die Sie im CSV-Format herunterladen können. Sie können größere CSV-Dateien herunterladen und private Abfragen anzeigen, wenn Sie mehr bezahlen.
Einzelhandelsorientierte Unternehmen haben tendenziell einen geringen Umsatz pro Kunde und einen geringen Anteil zahlender Kunden im Verhältnis zu den kostenlosen Nutzern. Vergleichen Sie dies mit den Umrechnungskursen für die Freemium-Modelle von Internetunternehmen. Normalerweise beträgt die Conversion-Rate 2%–5%. Eine Conversion-Rate von 10 % wäre ein Ausreißer. Ihr Ziel ist es, so viele kostenlose Kunden wie möglich zu haben, sodass eine Conversion-Rate von 4 % erheblich zum Umsatz beiträgt. Dies ist, was wir die Spitze des Trichters nennen.
Daher müssen Datenunternehmen die Spitze des Trichters groß genug sein, um genügend Umsatz zu generieren und sich bei einer niedrigeren Conversion-Rate behaupten zu können. Unternehmen können auch erwägen, Einnahmen aus Werbung zu erzielen, wenn die Website viele Besucher hat. CoinGecko nutzt Werbeeinnahmen als Druckmittel, um die meisten Daten weiterhin kostenlos bereitzustellen.
Im Laufe der Jahre haben Unternehmen an beiden Enden des Spektrums (B2B und B2C) Plätze besetzt und dazwischen einige Lücken hinterlassen. Wenn jemand sehen möchte, wie sich die Auftragsbücher an zentralisierten Börsen ändern oder wie sich die Put-Call-Verhältnisse, IVs und Skews ändern, gibt es nicht viele Produkte, die bei der Visualisierung helfen. Es gibt Platz für ein detaillierteres Produkt als die CoinGeckos dieser Welt, aber weniger detailliertes Produkt als Produkte von reinen B2B-Spielern.
Es ist nicht einfach, in Unternehmen, in denen der Rohstoff kostenlos ist, Gräben zu finden. Blockchain-Daten sind frei verfügbar. Die Daten, die Sie sammeln können, sind nicht proprietär. Die Gräben in Datengeschäften basieren also nicht nur darauf, dass Sie über einige Daten verfügen, die andere nicht haben. Stattdessen basieren sie auf der Fähigkeit eines Teams, die Daten in einem aufschlussreichen, nutzbaren Format pünktlich und fehlerfrei bereitzustellen.
Viele Unternehmen behaupten, über die gleichen Daten zu verfügen, die Datenqualität und deren Darstellung unterscheiden sich jedoch. Viele Unternehmen behaupten beispielsweise, über Off-Chain-Auftragsbuchdaten zu verfügen. Allerdings unterscheiden sich Faktoren wie die Anzahl der Geld-/Briefaufträge, die Länge der Zeitreihen und die Anzahl der verfügbaren Börsen und Paare von Anbieter zu Anbieter. Amberdata und Kaiko verfügen über die umfassendsten Orderbuchdaten für Kryptomärkte.
Warum aber können nur wenige Anbieter solche Daten bereitstellen? Die Erklärung dafür, wo Gräben in Web3-Daten entstehen, liegt hier.
Talent – Auf die Gefahr hin, das Offensichtliche zu sagen: Wenn das Rohmaterial kostenlos ist, bestimmt die Art und Weise, wie man es formt, den Wert des Produkts. Um Rohdaten in nützliche Informationen umzuwandeln, ist Fachwissen in vielen Nischen der Krypto- und traditionellen Finanzmärkte erforderlich. Teams wie Velo Data mit Erfahrung in traditionellen Märkten haben einen Vorteil gegenüber anderen, die versuchen, ähnliche B2C-Produkte zu entwickeln. Es ist selten, talentierte Entwickler zu finden, die Blockchain-Datenstrukturen verstehen und über einschlägige Erfahrung auf den Finanzmärkten verfügen.
Infrastruktur – Das Sammeln und Bereitstellen großer Datenmengen erfordert eine Infrastruktur, die nicht einfach zu beschaffen ist. Diese Art von Operation erfordert Kapital und Talent. Warum ist Infrastruktur ein Wassergraben? Denken Sie an Speicherpooldaten. Blöcke enthalten Daten für bestätigte Transaktionen. Was ist mit unbestätigten Transaktionen?
Verschiedene Netzwerkknoten (z. B. Knoten, die mit demselben Pool verbunden sind) sehen unterschiedliche unbestätigte Transaktionen. Wenn Sie nur einen Knoten ausführen, erhalten Sie keinen globalen Überblick über konkurrierende Transaktionen. Die Verwaltung mehrerer Knoten auf mehreren Blockchains erhöht die Infrastrukturkosten. Ähnlich wie bei KI (und Content-Netzwerken in der Vergangenheit) wird die Fähigkeit, die Hardwarekosten bei gleichzeitiger Skalierung niedrig zu halten, im Laufe der Zeit über die Gewinner und Verlierer in der Branche entscheiden.
Netzwerkeffekte – Man kann die Hypothese aufstellen, dass es in vielen Krypto-Datenprodukten Netzwerkeffekte gibt. Nehmen Sie Chainlink als Beispiel. Es war eines der ersten Orakel, das es Anwendungen ermöglichte, Daten aus anderen Anwendungen oder Ketten zu lesen. Es gelang ihr, die Unterstützung der Community zu gewinnen und verfügt über eine der stärksten Communities. Ein weiteres Beispiel ist Nansen. Berühmtheit erlangte das Unternehmen durch Adressetiketten, die es ihm ermöglichten, Vermögensbewegungen realen Entitäten statt hexanumerischen Adressen zuzuordnen.
Anschließend wurden Funktionen wie NFT Paradise und Token God Mode eingeführt, die es Benutzern ermöglichen, NFTs und Token effektiver zu verfolgen. Arkham brachte ein Produkt auf den Markt, das den Marken von Nansen ähnelte, aber die Investition in Dashboards und Forschung ermöglichte es Nansen, auf Unternehmenskunden zuzugehen und auf sie zugeschnittene Produkte anzubieten. Erwähnenswert ist, dass Netzwerkeffekte ohne die ersten beiden Punkte (Talent und Infrastruktur) nicht möglich sind.
Dies funktioniert beispielsweise bei Indexern. Je mehr Ketten ein Produkt unterstützt, desto höher ist die Wahrscheinlichkeit, dass ein Entwickler das Produkt verwendet, anstatt sich auf mehrere Quellen zu verlassen. Teams wie Covalent haben hier einen Vorteil, da sie seit geraumer Zeit die Breite der unterstützten Ketten optimieren. Aber denken Sie daran, dass Tiefe genauso wichtig ist wie Breite.
Es ist noch zu früh, um zu sagen, ob ein Produkt einen bedeutenden Vorsprung im Kryptobereich hat. Wir haben im Großen und Ganzen die Vorteile von Early-Mover-Unternehmen gesehen. Da Kategorien wie Web3 Social und die Überschneidung zwischen KI und Krypto weiter zunehmen, könnten sich Datenprodukte in der Branche zum nächsten Alphabet entwickeln. Aber das wird eine Geschichte von mehreren Jahrzehnten sein; wir stecken noch in den Anfängen.
Viele der Anwendungsfälle, die wir für diesen Artikel erwähnt haben, befassen sich mit Finanzspekulationen in irgendeiner Form. Sogar die Entwickler, die APIs zum Abfragen von Daten verwenden, entwickeln Finanzprodukte. Es mag seltsam erscheinen, aber Blockchains (als neues Netzwerk) folgen demselben Trend wie der Telegraph und das Internet.
Die Einführung eines neuen Mediums und die Entstehung eines neuen Netzwerks beschleunigen finanzielle Anwendungsfälle. Mit dem Internet dauerte es bis in die frühen 2000er Jahre, bis den Menschen klar wurde, dass Benutzer anhand ihres Standorts gezielt angesprochen werden können. Mit Blockchains überlegen wir immer noch, wie wir Geschäftsmodelle auf der Grundlage öffentlich zugänglicher Datenspuren aufbauen können.
Wir haben eine wesentliche Veränderung in unserer täglichen Nutzung dieser Plattformen festgestellt: Dune Analytics integriert KI in sein Produkt. Dune bietet Benutzern eine SQL-basierte Schnittstelle zum Abfragen von Daten aus Blockchains wie Ethereum und Solana. Der Markt für ein solches Produkt ist normalerweise auf Benutzer beschränkt, die wissen, wie man SQL-Abfragen schreibt. Sie haben vor kurzem damit begonnen, KI zu nutzen, um Analysten bei der Generierung von Abfragen zu helfen, ohne SQL-Experten zu sein. Es ist nicht so funktional, wie man es sich erhoffen würde. Aber es ist immer noch ein Schritt in die Zukunft. Es wird möglicherweise nicht lange dauern, bis wir KI (wie ChatGPT) bitten, Daten aus einer Blockchain abzufragen und deren Analyse anzubieten.
Eine Möglichkeit, „Daten“ im Kontext von Web3 zu betrachten, ist die Betrachtung von Google Maps. GPS gibt es mindestens seit den 1980er Jahren. Google hat die nötige Arbeit investiert, um die Welt zu kartieren. Durch die Bereitstellung der Overlays für Karten für Apps von Drittanbietern (unter Verwendung von APIs) ermöglichte das Unternehmen die Entwicklung einer neuen Generation von Anwendungen. Alles, von der Lieferung bis zum Ride-Hailing, boomte, weil ein auf Daten spezialisierter Einzelanbieter diese Last von den Entwicklern übernommen hat.
Datenprodukte in Web3 dürften eine ähnliche Rolle spielen. Wir kennen die genaue Art der Anwendungen, die auf dieser öffentlich zugänglichen Ressource erstellt werden könnten, noch nicht, aber es zeichnet sich ab, dass es in der Datenlandschaft eine Chance in Alphabet-Größe gibt.