DIN: Réseau d'Intelligence des Données

Intermédiaire11/19/2024, 1:41:35 AM
Au cœur de DIN se trouve une couche de données qui collecte et valide à la fois les données on-chain et off-chain, tout en utilisant la blockchain comme couche de règlement. La grande idée ? Redonner la propriété des données aux utilisateurs et leur permettre de gagner des récompenses pour ce qu'ils apportent au système.

La ruée vers l'or des données

Pendant la ruée vers l'or de Californie du milieu des années 1800, des milliers de personnes ont poursuivi la promesse de richesses inexploitées dans une nouvelle frontière.

Les gens qui n'avaient jamais été riches se sont soudain retrouvés avec des fortunes, les histoires de la misère à la richesse sont devenues monnaie courante et des industries entières et des villes ont surgi pour soutenir la ruée. L'infrastructure s'est développée à un rythme effréné, remodelant le paysage américain.

Les parallèles avec Crypto AI sont difficiles à ignorer.

La plupart des produits Crypto AI d'aujourd'hui sont encore en développement ou fonctionnent sur des testnets, ce qui indique que nous sommes fermement dans la phase de construction de l'infrastructure.

Les investisseurs et les constructeurs posent les bases, se positionnant pour une éventuelle explosion de croissance. Les outils, les réseaux et les protocoles qui sont en train d'être établis maintenant constituent la base de ce qui pourrait devenir un écosystème d'IA décentralisé et étendu.

Si l'analogie se maintient, nous assistons aux premiers stades d'une ruée vers l'or numérique - une ruée qui pourrait être tout aussi transformative que son homologue du 19e siècle.

Imaginez donc ma surprise lorsque je suis tombé sur un projet Crypto AI revendiquant plus de 700 000 utilisateurs actifs quotidiens. Pas mensuels - quotidiens. Dans un domaine aussi naissant que celui-ci, de telles mesures d'utilisation sont pratiquement inédites. Naturellement, j'ai dû creuser et comprendre ce qui se passait réellement sous le capot.

Ce projet?DIN, un "Data Intelligence Network"

La cryptographie stimule les réseaux de données

Source:Andy Scherpenbeg

J'ai suivi de près les réseaux de données dans Crypto AI, et il est clair qu'ils abordent un point critique dans le paysage de l'IA: l'accès à des ensembles de données précieux.

Aujourd'hui, bon nombre des sources de données les plus précieuses sont étroitement contrôlées par des entités centralisées, qui facturent des frais élevés pour y accéder.

Par exemple :

  • Reddit a signé un contrat de 60M$/an.accord de licenceavec OpenAI pour fournir l'accès à son contenu généré par les utilisateurs.
  • X (anciennement Twitter) ne propose plus un accès gratuit à l'API aux développeurs, maintenant en facturant entre 100 $ et 42 000 $ (sans blague) par mois pour les données de tweets.

Le message est clair: les entreprises reconnaissent que les données sont le nouveau champ de bataille et qu'elles verrouillent le contrôle pour maximiser les profits.

La cryptographie offre une solution potentielle, un moyen de se libérer de l'emprise centralisée sur des ensembles de données précieuses.

Les réseaux de données cryptographiques adoptent une approche fondamentalement différente, visant à construire des ensembles de données décentralisés de haute qualité sans les goulots d'étranglement des modèles traditionnels. En utilisant des jetons, ces réseaux peuvent inciter à des efforts d'étiquetage de données à grande échelle, motivant les individus à contribuer à la collecte de données de masse ou même à organiser des efforts pour extraire des données d'entraînement sur le Web (quelqu'un a-t-il dit... Grass ?).

Entre-temps, les blockchains fournissent une transparence, créant un cadre pour suivre la propriété et la provenance des données. Cela garantit que les contributeurs sont justement compensés chaque fois que leurs données sont utilisées, établissant un nouveau paradigme où la valeur des données est partagée plutôt que monopolisée.

Vision de DIN

DIN est l'une des équipes qui s'attaque directement au problème des données.

Au cœur, DIN est une couche de données qui collecte et valide à la fois des données on-chain et off-chain, tout en utilisant la blockchain comme couche de règlement.

La grande idée ? Redonner la propriété des données aux utilisateurs et leur permettre de gagner des récompenses pour leur contribution au système.

Comment fonctionne DIN ?

À première vue, ce diagramme peut sembler complexe, mais examinons-le de plus près.

Il y a trois acteurs principaux dans le réseau DIN:

  1. Collecteurs de données
  2. Validateurs de données
  3. Noeuds de calcul

Pour mieux comprendre comment fonctionnent les collecteurs de données et les validateurs, plongeons dans xData, le principal produit en direct de DIN aujourd'hui.

#1: xData — Collecte de données

xData est la plate-forme phare de DIN conçue pour collecter, organiser et stocker des données provenant de plateformes de médias sociaux comme X, sans avoir recours à l'API. Elle fonctionne sur un réseau décentralisé, garantissant la propriété et la confidentialité des utilisateurs. Elle a été lancée en avril 2024 sur opBNB (une couche 2 sur la chaîne BNB).

Extension Chrome de xData

xData rend la collecte de données pour les utilisateurs amusante et gratifiante grâce à des mécanismes ludifiés. Voici un aperçu rapide de son fonctionnement :

  1. Les utilisateurs installent un plugin de navigateur, se connectent avec leur portefeuille et lient leur compte X
  2. Les utilisateurs peuvent marquer des tweets intéressants en répondant au tweet et en les marquant.@din_lolcompte
  3. Les utilisateurs gagnent des "wafers" pour étiqueter des tweets, qui sont des points pouvant être convertis en jetons lors du TGE.
  4. Il existe plusieurs mécanismes de ludification. Chaque utilisateur a un nombre limité de tweets qu'ils peuvent taguer (stockage), mais ils peuvent augmenter leur espace de stockage en dépensant des gaufrettes. Les utilisateurs doivent également dépenser des gaufrettes toutes les 24 heures pour maintenir leur compte "débloqué" et gagner plus de gaufrettes.
  5. DIN publie des missions autour de mots-clés ou d'étiquettes spécifiques, et les membres de la communauté recherchent des tweets en temps réel et les étiquettent en fonction de l'étiquette spécifique.

La nature sans autorisation de xData signifie que n'importe quel utilisateur dans le monde peut participer à la collecte et à l'annotation de données et gagner des récompenses/revenus, indépendamment de la nationalité. Pour l'instant, la collecte de données se fait hors-chaîne, avec des tweets marqués stockés sur BNB green field, une couche de données décentralisée sur BNB Chain.

#2: Chipper Nodes — Validation des données

La prochaine question naturelle est: comment garantir la qualité et l'intégrité des données soumises par les utilisateurs ? Après tout, quelqu'un pourrait exécuter un bot d'IA pour étiqueter au hasard des tweets qui ne correspondent pas aux étiquettes spécifiées simplement pour maximiser leurs gains.

L'étiquetage des données n'est pas toujours simple non plus. Les tweets incluent souvent des surnoms, de l'argot et des références culturelles - par exemple, Bitcoin est souvent appelé "gros biscuit" dans les tweets en mandarin.

C'est là que la validation des données entre en jeu.

Les nœuds Chipper sont des nœuds de validation et de traitement de données pilotés par l'IA de DIN, responsables de la validation et de la vectorisation des données, tout en permettant également aux utilisateurs de gagner des jetons ($xDIN et $DIN).

En coulisses, chaque nœud exploité par l'utilisateur exécute en fait localement un petit modèle d'IA pour valider que le contenu du tweet correspond à l'étiquette attachée avant de le stocker dans la couche de données décentralisée. Les utilisateurs peuvent exploiter ces nœuds sur des PC standards, sans avoir besoin de configurations matérielles coûteuses.

Les validateurs de modèles d'IA utilisent continuellement s'améliorer à mesure qu'ils traitent plus de données validées, permettant au réseau de devenir plus intelligent et plus précis avec le temps.

Actuellement, DIN gère toutes les validations de données en interne, mais l'objectif est de décentraliser le processus de validation. Des tests actifs pour les nœuds sont actuellement en cours. Les utilisateurs peuvent exécuter le logiciel du nœud sur leurs appareils locaux pour tester le réseau, avec des primes aux bogues en place pendant que DIN se prépare pour son mainnet et le lancement de jetons dans les semaines à venir.

#3: Noeuds de calcul

Bien que pas encore en vie, les nœuds de calcul représentent les futurs projets de DIN pour stocker des données de manière privée et sécurisée. Voici comment ils sont prévus pour fonctionner :

  1. Conversion de vecteur : les nœuds de calcul convertissent les données validées en vecteurs.
  2. Traitement de la confidentialité : les vecteurs sont traités par un processeur ZK (Zero-Knowledge) pour garantir la confidentialité.
  3. Finalisation des données : les ensembles de données et les vecteurs finalisés sont stockés sur IPFS, ce qui les rend accessibles à des tiers.

Un nouveau L2 sur BNBChain?

Aucune annonce officielle n'a été faite, mais dans nos recherches, nous avons découvert un jeton DIN sur le testnet de BNB Chain. Cela laisse présager des développements futurs de la blockchain - potentiellement une sidechain ou une solution Layer 2 sur BNB Chain.

Un bref historique de DIN

DIN pourrait sembler être un nouvel acteur, mais les origines du projet remontent à fin 2021. Lancé initialement sous le nom de « Web3Go », il a commencé en tant que plateforme d'analyse de données on-chain au sein de l'écosystème Polkadot, obtenant des subventions de la Web3 Foundation et travaillant avec des clients tels que Moonbeam et Oak Network.

En 2022, l'équipe a élargi sa portée à l'écosystème de la chaîne BNB, en rejoignant l'incubateur MVB de Binance Lab et en sécurisant des investissements pour développer une « plateforme d'analyse de données ouverte multi-chaînes ».

En juillet 2023, ils ont vu l’écriture sur le mur : l’IA générative était en plein essor et le besoin d’une infrastructure de données robuste devenait plus pressant que jamais. L’équipe est passée à la vitesse supérieure pour créer une « couche d’intelligence des données pour l’IA » complète, alignant ainsi sa mission sur les exigences en matière de données de l’innovation en matière d’IA. Cette évolution a culminé en mai 2024, lorsque Web3Go a officiellement changé de nom pour devenir DIN, marquant un nouvel accent audacieux sur les données en tant que prochaine vague d’avancement de l’IA.

La traction de DIN - Bon momentum jusqu'à présent

Utilisateurs quotidiens sur gate.io: ~700K+

Source : BNB Chain DappBay

Transactions quotidiennes de DIN sur opBNB : ~1,2M+

Source: Chaîne BNBDappBay

Selon DappBay, DIN a maintenu une moyenne de >700 000 utilisateurs quotidiens au cours du mois d'octobre et >1,2 million de transactions quotidiennes. La majorité des transactions sont liées aux utilisateurs de xData qui doivent effectuer une transaction on-chain toutes les 24 heures pour activer leur application xData et gagner des points.

Source: BNB ChainDappBay

DIN se classe régulièrement parmi les 10 meilleures dApps sur BNB Chain et, certains jours, c'est l'application numéro 1 en termes d'utilisateurs sur le réseau. Bien que je n'aie pas suivi de près l'écosystème de BNB Chain comme les chaînes Solana et Base, c'est un exploit remarquable, surtout compte tenu de la longévité de BNB Chain et de son fort soutien de Binance.

Pour remettre les choses en contexte, j'ai examiné certaines des autres applications les mieux classées sur BNB Chain pour voir ce qui les motive.

  • Vooi (DeFi) est un agrégateur DEX perp
  • Particle network (Infra) est un protocole omnichain en testnet
  • Revox (Infra) est un réseau en chaîne modulaire avec une application de contenu populaire, ReadON.
  • SERAPH (jeu) est un jeu RPG de type Souls-like.
  • MyShell est un écosystème de magasin d'applications AI sans code

Selon l'équipe, DIN a collecté et étiqueté plus de 100 millions de tweets jusqu'à présent, avec une base d'utilisateurs dépassant 30 millions à travers gate et Mantle.

Ce qui ressort ici, c'est la capacité de DIN à générer rapidement un ensemble de données massif et en temps réel de tweets pertinents, en exploitant sa base d'utilisateurs importante. Ce processus ne dépend pas du tout de l'API X.

Alors que xData se concentre actuellement sur Twitter, l'équipe prévoit d'étendre la plateforme de collecte et d'étiquetage de données à d'autres sources telles que Reddit, Facebook, Instagram, et essentiellement toute plateforme de données utilisateur contenant des informations de grande valeur. Pour moi, c'est là que se trouve la véritable mine d'or.

Quête secondaire : Reiki

Reiki est un autre produit de DIN qui s'intègre parfaitement à la métamatière des agents d'IA en cours - en fait, DIN aurait peut-être été en avance sur son temps, étant donné l'intérêt latent des consommateurs pour les agents d'IA que nous avons observé avec Gate.Terminal de Vérité et GOATau cours des dernières semaines.

En janvier 2024, DIN a lancéReiki, une plateforme où les utilisateurs peuvent créer des agents d'IA (principalement des chatbots) sans expérience en programmation. Les utilisateurs peuvent également intégrer leur propre base de connaissances, ce qui leur permet de construire des chatbots captivants et personnalisés rappelant MyShell.

Après son lancement, la plateforme a rapidement gagné en popularité, devenant le produit numéro 1 sur Product Hunt.

Reiki a également donné aux créateurs plusieurs moyens de monétiser leurs bots, de participer à des programmes de récompense et même de créer leurs bots sous forme de NFT, ajoutant ainsi une couche amusante de propriété à l'expérience. Il est à noter que le bot de support de connaissances Discord de BNB Chain est alimenté par Reiki.

Bien que la plateforme ait été largement obsolète pour le moment, l'équipe de DIN n'a pas exclu de la ramener après le lancement de leur jeton. Si elle est relancée, Reiki pourrait fournir une utilité supplémentaire pour le jeton et un moyen pour les créateurs d'agents d'IA de tirer parti des données collectées par xData.

Conception du token : xDIN, DIN et ventes de nœuds

En août-septembre 2024, DIN a organisé une vente de nœuds Chipper, levant 2,5 millions de dollars grâce à la vente de nœuds. Ces nœuds Chipper permettront aux utilisateurs d'exécuter un logiciel de validation sur leurs appareils locaux, en utilisant des modèles pour garantir que les données sont étiquetées avec précision. La vente a été un succès, avec 25 112 nœuds de niveau 2, vendus au prix de 99 $ chacun, qui se sont tous vendus.

Côté offre

Avant la TGE, les utilisateurs de xData peuvent convertir leurs tranches (points) en xDIN, un jeton pré-airdrop. Cependant, il y aura des frais de conversion allant de 5 à 30 %, ces frais étant distribués aux propriétaires de nœuds Chipper. Ce mécanisme de conversion n'est pas encore en service, mais devrait commencer une fois que le "pre-mining" des nœuds sera actif plus tard ce mois-ci.

Lors de la TGE, les utilisateurs recevront une distribution aérienne de DIN (jeton échangeable) basée sur leur proportion de xDIN détenus, entièrement libérée sans mécanismes de blocage complexes.

Après le TGE, 25% de l'offre totale de jetons DIN sera réservée aux récompenses de nœuds Chipper. La moitié de cette allocation sera débloquée la première année, les émissions restantes diminuant de moitié chaque année.

Notez que ceci est un déverrouillage relativement rapide par rapport à d'autres projets effectuant des ventes de nœuds, où les récompenses des nœuds sont distribuées progressivement sur 3 à 4 ans.

Demande

Les nœuds validateurs devront probablement miser des jetons DIN pour participer au réseau. En retour, ils gagneront des récompenses pour la validation des données, mais ils feront face à des pénalités de réduction s'ils produisent des sorties inexactes.

De l'autre côté, les consommateurs de données doivent dépenser des jetons DIN pour accéder aux données du réseau. Étant donné que la plupart des entreprises Web2 sont encore réticentes à s'engager avec la cryptographie, l'entreprise devra faciliter ces transactions pour combler le fossé entre les entreprises traditionnelles et le réseau décentralisé.

Nous attendons toujours la tokenomique détaillée du DIN, qui devrait être publiée plus près du TGE.

Équipe & Financement

L'équipe principale de DIN réunit des talents de l'Université Columbia, de l'University College London et de l'Université de Stuttgart, avec une décennie d'expertise en IA et blockchain.

Le fondateur de DIN, Hao Ding, est titulaire d'un master en informatique de l'Université de Stuttgart. Avant de se plonger dans la cryptographie, Hao a occupé le poste de directeur du développement de la recherche à l'Institut de l'intelligence artificielle de Suzhou en Chine. Il a ensuite occupé le poste de vice-président chez Litentry, un réseau d'oracles d'identité, avant de fonder Web3Go.

J'ai eu le plaisir de rencontrer Hao en personne et nous avons eu de grandes conversations sur l'avenir de l'IA. Sa conviction ? Les données seront au cœur de tout cela. L'équipe DIN se compose actuellement de 16 membres, principalement des ingénieurs.

DIN a participé au programme d'accélération MVB 5 de Binance Lab et a levé 4 millions de dollars lors d'un tour de table en juillet 2023, mené par Binance Labs, HashKey, NGC et Shima Capital. En août 2024, DIN a sécurisé un autre financement de 4 millions de dollarsavec la participation de Manta Network, Moonbeam Network, Ankr et Maxx Capital, portant son financement total à 8 millions de dollars.

Nos pensées

Réflexion n°1 : Construire une Scale AI décentralisée est une histoire sexy

Source: https://sacra.com/c/scale-ai/

La collecte de données et l'étiquetage sont un gros business.

Scale AI est le joueur le plus connu dans cet espace, rapportantrevenus récurrents annuelsd'environ 1 milliard de dollars. Cela est alimenté par une forte demande de la part d'entreprises modèles d'IA fondamentales comme OpenAI, Anthropic et Cohere, qui sont les principaux clients de Scale. En mai 2024, elle était estimée à une somme colossale de 14 milliards de dollars.

Jetons un coup d'œil plus attentif au modèle économique de Scale AI.

Scale s'appuie sur une main-d'œuvre importante et répartie pour ses tâches d'étiquetage de données, qui impliquent l'étiquetage manuel de vidéos, le tri de photos et la transcription audio.

Il emploie environ 240 000 travailleurs dans plusieurs pays, recrutant activement dans les régions présentant des taux de chômage élevés et des coûts de la vie inférieurs. Le Kenya, par exemple, est devenu un hub de recrutement clé en Afrique, avec des "boot camps" en personne à Nairobi et des publicités payantes ciblées pour attirer les travailleurs.

Le processus d'étiquetage comporte généralement deux couches : une première couche d'annotateurs qui étiquettent les données à partir de zéro et une deuxième couche de contrôleurs de qualité qui examinent le travail, ajoutent des annotations manquantes et corrigent les erreurs. C'est très intensif en main-d'œuvre humaine, mais ça fonctionne parce que les coûts de main-d'œuvre humaine sont faibles et que ses clients sont prêts à payer une somme significative.

Maintenant, imaginez étendre ce modèle (jeu de mots intentionnel) à travers des réseaux décentralisés. Une main-d'œuvre globale et sans permission incitée par des jetons pourrait permettre à n'importe qui de participer, tandis qu'un réseau distribué de validateurs garantit l'exactitude et la qualité des données. La décentralisation pourrait ouvrir de nouvelles possibilités pour l'étiquetage de données à grande échelle, en en faisant un processus vraiment mondial et démocratisé.

Réflexion n°2 : Large Base d'Utilisateurs = Bonne

L'avantage principal de DIN aujourd'hui réside dans sa grande communauté engagée, construite au cours de deux années d'efforts de construction communautaire ciblés. Grâce à ce réseau, DIN peut rapidement mobiliser la collecte de données selon des critères spécifiques. Cependant, le défi réside dans l'identification de la véritable demande de données, en orientant ses utilisateurs pour collecter et étiqueter les ensembles de données appropriés, ainsi que dans la mise en place de flux de revenus durables pour soutenir la croissance à long terme.

Réflexion n°3 : Les incitations sont une arme à double tranchant.

En ce moment, une grande partie de l'engagement des utilisateurs est stimulée par l'anticipation des récompenses en jetons une fois que le jeton sera lancé. Mais si l'équipe ne parvient pas à susciter une demande suffisante pour le jeton par la suite, l'utilisation pourrait diminuer à mesure que l'intérêt initial s'estompe. Créer cette demande nécessitera un intérêt spéculatif et l'établissement d'un marché de consommateurs de données désireux d'acheter ces ensembles de données.

Pensée n°4 : L'étiquetage des données est un domaine très compétitif

DIN n'est pas la seule équipe de crypto à lutter pour une part de ce marché - des projets comme Sapiens, Grass et Masa sont également dans la course. Mais le gâteau est substantiel. Prenez GRASS, par exemple, qui a actuellement une capitalisation boursière de 2,5 milliards de dollars, soulignant l'ampleur des opportunités dans ce secteur.

Un moyen pour DIN de se différencier et de se démarquer pourrait être la formation et le déploiement de modèles d'IA propriétaires pour la validation des données, réduisant ainsi la dépendance à l'égard du travail humain. Cette approche d'automatisation en premier lieu pourrait rationaliser les opérations, améliorer la scalabilité et donner à DIN un avantage sur des concurrents qui s'appuient encore fortement sur des processus manuels.

Pensées d'adieu

Les réseaux de données représentent l'une des frontières les plus passionnantes à l'intersection de l'IA et de la crypto. Contrairement aux modèles centralisés traditionnels, les réseaux de données alimentés par la crypto utilisent la participation décentralisée et des incitations pour construire des ensembles de données de haute qualité à grande échelle.

DIN se positionne comme un précurseur dans ce domaine, et il sera fascinant de voir comment le projet évolue. C'est l'occasion pour DIN de saisir. Je dis souvent aux gens : les réseaux de données sont l'un des domaines les plus intelligents à développer en ce moment.

La crypto redéfinit la manière dont les données sont collectées, validées et monétisées, jetant les bases d'une nouvelle économie des données décentralisée.

Avertissement:

  1. Cet article est repris de [Chaîne de pensée], Tous les droits d'auteur appartiennent à l'auteur original [Teng Yan]. Si vous avez des objections à cette reproduction, veuillez contacter le Porte Apprendrel'équipe, et ils s'en occuperont rapidement.
  2. Avertissement de responsabilité : Les points de vue et opinions exprimés dans cet article sont uniquement ceux de l'auteur et ne constituent pas un conseil en investissement.
  3. Les traductions de l'article dans d'autres langues sont faites par l'équipe Learn de gate. Sauf mention contraire, il est interdit de copier, distribuer ou plagier les articles traduits.

DIN: Réseau d'Intelligence des Données

Intermédiaire11/19/2024, 1:41:35 AM
Au cœur de DIN se trouve une couche de données qui collecte et valide à la fois les données on-chain et off-chain, tout en utilisant la blockchain comme couche de règlement. La grande idée ? Redonner la propriété des données aux utilisateurs et leur permettre de gagner des récompenses pour ce qu'ils apportent au système.

La ruée vers l'or des données

Pendant la ruée vers l'or de Californie du milieu des années 1800, des milliers de personnes ont poursuivi la promesse de richesses inexploitées dans une nouvelle frontière.

Les gens qui n'avaient jamais été riches se sont soudain retrouvés avec des fortunes, les histoires de la misère à la richesse sont devenues monnaie courante et des industries entières et des villes ont surgi pour soutenir la ruée. L'infrastructure s'est développée à un rythme effréné, remodelant le paysage américain.

Les parallèles avec Crypto AI sont difficiles à ignorer.

La plupart des produits Crypto AI d'aujourd'hui sont encore en développement ou fonctionnent sur des testnets, ce qui indique que nous sommes fermement dans la phase de construction de l'infrastructure.

Les investisseurs et les constructeurs posent les bases, se positionnant pour une éventuelle explosion de croissance. Les outils, les réseaux et les protocoles qui sont en train d'être établis maintenant constituent la base de ce qui pourrait devenir un écosystème d'IA décentralisé et étendu.

Si l'analogie se maintient, nous assistons aux premiers stades d'une ruée vers l'or numérique - une ruée qui pourrait être tout aussi transformative que son homologue du 19e siècle.

Imaginez donc ma surprise lorsque je suis tombé sur un projet Crypto AI revendiquant plus de 700 000 utilisateurs actifs quotidiens. Pas mensuels - quotidiens. Dans un domaine aussi naissant que celui-ci, de telles mesures d'utilisation sont pratiquement inédites. Naturellement, j'ai dû creuser et comprendre ce qui se passait réellement sous le capot.

Ce projet?DIN, un "Data Intelligence Network"

La cryptographie stimule les réseaux de données

Source:Andy Scherpenbeg

J'ai suivi de près les réseaux de données dans Crypto AI, et il est clair qu'ils abordent un point critique dans le paysage de l'IA: l'accès à des ensembles de données précieux.

Aujourd'hui, bon nombre des sources de données les plus précieuses sont étroitement contrôlées par des entités centralisées, qui facturent des frais élevés pour y accéder.

Par exemple :

  • Reddit a signé un contrat de 60M$/an.accord de licenceavec OpenAI pour fournir l'accès à son contenu généré par les utilisateurs.
  • X (anciennement Twitter) ne propose plus un accès gratuit à l'API aux développeurs, maintenant en facturant entre 100 $ et 42 000 $ (sans blague) par mois pour les données de tweets.

Le message est clair: les entreprises reconnaissent que les données sont le nouveau champ de bataille et qu'elles verrouillent le contrôle pour maximiser les profits.

La cryptographie offre une solution potentielle, un moyen de se libérer de l'emprise centralisée sur des ensembles de données précieuses.

Les réseaux de données cryptographiques adoptent une approche fondamentalement différente, visant à construire des ensembles de données décentralisés de haute qualité sans les goulots d'étranglement des modèles traditionnels. En utilisant des jetons, ces réseaux peuvent inciter à des efforts d'étiquetage de données à grande échelle, motivant les individus à contribuer à la collecte de données de masse ou même à organiser des efforts pour extraire des données d'entraînement sur le Web (quelqu'un a-t-il dit... Grass ?).

Entre-temps, les blockchains fournissent une transparence, créant un cadre pour suivre la propriété et la provenance des données. Cela garantit que les contributeurs sont justement compensés chaque fois que leurs données sont utilisées, établissant un nouveau paradigme où la valeur des données est partagée plutôt que monopolisée.

Vision de DIN

DIN est l'une des équipes qui s'attaque directement au problème des données.

Au cœur, DIN est une couche de données qui collecte et valide à la fois des données on-chain et off-chain, tout en utilisant la blockchain comme couche de règlement.

La grande idée ? Redonner la propriété des données aux utilisateurs et leur permettre de gagner des récompenses pour leur contribution au système.

Comment fonctionne DIN ?

À première vue, ce diagramme peut sembler complexe, mais examinons-le de plus près.

Il y a trois acteurs principaux dans le réseau DIN:

  1. Collecteurs de données
  2. Validateurs de données
  3. Noeuds de calcul

Pour mieux comprendre comment fonctionnent les collecteurs de données et les validateurs, plongeons dans xData, le principal produit en direct de DIN aujourd'hui.

#1: xData — Collecte de données

xData est la plate-forme phare de DIN conçue pour collecter, organiser et stocker des données provenant de plateformes de médias sociaux comme X, sans avoir recours à l'API. Elle fonctionne sur un réseau décentralisé, garantissant la propriété et la confidentialité des utilisateurs. Elle a été lancée en avril 2024 sur opBNB (une couche 2 sur la chaîne BNB).

Extension Chrome de xData

xData rend la collecte de données pour les utilisateurs amusante et gratifiante grâce à des mécanismes ludifiés. Voici un aperçu rapide de son fonctionnement :

  1. Les utilisateurs installent un plugin de navigateur, se connectent avec leur portefeuille et lient leur compte X
  2. Les utilisateurs peuvent marquer des tweets intéressants en répondant au tweet et en les marquant.@din_lolcompte
  3. Les utilisateurs gagnent des "wafers" pour étiqueter des tweets, qui sont des points pouvant être convertis en jetons lors du TGE.
  4. Il existe plusieurs mécanismes de ludification. Chaque utilisateur a un nombre limité de tweets qu'ils peuvent taguer (stockage), mais ils peuvent augmenter leur espace de stockage en dépensant des gaufrettes. Les utilisateurs doivent également dépenser des gaufrettes toutes les 24 heures pour maintenir leur compte "débloqué" et gagner plus de gaufrettes.
  5. DIN publie des missions autour de mots-clés ou d'étiquettes spécifiques, et les membres de la communauté recherchent des tweets en temps réel et les étiquettent en fonction de l'étiquette spécifique.

La nature sans autorisation de xData signifie que n'importe quel utilisateur dans le monde peut participer à la collecte et à l'annotation de données et gagner des récompenses/revenus, indépendamment de la nationalité. Pour l'instant, la collecte de données se fait hors-chaîne, avec des tweets marqués stockés sur BNB green field, une couche de données décentralisée sur BNB Chain.

#2: Chipper Nodes — Validation des données

La prochaine question naturelle est: comment garantir la qualité et l'intégrité des données soumises par les utilisateurs ? Après tout, quelqu'un pourrait exécuter un bot d'IA pour étiqueter au hasard des tweets qui ne correspondent pas aux étiquettes spécifiées simplement pour maximiser leurs gains.

L'étiquetage des données n'est pas toujours simple non plus. Les tweets incluent souvent des surnoms, de l'argot et des références culturelles - par exemple, Bitcoin est souvent appelé "gros biscuit" dans les tweets en mandarin.

C'est là que la validation des données entre en jeu.

Les nœuds Chipper sont des nœuds de validation et de traitement de données pilotés par l'IA de DIN, responsables de la validation et de la vectorisation des données, tout en permettant également aux utilisateurs de gagner des jetons ($xDIN et $DIN).

En coulisses, chaque nœud exploité par l'utilisateur exécute en fait localement un petit modèle d'IA pour valider que le contenu du tweet correspond à l'étiquette attachée avant de le stocker dans la couche de données décentralisée. Les utilisateurs peuvent exploiter ces nœuds sur des PC standards, sans avoir besoin de configurations matérielles coûteuses.

Les validateurs de modèles d'IA utilisent continuellement s'améliorer à mesure qu'ils traitent plus de données validées, permettant au réseau de devenir plus intelligent et plus précis avec le temps.

Actuellement, DIN gère toutes les validations de données en interne, mais l'objectif est de décentraliser le processus de validation. Des tests actifs pour les nœuds sont actuellement en cours. Les utilisateurs peuvent exécuter le logiciel du nœud sur leurs appareils locaux pour tester le réseau, avec des primes aux bogues en place pendant que DIN se prépare pour son mainnet et le lancement de jetons dans les semaines à venir.

#3: Noeuds de calcul

Bien que pas encore en vie, les nœuds de calcul représentent les futurs projets de DIN pour stocker des données de manière privée et sécurisée. Voici comment ils sont prévus pour fonctionner :

  1. Conversion de vecteur : les nœuds de calcul convertissent les données validées en vecteurs.
  2. Traitement de la confidentialité : les vecteurs sont traités par un processeur ZK (Zero-Knowledge) pour garantir la confidentialité.
  3. Finalisation des données : les ensembles de données et les vecteurs finalisés sont stockés sur IPFS, ce qui les rend accessibles à des tiers.

Un nouveau L2 sur BNBChain?

Aucune annonce officielle n'a été faite, mais dans nos recherches, nous avons découvert un jeton DIN sur le testnet de BNB Chain. Cela laisse présager des développements futurs de la blockchain - potentiellement une sidechain ou une solution Layer 2 sur BNB Chain.

Un bref historique de DIN

DIN pourrait sembler être un nouvel acteur, mais les origines du projet remontent à fin 2021. Lancé initialement sous le nom de « Web3Go », il a commencé en tant que plateforme d'analyse de données on-chain au sein de l'écosystème Polkadot, obtenant des subventions de la Web3 Foundation et travaillant avec des clients tels que Moonbeam et Oak Network.

En 2022, l'équipe a élargi sa portée à l'écosystème de la chaîne BNB, en rejoignant l'incubateur MVB de Binance Lab et en sécurisant des investissements pour développer une « plateforme d'analyse de données ouverte multi-chaînes ».

En juillet 2023, ils ont vu l’écriture sur le mur : l’IA générative était en plein essor et le besoin d’une infrastructure de données robuste devenait plus pressant que jamais. L’équipe est passée à la vitesse supérieure pour créer une « couche d’intelligence des données pour l’IA » complète, alignant ainsi sa mission sur les exigences en matière de données de l’innovation en matière d’IA. Cette évolution a culminé en mai 2024, lorsque Web3Go a officiellement changé de nom pour devenir DIN, marquant un nouvel accent audacieux sur les données en tant que prochaine vague d’avancement de l’IA.

La traction de DIN - Bon momentum jusqu'à présent

Utilisateurs quotidiens sur gate.io: ~700K+

Source : BNB Chain DappBay

Transactions quotidiennes de DIN sur opBNB : ~1,2M+

Source: Chaîne BNBDappBay

Selon DappBay, DIN a maintenu une moyenne de >700 000 utilisateurs quotidiens au cours du mois d'octobre et >1,2 million de transactions quotidiennes. La majorité des transactions sont liées aux utilisateurs de xData qui doivent effectuer une transaction on-chain toutes les 24 heures pour activer leur application xData et gagner des points.

Source: BNB ChainDappBay

DIN se classe régulièrement parmi les 10 meilleures dApps sur BNB Chain et, certains jours, c'est l'application numéro 1 en termes d'utilisateurs sur le réseau. Bien que je n'aie pas suivi de près l'écosystème de BNB Chain comme les chaînes Solana et Base, c'est un exploit remarquable, surtout compte tenu de la longévité de BNB Chain et de son fort soutien de Binance.

Pour remettre les choses en contexte, j'ai examiné certaines des autres applications les mieux classées sur BNB Chain pour voir ce qui les motive.

  • Vooi (DeFi) est un agrégateur DEX perp
  • Particle network (Infra) est un protocole omnichain en testnet
  • Revox (Infra) est un réseau en chaîne modulaire avec une application de contenu populaire, ReadON.
  • SERAPH (jeu) est un jeu RPG de type Souls-like.
  • MyShell est un écosystème de magasin d'applications AI sans code

Selon l'équipe, DIN a collecté et étiqueté plus de 100 millions de tweets jusqu'à présent, avec une base d'utilisateurs dépassant 30 millions à travers gate et Mantle.

Ce qui ressort ici, c'est la capacité de DIN à générer rapidement un ensemble de données massif et en temps réel de tweets pertinents, en exploitant sa base d'utilisateurs importante. Ce processus ne dépend pas du tout de l'API X.

Alors que xData se concentre actuellement sur Twitter, l'équipe prévoit d'étendre la plateforme de collecte et d'étiquetage de données à d'autres sources telles que Reddit, Facebook, Instagram, et essentiellement toute plateforme de données utilisateur contenant des informations de grande valeur. Pour moi, c'est là que se trouve la véritable mine d'or.

Quête secondaire : Reiki

Reiki est un autre produit de DIN qui s'intègre parfaitement à la métamatière des agents d'IA en cours - en fait, DIN aurait peut-être été en avance sur son temps, étant donné l'intérêt latent des consommateurs pour les agents d'IA que nous avons observé avec Gate.Terminal de Vérité et GOATau cours des dernières semaines.

En janvier 2024, DIN a lancéReiki, une plateforme où les utilisateurs peuvent créer des agents d'IA (principalement des chatbots) sans expérience en programmation. Les utilisateurs peuvent également intégrer leur propre base de connaissances, ce qui leur permet de construire des chatbots captivants et personnalisés rappelant MyShell.

Après son lancement, la plateforme a rapidement gagné en popularité, devenant le produit numéro 1 sur Product Hunt.

Reiki a également donné aux créateurs plusieurs moyens de monétiser leurs bots, de participer à des programmes de récompense et même de créer leurs bots sous forme de NFT, ajoutant ainsi une couche amusante de propriété à l'expérience. Il est à noter que le bot de support de connaissances Discord de BNB Chain est alimenté par Reiki.

Bien que la plateforme ait été largement obsolète pour le moment, l'équipe de DIN n'a pas exclu de la ramener après le lancement de leur jeton. Si elle est relancée, Reiki pourrait fournir une utilité supplémentaire pour le jeton et un moyen pour les créateurs d'agents d'IA de tirer parti des données collectées par xData.

Conception du token : xDIN, DIN et ventes de nœuds

En août-septembre 2024, DIN a organisé une vente de nœuds Chipper, levant 2,5 millions de dollars grâce à la vente de nœuds. Ces nœuds Chipper permettront aux utilisateurs d'exécuter un logiciel de validation sur leurs appareils locaux, en utilisant des modèles pour garantir que les données sont étiquetées avec précision. La vente a été un succès, avec 25 112 nœuds de niveau 2, vendus au prix de 99 $ chacun, qui se sont tous vendus.

Côté offre

Avant la TGE, les utilisateurs de xData peuvent convertir leurs tranches (points) en xDIN, un jeton pré-airdrop. Cependant, il y aura des frais de conversion allant de 5 à 30 %, ces frais étant distribués aux propriétaires de nœuds Chipper. Ce mécanisme de conversion n'est pas encore en service, mais devrait commencer une fois que le "pre-mining" des nœuds sera actif plus tard ce mois-ci.

Lors de la TGE, les utilisateurs recevront une distribution aérienne de DIN (jeton échangeable) basée sur leur proportion de xDIN détenus, entièrement libérée sans mécanismes de blocage complexes.

Après le TGE, 25% de l'offre totale de jetons DIN sera réservée aux récompenses de nœuds Chipper. La moitié de cette allocation sera débloquée la première année, les émissions restantes diminuant de moitié chaque année.

Notez que ceci est un déverrouillage relativement rapide par rapport à d'autres projets effectuant des ventes de nœuds, où les récompenses des nœuds sont distribuées progressivement sur 3 à 4 ans.

Demande

Les nœuds validateurs devront probablement miser des jetons DIN pour participer au réseau. En retour, ils gagneront des récompenses pour la validation des données, mais ils feront face à des pénalités de réduction s'ils produisent des sorties inexactes.

De l'autre côté, les consommateurs de données doivent dépenser des jetons DIN pour accéder aux données du réseau. Étant donné que la plupart des entreprises Web2 sont encore réticentes à s'engager avec la cryptographie, l'entreprise devra faciliter ces transactions pour combler le fossé entre les entreprises traditionnelles et le réseau décentralisé.

Nous attendons toujours la tokenomique détaillée du DIN, qui devrait être publiée plus près du TGE.

Équipe & Financement

L'équipe principale de DIN réunit des talents de l'Université Columbia, de l'University College London et de l'Université de Stuttgart, avec une décennie d'expertise en IA et blockchain.

Le fondateur de DIN, Hao Ding, est titulaire d'un master en informatique de l'Université de Stuttgart. Avant de se plonger dans la cryptographie, Hao a occupé le poste de directeur du développement de la recherche à l'Institut de l'intelligence artificielle de Suzhou en Chine. Il a ensuite occupé le poste de vice-président chez Litentry, un réseau d'oracles d'identité, avant de fonder Web3Go.

J'ai eu le plaisir de rencontrer Hao en personne et nous avons eu de grandes conversations sur l'avenir de l'IA. Sa conviction ? Les données seront au cœur de tout cela. L'équipe DIN se compose actuellement de 16 membres, principalement des ingénieurs.

DIN a participé au programme d'accélération MVB 5 de Binance Lab et a levé 4 millions de dollars lors d'un tour de table en juillet 2023, mené par Binance Labs, HashKey, NGC et Shima Capital. En août 2024, DIN a sécurisé un autre financement de 4 millions de dollarsavec la participation de Manta Network, Moonbeam Network, Ankr et Maxx Capital, portant son financement total à 8 millions de dollars.

Nos pensées

Réflexion n°1 : Construire une Scale AI décentralisée est une histoire sexy

Source: https://sacra.com/c/scale-ai/

La collecte de données et l'étiquetage sont un gros business.

Scale AI est le joueur le plus connu dans cet espace, rapportantrevenus récurrents annuelsd'environ 1 milliard de dollars. Cela est alimenté par une forte demande de la part d'entreprises modèles d'IA fondamentales comme OpenAI, Anthropic et Cohere, qui sont les principaux clients de Scale. En mai 2024, elle était estimée à une somme colossale de 14 milliards de dollars.

Jetons un coup d'œil plus attentif au modèle économique de Scale AI.

Scale s'appuie sur une main-d'œuvre importante et répartie pour ses tâches d'étiquetage de données, qui impliquent l'étiquetage manuel de vidéos, le tri de photos et la transcription audio.

Il emploie environ 240 000 travailleurs dans plusieurs pays, recrutant activement dans les régions présentant des taux de chômage élevés et des coûts de la vie inférieurs. Le Kenya, par exemple, est devenu un hub de recrutement clé en Afrique, avec des "boot camps" en personne à Nairobi et des publicités payantes ciblées pour attirer les travailleurs.

Le processus d'étiquetage comporte généralement deux couches : une première couche d'annotateurs qui étiquettent les données à partir de zéro et une deuxième couche de contrôleurs de qualité qui examinent le travail, ajoutent des annotations manquantes et corrigent les erreurs. C'est très intensif en main-d'œuvre humaine, mais ça fonctionne parce que les coûts de main-d'œuvre humaine sont faibles et que ses clients sont prêts à payer une somme significative.

Maintenant, imaginez étendre ce modèle (jeu de mots intentionnel) à travers des réseaux décentralisés. Une main-d'œuvre globale et sans permission incitée par des jetons pourrait permettre à n'importe qui de participer, tandis qu'un réseau distribué de validateurs garantit l'exactitude et la qualité des données. La décentralisation pourrait ouvrir de nouvelles possibilités pour l'étiquetage de données à grande échelle, en en faisant un processus vraiment mondial et démocratisé.

Réflexion n°2 : Large Base d'Utilisateurs = Bonne

L'avantage principal de DIN aujourd'hui réside dans sa grande communauté engagée, construite au cours de deux années d'efforts de construction communautaire ciblés. Grâce à ce réseau, DIN peut rapidement mobiliser la collecte de données selon des critères spécifiques. Cependant, le défi réside dans l'identification de la véritable demande de données, en orientant ses utilisateurs pour collecter et étiqueter les ensembles de données appropriés, ainsi que dans la mise en place de flux de revenus durables pour soutenir la croissance à long terme.

Réflexion n°3 : Les incitations sont une arme à double tranchant.

En ce moment, une grande partie de l'engagement des utilisateurs est stimulée par l'anticipation des récompenses en jetons une fois que le jeton sera lancé. Mais si l'équipe ne parvient pas à susciter une demande suffisante pour le jeton par la suite, l'utilisation pourrait diminuer à mesure que l'intérêt initial s'estompe. Créer cette demande nécessitera un intérêt spéculatif et l'établissement d'un marché de consommateurs de données désireux d'acheter ces ensembles de données.

Pensée n°4 : L'étiquetage des données est un domaine très compétitif

DIN n'est pas la seule équipe de crypto à lutter pour une part de ce marché - des projets comme Sapiens, Grass et Masa sont également dans la course. Mais le gâteau est substantiel. Prenez GRASS, par exemple, qui a actuellement une capitalisation boursière de 2,5 milliards de dollars, soulignant l'ampleur des opportunités dans ce secteur.

Un moyen pour DIN de se différencier et de se démarquer pourrait être la formation et le déploiement de modèles d'IA propriétaires pour la validation des données, réduisant ainsi la dépendance à l'égard du travail humain. Cette approche d'automatisation en premier lieu pourrait rationaliser les opérations, améliorer la scalabilité et donner à DIN un avantage sur des concurrents qui s'appuient encore fortement sur des processus manuels.

Pensées d'adieu

Les réseaux de données représentent l'une des frontières les plus passionnantes à l'intersection de l'IA et de la crypto. Contrairement aux modèles centralisés traditionnels, les réseaux de données alimentés par la crypto utilisent la participation décentralisée et des incitations pour construire des ensembles de données de haute qualité à grande échelle.

DIN se positionne comme un précurseur dans ce domaine, et il sera fascinant de voir comment le projet évolue. C'est l'occasion pour DIN de saisir. Je dis souvent aux gens : les réseaux de données sont l'un des domaines les plus intelligents à développer en ce moment.

La crypto redéfinit la manière dont les données sont collectées, validées et monétisées, jetant les bases d'une nouvelle économie des données décentralisée.

Avertissement:

  1. Cet article est repris de [Chaîne de pensée], Tous les droits d'auteur appartiennent à l'auteur original [Teng Yan]. Si vous avez des objections à cette reproduction, veuillez contacter le Porte Apprendrel'équipe, et ils s'en occuperont rapidement.
  2. Avertissement de responsabilité : Les points de vue et opinions exprimés dans cet article sont uniquement ceux de l'auteur et ne constituent pas un conseil en investissement.
  3. Les traductions de l'article dans d'autres langues sont faites par l'équipe Learn de gate. Sauf mention contraire, il est interdit de copier, distribuer ou plagier les articles traduits.
Lancez-vous
Inscrivez-vous et obtenez un bon de
100$
!