¿Alguna vez te has preguntado por qué las plataformas de redes sociales como Reddit y X (anteriormente Twitter) se pueden utilizar de forma gratuita? La respuesta radica en las publicaciones que haces, los me gusta que das e incluso el tiempo que pasas desplazándote.
En el pasado, estas plataformas vendían su atención como una mercancía a los anunciantes. Ahora, han encontrado un comprador más grande: las compañías de IA. Los informes indican que un solo acuerdo de licencia de datos entre Reddit y Google puede generar $60 millones anualmente para la primera. Sin embargo, esta enorme riqueza no tiene nada que ver con nosotros como creadores de datos.
Lo que es aún más perturbador es que la IA entrenada con nuestros datos podría eventualmente reemplazar nuestros trabajos. Si bien la IA también podría crear nuevas oportunidades de empleo, la concentración de riqueza resultante de este monopolio de datos sin duda exacerba la desigualdad social. Parece que estamos deslizándonos hacia un mundo ciberpunk controlado por un puñado de gigantes tecnológicos.
Entonces, ¿cómo pueden proteger los intereses de las personas comunes en esta era de IA? Después del auge de la IA, muchos ven la cadena de bloques como la última línea de defensa de la humanidad contra ella. Basándose en este pensamiento, algunos innovadores han comenzado a explorar soluciones. Proponen que primero, debemos recuperar la propiedad y el control de nuestros datos; segundo, debemos utilizar estos datos para entrenar de manera colaborativa un modelo de IA que realmente sirva a las personas comunes.
Esta idea puede parecer idealista, pero la historia nos muestra que cada revolución tecnológica comienza con un concepto 'loco'. Hoy, un nuevo proyecto de cadena pública llamado 'Vana' está convirtiendo esta visión en realidad. Como la primera red de liquidez de datos descentralizada, Vana tiene como objetivo transformar tus datos en tokens de circulación libre, promoviendo así una inteligencia artificial descentralizada verdaderamente controlada por el usuario.
De hecho, el nacimiento de Vana se remonta a un aula en el MIT Media Lab, donde dos jóvenes con una visión de cambiar el mundo, Anna Kazlauskas y Art Abal, se conocieron.
Izquierda: Anna Kazlauskas; Derecha: Art Abal.
Anna Kazlauskas se especializó en informática y economía en el MIT, y su interés en los datos y las criptomonedas se remonta a 2015. En ese momento, estuvo involucrada en la minería temprana de Ethereum, lo que le dio un profundo entendimiento del potencial de la tecnología descentralizada. Posteriormente, Anna realizó investigaciones de datos en instituciones financieras internacionales como la Reserva Federal, el Banco Central Europeo y el Banco Mundial, experiencias que la llevaron a darse cuenta de que los datos se convertirían en una nueva forma de moneda en el futuro.
Mientras tanto, Art Abal cursó una maestría en políticas públicas en la Universidad de Harvard e investigó a fondo sobre evaluaciones de impacto de datos en el Centro Belfer de Ciencias y Asuntos Internacionales. Antes de unirse a Vana, Art lideró métodos innovadores de recolección de datos en Appen, un proveedor de datos de entrenamiento de IA, contribuyendo significativamente a la aparición de muchas herramientas de IA generativas hoy en día. Sus conocimientos sobre ética de datos y responsabilidad de la IA han impregnado a Vana con un fuerte sentido de responsabilidad social.
Cuando Anna y Art se conocieron en una clase en el MIT Media Lab, rápidamente descubrieron su pasión compartida por la democratización de los datos y los derechos de los usuarios sobre los datos. Reconocieron que para abordar verdaderamente los problemas de propiedad de los datos y la equidad en la IA, se necesitaba un nuevo paradigma, uno que permitiera a los usuarios controlar genuinamente sus propios datos.
Esta visión común los motivó a cofundar Vana. Su objetivo es crear una plataforma revolucionaria que no solo aboga por la soberanía de datos para los usuarios, sino que también asegura que los usuarios puedan obtener beneficios económicos de sus datos. A través del innovador mecanismo de Pool de Liquidez de Datos (DLP) y el sistema de Prueba de Contribución, Vana permite a los usuarios contribuir de forma segura con datos privados, co-propiar y beneficiarse de los modelos de inteligencia artificial entrenados con esos datos, promoviendo así el desarrollo de IA impulsado por el usuario.
La visión de Vana rápidamente ganó reconocimiento en la industria. Hasta la fecha, Vana ha anunciado que ha completado un total de $25 millones en financiamiento, incluyendo una ronda estratégica de $5 millones liderada por Coinbase Ventures, una ronda Serie A de $18 millones liderada por Paradigm, y una ronda inicial de $2 millones liderada por Polychain. Otros inversores destacados incluyen a Casey Caruso, Packy McCormick, Manifold, GSR y DeFiance Capital.
En este mundo donde los datos son el nuevo petróleo de la era, la aparición de Vana sin duda nos brinda una importante oportunidad para recuperar la soberanía de los datos. Entonces, ¿cómo funciona este prometedor proyecto? Sumergámonos juntos en la arquitectura técnica y los conceptos innovadores de Vana.
La arquitectura técnica de Vana es un ecosistema meticulosamente diseñado con el objetivo de democratizar los datos y maximizar su valor. Sus componentes principales incluyen el Pool de Liquidez de Datos (DLP), mecanismo de Prueba de Contribución, Consenso de Nagoya, auto-custodia de datos por parte del usuario y una capa de aplicación descentralizada. Juntos, estos elementos crean una plataforma innovadora que protege la privacidad del usuario al mismo tiempo que desbloquea el valor potencial de los datos.
El Pool de Liquidez de Datos (DLP) sirve como la unidad fundamental dentro de la red Vana y se puede comparar con la "minería de liquidez" pero para datos. Cada DLP es básicamente un contrato inteligente diseñado para agrupar tipos específicos de activos de datos. Por ejemplo, el DAO de Datos de Reddit (r/datadao) es un caso exitoso de DLP, atrayendo a más de 140.000 usuarios de Reddit y agregando las publicaciones, comentarios e historias de votación de los usuarios.
Después de que los usuarios envíen sus datos a un DLP, pueden ganar tokens específicos asociados con ese DLP, como RDAT para el Reddit Data DAO (r/datadao). Estos tokens no solo representan la contribución del usuario al grupo de datos, sino que también otorgan derechos de gobernanza y beneficios futuros de participación en las ganancias dentro del DLP. Es importante destacar que Vana permite que cada DLP emita sus propios tokens, ofreciendo un mecanismo flexible de captura de valor para diferentes tipos de activos de datos.
En el ecosistema de Vana, los 16 mejores DLP reciben emisiones adicionales de tokens VANA, lo que incentiva aún más la formación y competencia de piscinas de datos de alta calidad. Este enfoque transforma inteligentemente los datos personales dispersos en activos digitales líquidos, sentando las bases para la valorización y liquidez de datos.
La Prueba de Contribución es el mecanismo clave de Vana para garantizar la calidad de los datos. Cada DLP puede adaptar una función única de Prueba de Contribución basada en sus necesidades específicas. Esta función no solo verifica la autenticidad y la integridad de los datos, sino que también evalúa su contribución para mejorar el rendimiento del modelo de IA.
Por ejemplo, el Proof of Contribution del ChatGPT Data DAO considera cuatro dimensiones críticas: autenticidad, propiedad, calidad y unicidad. La autenticidad se verifica a través de los enlaces de exportación de datos proporcionados por OpenAI; la propiedad se confirma mediante la verificación del correo electrónico de los usuarios; la evaluación de la calidad aprovecha la puntuación LLM en conversaciones muestreadas al azar; y la unicidad se determina calculando vectores de características de datos y comparándolos con datos existentes.
Esta evaluación multidimensional garantiza que solo se acepten y recompensen datos de alta calidad y valor. La Prueba de Contribución sirve como base para la fijación de precios de datos y es esencial para mantener la calidad de los datos en todo el ecosistema.
El Consenso de Nagoya es el núcleo de la red Vana, inspirado en y mejorando el Consenso Yuma de Bittensor. Este mecanismo gira en torno a una evaluación colectiva de la calidad de los datos por un conjunto de nodos de validación, llegando a una puntuación final a través de un promedio ponderado.
Lo que lo distingue es el enfoque de "evaluación de dos capas": no solo los nodos de validación evalúan la calidad de los datos, sino que también califican los comportamientos de calificación de otros nodos. Esto agrega una capa de equidad y precisión, disuadiendo la mala conducta. Por ejemplo, si un nodo de validación asigna una alta puntuación a datos de baja calidad, otros nodos pueden penalizar este error de juicio con una puntuación correctiva.
Cada 1800 bloques (aproximadamente cada 3 horas) marca un ciclo, durante el cual los nodos son recompensados en función de sus puntajes acumulativos. Este mecanismo incentiva la honestidad entre los validadores y detecta y elimina rápidamente el mal comportamiento, asegurando el funcionamiento saludable de la red.
Una de las innovaciones significativas de Vana radica en su enfoque único de gestión de datos. En la red de Vana, los datos originales de los usuarios nunca están verdaderamente "en cadena". En cambio, los usuarios pueden elegir sus ubicaciones de almacenamiento, como Google Drive, Dropbox o incluso servidores personales que se ejecutan en un MacBook.
Cuando los usuarios envían datos a un DLP, básicamente están proporcionando una URL que apunta a los datos cifrados y un hash de integridad de contenido opcional. Esta información se registra en el contrato de registro de datos de Vana. Los validadores pueden solicitar claves de descifrado para descargar y verificar los datos cuando sea necesario.
Este diseño aborda de manera inteligente problemas de privacidad y control de datos. Los usuarios mantienen un control completo sobre sus datos mientras siguen participando en la economía de datos. Esto no solo garantiza la seguridad de los datos, sino que también abre posibilidades para escenarios de aplicación de datos más amplios en el futuro.
La capa superior de Vana es un ecosistema de aplicaciones abiertas. Aquí, los desarrolladores pueden aprovechar la liquidez de datos acumulada en DLPs para construir diversas aplicaciones innovadoras, mientras que los contribuyentes de datos pueden obtener un valor económico tangible de estas aplicaciones.
Por ejemplo, un equipo de desarrollo puede entrenar un modelo de inteligencia artificial especializado utilizando datos del Reddit Data DAO. Los usuarios que contribuyeron con datos no solo pueden utilizar el modelo una vez que esté entrenado, sino que también reciben una parte de las ganancias generadas por el modelo de acuerdo a su contribución. De hecho, ya se ha desarrollado un modelo de IA de este tipo; se pueden encontrar más detalles en el artículo “Recuperándose desde el fondo: ¿Por qué el viejo token r/datadao en la pista de IA está volviendo a la vida?“
Este modelo no solo incentiva las contribuciones de datos de alta calidad, sino que también crea un ecosistema de desarrollo de IA verdaderamente impulsado por el usuario. Los usuarios pasan de ser simples proveedores de datos a ser copropietarios y beneficiarios de productos de IA.
A través de este enfoque, Vana está transformando el paisaje de la economía de datos. En este nuevo paradigma, los usuarios pasan de ser proveedores de datos pasivos a participantes activos y co-beneficiarios en la construcción del ecosistema. Esto no solo crea nuevas oportunidades para la adquisición de valor individual, sino que también inyecta nueva vitalidad e innovación en toda la industria de la inteligencia artificial.
La arquitectura técnica de Vana aborda problemas fundamentales en la economía actual de datos, como la propiedad de los datos, la protección de la privacidad y la distribución de valor, al mismo tiempo que allana el camino para futuras innovaciones basadas en datos. A medida que más organizaciones autónomas descentralizadas de datos se unan a la red y se desarrollen aplicaciones adicionales en la plataforma, Vana tiene el potencial de convertirse en la infraestructura fundamental para la próxima generación de IA descentralizada y la economía de datos.
Con el lanzamiento de la red de prueba Satori el 11 de junio, Vana ha mostrado un prototipo de su ecosistema al público. Esto sirve no solo como una plataforma para la validación técnica, sino también como una vista previa del modelo operativo para la futura mainnet. Actualmente, el ecosistema de Vana ofrece a los participantes tres vías principales: ejecutar nodos de validación de DLP, crear nuevos DLP o enviar datos a DLP existentes para participar en la “minería de datos.”
Los nodos de validación son los guardianes de la red Vana, responsables de verificar la calidad de los datos enviados a los DLP. Operar un nodo de validación requiere no solo experiencia técnica, sino también recursos informáticos suficientes. Según la documentación técnica de Vana, los requisitos mínimos de hardware para un nodo de validación son un núcleo de CPU, 8 GB de RAM y 10 GB de almacenamiento SSD de alta velocidad.
Los usuarios interesados en convertirse en validadores primero deben seleccionar un DLP y luego registrarse como validadores a través del contrato inteligente de ese DLP. Una vez registrado y aprobado, los validadores pueden ejecutar nodos de validación específicos para ese DLP. Es importante tener en cuenta que los validadores pueden operar nodos para múltiples DLPs simultáneamente, pero cada DLP tiene sus propios requisitos mínimos de apuesta.
Para los usuarios con recursos de datos únicos o ideas innovadoras, crear un nuevo DLP es una opción atractiva. Establecer un DLP requiere un profundo conocimiento de la arquitectura técnica de Vana, especialmente los mecanismos de prueba de contribución y consenso de Nagoya.
Los creadores de un nuevo DLP deben diseñar objetivos específicos de contribución de datos, métodos de validación y parámetros de recompensa. Además, necesitan implementar una función de prueba de contribución que evalúe con precisión el valor de los datos. Aunque este proceso puede ser complejo, Vana proporciona plantillas detalladas y documentación para apoyar a los creadores.
Para la mayoría de los usuarios, enviar datos a los DLP existentes para participar en la "minería de datos" puede ser la forma más directa de participar. Actualmente, se han recomendado oficialmente 13 DLP, que abarcan una variedad de campos, desde datos de redes sociales hasta datos de predicción financiera.
·Finquarium: Recopila datos de predicción financiera.
·GPT Data DAO: Se centra en las exportaciones de datos de chat de ChatGPT.
· Reddit Data DAO: se centra en los datos de los usuarios de Reddit y se ha lanzado oficialmente.
·Volara: Especializada en la recolección y utilización de datos de Twitter.
·Flirtual: Recopila datos de citas.
·ResumeDataDAO: Se enfoca en las exportaciones de datos de LinkedIn.
·SixGPT: Recopila y gestiona datos de chat LLM.
·YKYR: Recopila datos de Google Analytics.
· Sydintel: Crowdsources intelligence to reveal the dark corners of the internet.
·MindDAO: Recopila datos de series temporales relacionados con el bienestar del usuario.
·Kleo: Construye el conjunto de datos de historial de navegación más completo a nivel mundial.
·DataPIG: Se enfoca en datos de preferencia de inversión de tokens.
·ScrollDAO: Recopila y utiliza datos de Instagram.
Algunos de estos DLP todavía están en desarrollo, mientras que otros ya están en línea, pero todos están en la fase de pre-minería. Los usuarios solo pueden enviar oficialmente datos para la minería una vez que se lance la mainnet. Sin embargo, los usuarios pueden asegurar la elegibilidad para participar de diversas formas con anticipación. Por ejemplo, pueden participar en actividades de desafío relevantes en el Aplicación de Telegram de Vanao preinscríbete en los sitios web oficiales de cada DLP.
La aparición de Vana marca un cambio de paradigma en la economía de datos. En la actual ola de IA, los datos se han convertido en el "petróleo" de la nueva era, y Vana busca remodelar los modelos de extracción, refinación y distribución de este recurso.
Básicamente, Vana está construyendo una solución para la "tragedia de los comunes" en los datos. A través de un diseño de incentivos inteligente e innovación tecnológica, transforma los datos personales, un suministro aparentemente ilimitado que es difícil de monetizar, en un activo digital manejable, con precio y negociable. Esto no solo abre nuevos caminos para que los usuarios comunes participen en el reparto de beneficios de la inteligencia artificial, sino que también proporciona un posible modelo para el desarrollo de la inteligencia artificial descentralizada.
Sin embargo, el éxito de Vana enfrenta numerosas incertidumbres. Técnicamente, debe encontrar un equilibrio entre la apertura y la seguridad; económicamente, necesita demostrar que su modelo puede generar un valor sostenible; y socialmente, debe abordar posibles desafíos éticos y regulatorios de datos.
A un nivel más profundo, Vana representa una reflexión y un desafío a los monopolios de datos existentes y a los modelos de desarrollo de IA. Plantea una pregunta importante: En la era de la IA, ¿elegimos reforzar los actuales oligarcas de datos o intentamos construir un ecosistema de datos más abierto, justo y diverso?
Independientemente de si Vana tiene éxito en última instancia, su aparición nos ofrece una ventana para repensar el valor de los datos, la ética de la IA y la innovación tecnológica. En el futuro, proyectos como Vana pueden convertirse en puentes vitales que conecten los ideales de Web3 con las realidades de la IA, guiando la próxima fase del desarrollo económico digital.
Este artículo se reproduce de [BlockBeats] , el copyright pertenece al autor original [Pensamiento extraño], si tienes alguna objeción al reimpreso, por favor contacta al Gate Learnel equipo, y el equipo lo manejará lo antes posible de acuerdo con los procedimientos relevantes.
Descargo de responsabilidad: Las opiniones expresadas en este artículo representan solo las opiniones personales del autor y no constituyen ningún consejo de inversión.
Otras versiones del artículo son traducidas por el equipo de Aprende de gate y no se mencionan enGate.io, el artículo traducido no puede ser reproducido, distribuido o plagiado.
¿Alguna vez te has preguntado por qué las plataformas de redes sociales como Reddit y X (anteriormente Twitter) se pueden utilizar de forma gratuita? La respuesta radica en las publicaciones que haces, los me gusta que das e incluso el tiempo que pasas desplazándote.
En el pasado, estas plataformas vendían su atención como una mercancía a los anunciantes. Ahora, han encontrado un comprador más grande: las compañías de IA. Los informes indican que un solo acuerdo de licencia de datos entre Reddit y Google puede generar $60 millones anualmente para la primera. Sin embargo, esta enorme riqueza no tiene nada que ver con nosotros como creadores de datos.
Lo que es aún más perturbador es que la IA entrenada con nuestros datos podría eventualmente reemplazar nuestros trabajos. Si bien la IA también podría crear nuevas oportunidades de empleo, la concentración de riqueza resultante de este monopolio de datos sin duda exacerba la desigualdad social. Parece que estamos deslizándonos hacia un mundo ciberpunk controlado por un puñado de gigantes tecnológicos.
Entonces, ¿cómo pueden proteger los intereses de las personas comunes en esta era de IA? Después del auge de la IA, muchos ven la cadena de bloques como la última línea de defensa de la humanidad contra ella. Basándose en este pensamiento, algunos innovadores han comenzado a explorar soluciones. Proponen que primero, debemos recuperar la propiedad y el control de nuestros datos; segundo, debemos utilizar estos datos para entrenar de manera colaborativa un modelo de IA que realmente sirva a las personas comunes.
Esta idea puede parecer idealista, pero la historia nos muestra que cada revolución tecnológica comienza con un concepto 'loco'. Hoy, un nuevo proyecto de cadena pública llamado 'Vana' está convirtiendo esta visión en realidad. Como la primera red de liquidez de datos descentralizada, Vana tiene como objetivo transformar tus datos en tokens de circulación libre, promoviendo así una inteligencia artificial descentralizada verdaderamente controlada por el usuario.
De hecho, el nacimiento de Vana se remonta a un aula en el MIT Media Lab, donde dos jóvenes con una visión de cambiar el mundo, Anna Kazlauskas y Art Abal, se conocieron.
Izquierda: Anna Kazlauskas; Derecha: Art Abal.
Anna Kazlauskas se especializó en informática y economía en el MIT, y su interés en los datos y las criptomonedas se remonta a 2015. En ese momento, estuvo involucrada en la minería temprana de Ethereum, lo que le dio un profundo entendimiento del potencial de la tecnología descentralizada. Posteriormente, Anna realizó investigaciones de datos en instituciones financieras internacionales como la Reserva Federal, el Banco Central Europeo y el Banco Mundial, experiencias que la llevaron a darse cuenta de que los datos se convertirían en una nueva forma de moneda en el futuro.
Mientras tanto, Art Abal cursó una maestría en políticas públicas en la Universidad de Harvard e investigó a fondo sobre evaluaciones de impacto de datos en el Centro Belfer de Ciencias y Asuntos Internacionales. Antes de unirse a Vana, Art lideró métodos innovadores de recolección de datos en Appen, un proveedor de datos de entrenamiento de IA, contribuyendo significativamente a la aparición de muchas herramientas de IA generativas hoy en día. Sus conocimientos sobre ética de datos y responsabilidad de la IA han impregnado a Vana con un fuerte sentido de responsabilidad social.
Cuando Anna y Art se conocieron en una clase en el MIT Media Lab, rápidamente descubrieron su pasión compartida por la democratización de los datos y los derechos de los usuarios sobre los datos. Reconocieron que para abordar verdaderamente los problemas de propiedad de los datos y la equidad en la IA, se necesitaba un nuevo paradigma, uno que permitiera a los usuarios controlar genuinamente sus propios datos.
Esta visión común los motivó a cofundar Vana. Su objetivo es crear una plataforma revolucionaria que no solo aboga por la soberanía de datos para los usuarios, sino que también asegura que los usuarios puedan obtener beneficios económicos de sus datos. A través del innovador mecanismo de Pool de Liquidez de Datos (DLP) y el sistema de Prueba de Contribución, Vana permite a los usuarios contribuir de forma segura con datos privados, co-propiar y beneficiarse de los modelos de inteligencia artificial entrenados con esos datos, promoviendo así el desarrollo de IA impulsado por el usuario.
La visión de Vana rápidamente ganó reconocimiento en la industria. Hasta la fecha, Vana ha anunciado que ha completado un total de $25 millones en financiamiento, incluyendo una ronda estratégica de $5 millones liderada por Coinbase Ventures, una ronda Serie A de $18 millones liderada por Paradigm, y una ronda inicial de $2 millones liderada por Polychain. Otros inversores destacados incluyen a Casey Caruso, Packy McCormick, Manifold, GSR y DeFiance Capital.
En este mundo donde los datos son el nuevo petróleo de la era, la aparición de Vana sin duda nos brinda una importante oportunidad para recuperar la soberanía de los datos. Entonces, ¿cómo funciona este prometedor proyecto? Sumergámonos juntos en la arquitectura técnica y los conceptos innovadores de Vana.
La arquitectura técnica de Vana es un ecosistema meticulosamente diseñado con el objetivo de democratizar los datos y maximizar su valor. Sus componentes principales incluyen el Pool de Liquidez de Datos (DLP), mecanismo de Prueba de Contribución, Consenso de Nagoya, auto-custodia de datos por parte del usuario y una capa de aplicación descentralizada. Juntos, estos elementos crean una plataforma innovadora que protege la privacidad del usuario al mismo tiempo que desbloquea el valor potencial de los datos.
El Pool de Liquidez de Datos (DLP) sirve como la unidad fundamental dentro de la red Vana y se puede comparar con la "minería de liquidez" pero para datos. Cada DLP es básicamente un contrato inteligente diseñado para agrupar tipos específicos de activos de datos. Por ejemplo, el DAO de Datos de Reddit (r/datadao) es un caso exitoso de DLP, atrayendo a más de 140.000 usuarios de Reddit y agregando las publicaciones, comentarios e historias de votación de los usuarios.
Después de que los usuarios envíen sus datos a un DLP, pueden ganar tokens específicos asociados con ese DLP, como RDAT para el Reddit Data DAO (r/datadao). Estos tokens no solo representan la contribución del usuario al grupo de datos, sino que también otorgan derechos de gobernanza y beneficios futuros de participación en las ganancias dentro del DLP. Es importante destacar que Vana permite que cada DLP emita sus propios tokens, ofreciendo un mecanismo flexible de captura de valor para diferentes tipos de activos de datos.
En el ecosistema de Vana, los 16 mejores DLP reciben emisiones adicionales de tokens VANA, lo que incentiva aún más la formación y competencia de piscinas de datos de alta calidad. Este enfoque transforma inteligentemente los datos personales dispersos en activos digitales líquidos, sentando las bases para la valorización y liquidez de datos.
La Prueba de Contribución es el mecanismo clave de Vana para garantizar la calidad de los datos. Cada DLP puede adaptar una función única de Prueba de Contribución basada en sus necesidades específicas. Esta función no solo verifica la autenticidad y la integridad de los datos, sino que también evalúa su contribución para mejorar el rendimiento del modelo de IA.
Por ejemplo, el Proof of Contribution del ChatGPT Data DAO considera cuatro dimensiones críticas: autenticidad, propiedad, calidad y unicidad. La autenticidad se verifica a través de los enlaces de exportación de datos proporcionados por OpenAI; la propiedad se confirma mediante la verificación del correo electrónico de los usuarios; la evaluación de la calidad aprovecha la puntuación LLM en conversaciones muestreadas al azar; y la unicidad se determina calculando vectores de características de datos y comparándolos con datos existentes.
Esta evaluación multidimensional garantiza que solo se acepten y recompensen datos de alta calidad y valor. La Prueba de Contribución sirve como base para la fijación de precios de datos y es esencial para mantener la calidad de los datos en todo el ecosistema.
El Consenso de Nagoya es el núcleo de la red Vana, inspirado en y mejorando el Consenso Yuma de Bittensor. Este mecanismo gira en torno a una evaluación colectiva de la calidad de los datos por un conjunto de nodos de validación, llegando a una puntuación final a través de un promedio ponderado.
Lo que lo distingue es el enfoque de "evaluación de dos capas": no solo los nodos de validación evalúan la calidad de los datos, sino que también califican los comportamientos de calificación de otros nodos. Esto agrega una capa de equidad y precisión, disuadiendo la mala conducta. Por ejemplo, si un nodo de validación asigna una alta puntuación a datos de baja calidad, otros nodos pueden penalizar este error de juicio con una puntuación correctiva.
Cada 1800 bloques (aproximadamente cada 3 horas) marca un ciclo, durante el cual los nodos son recompensados en función de sus puntajes acumulativos. Este mecanismo incentiva la honestidad entre los validadores y detecta y elimina rápidamente el mal comportamiento, asegurando el funcionamiento saludable de la red.
Una de las innovaciones significativas de Vana radica en su enfoque único de gestión de datos. En la red de Vana, los datos originales de los usuarios nunca están verdaderamente "en cadena". En cambio, los usuarios pueden elegir sus ubicaciones de almacenamiento, como Google Drive, Dropbox o incluso servidores personales que se ejecutan en un MacBook.
Cuando los usuarios envían datos a un DLP, básicamente están proporcionando una URL que apunta a los datos cifrados y un hash de integridad de contenido opcional. Esta información se registra en el contrato de registro de datos de Vana. Los validadores pueden solicitar claves de descifrado para descargar y verificar los datos cuando sea necesario.
Este diseño aborda de manera inteligente problemas de privacidad y control de datos. Los usuarios mantienen un control completo sobre sus datos mientras siguen participando en la economía de datos. Esto no solo garantiza la seguridad de los datos, sino que también abre posibilidades para escenarios de aplicación de datos más amplios en el futuro.
La capa superior de Vana es un ecosistema de aplicaciones abiertas. Aquí, los desarrolladores pueden aprovechar la liquidez de datos acumulada en DLPs para construir diversas aplicaciones innovadoras, mientras que los contribuyentes de datos pueden obtener un valor económico tangible de estas aplicaciones.
Por ejemplo, un equipo de desarrollo puede entrenar un modelo de inteligencia artificial especializado utilizando datos del Reddit Data DAO. Los usuarios que contribuyeron con datos no solo pueden utilizar el modelo una vez que esté entrenado, sino que también reciben una parte de las ganancias generadas por el modelo de acuerdo a su contribución. De hecho, ya se ha desarrollado un modelo de IA de este tipo; se pueden encontrar más detalles en el artículo “Recuperándose desde el fondo: ¿Por qué el viejo token r/datadao en la pista de IA está volviendo a la vida?“
Este modelo no solo incentiva las contribuciones de datos de alta calidad, sino que también crea un ecosistema de desarrollo de IA verdaderamente impulsado por el usuario. Los usuarios pasan de ser simples proveedores de datos a ser copropietarios y beneficiarios de productos de IA.
A través de este enfoque, Vana está transformando el paisaje de la economía de datos. En este nuevo paradigma, los usuarios pasan de ser proveedores de datos pasivos a participantes activos y co-beneficiarios en la construcción del ecosistema. Esto no solo crea nuevas oportunidades para la adquisición de valor individual, sino que también inyecta nueva vitalidad e innovación en toda la industria de la inteligencia artificial.
La arquitectura técnica de Vana aborda problemas fundamentales en la economía actual de datos, como la propiedad de los datos, la protección de la privacidad y la distribución de valor, al mismo tiempo que allana el camino para futuras innovaciones basadas en datos. A medida que más organizaciones autónomas descentralizadas de datos se unan a la red y se desarrollen aplicaciones adicionales en la plataforma, Vana tiene el potencial de convertirse en la infraestructura fundamental para la próxima generación de IA descentralizada y la economía de datos.
Con el lanzamiento de la red de prueba Satori el 11 de junio, Vana ha mostrado un prototipo de su ecosistema al público. Esto sirve no solo como una plataforma para la validación técnica, sino también como una vista previa del modelo operativo para la futura mainnet. Actualmente, el ecosistema de Vana ofrece a los participantes tres vías principales: ejecutar nodos de validación de DLP, crear nuevos DLP o enviar datos a DLP existentes para participar en la “minería de datos.”
Los nodos de validación son los guardianes de la red Vana, responsables de verificar la calidad de los datos enviados a los DLP. Operar un nodo de validación requiere no solo experiencia técnica, sino también recursos informáticos suficientes. Según la documentación técnica de Vana, los requisitos mínimos de hardware para un nodo de validación son un núcleo de CPU, 8 GB de RAM y 10 GB de almacenamiento SSD de alta velocidad.
Los usuarios interesados en convertirse en validadores primero deben seleccionar un DLP y luego registrarse como validadores a través del contrato inteligente de ese DLP. Una vez registrado y aprobado, los validadores pueden ejecutar nodos de validación específicos para ese DLP. Es importante tener en cuenta que los validadores pueden operar nodos para múltiples DLPs simultáneamente, pero cada DLP tiene sus propios requisitos mínimos de apuesta.
Para los usuarios con recursos de datos únicos o ideas innovadoras, crear un nuevo DLP es una opción atractiva. Establecer un DLP requiere un profundo conocimiento de la arquitectura técnica de Vana, especialmente los mecanismos de prueba de contribución y consenso de Nagoya.
Los creadores de un nuevo DLP deben diseñar objetivos específicos de contribución de datos, métodos de validación y parámetros de recompensa. Además, necesitan implementar una función de prueba de contribución que evalúe con precisión el valor de los datos. Aunque este proceso puede ser complejo, Vana proporciona plantillas detalladas y documentación para apoyar a los creadores.
Para la mayoría de los usuarios, enviar datos a los DLP existentes para participar en la "minería de datos" puede ser la forma más directa de participar. Actualmente, se han recomendado oficialmente 13 DLP, que abarcan una variedad de campos, desde datos de redes sociales hasta datos de predicción financiera.
·Finquarium: Recopila datos de predicción financiera.
·GPT Data DAO: Se centra en las exportaciones de datos de chat de ChatGPT.
· Reddit Data DAO: se centra en los datos de los usuarios de Reddit y se ha lanzado oficialmente.
·Volara: Especializada en la recolección y utilización de datos de Twitter.
·Flirtual: Recopila datos de citas.
·ResumeDataDAO: Se enfoca en las exportaciones de datos de LinkedIn.
·SixGPT: Recopila y gestiona datos de chat LLM.
·YKYR: Recopila datos de Google Analytics.
· Sydintel: Crowdsources intelligence to reveal the dark corners of the internet.
·MindDAO: Recopila datos de series temporales relacionados con el bienestar del usuario.
·Kleo: Construye el conjunto de datos de historial de navegación más completo a nivel mundial.
·DataPIG: Se enfoca en datos de preferencia de inversión de tokens.
·ScrollDAO: Recopila y utiliza datos de Instagram.
Algunos de estos DLP todavía están en desarrollo, mientras que otros ya están en línea, pero todos están en la fase de pre-minería. Los usuarios solo pueden enviar oficialmente datos para la minería una vez que se lance la mainnet. Sin embargo, los usuarios pueden asegurar la elegibilidad para participar de diversas formas con anticipación. Por ejemplo, pueden participar en actividades de desafío relevantes en el Aplicación de Telegram de Vanao preinscríbete en los sitios web oficiales de cada DLP.
La aparición de Vana marca un cambio de paradigma en la economía de datos. En la actual ola de IA, los datos se han convertido en el "petróleo" de la nueva era, y Vana busca remodelar los modelos de extracción, refinación y distribución de este recurso.
Básicamente, Vana está construyendo una solución para la "tragedia de los comunes" en los datos. A través de un diseño de incentivos inteligente e innovación tecnológica, transforma los datos personales, un suministro aparentemente ilimitado que es difícil de monetizar, en un activo digital manejable, con precio y negociable. Esto no solo abre nuevos caminos para que los usuarios comunes participen en el reparto de beneficios de la inteligencia artificial, sino que también proporciona un posible modelo para el desarrollo de la inteligencia artificial descentralizada.
Sin embargo, el éxito de Vana enfrenta numerosas incertidumbres. Técnicamente, debe encontrar un equilibrio entre la apertura y la seguridad; económicamente, necesita demostrar que su modelo puede generar un valor sostenible; y socialmente, debe abordar posibles desafíos éticos y regulatorios de datos.
A un nivel más profundo, Vana representa una reflexión y un desafío a los monopolios de datos existentes y a los modelos de desarrollo de IA. Plantea una pregunta importante: En la era de la IA, ¿elegimos reforzar los actuales oligarcas de datos o intentamos construir un ecosistema de datos más abierto, justo y diverso?
Independientemente de si Vana tiene éxito en última instancia, su aparición nos ofrece una ventana para repensar el valor de los datos, la ética de la IA y la innovación tecnológica. En el futuro, proyectos como Vana pueden convertirse en puentes vitales que conecten los ideales de Web3 con las realidades de la IA, guiando la próxima fase del desarrollo económico digital.
Este artículo se reproduce de [BlockBeats] , el copyright pertenece al autor original [Pensamiento extraño], si tienes alguna objeción al reimpreso, por favor contacta al Gate Learnel equipo, y el equipo lo manejará lo antes posible de acuerdo con los procedimientos relevantes.
Descargo de responsabilidad: Las opiniones expresadas en este artículo representan solo las opiniones personales del autor y no constituyen ningún consejo de inversión.
Otras versiones del artículo son traducidas por el equipo de Aprende de gate y no se mencionan enGate.io, el artículo traducido no puede ser reproducido, distribuido o plagiado.