AI Veri Engellerini Aşmak: Veri DAO'ları Neden Şimdi Önemlidir

Orta SeviyeJul 14, 2024
Bu makale, yapay zeka veri kaynaklarının mevcut sınırlamalarını incelemekte ve Veri DAO'ların yeni, yüksek kaliteli veri kümeleri sağlayarak yapay zeka modellerini ilerletmesine yardımcı olabileceğini önermektedir. Veri DAO'ları, gerçek dünya verileri, kişisel sağlık verileri ve insan geri bildirimleriyle yapay zeka eğitimini geliştirebilir, ancak aynı zamanda teşvik bozulması, veri doğrulama ve fayda değerlendirmesi gibi zorluklarla da karşı karşıyadır.
AI Veri Engellerini Aşmak: Veri DAO'ları Neden Şimdi Önemlidir

Openai ve news corp ve reddit arasındaki son dikkate değer veri yetkilendirme anlaşmaları, yapay zeka için yüksek kaliteli veri gerekliliğini vurgulamaktadır. Önde gelen yapay zeka modelleri internetin önemli bir bölümü üzerinde zaten eğitilmiştir. Örneğin, common crawl, büyük dil modeli eğitimi için web sayfalarının yaklaşık %10'unu indekslemiştir ve bu da 100 trilyondan fazla jeton içermektedir.

Yapay zeka modellerini daha da geliştirmek için, eğitim için mevcut veriyi genişletmek ve geliştirmek esastır. Veriyi toplamanın yollarını özellikle merkezi olmayan yöntemlerle tartışıyoruz. Merkezi olmayan yaklaşımların, katkıda bulunanlara ve yaratıcılara ekonomik teşvikler sunarak yeni veri kümeleri oluşturmak konusundaki potansiyeline özellikle ilgi duyuyoruz.

Son yıllarda, kripto dünyasında sıcak konulardan biri veri daoları kavramı olmuştur, ki bu daolar, veri oluşturan, düzenleyen ve yöneten insan gruplarıdır. Bu konu Multicoin ve diğerleri tarafından tartışılmış olsa da, yapay zekanın hızlı ilerlemesi yeni bir soru ortaya çıkarıyor: "Neden şimdi veri daoları için doğru zaman?"

Bu makalede, veri daoları hakkındaki görüşlerimizi paylaşacağız ve şu soruyu ele alacağız: Veri daoları nasıl yapay zeka gelişimini hızlandırabilir?

1. yapay zekadaki verilerin mevcut durumu

Bugün, yapay zeka modelleri genellikle kamu verileri üzerinde eğitim alır, ya news corp ve reddit gibi şirketlerle işbirlikleri aracılığıyla ya da açık internetten veri çekerek. Örneğin, Meta'nın Llama 3'ü, kamu kaynaklarından 15 trilyon token kullanılarak eğitildi. Bu yöntemler, hızlı bir şekilde büyük miktarda veri toplamak için etkilidir, ancak hangi türde verilerin toplandığı ve bu verilerin nasıl elde edildiği konusunda bazı sınırlamaları vardır.

Öncelikle, hangi verilerin toplanması gerektiği konusunda: yapay zeka gelişimi, veri kalitesi ve miktarındaki darboğazlardan dolayı engellenmektedir. Leopold Aschenbrenner, daha fazla algoritma geliştirmelerini sınırlandıran "veri duvarı"ndan bahsetti: "Yakında, daha fazla kazınmış veri üzerinde daha büyük dil modellerinin ön eğitimine dayalı basit yaklaşım önemli darboğazlarla karşı karşıya kalabilir."

Veri duvarını aşmanın bir yolu yeni veri setlerini kullanılabilir hale getirmektir. Örneğin, model şirketlerinin çoğu web sitesinin hizmet şartlarını ihlal etmeden giriş korumalı verileri çekmesi mümkün değildir ve toplanmamış verilere erişemezler. Şu anda, Google Drive, Slack, kişisel sağlık kayıtları ve diğer özel bilgiler gibi yapay zeka eğitiminin erişemediği büyük miktarda özel veri bulunmaktadır.

İkinci olarak, verilerin nasıl toplandığına dair: mevcut modelde, veri toplama şirketleri çoğu değeri ele geçiriyor. Reddit'in s-1 dosyası, veri lisanslamasını önemli bir beklenen gelir kaynağı olarak vurguluyor: "Büyüyen veri avantajımızın ve fikri mülkiyetimizin gelecekteki llm eğitiminin temel unsurları olmaya devam etmesini bekliyoruz." Ancak, gerçek içeriği üreten son kullanıcılar bu lisans anlaşmalarından veya yapay zeka modellerinden herhangi bir ekonomik fayda elde etmiyor. Bu uyumsuzluk, katılımı engelleyebilir - zaten generatif ai şirketlerine dava açma veya eğitim veri setlerinden çıkma hareketleri var. Ayrıca, model şirketlerinin veya platformların geliri odaklanmasının, son kullanıcılarla paylaşmadan ciddi sosyo-ekonomik sonuçları olabilir.

2. veri daolarının etkisi

Önceden bahsedilen veri sorunları ortak bir tema paylaşıyor: çeşitli ve temsilci kullanıcı örneklerinden önemli katkılar elde ediyorlar. Herhangi bir tek veri noktasının model performansı üzerinde ihmal edilebilir bir etkisi olabilirken, bir grup kullanıcı bir araya gelerek yapay zeka eğitimi için son derece değerli yeni veri setleri oluşturabilir. İşte burada veri daoları (merkezi olmayan otonom organizasyonlar) devreye giriyor. Veri daoları ile veri katkıda bulunanlar veri sağlamak için ekonomik ödüller kazanabilir ve verilerinin nasıl kullanıldığını ve para kazandırıldığını kontrol edebilirler.

Veri DAO'ları hangi alanlarda mevcut veri manzarasında önemli bir etki yaratabilir? İşte birkaç fikir - bu tam bir liste değil ve veri DAO'ları kesinlikle diğer fırsatlara sahiptir:

(1) gerçek dünya verisi
Merkezi olmayan fiziksel altyapı (depin) alanında, Hivemapper gibi ağlar, dashcam sahiplerini verilerini paylaşmaya teşvik ederek ve kullanıcıların uygulamaları aracılığıyla veri sağlamalarını teşvik ederek en son küresel harita verilerini toplamayı amaçlar (örneğin, yol kapatmaları veya onarımları hakkında bilgi). depin, donanım cihazlarından ve/veya kullanıcı ağlarından oluşan gerçek dünya veri dao'su olarak görülebilir. Bu veri birçok şirket için ticari değere sahiptir ve katkıda bulunanlar jetonlarla ödüllendirilir.

(2) kişisel sağlık verileri
Biohacking, bireyler ve toplulukların, genellikle kendilerinde deney yaparak biyolojiyi inceleme konusunda kendilerine diy bir yaklaşım benimsediği bir sosyal harekettir. Örneğin, birisi beyin performansını artırmak için farklı nootropik ilaçlar kullanabilir, uyku kalitesini artırmak için çeşitli tedaviler veya çevresel değişiklikler deneyebilir veya hatta deneysel maddeleri kendilerine enjekte edebilir.

Veri daoları, katılımcıları ortak deneyler etrafında düzenleyerek ve sonuçları sistematik olarak toplayarak bu biyo-hacking çabalarına destek olabilir. Araştırma laboratuvarlarından veya ilaç şirketlerinden gelen bu kişisel sağlık daolarından elde edilen gelir, kişisel sağlık verilerini sağlayan katılımcılara geri ödenebilir.

(3) insan geri bildirimi ile güçlendirme öğrenimi
İnsan geri bildirimi ile güçlendirme öğrenimi (rlhf), yapay zeka modellerini ayarlamak ve performansını iyileştirmek için insan girdisi kullanmayı içerir. Tipik olarak, geri bildirim, modelin çıktısını etkili bir şekilde değerlendirebilen belirli alanlardaki uzmanlardan gelir. Örneğin, bir araştırma laboratuvarı, yapay zekanın matematiksel yeteneklerini geliştirmek için bir matematik doktorasından yardım isteyebilir. Token ödülleri, uzmanları katılmaya teşvik edebilir ve spekülatif değer ve kripto ödeme sistemleri aracılığıyla küresel erişim sunabilir. Sapien, Fraction ve Sahara gibi şirketler bu alanda aktif olarak çalışıyor.

(4) özel veri
Yapay zeka eğitimi için mevcut kamu verileri azaldıkça, odaklanma özel veri kümelerine, özellikle de özel kullanıcı verilerine kayabilir. Giriş duvarlarının arkasında, özel mesajlar ve belgeler gibi erişilemeyen yüksek kaliteli verilerin bir zenginliği bulunur. Bu veriler, kişiselleştirilmiş yapay zeka eğitimi için son derece etkili olabilir ve genel internet üzerinde bulunmayan değerli bilgiler içerir.

Bu verilere erişmek ve kullanmak ciddi yasal ve etik zorluklar ortaya çıkarır. Veri daoları, istekli katılımcıların verilerini yüklemelerine ve bunun kullanımını yönetmelerine izin vererek bir çözüm sunabilir. Örneğin, bir reddit veri daosu, kullanıcıların yorumlarını, gönderilerini ve oy geçmişlerini içeren reddit verilerini yüklemelerine ve gizlilik koruyucu bir şekilde yapay zeka şirketlerine satmalarına veya kiralamalarına olanak tanıyabilir. Token teşvikleri, kullanıcıların verileriyle eğitilen yapay zeka modelleri tarafından üretilen sürekli değerden yalnızca bir kez değil, aynı zamanda sürekli olarak kazanmalarına olanak tanır.

3. açık konular ve zorluklar

Veri DAO'ları önemli potansiyel faydalar sunarken, ele alınması gereken birkaç önemli husus ve zorluk vardır.

(1) teşviklerin bozulması
Kripto para birimi token ödülleri kullanımının tarihinden çıkarılabilecek önemli bir ders, dışsal ödüllerin kullanıcı davranışlarını değiştirebileceğidir. Bu, veri toplamak için token ödülleri kullanmanın doğrudan sonuçlarına sahiptir: teşvikler katılımcı havuzunu ve katkıda bulundukları veri türlerini bozabilir.

Token teşviklerinin tanıtılması, katılımcıların gelirlerini maksimize etmek için düşük kaliteli veya sahte veriler sunarak sistemi suiistimal etme olasılığını da ortaya çıkarır. Bu, veri daolarının başarısı, verinin kalitesine bağlı olduğu için önemlidir. Katkılar istenilen hedeften saparsa, veri kümesinin değeri tehlikeye girebilir.

(2) veri ölçümü ve ödüllendirme

Veri DAO'larının merkezi fikri, katkıda bulunanlara tokenlerle veri sunumları için ödül vermek ve uzun vadede DAO için gelir oluşturmaktır. Bununla birlikte, veri değerinin subjektif doğası nedeniyle, farklı veri katkıları için uygun ödül belirlemek oldukça zorlu bir süreçtir. Örneğin, biyo-hackleme senaryosunda: bazı kullanıcıların verileri diğerlerinden daha değerli midir? Eğer öyleyse, bunu belirleyen faktörler nelerdir? Harita verileri için: bazı bölgelerden gelen bilgiler diğerlerinden daha değerli midir? Bu farklılıklar nasıl ölçülmelidir? (Verinin model performansına olan katkısını değerlendirerek veri değerini ölçme üzerine yapılan yapay zeka araştırmaları devam etmektedir, ancak bu hesaplama açısından yoğun olabilir.)

Ayrıca, verilerin gerçekliğini ve doğruluğunu doğrulamak için sağlam mekanizmalar kurmak son derece önemlidir. Bu önlemler olmadan, sistem sahte veri gönderimlerine (örneğin, sahte hesap oluşturma) veya sybil saldırılarına karşı savunmasız olabilir. Depin ağları, bu sorunu donanım cihaz düzeyinde doğrulamayla ele alırken, kullanıcı katkılarına dayanan diğer veri daoları daha fazla manipülasyona duyarlı olabilir.

(3) yeni verinin artı değeri
Çoğu açık ağ zaten eğitim amaçları için kullanılmıştır, bu nedenle veri dao işletmecilerinin, merkezi olmayan bir şekilde toplanan veri kümelerinin mevcut açık ağlardaki mevcut verilere gerçekten artı değer ekleyip eklemeyeceğini ve araştırmacıların bu verilere platformdan veya diğer yollarla erişebilip erişemeyeceğini düşünmeleri gerekir. Bu fikir, şimdiki mevcut verilerin ötesinde tamamen yeni verilerin toplanmasının önemini vurgulamaktadır, bu da bir sonraki düşünceye yol açar: etki ve gelir fırsatlarının ölçeği.

(4) gelir fırsatlarını değerlendirme
Temel olarak, veri DAO'ları, veri alıcılarını veri katkıda bulunanlarla bağlayan iki taraflı bir pazar yaratıyor. Bu nedenle, bir veri DAO'nun başarısı, veri için ödemeye istekli, istikrarlı ve çeşitli bir müşteri tabanını çekme yeteneğine bağlıdır.

Veri daolarının, verilerinin talebini belirlemesi ve onaylaması ve gelir fırsatlarının yeterince önemli olup olmadığından emin olması gerekir (toplamda veya katkı sağlayıcı başına) gerekli miktarda ve kalitede veri sağlamak için teşvik edici olduğundan. Örneğin, reklam amaçları için kişisel tercihleri ve gezinme verilerini toplamak üzere bir kullanıcı veri daosu oluşturma konsepti yıllardır tartışılıyor, ancak kullanıcılar için potansiyel getiriler minimal olabilir. (bağlam için, meta'nın küresel ARPU'su 2023'ün sonunda 13.12 dolar oldu.) Yapay zeka şirketlerinin trilyonlarca dolar yatırım yapmayı planlamasıyla, veriden potansiyel kazançlar büyük çapta katkılara teşvik etmek için yeterli olabilir, veri daoları için ilginç bir soru ortaya çıkar: "neden şimdi?"

4. veri duvarını aşmak

Veri daoları, yapay zekaya meydan okuyan veri duvarını yıkmak ve yeni, yüksek kaliteli veri kümesi oluşturmak için umut vadeden bir çözüm sunar. Bunun nasıl başarılabileceği henüz belirlenmemiş olsa da, bu alandaki gelişmeleri heyecanla bekliyoruz.

feragatname:

  1. bu makale [den yeniden basılmıştırJinse finans], ve telif hakkı orijinal yazar [li jin]'e aittir. Bu yeniden basım konusunda herhangi bir itirazınız varsa, lütfen gate learn ekibiyle iletişime geçin.[email protected].takım ilgili prosedürlere göre herhangi bir endişeyi derhal ele alacaktır.
  2. Açıklama: Bu makalede yer alan görüşler ve düşünceler yalnızca yazarına aittir ve herhangi bir yatırım tavsiyesi teşkil etmez.
  3. Bu makalenin diğer dil sürümleri Gate öğrenme ekibi tarafından çevrilmiştir. BahsetmedenGate.io, çevrilen makaleler kopyalanamaz, dağıtılamaz veya kopyalanamaz.

AI Veri Engellerini Aşmak: Veri DAO'ları Neden Şimdi Önemlidir

Orta SeviyeJul 14, 2024
Bu makale, yapay zeka veri kaynaklarının mevcut sınırlamalarını incelemekte ve Veri DAO'ların yeni, yüksek kaliteli veri kümeleri sağlayarak yapay zeka modellerini ilerletmesine yardımcı olabileceğini önermektedir. Veri DAO'ları, gerçek dünya verileri, kişisel sağlık verileri ve insan geri bildirimleriyle yapay zeka eğitimini geliştirebilir, ancak aynı zamanda teşvik bozulması, veri doğrulama ve fayda değerlendirmesi gibi zorluklarla da karşı karşıyadır.
AI Veri Engellerini Aşmak: Veri DAO'ları Neden Şimdi Önemlidir

Openai ve news corp ve reddit arasındaki son dikkate değer veri yetkilendirme anlaşmaları, yapay zeka için yüksek kaliteli veri gerekliliğini vurgulamaktadır. Önde gelen yapay zeka modelleri internetin önemli bir bölümü üzerinde zaten eğitilmiştir. Örneğin, common crawl, büyük dil modeli eğitimi için web sayfalarının yaklaşık %10'unu indekslemiştir ve bu da 100 trilyondan fazla jeton içermektedir.

Yapay zeka modellerini daha da geliştirmek için, eğitim için mevcut veriyi genişletmek ve geliştirmek esastır. Veriyi toplamanın yollarını özellikle merkezi olmayan yöntemlerle tartışıyoruz. Merkezi olmayan yaklaşımların, katkıda bulunanlara ve yaratıcılara ekonomik teşvikler sunarak yeni veri kümeleri oluşturmak konusundaki potansiyeline özellikle ilgi duyuyoruz.

Son yıllarda, kripto dünyasında sıcak konulardan biri veri daoları kavramı olmuştur, ki bu daolar, veri oluşturan, düzenleyen ve yöneten insan gruplarıdır. Bu konu Multicoin ve diğerleri tarafından tartışılmış olsa da, yapay zekanın hızlı ilerlemesi yeni bir soru ortaya çıkarıyor: "Neden şimdi veri daoları için doğru zaman?"

Bu makalede, veri daoları hakkındaki görüşlerimizi paylaşacağız ve şu soruyu ele alacağız: Veri daoları nasıl yapay zeka gelişimini hızlandırabilir?

1. yapay zekadaki verilerin mevcut durumu

Bugün, yapay zeka modelleri genellikle kamu verileri üzerinde eğitim alır, ya news corp ve reddit gibi şirketlerle işbirlikleri aracılığıyla ya da açık internetten veri çekerek. Örneğin, Meta'nın Llama 3'ü, kamu kaynaklarından 15 trilyon token kullanılarak eğitildi. Bu yöntemler, hızlı bir şekilde büyük miktarda veri toplamak için etkilidir, ancak hangi türde verilerin toplandığı ve bu verilerin nasıl elde edildiği konusunda bazı sınırlamaları vardır.

Öncelikle, hangi verilerin toplanması gerektiği konusunda: yapay zeka gelişimi, veri kalitesi ve miktarındaki darboğazlardan dolayı engellenmektedir. Leopold Aschenbrenner, daha fazla algoritma geliştirmelerini sınırlandıran "veri duvarı"ndan bahsetti: "Yakında, daha fazla kazınmış veri üzerinde daha büyük dil modellerinin ön eğitimine dayalı basit yaklaşım önemli darboğazlarla karşı karşıya kalabilir."

Veri duvarını aşmanın bir yolu yeni veri setlerini kullanılabilir hale getirmektir. Örneğin, model şirketlerinin çoğu web sitesinin hizmet şartlarını ihlal etmeden giriş korumalı verileri çekmesi mümkün değildir ve toplanmamış verilere erişemezler. Şu anda, Google Drive, Slack, kişisel sağlık kayıtları ve diğer özel bilgiler gibi yapay zeka eğitiminin erişemediği büyük miktarda özel veri bulunmaktadır.

İkinci olarak, verilerin nasıl toplandığına dair: mevcut modelde, veri toplama şirketleri çoğu değeri ele geçiriyor. Reddit'in s-1 dosyası, veri lisanslamasını önemli bir beklenen gelir kaynağı olarak vurguluyor: "Büyüyen veri avantajımızın ve fikri mülkiyetimizin gelecekteki llm eğitiminin temel unsurları olmaya devam etmesini bekliyoruz." Ancak, gerçek içeriği üreten son kullanıcılar bu lisans anlaşmalarından veya yapay zeka modellerinden herhangi bir ekonomik fayda elde etmiyor. Bu uyumsuzluk, katılımı engelleyebilir - zaten generatif ai şirketlerine dava açma veya eğitim veri setlerinden çıkma hareketleri var. Ayrıca, model şirketlerinin veya platformların geliri odaklanmasının, son kullanıcılarla paylaşmadan ciddi sosyo-ekonomik sonuçları olabilir.

2. veri daolarının etkisi

Önceden bahsedilen veri sorunları ortak bir tema paylaşıyor: çeşitli ve temsilci kullanıcı örneklerinden önemli katkılar elde ediyorlar. Herhangi bir tek veri noktasının model performansı üzerinde ihmal edilebilir bir etkisi olabilirken, bir grup kullanıcı bir araya gelerek yapay zeka eğitimi için son derece değerli yeni veri setleri oluşturabilir. İşte burada veri daoları (merkezi olmayan otonom organizasyonlar) devreye giriyor. Veri daoları ile veri katkıda bulunanlar veri sağlamak için ekonomik ödüller kazanabilir ve verilerinin nasıl kullanıldığını ve para kazandırıldığını kontrol edebilirler.

Veri DAO'ları hangi alanlarda mevcut veri manzarasında önemli bir etki yaratabilir? İşte birkaç fikir - bu tam bir liste değil ve veri DAO'ları kesinlikle diğer fırsatlara sahiptir:

(1) gerçek dünya verisi
Merkezi olmayan fiziksel altyapı (depin) alanında, Hivemapper gibi ağlar, dashcam sahiplerini verilerini paylaşmaya teşvik ederek ve kullanıcıların uygulamaları aracılığıyla veri sağlamalarını teşvik ederek en son küresel harita verilerini toplamayı amaçlar (örneğin, yol kapatmaları veya onarımları hakkında bilgi). depin, donanım cihazlarından ve/veya kullanıcı ağlarından oluşan gerçek dünya veri dao'su olarak görülebilir. Bu veri birçok şirket için ticari değere sahiptir ve katkıda bulunanlar jetonlarla ödüllendirilir.

(2) kişisel sağlık verileri
Biohacking, bireyler ve toplulukların, genellikle kendilerinde deney yaparak biyolojiyi inceleme konusunda kendilerine diy bir yaklaşım benimsediği bir sosyal harekettir. Örneğin, birisi beyin performansını artırmak için farklı nootropik ilaçlar kullanabilir, uyku kalitesini artırmak için çeşitli tedaviler veya çevresel değişiklikler deneyebilir veya hatta deneysel maddeleri kendilerine enjekte edebilir.

Veri daoları, katılımcıları ortak deneyler etrafında düzenleyerek ve sonuçları sistematik olarak toplayarak bu biyo-hacking çabalarına destek olabilir. Araştırma laboratuvarlarından veya ilaç şirketlerinden gelen bu kişisel sağlık daolarından elde edilen gelir, kişisel sağlık verilerini sağlayan katılımcılara geri ödenebilir.

(3) insan geri bildirimi ile güçlendirme öğrenimi
İnsan geri bildirimi ile güçlendirme öğrenimi (rlhf), yapay zeka modellerini ayarlamak ve performansını iyileştirmek için insan girdisi kullanmayı içerir. Tipik olarak, geri bildirim, modelin çıktısını etkili bir şekilde değerlendirebilen belirli alanlardaki uzmanlardan gelir. Örneğin, bir araştırma laboratuvarı, yapay zekanın matematiksel yeteneklerini geliştirmek için bir matematik doktorasından yardım isteyebilir. Token ödülleri, uzmanları katılmaya teşvik edebilir ve spekülatif değer ve kripto ödeme sistemleri aracılığıyla küresel erişim sunabilir. Sapien, Fraction ve Sahara gibi şirketler bu alanda aktif olarak çalışıyor.

(4) özel veri
Yapay zeka eğitimi için mevcut kamu verileri azaldıkça, odaklanma özel veri kümelerine, özellikle de özel kullanıcı verilerine kayabilir. Giriş duvarlarının arkasında, özel mesajlar ve belgeler gibi erişilemeyen yüksek kaliteli verilerin bir zenginliği bulunur. Bu veriler, kişiselleştirilmiş yapay zeka eğitimi için son derece etkili olabilir ve genel internet üzerinde bulunmayan değerli bilgiler içerir.

Bu verilere erişmek ve kullanmak ciddi yasal ve etik zorluklar ortaya çıkarır. Veri daoları, istekli katılımcıların verilerini yüklemelerine ve bunun kullanımını yönetmelerine izin vererek bir çözüm sunabilir. Örneğin, bir reddit veri daosu, kullanıcıların yorumlarını, gönderilerini ve oy geçmişlerini içeren reddit verilerini yüklemelerine ve gizlilik koruyucu bir şekilde yapay zeka şirketlerine satmalarına veya kiralamalarına olanak tanıyabilir. Token teşvikleri, kullanıcıların verileriyle eğitilen yapay zeka modelleri tarafından üretilen sürekli değerden yalnızca bir kez değil, aynı zamanda sürekli olarak kazanmalarına olanak tanır.

3. açık konular ve zorluklar

Veri DAO'ları önemli potansiyel faydalar sunarken, ele alınması gereken birkaç önemli husus ve zorluk vardır.

(1) teşviklerin bozulması
Kripto para birimi token ödülleri kullanımının tarihinden çıkarılabilecek önemli bir ders, dışsal ödüllerin kullanıcı davranışlarını değiştirebileceğidir. Bu, veri toplamak için token ödülleri kullanmanın doğrudan sonuçlarına sahiptir: teşvikler katılımcı havuzunu ve katkıda bulundukları veri türlerini bozabilir.

Token teşviklerinin tanıtılması, katılımcıların gelirlerini maksimize etmek için düşük kaliteli veya sahte veriler sunarak sistemi suiistimal etme olasılığını da ortaya çıkarır. Bu, veri daolarının başarısı, verinin kalitesine bağlı olduğu için önemlidir. Katkılar istenilen hedeften saparsa, veri kümesinin değeri tehlikeye girebilir.

(2) veri ölçümü ve ödüllendirme

Veri DAO'larının merkezi fikri, katkıda bulunanlara tokenlerle veri sunumları için ödül vermek ve uzun vadede DAO için gelir oluşturmaktır. Bununla birlikte, veri değerinin subjektif doğası nedeniyle, farklı veri katkıları için uygun ödül belirlemek oldukça zorlu bir süreçtir. Örneğin, biyo-hackleme senaryosunda: bazı kullanıcıların verileri diğerlerinden daha değerli midir? Eğer öyleyse, bunu belirleyen faktörler nelerdir? Harita verileri için: bazı bölgelerden gelen bilgiler diğerlerinden daha değerli midir? Bu farklılıklar nasıl ölçülmelidir? (Verinin model performansına olan katkısını değerlendirerek veri değerini ölçme üzerine yapılan yapay zeka araştırmaları devam etmektedir, ancak bu hesaplama açısından yoğun olabilir.)

Ayrıca, verilerin gerçekliğini ve doğruluğunu doğrulamak için sağlam mekanizmalar kurmak son derece önemlidir. Bu önlemler olmadan, sistem sahte veri gönderimlerine (örneğin, sahte hesap oluşturma) veya sybil saldırılarına karşı savunmasız olabilir. Depin ağları, bu sorunu donanım cihaz düzeyinde doğrulamayla ele alırken, kullanıcı katkılarına dayanan diğer veri daoları daha fazla manipülasyona duyarlı olabilir.

(3) yeni verinin artı değeri
Çoğu açık ağ zaten eğitim amaçları için kullanılmıştır, bu nedenle veri dao işletmecilerinin, merkezi olmayan bir şekilde toplanan veri kümelerinin mevcut açık ağlardaki mevcut verilere gerçekten artı değer ekleyip eklemeyeceğini ve araştırmacıların bu verilere platformdan veya diğer yollarla erişebilip erişemeyeceğini düşünmeleri gerekir. Bu fikir, şimdiki mevcut verilerin ötesinde tamamen yeni verilerin toplanmasının önemini vurgulamaktadır, bu da bir sonraki düşünceye yol açar: etki ve gelir fırsatlarının ölçeği.

(4) gelir fırsatlarını değerlendirme
Temel olarak, veri DAO'ları, veri alıcılarını veri katkıda bulunanlarla bağlayan iki taraflı bir pazar yaratıyor. Bu nedenle, bir veri DAO'nun başarısı, veri için ödemeye istekli, istikrarlı ve çeşitli bir müşteri tabanını çekme yeteneğine bağlıdır.

Veri daolarının, verilerinin talebini belirlemesi ve onaylaması ve gelir fırsatlarının yeterince önemli olup olmadığından emin olması gerekir (toplamda veya katkı sağlayıcı başına) gerekli miktarda ve kalitede veri sağlamak için teşvik edici olduğundan. Örneğin, reklam amaçları için kişisel tercihleri ve gezinme verilerini toplamak üzere bir kullanıcı veri daosu oluşturma konsepti yıllardır tartışılıyor, ancak kullanıcılar için potansiyel getiriler minimal olabilir. (bağlam için, meta'nın küresel ARPU'su 2023'ün sonunda 13.12 dolar oldu.) Yapay zeka şirketlerinin trilyonlarca dolar yatırım yapmayı planlamasıyla, veriden potansiyel kazançlar büyük çapta katkılara teşvik etmek için yeterli olabilir, veri daoları için ilginç bir soru ortaya çıkar: "neden şimdi?"

4. veri duvarını aşmak

Veri daoları, yapay zekaya meydan okuyan veri duvarını yıkmak ve yeni, yüksek kaliteli veri kümesi oluşturmak için umut vadeden bir çözüm sunar. Bunun nasıl başarılabileceği henüz belirlenmemiş olsa da, bu alandaki gelişmeleri heyecanla bekliyoruz.

feragatname:

  1. bu makale [den yeniden basılmıştırJinse finans], ve telif hakkı orijinal yazar [li jin]'e aittir. Bu yeniden basım konusunda herhangi bir itirazınız varsa, lütfen gate learn ekibiyle iletişime geçin.[email protected].takım ilgili prosedürlere göre herhangi bir endişeyi derhal ele alacaktır.
  2. Açıklama: Bu makalede yer alan görüşler ve düşünceler yalnızca yazarına aittir ve herhangi bir yatırım tavsiyesi teşkil etmez.
  3. Bu makalenin diğer dil sürümleri Gate öğrenme ekibi tarafından çevrilmiştir. BahsetmedenGate.io, çevrilen makaleler kopyalanamaz, dağıtılamaz veya kopyalanamaz.
Şimdi Başlayın
Kaydolun ve
100 USD
değerinde Kupon kazanın!