Bạn đã bao giờ tự hỏi tại sao các nền tảng truyền thông xã hội như Reddit và X (trước đây là Twitter) có thể sử dụng miễn phí không? Câu trả lời nằm trong những bài đăng bạn tạo ra, những lượt thích bạn cho, và thậm chí cả thời gian bạn dành để cuộn trang.
Trong quá khứ, những nền tảng này đã bán sự chú ý của bạn như một mặt hàng cho nhà quảng cáo. Bây giờ, họ đã tìm thấy một người mua lớn hơn - các công ty AI. Các báo cáo cho thấy một thỏa thuận cấp phép dữ liệu duy nhất giữa Reddit và Google có thể tạo ra 60 triệu đô la mỗi năm cho Reddit. Tuy nhiên, sự giàu có khổng lồ này không liên quan gì đến chúng ta như những người tạo ra dữ liệu.
Điều đáng lo ngại hơn nữa là AI được đào tạo trên dữ liệu của chúng ta cuối cùng có thể thay thế công việc của chúng ta. Mặc dù AI cũng có thể tạo ra các cơ hội việc làm mới, nhưng sự tập trung của cải do độc quyền dữ liệu này chắc chắn làm trầm trọng thêm sự bất bình đẳng xã hội. Có vẻ như chúng ta đang trượt vào một thế giới cyberpunk được kiểm soát bởi một số gã khổng lồ công nghệ.
Vậy, làm sao những người bình thường có thể bảo vệ quyền lợi của mình trong thời đại trí tuệ nhân tạo này? Sau khi trí tuệ nhân tạo trỗi dậy, nhiều người xem blockchain như là đường cuối cùng bảo vệ nhân loại khỏi nó. Dựa trên suy nghĩ này, một số nhà đổi mới đã bắt đầu khám phá các giải pháp. Họ đề xuất rằng trước tiên, chúng ta phải lấy lại sở hữu và kiểm soát dữ liệu của chúng ta; thứ hai, chúng ta nên sử dụng dữ liệu này để đào tạo mô hình trí tuệ nhân tạo theo cách cộng tác thực sự phục vụ cho người dân chung.
Ý tưởng này có vẻ duy tâm, nhưng lịch sử cho chúng ta thấy rằng mọi cuộc cách mạng công nghệ đều bắt đầu với một khái niệm "điên rồ". Ngày nay, một dự án chuỗi công cộng mới có tên "Vana" đang biến tầm nhìn này thành hiện thực. Là mạng thanh khoản dữ liệu phi tập trung đầu tiên, Vana nhằm mục đích chuyển đổi dữ liệu của bạn thành các mã thông báo lưu hành tự do, từ đó thúc đẩy trí tuệ nhân tạo phi tập trung thực sự do người dùng kiểm soát.
Thực tế, sự ra đời của Vana có thể được truy ngược về một lớp học tại MIT Media Lab, nơi hai cá nhân trẻ tuổi có tầm nhìn để thay đổi thế giới - Anna Kazlauskas và Art Abal - gặp nhau.
Trái: Anna Kazlauskas; Phải: Art Abal.
Anna Kazlauskas tốt nghiệp ngành khoa học máy tính và kinh tế tại MIT, và sở thích về dữ liệu và tiền điện tử của cô bắt đầu từ năm 2015. Lúc đó, cô tham gia khai thác Ethereum sớm, điều này giúp cô hiểu rõ về tiềm năng của công nghệ phi tập trung. Sau đó, Anna tiến hành nghiên cứu dữ liệu tại các tổ chức tài chính quốc tế như Ngân hàng Dự trữ Liên bang, Ngân hàng Trung ương châu Âu và Ngân hàng Thế giới, những trải nghiệm này đã giúp cô nhận ra rằng dữ liệu sẽ trở thành một hình thức tiền tệ mới trong tương lai.
Trong khi đó, Art Abal theo đuổi bằng thạc sĩ về chính sách công tại Đại học Harvard và tiến hành nghiên cứu chuyên sâu về đánh giá tác động dữ liệu tại Trung tâm Khoa học và Quan hệ Quốc tế Belfer. Trước khi gia nhập Vana, Art đã lãnh đạo các phương pháp thu thập dữ liệu sáng tạo tại Appen, một nhà cung cấp dữ liệu đào tạo AI, góp phần đáng kể vào sự xuất hiện của nhiều công cụ AI tạo ra ngày nay. Những hiểu biết của ông về đạo đức dữ liệu và trách nhiệm giải trình AI đã truyền cho Vana ý thức trách nhiệm xã hội mạnh mẽ.
Khi Anna và Art gặp nhau trong một lớp học tại Viện Media MIT, họ nhanh chóng nhận ra niềm đam mê chung của họ về dân chủ hóa dữ liệu và quyền dữ liệu người dùng. Họ nhận ra rằng để thật sự giải quyết các vấn đề về sở hữu dữ liệu và sự công bằng trong trí tuệ nhân tạo, cần có một mô hình mới - một mô hình cho phép người dùng kiểm soát thực sự dữ liệu của họ.
Tầm nhìn chung này đã thúc đẩy họ thành lập Vana. Mục tiêu của họ là tạo ra một nền tảng cách mạng không chỉ ủng hộ chủ quyền dữ liệu cho người dùng mà còn đảm bảo người dùng có thể thu được lợi ích kinh tế từ dữ liệu của họ. Qua cơ chế Hồ bơi Lưu lượng Dữ liệu (DLP) đổi mới và hệ thống Chứng minh Đóng góp, Vana cho phép người dùng đóng góp dữ liệu cá nhân một cách an toàn, chia sẻ quyền sở hữu và hưởng lợi từ các mô hình Trí tuệ nhân tạo được đào tạo từ dữ liệu đó, từ đó thúc đẩy sự phát triển Trí tuệ nhân tạo dựa trên người dùng.
Tầm nhìn của Vana nhanh chóng được công nhận trong ngành công nghiệp. Đến nay, Vana đã thông báo rằng họ đã hoàn thành tổng cộng 25 triệu đô la Mỹ trong quá trình huy động vốn, bao gồm một vòng gọi vốn chiến lược trị giá 5 triệu đô la Mỹ do Coinbase Ventures dẫn đầu, một vòng gọi vốn loạt A trị giá 18 triệu đô la Mỹ do Paradigm dẫn đầu, và một vòng gọi vốn hạt giống trị giá 2 triệu đô la Mỹ do Polychain dẫn đầu. Các nhà đầu tư đáng chú ý khác bao gồm Casey Caruso, Packy McCormick, Manifold, GSR và DeFiance Capital.
Trong thế giới này, nơi dữ liệu là dầu mới của thời đại, sự xuất hiện của Vana không thể phủ nhận mang lại cho chúng ta một cơ hội quan trọng để lấy lại chủ quyền dữ liệu. Vậy, dự án hứa hẹn này hoạt động như thế nào? Hãy cùng khám phá kiến trúc kỹ thuật và khái niệm đổi mới của Vana.
Kiến trúc kỹ thuật của Vana được thiết kế một cách cẩn thận, hướng đến việc dân chủ hóa dữ liệu và tối đa hóa giá trị của nó. Các thành phần cốt lõi bao gồm Hồ chứa thanh khoản dữ liệu (DLP), cơ chế Chứng minh Đóng góp, Sự đồng thuận Nagoya, tự lưu trữ dữ liệu của người dùng và một lớp ứng dụng phi tập trung. Cùng nhau, những yếu tố này tạo ra một nền tảng sáng tạo bảo vệ quyền riêng tư của người dùng trong khi mở khóa giá trị tiềm năng của dữ liệu.
Hồ bơi thanh khoản dữ liệu (DLP) phục vụ như là đơn vị cơ bản trong mạng lưới Vana và có thể được coi là “đào thanh khoản” nhưng cho dữ liệu. Mỗi DLP về cơ bản là một hợp đồng thông minh được thiết kế để tổng hợp các loại tài sản dữ liệu cụ thể. Ví dụ, Reddit Data DAO (r/datadao) là một trường hợp DLP thành công, thu hút hơn 140.000 người dùng Reddit và tổng hợp bài đăng Reddit, bình luận và lịch sử bỏ phiếu của người dùng.
Sau khi người dùng gửi dữ liệu của họ cho một DLP, họ có thể kiếm được các mã thông báo cụ thể liên quan đến DLP đó, chẳng hạn như RDAT cho Reddit Data DAO (r/datadao). Các mã thông báo này không chỉ đại diện cho đóng góp của người dùng vào hồ bơi dữ liệu mà còn cấp quyền quản trị và lợi ích chia sẻ lợi nhuận trong tương lai trong DLP. Đáng chú ý, Vana cho phép mỗi DLP phát hành riêng các mã thông báo của mình, cung cấp cơ chế giữ giá trị linh hoạt cho các loại tài sản dữ liệu khác nhau.
Trong hệ sinh thái của Vana, 16 DLP hàng đầu nhận phát sinh token VANA bổ sung, thúc đẩy thêm việc hình thành và cạnh tranh của các hồ bơi dữ liệu chất lượng cao. Cách tiếp cận này một cách thông minh biến dữ liệu cá nhân phân tán thành tài sản kỹ thuật số lỏng lẻo, đặt nền móng cho việc định giá dữ liệu và thanh khoản.
Proof of Contribution là cơ chế chính của Vana để đảm bảo chất lượng dữ liệu. Mỗi DLP có thể tùy chỉnh một chức năng Proof of Contribution duy nhất dựa trên nhu cầu cụ thể của nó. Chức năng này không chỉ xác minh tính xác thực và tính toàn vẹn của dữ liệu mà còn đánh giá đóng góp của nó vào việc cải thiện hiệu suất mô hình AI.
Ví dụ, Proof of Contribution của ChatGPT Data DAO xem xét bốn chiều quan trọng: tính xác thực, sở hữu, chất lượng, và tính độc nhất vô nhị. Tính xác thực được xác minh thông qua các liên kết xuất dữ liệu do OpenAI cung cấp; việc sở hữu được xác nhận qua xác minh email của người dùng; đánh giá chất lượng sử dụng điểm LLM trên các cuộc trò chuyện được chọn mẫu ngẫu nhiên; và tính độc nhất vô nhị được xác định bằng cách tính toán vector đặc trưng dữ liệu và so sánh chúng với dữ liệu hiện tại.
Đánh giá đa chiều này đảm bảo chỉ có dữ liệu chất lượng cao, có giá trị được chấp nhận và được thưởng. Chứng minh Đóng góp là nền tảng cho giá cả dữ liệu và là yếu tố cần thiết để duy trì chất lượng dữ liệu trong toàn bộ hệ sinh thái.
The Nagoya Consensus is the core of the Vana network, inspired by and enhancing Bittensor’s Yuma Consensus. This mechanism revolves around a collective evaluation of data quality by a set of validation nodes, arriving at a final score through weighted averaging.
Điểm khác biệt của nó là phương pháp "đánh giá hai lớp": không chỉ các nút xác thực đánh giá chất lượng dữ liệu, mà họ cũng đánh giá hành vi xếp hạng của các nút khác. Điều này thêm một lớp công bằng và chính xác, ngăn chặn hành vi kỷ luật. Ví dụ, nếu một nút xác thực gán điểm cao cho dữ liệu chất lượng thấp, các nút khác có thể phạt sự đánh giá sai lầm này bằng điểm sửa đổi.
Mỗi 1800 khối (khoảng 3 giờ) đánh dấu một chu kỳ, trong đó các nút được thưởng dựa trên điểm tích lũy của họ. Cơ chế này khuyến khích tính trung thực giữa các bên xác thực và nhanh chóng xác định và loại bỏ các hành vi sai trái, đảm bảo hoạt động lành mạnh của mạng.
Một trong những đổi mới quan trọng của Vana nằm ở cách tiếp cận quản lý dữ liệu độc đáo. Trong mạng Vana, dữ liệu gốc của người dùng không bao giờ thực sự là "on-chain". Thay vào đó, người dùng có thể chọn vị trí lưu trữ của họ, chẳng hạn như Google Drive, Dropbox hoặc thậm chí các máy chủ cá nhân chạy trên MacBook.
Khi người dùng gửi dữ liệu cho DLP, họ thực chất đang cung cấp một URL trỏ đến dữ liệu đã được mã hóa và một băm tính toàn vẹn nội dung tùy chọn. Thông tin này được ghi lại trong hợp đồng đăng ký dữ liệu của Vana. Các bộ xác thực có thể yêu cầu khóa giải mã để tải xuống và xác minh dữ liệu khi cần thiết.
Thiết kế này một cách thông minh giải quyết các vấn đề về quyền riêng tư và kiểm soát dữ liệu. Người dùng duy trì hoàn toàn quyền kiểm soát dữ liệu của họ trong khi vẫn tham gia vào nền kinh tế dữ liệu. Điều này không chỉ đảm bảo an ninh dữ liệu mà còn mở ra những khả năng cho các kịch bản ứng dụng dữ liệu rộng lớn hơn trong tương lai.
Lớp trên cùng của Vana là một hệ sinh thái ứng dụng mở. Ở đây, nhà phát triển có thể tận dụng tính thanh khoản dữ liệu đã tích lũy trong DLP để xây dựng các ứng dụng đổi mới khác nhau, trong khi các nhà đóng góp dữ liệu có thể thu được giá trị kinh tế rõ ràng từ những ứng dụng này.
Ví dụ, một nhóm phát triển có thể huấn luyện một mô hình AI chuyên dụng bằng cách sử dụng dữ liệu từ Reddit Data DAO. Người dùng đã đóng góp dữ liệu không chỉ có thể sử dụng mô hình sau khi nó được huấn luyện mà còn nhận được một phần lợi nhuận được tạo ra bởi mô hình theo đóng góp của họ. Trên thực tế, một mô hình AI như vậy đã được phát triển; chi tiết thêm có thể được tìm thấy trong bài viết “Hồi phục từ đáy: Tại sao Token cũ r/datadao trong AI Track đang trở lại? “
Mô hình này không chỉ khuyến khích đóng góp dữ liệu chất lượng cao mà còn tạo ra một hệ sinh thái phát triển trí tuệ nhân tạo thực sự dựa trên người dùng. Người dùng chuyển từ việc cung cấp dữ liệu đơn thuần sang việc là cộng sự chủ sở hữu và người hưởng lợi từ các sản phẩm trí tuệ nhân tạo.
Qua cách tiếp cận này, Vana đang tái tạo cảnh quan nền kinh tế dữ liệu. Trong mô hình mới này, người dùng chuyển từ việc cung cấp dữ liệu một cách passively sang việc tham gia tích cực và trở thành người hưởng lợi chung trong việc xây dựng hệ sinh thái. Điều này không chỉ tạo ra những cơ hội mới cho việc tạo ra giá trị cá nhân mà còn đưa vào ngành công nghiệp trí tuệ nhân tạo toàn bộ sự sống động và sáng tạo mới.
Kiến trúc kỹ thuật của Vana giải quyết các vấn đề cốt lõi trong nền kinh tế dữ liệu hiện tại, như sở hữu dữ liệu, bảo vệ quyền riêng tư và phân phối giá trị, đồng thời mở đường cho những đổi mới dựa trên dữ liệu trong tương lai. Khi có thêm các tổ chức tự trị dữ liệu tham gia mạng lưới và các ứng dụng bổ sung được xây dựng trên nền tảng, Vana có tiềm năng trở thành cơ sở hạ tầng cốt lõi cho thế hệ tiếp theo của trí tuệ nhân tạo phi tập trung và nền kinh tế dữ liệu.
Với việc ra mắt Satori testnet vào ngày 11 tháng 6, Vana đã trình diễn một nguyên mẫu của hệ sinh thái của mình cho công chúng. Điều này không chỉ là một nền tảng cho việc xác thực kỹ thuật mà còn là một bản xem trước về mô hình hoạt động cho mainnet trong tương lai. Hiện tại, hệ sinh thái Vana cung cấp ba con đường chính cho các thành viên tham gia: chạy các nút xác thực DLP, tạo DLP mới hoặc gửi dữ liệu cho DLP hiện có để tham gia vào “đào dữ liệu.”
Các nút xác nhận là những người bảo vệ của mạng Vana, có trách nhiệm xác minh chất lượng dữ liệu được gửi đến DLPs. Vận hành một nút xác nhận không chỉ đòi hỏi chuyên môn kỹ thuật mà còn đòi hỏi tài nguyên tính toán đủ. Theo tài liệu kỹ thuật của Vana, yêu cầu tối thiểu về phần cứng cho một nút xác nhận là một lõi CPU, 8GB RAM và 10GB bộ nhớ SSD tốc độ cao.
Người dùng quan tâm đến việc trở thành người xác minh phải trước tiên chọn một DLP và sau đó đăng ký làm người xác minh thông qua hợp đồng thông minh của DLP đó. Khi đã đăng ký và được phê duyệt, người xác minh có thể vận hành các nút xác minh cụ thể cho DLP đó. Điều quan trọng cần lưu ý là người xác minh có thể vận hành các nút cho nhiều DLP cùng một lúc, nhưng mỗi DLP đều có yêu cầu tối thiểu đặt cược duy nhất của nó.
Đối với người dùng có nguồn tài nguyên dữ liệu độc đáo hoặc ý tưởng sáng tạo, việc tạo ra một DLP mới là một lựa chọn hấp dẫn. Việc thiết lập một DLP yêu cầu hiểu rõ về kiến trúc kỹ thuật của Vana, đặc biệt là cơ chế chứng minh đóng góp và cơ chế đồng thuận Nagoya.
Người sáng tạo của một DLP mới phải thiết kế các mục tiêu đóng góp dữ liệu cụ thể, phương pháp xác nhận và thông số thưởng. Ngoài ra, họ cần triển khai một chức năng chứng minh đóng góp mà đánh giá chính xác giá trị dữ liệu. Mặc dù quá trình này có thể phức tạp, Vana cung cấp các mẫu và tài liệu chi tiết để hỗ trợ người sáng tạo.
Đối với hầu hết người dùng, việc gửi dữ liệu đến các DLP hiện có để tham gia vào việc "đào dữ liệu" có thể là cách tiếp cận đơn giản nhất. Hiện tại, đã có 13 DLP được chính thức đề xuất, bao gồm một loạt các lĩnh vực từ dữ liệu truyền thông xã hội đến dữ liệu dự đoán tài chính.
·Finquarium: Tập hợp dữ liệu dự đoán tài chính.
·GPT Data DAO: Tập trung vào việc xuất dữ liệu trò chuyện ChatGPT.
· Reddit Data DAO: Tập trung vào dữ liệu người dùng Reddit và đã chính thức ra mắt.
·Volara: Chuyên về việc thu thập và sử dụng dữ liệu từ Twitter.
·Flirtual: Thu thập dữ liệu hẹn hò.
·ResumeDataDAO: Tập trung vào việc xuất dữ liệu LinkedIn.
·SixGPT: Thu thập và quản lý dữ liệu trò chuyện LLM.
·YKYR: Tập hợp dữ liệu Google Analytics.
· Sydintel: Crowdsources thông tin để tiết lộ những góc tối của internet.
·MindDAO: Thu thập dữ liệu chuỗi thời gian liên quan đến sức khỏe tinh thần của người dùng.
·Kleo: Xây dựng bộ dữ liệu lịch sử duyệt web toàn cầu phong phú nhất.
·DataPIG: Tập trung vào dữ liệu ưu tiên đầu tư token.
· ScrollDAO: Thu thập và sử dụng dữ liệu Instagram.
Một số DLP này vẫn đang được phát triển, trong khi một số khác đã trực tuyến, nhưng tất cả đều đang trong giai đoạn tiền khai thác. Người dùng chỉ có thể chính thức gửi dữ liệu để khai thác khi mạng chính được khởi chạy. Tuy nhiên, người dùng có thể đảm bảo đủ điều kiện tham gia theo nhiều cách khác nhau trước thời hạn. Ví dụ: họ có thể tham gia vào các hoạt động thử thách có liên quan trong Vana Ứng dụng Telegramhoặc đăng ký trước trên các trang web chính thức của từng DLP.
Sự xuất hiện của Vana đánh dấu một sự thay đổi mô hình trong nền kinh tế dữ liệu. Trong làn sóng AI hiện tại, dữ liệu đã trở thành "dầu" của kỷ nguyên mới và Vana tìm cách định hình lại các mô hình khai thác, tinh chế và phân phối tài nguyên này.
Về cơ bản, Vana đang xây dựng một giải pháp cho vấn đề “thảm kịch của tài nguyên chung” trong dữ liệu. Thông qua thiết kế động viên thông minh và đổi mới công nghệ, nó biến dữ liệu cá nhân – một nguồn cung có vẻ không giới hạn mà khó để kiếm tiền – thành tài sản kỹ thuật số có thể quản lý, có giá trị và có thể giao dịch. Điều này không chỉ mở ra những con đường mới cho người dùng thông thường tham gia chia sẻ lợi nhuận từ Trí tuệ nhân tạo mà còn cung cấp một bản thiết kế tiềm năng cho việc phát triển Trí tuệ nhân tạo phi tập trung.
Tuy nhiên, thành công của Vana phải đối mặt với vô số điều không chắc chắn. Về mặt kỹ thuật, nó phải tìm sự cân bằng giữa sự cởi mở và an ninh; Về mặt kinh tế, nó cần chứng minh rằng mô hình của nó có thể tạo ra giá trị bền vững; Và về mặt xã hội, nó phải giải quyết các thách thức về đạo đức dữ liệu và quy định tiềm ẩn.
Ở cấp độ sâu hơn, Vana đại diện cho sự phản ánh và thách thức đối với các độc quyền dữ liệu và mô hình phát triển AI hiện có. Nó đặt ra một câu hỏi quan trọng: Trong kỷ nguyên AI, chúng ta có chọn củng cố các đầu sỏ dữ liệu hiện tại hay chúng ta cố gắng xây dựng một hệ sinh thái dữ liệu cởi mở, công bằng và đa dạng hơn?
Cho dù Vana thành công cuối cùng hay không, sự xuất hiện của nó mang lại cho chúng ta một cửa sổ để suy nghĩ lại giá trị dữ liệu, đạo đức trí tuệ nhân tạo và đổi mới công nghệ. Trong tương lai, các dự án như Vana có thể trở thành những cây cầu quan trọng kết nối những lý tưởng Web3 với hiện thực trí tuệ nhân tạo, hướng dẫn giai đoạn tiếp theo của sự phát triển kinh tế kỹ thuật số.
Bài viết này được sao chép từ [FLOWgateBlockBeats], bản quyền thuộc về tác giả gốc [Tư duy kỳ lạ], nếu bạn có bất kỳ khiếu nại về việc sao chép lại, vui lòng liên hệ với chúng tôi.Cổng Họcđội, và đội sẽ xử lý nó càng sớm càng tốt theo các quy trình liên quan.
Miễn trừ: Quan điểm và ý kiến được thể hiện trong bài viết này chỉ đại diện cho quan điểm cá nhân của tác giả và không đại diện cho bất kỳ lời khuyên đầu tư nào.
Các phiên bản tiếng khác của bài viết được dịch bởi nhóm Gate Learn và không được đề cập trongGate.ioBài viết dịch có thể không được sao chép, phân phối hoặc đạo văn.
Bạn đã bao giờ tự hỏi tại sao các nền tảng truyền thông xã hội như Reddit và X (trước đây là Twitter) có thể sử dụng miễn phí không? Câu trả lời nằm trong những bài đăng bạn tạo ra, những lượt thích bạn cho, và thậm chí cả thời gian bạn dành để cuộn trang.
Trong quá khứ, những nền tảng này đã bán sự chú ý của bạn như một mặt hàng cho nhà quảng cáo. Bây giờ, họ đã tìm thấy một người mua lớn hơn - các công ty AI. Các báo cáo cho thấy một thỏa thuận cấp phép dữ liệu duy nhất giữa Reddit và Google có thể tạo ra 60 triệu đô la mỗi năm cho Reddit. Tuy nhiên, sự giàu có khổng lồ này không liên quan gì đến chúng ta như những người tạo ra dữ liệu.
Điều đáng lo ngại hơn nữa là AI được đào tạo trên dữ liệu của chúng ta cuối cùng có thể thay thế công việc của chúng ta. Mặc dù AI cũng có thể tạo ra các cơ hội việc làm mới, nhưng sự tập trung của cải do độc quyền dữ liệu này chắc chắn làm trầm trọng thêm sự bất bình đẳng xã hội. Có vẻ như chúng ta đang trượt vào một thế giới cyberpunk được kiểm soát bởi một số gã khổng lồ công nghệ.
Vậy, làm sao những người bình thường có thể bảo vệ quyền lợi của mình trong thời đại trí tuệ nhân tạo này? Sau khi trí tuệ nhân tạo trỗi dậy, nhiều người xem blockchain như là đường cuối cùng bảo vệ nhân loại khỏi nó. Dựa trên suy nghĩ này, một số nhà đổi mới đã bắt đầu khám phá các giải pháp. Họ đề xuất rằng trước tiên, chúng ta phải lấy lại sở hữu và kiểm soát dữ liệu của chúng ta; thứ hai, chúng ta nên sử dụng dữ liệu này để đào tạo mô hình trí tuệ nhân tạo theo cách cộng tác thực sự phục vụ cho người dân chung.
Ý tưởng này có vẻ duy tâm, nhưng lịch sử cho chúng ta thấy rằng mọi cuộc cách mạng công nghệ đều bắt đầu với một khái niệm "điên rồ". Ngày nay, một dự án chuỗi công cộng mới có tên "Vana" đang biến tầm nhìn này thành hiện thực. Là mạng thanh khoản dữ liệu phi tập trung đầu tiên, Vana nhằm mục đích chuyển đổi dữ liệu của bạn thành các mã thông báo lưu hành tự do, từ đó thúc đẩy trí tuệ nhân tạo phi tập trung thực sự do người dùng kiểm soát.
Thực tế, sự ra đời của Vana có thể được truy ngược về một lớp học tại MIT Media Lab, nơi hai cá nhân trẻ tuổi có tầm nhìn để thay đổi thế giới - Anna Kazlauskas và Art Abal - gặp nhau.
Trái: Anna Kazlauskas; Phải: Art Abal.
Anna Kazlauskas tốt nghiệp ngành khoa học máy tính và kinh tế tại MIT, và sở thích về dữ liệu và tiền điện tử của cô bắt đầu từ năm 2015. Lúc đó, cô tham gia khai thác Ethereum sớm, điều này giúp cô hiểu rõ về tiềm năng của công nghệ phi tập trung. Sau đó, Anna tiến hành nghiên cứu dữ liệu tại các tổ chức tài chính quốc tế như Ngân hàng Dự trữ Liên bang, Ngân hàng Trung ương châu Âu và Ngân hàng Thế giới, những trải nghiệm này đã giúp cô nhận ra rằng dữ liệu sẽ trở thành một hình thức tiền tệ mới trong tương lai.
Trong khi đó, Art Abal theo đuổi bằng thạc sĩ về chính sách công tại Đại học Harvard và tiến hành nghiên cứu chuyên sâu về đánh giá tác động dữ liệu tại Trung tâm Khoa học và Quan hệ Quốc tế Belfer. Trước khi gia nhập Vana, Art đã lãnh đạo các phương pháp thu thập dữ liệu sáng tạo tại Appen, một nhà cung cấp dữ liệu đào tạo AI, góp phần đáng kể vào sự xuất hiện của nhiều công cụ AI tạo ra ngày nay. Những hiểu biết của ông về đạo đức dữ liệu và trách nhiệm giải trình AI đã truyền cho Vana ý thức trách nhiệm xã hội mạnh mẽ.
Khi Anna và Art gặp nhau trong một lớp học tại Viện Media MIT, họ nhanh chóng nhận ra niềm đam mê chung của họ về dân chủ hóa dữ liệu và quyền dữ liệu người dùng. Họ nhận ra rằng để thật sự giải quyết các vấn đề về sở hữu dữ liệu và sự công bằng trong trí tuệ nhân tạo, cần có một mô hình mới - một mô hình cho phép người dùng kiểm soát thực sự dữ liệu của họ.
Tầm nhìn chung này đã thúc đẩy họ thành lập Vana. Mục tiêu của họ là tạo ra một nền tảng cách mạng không chỉ ủng hộ chủ quyền dữ liệu cho người dùng mà còn đảm bảo người dùng có thể thu được lợi ích kinh tế từ dữ liệu của họ. Qua cơ chế Hồ bơi Lưu lượng Dữ liệu (DLP) đổi mới và hệ thống Chứng minh Đóng góp, Vana cho phép người dùng đóng góp dữ liệu cá nhân một cách an toàn, chia sẻ quyền sở hữu và hưởng lợi từ các mô hình Trí tuệ nhân tạo được đào tạo từ dữ liệu đó, từ đó thúc đẩy sự phát triển Trí tuệ nhân tạo dựa trên người dùng.
Tầm nhìn của Vana nhanh chóng được công nhận trong ngành công nghiệp. Đến nay, Vana đã thông báo rằng họ đã hoàn thành tổng cộng 25 triệu đô la Mỹ trong quá trình huy động vốn, bao gồm một vòng gọi vốn chiến lược trị giá 5 triệu đô la Mỹ do Coinbase Ventures dẫn đầu, một vòng gọi vốn loạt A trị giá 18 triệu đô la Mỹ do Paradigm dẫn đầu, và một vòng gọi vốn hạt giống trị giá 2 triệu đô la Mỹ do Polychain dẫn đầu. Các nhà đầu tư đáng chú ý khác bao gồm Casey Caruso, Packy McCormick, Manifold, GSR và DeFiance Capital.
Trong thế giới này, nơi dữ liệu là dầu mới của thời đại, sự xuất hiện của Vana không thể phủ nhận mang lại cho chúng ta một cơ hội quan trọng để lấy lại chủ quyền dữ liệu. Vậy, dự án hứa hẹn này hoạt động như thế nào? Hãy cùng khám phá kiến trúc kỹ thuật và khái niệm đổi mới của Vana.
Kiến trúc kỹ thuật của Vana được thiết kế một cách cẩn thận, hướng đến việc dân chủ hóa dữ liệu và tối đa hóa giá trị của nó. Các thành phần cốt lõi bao gồm Hồ chứa thanh khoản dữ liệu (DLP), cơ chế Chứng minh Đóng góp, Sự đồng thuận Nagoya, tự lưu trữ dữ liệu của người dùng và một lớp ứng dụng phi tập trung. Cùng nhau, những yếu tố này tạo ra một nền tảng sáng tạo bảo vệ quyền riêng tư của người dùng trong khi mở khóa giá trị tiềm năng của dữ liệu.
Hồ bơi thanh khoản dữ liệu (DLP) phục vụ như là đơn vị cơ bản trong mạng lưới Vana và có thể được coi là “đào thanh khoản” nhưng cho dữ liệu. Mỗi DLP về cơ bản là một hợp đồng thông minh được thiết kế để tổng hợp các loại tài sản dữ liệu cụ thể. Ví dụ, Reddit Data DAO (r/datadao) là một trường hợp DLP thành công, thu hút hơn 140.000 người dùng Reddit và tổng hợp bài đăng Reddit, bình luận và lịch sử bỏ phiếu của người dùng.
Sau khi người dùng gửi dữ liệu của họ cho một DLP, họ có thể kiếm được các mã thông báo cụ thể liên quan đến DLP đó, chẳng hạn như RDAT cho Reddit Data DAO (r/datadao). Các mã thông báo này không chỉ đại diện cho đóng góp của người dùng vào hồ bơi dữ liệu mà còn cấp quyền quản trị và lợi ích chia sẻ lợi nhuận trong tương lai trong DLP. Đáng chú ý, Vana cho phép mỗi DLP phát hành riêng các mã thông báo của mình, cung cấp cơ chế giữ giá trị linh hoạt cho các loại tài sản dữ liệu khác nhau.
Trong hệ sinh thái của Vana, 16 DLP hàng đầu nhận phát sinh token VANA bổ sung, thúc đẩy thêm việc hình thành và cạnh tranh của các hồ bơi dữ liệu chất lượng cao. Cách tiếp cận này một cách thông minh biến dữ liệu cá nhân phân tán thành tài sản kỹ thuật số lỏng lẻo, đặt nền móng cho việc định giá dữ liệu và thanh khoản.
Proof of Contribution là cơ chế chính của Vana để đảm bảo chất lượng dữ liệu. Mỗi DLP có thể tùy chỉnh một chức năng Proof of Contribution duy nhất dựa trên nhu cầu cụ thể của nó. Chức năng này không chỉ xác minh tính xác thực và tính toàn vẹn của dữ liệu mà còn đánh giá đóng góp của nó vào việc cải thiện hiệu suất mô hình AI.
Ví dụ, Proof of Contribution của ChatGPT Data DAO xem xét bốn chiều quan trọng: tính xác thực, sở hữu, chất lượng, và tính độc nhất vô nhị. Tính xác thực được xác minh thông qua các liên kết xuất dữ liệu do OpenAI cung cấp; việc sở hữu được xác nhận qua xác minh email của người dùng; đánh giá chất lượng sử dụng điểm LLM trên các cuộc trò chuyện được chọn mẫu ngẫu nhiên; và tính độc nhất vô nhị được xác định bằng cách tính toán vector đặc trưng dữ liệu và so sánh chúng với dữ liệu hiện tại.
Đánh giá đa chiều này đảm bảo chỉ có dữ liệu chất lượng cao, có giá trị được chấp nhận và được thưởng. Chứng minh Đóng góp là nền tảng cho giá cả dữ liệu và là yếu tố cần thiết để duy trì chất lượng dữ liệu trong toàn bộ hệ sinh thái.
The Nagoya Consensus is the core of the Vana network, inspired by and enhancing Bittensor’s Yuma Consensus. This mechanism revolves around a collective evaluation of data quality by a set of validation nodes, arriving at a final score through weighted averaging.
Điểm khác biệt của nó là phương pháp "đánh giá hai lớp": không chỉ các nút xác thực đánh giá chất lượng dữ liệu, mà họ cũng đánh giá hành vi xếp hạng của các nút khác. Điều này thêm một lớp công bằng và chính xác, ngăn chặn hành vi kỷ luật. Ví dụ, nếu một nút xác thực gán điểm cao cho dữ liệu chất lượng thấp, các nút khác có thể phạt sự đánh giá sai lầm này bằng điểm sửa đổi.
Mỗi 1800 khối (khoảng 3 giờ) đánh dấu một chu kỳ, trong đó các nút được thưởng dựa trên điểm tích lũy của họ. Cơ chế này khuyến khích tính trung thực giữa các bên xác thực và nhanh chóng xác định và loại bỏ các hành vi sai trái, đảm bảo hoạt động lành mạnh của mạng.
Một trong những đổi mới quan trọng của Vana nằm ở cách tiếp cận quản lý dữ liệu độc đáo. Trong mạng Vana, dữ liệu gốc của người dùng không bao giờ thực sự là "on-chain". Thay vào đó, người dùng có thể chọn vị trí lưu trữ của họ, chẳng hạn như Google Drive, Dropbox hoặc thậm chí các máy chủ cá nhân chạy trên MacBook.
Khi người dùng gửi dữ liệu cho DLP, họ thực chất đang cung cấp một URL trỏ đến dữ liệu đã được mã hóa và một băm tính toàn vẹn nội dung tùy chọn. Thông tin này được ghi lại trong hợp đồng đăng ký dữ liệu của Vana. Các bộ xác thực có thể yêu cầu khóa giải mã để tải xuống và xác minh dữ liệu khi cần thiết.
Thiết kế này một cách thông minh giải quyết các vấn đề về quyền riêng tư và kiểm soát dữ liệu. Người dùng duy trì hoàn toàn quyền kiểm soát dữ liệu của họ trong khi vẫn tham gia vào nền kinh tế dữ liệu. Điều này không chỉ đảm bảo an ninh dữ liệu mà còn mở ra những khả năng cho các kịch bản ứng dụng dữ liệu rộng lớn hơn trong tương lai.
Lớp trên cùng của Vana là một hệ sinh thái ứng dụng mở. Ở đây, nhà phát triển có thể tận dụng tính thanh khoản dữ liệu đã tích lũy trong DLP để xây dựng các ứng dụng đổi mới khác nhau, trong khi các nhà đóng góp dữ liệu có thể thu được giá trị kinh tế rõ ràng từ những ứng dụng này.
Ví dụ, một nhóm phát triển có thể huấn luyện một mô hình AI chuyên dụng bằng cách sử dụng dữ liệu từ Reddit Data DAO. Người dùng đã đóng góp dữ liệu không chỉ có thể sử dụng mô hình sau khi nó được huấn luyện mà còn nhận được một phần lợi nhuận được tạo ra bởi mô hình theo đóng góp của họ. Trên thực tế, một mô hình AI như vậy đã được phát triển; chi tiết thêm có thể được tìm thấy trong bài viết “Hồi phục từ đáy: Tại sao Token cũ r/datadao trong AI Track đang trở lại? “
Mô hình này không chỉ khuyến khích đóng góp dữ liệu chất lượng cao mà còn tạo ra một hệ sinh thái phát triển trí tuệ nhân tạo thực sự dựa trên người dùng. Người dùng chuyển từ việc cung cấp dữ liệu đơn thuần sang việc là cộng sự chủ sở hữu và người hưởng lợi từ các sản phẩm trí tuệ nhân tạo.
Qua cách tiếp cận này, Vana đang tái tạo cảnh quan nền kinh tế dữ liệu. Trong mô hình mới này, người dùng chuyển từ việc cung cấp dữ liệu một cách passively sang việc tham gia tích cực và trở thành người hưởng lợi chung trong việc xây dựng hệ sinh thái. Điều này không chỉ tạo ra những cơ hội mới cho việc tạo ra giá trị cá nhân mà còn đưa vào ngành công nghiệp trí tuệ nhân tạo toàn bộ sự sống động và sáng tạo mới.
Kiến trúc kỹ thuật của Vana giải quyết các vấn đề cốt lõi trong nền kinh tế dữ liệu hiện tại, như sở hữu dữ liệu, bảo vệ quyền riêng tư và phân phối giá trị, đồng thời mở đường cho những đổi mới dựa trên dữ liệu trong tương lai. Khi có thêm các tổ chức tự trị dữ liệu tham gia mạng lưới và các ứng dụng bổ sung được xây dựng trên nền tảng, Vana có tiềm năng trở thành cơ sở hạ tầng cốt lõi cho thế hệ tiếp theo của trí tuệ nhân tạo phi tập trung và nền kinh tế dữ liệu.
Với việc ra mắt Satori testnet vào ngày 11 tháng 6, Vana đã trình diễn một nguyên mẫu của hệ sinh thái của mình cho công chúng. Điều này không chỉ là một nền tảng cho việc xác thực kỹ thuật mà còn là một bản xem trước về mô hình hoạt động cho mainnet trong tương lai. Hiện tại, hệ sinh thái Vana cung cấp ba con đường chính cho các thành viên tham gia: chạy các nút xác thực DLP, tạo DLP mới hoặc gửi dữ liệu cho DLP hiện có để tham gia vào “đào dữ liệu.”
Các nút xác nhận là những người bảo vệ của mạng Vana, có trách nhiệm xác minh chất lượng dữ liệu được gửi đến DLPs. Vận hành một nút xác nhận không chỉ đòi hỏi chuyên môn kỹ thuật mà còn đòi hỏi tài nguyên tính toán đủ. Theo tài liệu kỹ thuật của Vana, yêu cầu tối thiểu về phần cứng cho một nút xác nhận là một lõi CPU, 8GB RAM và 10GB bộ nhớ SSD tốc độ cao.
Người dùng quan tâm đến việc trở thành người xác minh phải trước tiên chọn một DLP và sau đó đăng ký làm người xác minh thông qua hợp đồng thông minh của DLP đó. Khi đã đăng ký và được phê duyệt, người xác minh có thể vận hành các nút xác minh cụ thể cho DLP đó. Điều quan trọng cần lưu ý là người xác minh có thể vận hành các nút cho nhiều DLP cùng một lúc, nhưng mỗi DLP đều có yêu cầu tối thiểu đặt cược duy nhất của nó.
Đối với người dùng có nguồn tài nguyên dữ liệu độc đáo hoặc ý tưởng sáng tạo, việc tạo ra một DLP mới là một lựa chọn hấp dẫn. Việc thiết lập một DLP yêu cầu hiểu rõ về kiến trúc kỹ thuật của Vana, đặc biệt là cơ chế chứng minh đóng góp và cơ chế đồng thuận Nagoya.
Người sáng tạo của một DLP mới phải thiết kế các mục tiêu đóng góp dữ liệu cụ thể, phương pháp xác nhận và thông số thưởng. Ngoài ra, họ cần triển khai một chức năng chứng minh đóng góp mà đánh giá chính xác giá trị dữ liệu. Mặc dù quá trình này có thể phức tạp, Vana cung cấp các mẫu và tài liệu chi tiết để hỗ trợ người sáng tạo.
Đối với hầu hết người dùng, việc gửi dữ liệu đến các DLP hiện có để tham gia vào việc "đào dữ liệu" có thể là cách tiếp cận đơn giản nhất. Hiện tại, đã có 13 DLP được chính thức đề xuất, bao gồm một loạt các lĩnh vực từ dữ liệu truyền thông xã hội đến dữ liệu dự đoán tài chính.
·Finquarium: Tập hợp dữ liệu dự đoán tài chính.
·GPT Data DAO: Tập trung vào việc xuất dữ liệu trò chuyện ChatGPT.
· Reddit Data DAO: Tập trung vào dữ liệu người dùng Reddit và đã chính thức ra mắt.
·Volara: Chuyên về việc thu thập và sử dụng dữ liệu từ Twitter.
·Flirtual: Thu thập dữ liệu hẹn hò.
·ResumeDataDAO: Tập trung vào việc xuất dữ liệu LinkedIn.
·SixGPT: Thu thập và quản lý dữ liệu trò chuyện LLM.
·YKYR: Tập hợp dữ liệu Google Analytics.
· Sydintel: Crowdsources thông tin để tiết lộ những góc tối của internet.
·MindDAO: Thu thập dữ liệu chuỗi thời gian liên quan đến sức khỏe tinh thần của người dùng.
·Kleo: Xây dựng bộ dữ liệu lịch sử duyệt web toàn cầu phong phú nhất.
·DataPIG: Tập trung vào dữ liệu ưu tiên đầu tư token.
· ScrollDAO: Thu thập và sử dụng dữ liệu Instagram.
Một số DLP này vẫn đang được phát triển, trong khi một số khác đã trực tuyến, nhưng tất cả đều đang trong giai đoạn tiền khai thác. Người dùng chỉ có thể chính thức gửi dữ liệu để khai thác khi mạng chính được khởi chạy. Tuy nhiên, người dùng có thể đảm bảo đủ điều kiện tham gia theo nhiều cách khác nhau trước thời hạn. Ví dụ: họ có thể tham gia vào các hoạt động thử thách có liên quan trong Vana Ứng dụng Telegramhoặc đăng ký trước trên các trang web chính thức của từng DLP.
Sự xuất hiện của Vana đánh dấu một sự thay đổi mô hình trong nền kinh tế dữ liệu. Trong làn sóng AI hiện tại, dữ liệu đã trở thành "dầu" của kỷ nguyên mới và Vana tìm cách định hình lại các mô hình khai thác, tinh chế và phân phối tài nguyên này.
Về cơ bản, Vana đang xây dựng một giải pháp cho vấn đề “thảm kịch của tài nguyên chung” trong dữ liệu. Thông qua thiết kế động viên thông minh và đổi mới công nghệ, nó biến dữ liệu cá nhân – một nguồn cung có vẻ không giới hạn mà khó để kiếm tiền – thành tài sản kỹ thuật số có thể quản lý, có giá trị và có thể giao dịch. Điều này không chỉ mở ra những con đường mới cho người dùng thông thường tham gia chia sẻ lợi nhuận từ Trí tuệ nhân tạo mà còn cung cấp một bản thiết kế tiềm năng cho việc phát triển Trí tuệ nhân tạo phi tập trung.
Tuy nhiên, thành công của Vana phải đối mặt với vô số điều không chắc chắn. Về mặt kỹ thuật, nó phải tìm sự cân bằng giữa sự cởi mở và an ninh; Về mặt kinh tế, nó cần chứng minh rằng mô hình của nó có thể tạo ra giá trị bền vững; Và về mặt xã hội, nó phải giải quyết các thách thức về đạo đức dữ liệu và quy định tiềm ẩn.
Ở cấp độ sâu hơn, Vana đại diện cho sự phản ánh và thách thức đối với các độc quyền dữ liệu và mô hình phát triển AI hiện có. Nó đặt ra một câu hỏi quan trọng: Trong kỷ nguyên AI, chúng ta có chọn củng cố các đầu sỏ dữ liệu hiện tại hay chúng ta cố gắng xây dựng một hệ sinh thái dữ liệu cởi mở, công bằng và đa dạng hơn?
Cho dù Vana thành công cuối cùng hay không, sự xuất hiện của nó mang lại cho chúng ta một cửa sổ để suy nghĩ lại giá trị dữ liệu, đạo đức trí tuệ nhân tạo và đổi mới công nghệ. Trong tương lai, các dự án như Vana có thể trở thành những cây cầu quan trọng kết nối những lý tưởng Web3 với hiện thực trí tuệ nhân tạo, hướng dẫn giai đoạn tiếp theo của sự phát triển kinh tế kỹ thuật số.
Bài viết này được sao chép từ [FLOWgateBlockBeats], bản quyền thuộc về tác giả gốc [Tư duy kỳ lạ], nếu bạn có bất kỳ khiếu nại về việc sao chép lại, vui lòng liên hệ với chúng tôi.Cổng Họcđội, và đội sẽ xử lý nó càng sớm càng tốt theo các quy trình liên quan.
Miễn trừ: Quan điểm và ý kiến được thể hiện trong bài viết này chỉ đại diện cho quan điểm cá nhân của tác giả và không đại diện cho bất kỳ lời khuyên đầu tư nào.
Các phiên bản tiếng khác của bài viết được dịch bởi nhóm Gate Learn và không được đề cập trongGate.ioBài viết dịch có thể không được sao chép, phân phối hoặc đạo văn.