Bài viết này khám phá sự phát triển của khả năng truy cập dữ liệu blockchain, so sánh các đặc điểm của ba giao thức dịch vụ dữ liệu - The Graph, Chainbase và Space and Time - về mặt kiến trúc và ứng dụng công nghệ AI. Nó chỉ ra rằng các dịch vụ dữ liệu blockchain đang tiến triển về mức độ thông minh và bảo mật tăng lên, và sẽ tiếp tục đóng vai trò quan trọng như cơ sở hạ tầng căn bản trong ngành trong tương lai.
Bắt đầu từ làn sóng đầu tiên của dApps vào năm 2017, bao gồm Etheroll, ETHLend và CryptoKitties, chúng ta hiện tại thấy một loạt các dApps tài chính, chơi game và xã hội đang phát triển dựa trên các blockchain khác nhau. Khi thảo luận về các ứng dụng phi tập trung trên chuỗi, liệu chúng ta đã từng xem xét nguồn gốc của các dữ liệu khác nhau mà các dApps này sử dụng trong tương tác của chúng?
Vào năm 2024, tập trung vào AI và Web3. Trong thế giới trí tuệ nhân tạo, dữ liệu giống như là mạch máu cho sự phát triển và tiến hóa của nó. Giống như cây cối phụ thuộc vào ánh nắng mặt trời và nước để phát triển, hệ thống AI phụ thuộc vào lượng lớn dữ liệu để liên tục 'học' và 'suy nghĩ'. Thiếu dữ liệu, ngay cả những thuật toán AI phức tạp nhất cũng chỉ là những lâu đài trong không trung, không thể phát huy thông minh và hiệu quả theo ý định của chúng.
Bài viết này phân tích sự tiến hóa của việc lập chỉ mục dữ liệu blockchain từ góc nhìn về khả năng truy cập dữ liệu, so sánh giao thức lập chỉ mục dữ liệu đã được xác định The Graph với các giao thức dịch vụ dữ liệu blockchain mới nổi Chainbase và Space and Time. Đặc biệt, nó khám phá các điểm tương đồng và khác biệt trong dịch vụ dữ liệu và kiến trúc sản phẩm giữa hai giao thức mới này tích hợp công nghệ AI.
2.1 Nguồn dữ liệu: Các nút Blockchain
Từ thời điểm chúng ta bắt đầu hiểu "blockchain là gì", chúng ta thường bắt gặp cụm từ: blockchain là một sổ cái phi tập trung. Các nút Blockchain là nền tảng của toàn bộ mạng blockchain, chịu trách nhiệm ghi lại, lưu trữ và phổ biến tất cả dữ liệu giao dịch trên chuỗi. Mỗi nút sở hữu một bản sao hoàn chỉnh của dữ liệu blockchain, đảm bảo sự phân cấp của mạng. Tuy nhiên, đối với người dùng thông thường, việc xây dựng và duy trì một nút blockchain không phải là một nhiệm vụ dễ dàng. Điều này không chỉ đòi hỏi kỹ năng kỹ thuật chuyên môn mà còn phải chịu chi phí phần cứng và băng thông cao. Ngoài ra, khả năng truy vấn của các nút thông thường bị hạn chế, gây khó khăn cho việc truy xuất dữ liệu ở định dạng mà nhà phát triển yêu cầu. Do đó, mặc dù về mặt lý thuyết bất kỳ ai cũng có thể chạy nút của riêng mình, nhưng trên thực tế, người dùng có xu hướng dựa vào các dịch vụ của bên thứ ba.
Để giải quyết vấn đề này, nhà cung cấp nút RPC (cuộc gọi thủ tục từ xa) đã xuất hiện. Các nhà cung cấp này xử lý chi phí và quản lý các nút và cung cấp dữ liệu thông qua các điểm cuối RPC, cho phép người dùng truy cập dữ liệu blockchain mà không cần xây dựng các nút của riêng họ. Các điểm cuối RPC công khai là miễn phí nhưng đi kèm với giới hạn tốc độ, điều này có thể tác động tiêu cực đến trải nghiệm người dùng của dApps. Các điểm cuối RPC riêng cung cấp hiệu suất tốt hơn bằng cách giảm tắc nghẽn, nhưng ngay cả việc truy xuất dữ liệu đơn giản cũng yêu cầu giao tiếp qua lại đáng kể. Điều này làm cho chúng yêu cầu nặng và không hiệu quả cho các truy vấn dữ liệu phức tạp. Hơn nữa, các điểm cuối RPC riêng thường phải đối mặt với những thách thức về khả năng mở rộng và thiếu khả năng tương thích trên các mạng khác nhau. Tuy nhiên, các giao diện API được tiêu chuẩn hóa được cung cấp bởi các nhà cung cấp nút làm giảm các rào cản cho người dùng truy cập dữ liệu trên chuỗi, đặt nền tảng cho các ứng dụng và phân tích dữ liệu tiếp theo.
2.2 Phân tích Dữ liệu: Từ Dữ liệu Gốc đến Dữ liệu Có thể Sử dụng
Dữ liệu thu thập từ các nút blockchain thường là dữ liệu nguyên thô đã được mã hóa và mã hóa. Trong khi dữ liệu này giữ nguyên tính toàn vẹn và bảo mật của blockchain, sự phức tạp của nó làm tăng độ khó trong việc phân tích dữ liệu. Đối với người dùng thông thường hoặc nhà phát triển, việc xử lý trực tiếp dữ liệu nguyên thô này đòi hỏi kiến thức kỹ thuật đáng kể và tài nguyên tính toán.
Trong ngữ cảnh này, quá trình phân tích dữ liệu trở nên đặc biệt quan trọng. Bằng cách phân tích dữ liệu nguyên thô phức tạp và biến đổi nó thành các định dạng dễ hiểu và có thể vận hành hơn, người dùng có thể hiểu một cách trực quan và sử dụng dữ liệu này. Sự thành công của quá trình phân tích dữ liệu trực tiếp ảnh hưởng đến hiệu suất và hiệu quả của các ứng dụng dữ liệu blockchain, khiến nó trở thành một bước quan trọng trong quá trình chỉ mục hóa dữ liệu toàn bộ.
2.3 Tiến hóa của các chỉ mục dữ liệu
Khi khối lượng dữ liệu blockchain tăng lên, nhu cầu về các nhà lập chỉ mục dữ liệu cũng tăng lên. Bộ lập chỉ mục đóng một vai trò quan trọng trong việc tổ chức dữ liệu trên chuỗi và gửi nó đến cơ sở dữ liệu để dễ dàng truy vấn. Nguyên tắc hoạt động của trình lập chỉ mục là lập chỉ mục dữ liệu blockchain và làm cho nó có sẵn thông qua ngôn ngữ truy vấn giống SQL (chẳng hạn như API GraphQL). Bằng cách cung cấp một giao diện thống nhất để truy vấn dữ liệu, các nhà lập chỉ mục cho phép các nhà phát triển truy xuất nhanh chóng và chính xác thông tin họ cần bằng cách sử dụng các ngôn ngữ truy vấn được tiêu chuẩn hóa, đơn giản hóa đáng kể quy trình.
Các loại indexers khác nhau tối ưu hóa việc truy xuất dữ liệu theo cách khác nhau:
· Các chỉ số Node hoàn chỉnh: Những chỉ số này chạy các nút blockchain đầy đủ và trực tiếp trích xuất dữ liệu từ chúng, đảm bảo tính hoàn chỉnh và chính xác của dữ liệu nhưng đòi hỏi lưu trữ và xử lý mạnh mẽ.
· Chỉ mục nhẹ: Những chỉ mục này dựa vào các nút đầy đủ để truy xuất dữ liệu cụ thể khi cần thiết, giảm yêu cầu lưu trữ nhưng có thể làm tăng thời gian truy vấn.
· Chuyên gia chỉ số chuyên ngành: Những chuyên gia chỉ số này tập trung vào các loại dữ liệu cụ thể hoặc các chuỗi khối cụ thể, tối ưu hóa việc truy xuất cho các trường hợp sử dụng cụ thể, như dữ liệu NFT hoặc giao dịch DeFi.
· AggreGated Indexers: Những indexers này trích xuất dữ liệu từ nhiều chuỗi khối và nguồn thông tin khác nhau, bao gồm thông tin off-chain, cung cấp giao diện truy vấn thống nhất, đặc biệt hữu ích cho multi-chain dApps.
Hiện tại, một nút lưu trữ Ethereum trong máy khách Geth ở chế độ lưu trữ chiếm khoảng 13,5 TB dung lượng lưu trữ, trong khi theo ứng dụng khách Erigon, yêu cầu lưu trữ là khoảng 3 TB. Khi blockchain tiếp tục phát triển, các yêu cầu lưu trữ dữ liệu cho các nút lưu trữ cũng sẽ tăng lên. Trước lượng dữ liệu khổng lồ như vậy, các giao thức lập chỉ mục chính thống không chỉ hỗ trợ lập chỉ mục đa chuỗi mà còn tùy chỉnh các khung phân tích dữ liệu phù hợp với các nhu cầu dữ liệu ứng dụng khác nhau. Ví dụ, framework "subgraph" của The Graph là một ví dụ điển hình.
Sự xuất hiện của các chỉ mục gia tăng đáng kể hiệu suất của việc chỉ mục và truy vấn dữ liệu. So với các điểm cuối RPC truyền thống, các chỉ mục gia tăng có thể chỉ mục dữ liệu lớn một cách hiệu quả và hỗ trợ truy vấn tốc độ cao. Các chỉ mục này cho phép người dùng thực hiện các truy vấn phức tạp, dễ dàng lọc dữ liệu và phân tích nó sau khi rút trích. Ngoài ra, một số chỉ mục hỗ trợ tổng hợp nguồn dữ liệu từ nhiều chuỗi khối, tránh việc triển khai nhiều API trong các ứng dụng phi tập trung đa chuỗi. Bằng cách chạy phân phối trên nhiều nút, các chỉ mục cung cấp bảo mật và hiệu suất mạnh hơn trong khi giảm rủi ro gián đoạn và thời gian không hoạt động liên quan đến các nhà cung cấp RPC tập trung.
Ngược lại, các chỉ mục cho phép người dùng thu được thông tin mà họ cần trực tiếp bằng cách sử dụng ngôn ngữ truy vấn được xác định trước mà không cần phải đối mặt với dữ liệu phức tạp ở bên dưới. Cơ chế này cải thiện đáng kể hiệu quả và đáng tin cậy của việc truy xuất dữ liệu, đại diện cho một đổi mới quan trọng trong việc truy cập dữ liệu blockchain.
2.4 Cơ sở dữ liệu Full-Chain: Điều chỉnh hướng đến Streaming First
Sử dụng các nút được lập chỉ mục để truy vấn dữ liệu thường có nghĩa là API trở thành Cổng duy nhất để tiêu hóa dữ liệu trên chuỗi. Tuy nhiên, khi một dự án bước vào giai đoạn mở rộng quy mô, nó thường yêu cầu các nguồn dữ liệu linh hoạt hơn, điều mà các API được tiêu chuẩn hóa không thể cung cấp. Khi nhu cầu ứng dụng trở nên phức tạp hơn, các trình lập chỉ mục dữ liệu chính với các định dạng lập chỉ mục được tiêu chuẩn hóa dần dần phải vật lộn để đáp ứng nhu cầu truy vấn ngày càng đa dạng, chẳng hạn như tìm kiếm, truy cập chuỗi chéo hoặc ánh xạ dữ liệu ngoài chuỗi.
Trong kiến trúc đường ống dữ liệu hiện đại, việc tiếp cận “luồng trước” đã trở thành một giải pháp cho các hạn chế của xử lý hàng loạt truyền thống, cho phép tiếp nhận, xử lý và phân tích dữ liệu theo thời gian thực. Sự thay đổi mô hình này cho phép tổ chức phản ứng ngay lập tức với dữ liệu đầu vào, đem lại cái nhìn và quyết định gần như tức thì. Tương tự, việc phát triển các nhà cung cấp dịch vụ dữ liệu chuỗi khối đang tiến triển hướng việc xây dựng luồng dữ liệu chuỗi khối. Các nhà cung cấp dịch vụ chỉ mục truyền thống đã liên tiếp tung ra các sản phẩm nhận dữ liệu chuỗi khối theo thời gian thực thông qua luồng dữ liệu, như Substreams của The Graph và Mirror của Goldsky, cũng như hồ dữ liệu thời gian thực như Chainbase và SubSquid tạo ra luồng dữ liệu dựa trên chuỗi khối.
Các dịch vụ này nhằm đáp ứng nhu cầu phân tích giao dịch blockchain theo thời gian thực và cung cấp khả năng truy vấn toàn diện hơn. Giống như kiến trúc “trước luồng” cách mạng hóa việc xử lý dữ liệu và tiêu thụ trong đường ống dữ liệu truyền thống bằng cách giảm độ trễ và tăng cường khả năng phản hồi, các nhà cung cấp dữ liệu luồng blockchain cũng tìm kiếm hỗ trợ phát triển các ứng dụng hơn và hỗ trợ phân tích dữ liệu trên chuỗi thông qua các nguồn dữ liệu tiên tiến và chín chắn hơn.
Bằng cách định nghĩa lại những thách thức của dữ liệu on-chain từ quan điểm của các ống dẫn dữ liệu hiện đại, chúng ta có thể nhìn nhận việc quản lý, lưu trữ và cung cấp dữ liệu on-chain từ một góc nhìn mới, thực hiện tiềm năng đầy đủ của nó. Khi chúng ta bắt đầu nhìn vào các subgraph và các dịch vụ chỉ mục Ethereum ETL như là các luồng dữ liệu trong ống dẫn dữ liệu thay vì các kết quả cuối cùng, chúng ta có thể tưởng tượng một thế giới có thể nơi các bộ dữ liệu hiệu suất cao được tùy chỉnh cho bất kỳ trường hợp sử dụng kinh doanh nào.
3.1 Đồ thị
Mạng lưới The Graph đạt được việc lập chỉ mục dữ liệu và các dịch vụ truy vấn đa chuỗi thông qua mạng phân cấp các nút, cho phép các nhà phát triển thuận tiện lập chỉ mục dữ liệu blockchain và xây dựng ứng dụng phi tập trung. Các mô hình sản phẩm chính bao gồm thị trường thực hiện truy vấn dữ liệu và thị trường bộ nhớ cache chỉ mục dữ liệu, cả hai đều phục vụ nhu cầu truy vấn sản phẩm của người dùng. Thị trường thực hiện truy vấn dữ liệu cụ thể đề cập đến người tiêu dùng trả tiền cho các nút chỉ mục thích hợp cho dữ liệu mà họ yêu cầu, trong khi thị trường bộ nhớ cache chỉ mục dữ liệu liên quan đến việc phân bổ tài nguyên cho các nút chỉ mục dựa trên các yếu tố như mức độ phổ biến của việc lập chỉ mục lịch sử của các đồ thị phụ, các khoản phí truy vấn được thu thuế và nhu cầu từ các quản trị viên trên chuỗi cho đầu ra của đồ thị phụ.
Đồ thị con là các cấu trúc dữ liệu cơ bản trong mạng Đồ thị. Họ xác định cách trích xuất và chuyển đổi dữ liệu từ blockchain thành định dạng có thể truy vấn (ví dụ: lược đồ GraphQL). Bất kỳ ai cũng có thể tạo một biểu đồ con và nhiều ứng dụng có thể sử dụng lại các biểu đồ con này, nâng cao khả năng tái sử dụng dữ liệu và hiệu quả hoạt động.
Mạng The Graph bao gồm bốn vai trò chính: Indexers, Delegators, Curators và Developers, tất cả đều cùng nhau làm việc để cung cấp hỗ trợ dữ liệu cho ứng dụng Web3. Trách nhiệm của họ lần lượt như sau:
· Các bộ chỉ mục: Các bộ chỉ mục là các nhà điều hành nút trong mạng The Graph tham gia bằng cách đặt cược GRT (token gốc của The Graph). Họ cung cấp dịch vụ chỉ mục và xử lý truy vấn.
· Delegators: Delegators là người dùng đặt cược token GRT để hỗ trợ hoạt động của các nút chỉ số. Họ kiếm được một phần thưởng dựa trên các nút chỉ số mà họ đại diện.
· Người phục vụ: Người phục vụ chịu trách nhiệm đánh dấu xem subgraph nào nên được lập chỉ mục bởi mạng. Họ giúp đảm bảo rằng subgraphs có giá trị được ưu tiên xử lý.
· Nhà phát triển: Khác với ba vai trò trước đó, Nhà phát triển là phía đòi hỏi và là người dùng chính của The Graph. Họ tạo và gửi các đồ thị con (subgraphs) lên mạng The Graph, đợi mạng đáp ứng nhu cầu dữ liệu của họ.
3.1 The Graph
The Graph hiện đã chuyển hoàn toàn sang dịch vụ lưu trữ đồ thị phụ tập trung, với động lực kinh tế chảy qua các bên tham gia khác nhau để đảm bảo hoạt động của hệ thống:
· Phần thưởng cho Indexer: Indexer kiếm thu nhập thông qua phí truy vấn của người tiêu dùng và một phần phần thưởng khối GRT token.
· Phần Thưởng Người Uỷ Thác: Người uỷ thác nhận một phần thưởng từ những người còn lại mà họ hỗ trợ.
· Phần thưởng người quản lý: Nếu người quản lý tín hiệu các subgraph có giá trị, họ có thể kiếm được một phần phí truy vấn.
Thực tế, các sản phẩm của The Graph đang phát triển nhanh chóng trong làn sóng trí tuệ nhân tạo. Là một trong những nhóm phát triển cốt lõi trong hệ sinh thái The Graph, Semiotic Labs đã tập trung sử dụng công nghệ trí tuệ nhân tạo để tối ưu hóa giá chỉ mục và trải nghiệm truy vấn người dùng. Hiện tại, các công cụ được phát triển bởi Semiotic Labs, như AutoAgora, Allocation Optimizer và AgentC, cải thiện nhiều khía cạnh khác nhau của hiệu suất hệ sinh thái.
· AutoAgora giới thiệu một cơ chế định giá động điều chỉnh giá cả theo thời gian thực dựa trên lượng truy vấn và sử dụng tài nguyên, tối ưu hóa chiến lược định giá để đảm bảo tính cạnh tranh của chỉ số và tối đa hóa doanh thu.
· Allocation Optimizer giải quyết các vấn đề phức tạp về phân bổ tài nguyên đồ thị con, giúp người lập chỉ mục đạt được cấu hình tài nguyên tối ưu để nâng cao doanh thu và hiệu suất.
· AgentC là một công cụ thử nghiệm cho phép người dùng truy cập dữ liệu blockchain của The Graph bằng ngôn ngữ tự nhiên, từ đó cải thiện trải nghiệm người dùng.
Việc áp dụng những công cụ này đã cho phép The Graph nâng cao sự thông minh hệ thống và tính thân thiện với người dùng thông qua sự hỗ trợ của trí tuệ nhân tạo (AI).
3.2 Chainbase
Chainbase là một mạng dữ liệu toàn diện tích hợp tất cả dữ liệu blockchain vào một nền tảng duy nhất, giúp các nhà phát triển xây dựng và duy trì ứng dụng dễ dàng hơn. Các tính năng độc đáo của nó bao gồm:
· Hồ Sơ Dữ Liệu Thời Gian Thực: Chainbase cung cấp một hồ sơ dữ liệu thời gian thực dành riêng cho luồng dữ liệu blockchain, cho phép truy cập ngay lập tức đến dữ liệu khi nó được tạo ra.
· Kiến trúc Dual-chain: Chainbase được xây dựng trên Eigenlayer AVS, tạo ra một lớp thực thi chạy song song với thuật toán đồng thuận CometBFT. Thiết kế này nâng cao khả năng lập trình và kết hợp dữ liệu giữa các chuỗi, hỗ trợ khả năng xử lý cao, độ trễ thấp và khả năng hoàn tất, đồng thời cải thiện bảo mật mạng thông qua mô hình đặt cược đôi.
· Chuẩn định dạng dữ liệu đổi mới: Chainbase giới thiệu một chuẩn định dạng dữ liệu mới gọi là “bản thảo,” tối ưu hóa cấu trúc và sử dụng dữ liệu trong ngành công nghiệp tiền điện tử.
· Mô hình Cryptoworld: Với tài nguyên dữ liệu blockchain mở rộng, Chainbase kết hợp công nghệ mô hình AI để tạo ra các mô hình AI hiệu quả trong việc hiểu, dự đoán và tương tác với giao dịch blockchain. Mô hình cơ bản, Theia, hiện đã có sẵn để sử dụng công khai.
Các tính năng này khiến Chainbase trở nên khác biệt trong các giao thức lập chỉ mục blockchain, tập trung vào khả năng truy cập dữ liệu theo thời gian thực, định dạng dữ liệu sáng tạo và tạo ra các mô hình thông minh hơn thông qua việc tích hợp dữ liệu trên chuỗi và ngoài chuỗi để nâng cao thông tin chi tiết.
Mô hình trí tuệ nhân tạo Theia của Chainbase là một điểm nổi bật quan trọng phân biệt nó so với các giao thức dịch vụ dữ liệu khác. Dựa trên mô hình DORA của NVIDIA, Theia học và phân tích các mẫu mã tiền điện tử bằng cách tích hợp dữ liệu trên chuỗi và ngoài chuỗi cùng với các hoạt động không gian thời gian. Thông qua lý thuyết nguyên nhân, nó phản ứng để tăng cường khám phá giá trị tiềm năng và mẫu mã của dữ liệu trên chuỗi, cung cấp cho người dùng các dịch vụ dữ liệu thông minh hơn.
Các dịch vụ dữ liệu được kích hoạt bởi trí tuệ nhân tạo đã biến Chainbase từ một nền tảng dịch vụ dữ liệu blockchain thành một nhà cung cấp dịch vụ dữ liệu thông minh cạnh tranh hơn. Với tài nguyên dữ liệu mạnh mẽ và phân tích trí tuệ nhân tạo chủ động, Chainbase có thể cung cấp những cái nhìn dữ liệu rộng hơn và tối ưu hóa quy trình xử lý dữ liệu của người dùng.
3.3 Không gian và Thời gian
Space and Time (SxT) nhằm tạo ra một lớp tính toán có thể xác minh mở rộng các chứng minh không biết về một kho dữ liệu phi tập trung, cung cấp xử lý dữ liệu đáng tin cậy cho hợp đồng thông minh, các mô hình ngôn ngữ lớn và doanh nghiệp. Space and Time vừa mới đảm bảo được 20 triệu đô la trong vòng gọi vốn Series A mới nhất của mình, do Framework Ventures, Lightspeed Faction, Arrington Capital và Hivemind Capital dẫn đầu.
Trong lĩnh vực lập chỉ mục và xác minh dữ liệu, Space and Time giới thiệu một cách tiếp cận kỹ thuật mới — Proof of SQL. Đây là một công nghệ bằng chứng không có kiến thức (ZKP) sáng tạo được phát triển bởi Space and Time nhằm đảm bảo các truy vấn SQL được thực hiện trên kho dữ liệu phi tập trung có khả năng chống giả mạo và có thể kiểm chứng được. Khi một truy vấn được chạy, Proof of SQL tạo ra một bằng chứng mật mã xác minh tính toàn vẹn và chính xác của kết quả truy vấn. Bằng chứng này được gắn vào kết quả truy vấn, cho phép bất kỳ trình xác minh nào (chẳng hạn như hợp đồng thông minh) xác nhận độc lập rằng dữ liệu không bị giả mạo trong quá trình xử lý. Các mạng blockchain truyền thống thường dựa vào các cơ chế đồng thuận để xác minh tính xác thực của dữ liệu, trong khi Proof of SQL của Space and Time thực hiện một phương pháp xác minh dữ liệu hiệu quả hơn. Cụ thể, trong hệ thống của Space and Time, một nút chịu trách nhiệm thu thập dữ liệu trong khi các nút khác sử dụng công nghệ zk để xác minh tính xác thực của dữ liệu đó. Cách tiếp cận này làm giảm mức tiêu thụ tài nguyên từ nhiều nút lập chỉ mục dư thừa cùng một dữ liệu để đạt được sự đồng thuận, do đó nâng cao hiệu suất tổng thể của hệ thống. Khi công nghệ này trưởng thành, nó đóng vai trò là nền tảng cho các ngành công nghiệp truyền thống tập trung vào độ tin cậy của dữ liệu để xây dựng các sản phẩm dựa trên dữ liệu blockchain.
Đồng thời, SxT đã chặt chẽ hợp tác với phòng thí nghiệm đổi mới chung của trí tuệ nhân tạo của Microsoft để tăng tốc việc phát triển các công cụ trí tuệ nhân tạo sinh ra, cho phép người dùng dễ dàng xử lý dữ liệu blockchain thông qua ngôn ngữ tự nhiên. Hiện tại, trong Studio Không Gian và Thời Gian, người dùng có thể nhập các truy vấn bằng ngôn ngữ tự nhiên, và trí tuệ nhân tạo sẽ tự động chuyển chúng thành SQL và thực hiện truy vấn thay mặt người dùng để hiển thị kết quả cuối cùng cần thiết.
3.4 So sánh sự khác biệt
Tóm lại, công nghệ chỉ mục dữ liệu blockchain đã phát triển từ các nguồn dữ liệu nút ban đầu, thông qua việc phát triển các công cụ phân tích dữ liệu và chỉ mục, đến dịch vụ dữ liệu toàn bộ chuỗi được hỗ trợ bởi trí tuệ nhân tạo, đánh dấu quá trình cải thiện liên tục. Sự tiến hóa không ngừng này không chỉ nâng cao hiệu quả và độ chính xác của việc truy cập dữ liệu mà còn cung cấp cho người dùng một trải nghiệm thông minh chưa từng có.
Về phía trước, với sự phát triển liên tục của các công nghệ mới như AI và chứng minh không có kiến thức, các dịch vụ dữ liệu blockchain sẽ trở nên thông minh và an toàn hơn. Chúng ta có lý do để tin rằng các dịch vụ dữ liệu blockchain sẽ tiếp tục đóng vai trò quan trọng như cơ sở hạ tầng, cung cấp sự hỗ trợ mạnh mẽ cho tiến bộ và sáng tạo trong ngành công nghiệp.
Bài viết này được sao chép từ [Trustless Labs], bản quyền thuộc về tác giả gốc [Trustless Labs], nếu bạn có bất kỳ ý kiến nào về việc sao chép, vui lòng liên hệ với Cổng học và đội sẽ xử lý trong thời gian sớm nhất theo các thủ tục liên quan.
Disclaimer: Quan điểm và ý kiến được thể hiện trong bài viết này chỉ đại diện cho quan điểm cá nhân của tác giả và không hình thành bất kỳ lời khuyên đầu tư nào.
Các phiên bản ngôn ngữ khác của bài viết được dịch bởi nhóm Gate Learn và không được đề cập trong Gate.io, bài viết dịch có thể không được sao chép, phân phối hoặc đạo văn.
Bài viết này khám phá sự phát triển của khả năng truy cập dữ liệu blockchain, so sánh các đặc điểm của ba giao thức dịch vụ dữ liệu - The Graph, Chainbase và Space and Time - về mặt kiến trúc và ứng dụng công nghệ AI. Nó chỉ ra rằng các dịch vụ dữ liệu blockchain đang tiến triển về mức độ thông minh và bảo mật tăng lên, và sẽ tiếp tục đóng vai trò quan trọng như cơ sở hạ tầng căn bản trong ngành trong tương lai.
Bắt đầu từ làn sóng đầu tiên của dApps vào năm 2017, bao gồm Etheroll, ETHLend và CryptoKitties, chúng ta hiện tại thấy một loạt các dApps tài chính, chơi game và xã hội đang phát triển dựa trên các blockchain khác nhau. Khi thảo luận về các ứng dụng phi tập trung trên chuỗi, liệu chúng ta đã từng xem xét nguồn gốc của các dữ liệu khác nhau mà các dApps này sử dụng trong tương tác của chúng?
Vào năm 2024, tập trung vào AI và Web3. Trong thế giới trí tuệ nhân tạo, dữ liệu giống như là mạch máu cho sự phát triển và tiến hóa của nó. Giống như cây cối phụ thuộc vào ánh nắng mặt trời và nước để phát triển, hệ thống AI phụ thuộc vào lượng lớn dữ liệu để liên tục 'học' và 'suy nghĩ'. Thiếu dữ liệu, ngay cả những thuật toán AI phức tạp nhất cũng chỉ là những lâu đài trong không trung, không thể phát huy thông minh và hiệu quả theo ý định của chúng.
Bài viết này phân tích sự tiến hóa của việc lập chỉ mục dữ liệu blockchain từ góc nhìn về khả năng truy cập dữ liệu, so sánh giao thức lập chỉ mục dữ liệu đã được xác định The Graph với các giao thức dịch vụ dữ liệu blockchain mới nổi Chainbase và Space and Time. Đặc biệt, nó khám phá các điểm tương đồng và khác biệt trong dịch vụ dữ liệu và kiến trúc sản phẩm giữa hai giao thức mới này tích hợp công nghệ AI.
2.1 Nguồn dữ liệu: Các nút Blockchain
Từ thời điểm chúng ta bắt đầu hiểu "blockchain là gì", chúng ta thường bắt gặp cụm từ: blockchain là một sổ cái phi tập trung. Các nút Blockchain là nền tảng của toàn bộ mạng blockchain, chịu trách nhiệm ghi lại, lưu trữ và phổ biến tất cả dữ liệu giao dịch trên chuỗi. Mỗi nút sở hữu một bản sao hoàn chỉnh của dữ liệu blockchain, đảm bảo sự phân cấp của mạng. Tuy nhiên, đối với người dùng thông thường, việc xây dựng và duy trì một nút blockchain không phải là một nhiệm vụ dễ dàng. Điều này không chỉ đòi hỏi kỹ năng kỹ thuật chuyên môn mà còn phải chịu chi phí phần cứng và băng thông cao. Ngoài ra, khả năng truy vấn của các nút thông thường bị hạn chế, gây khó khăn cho việc truy xuất dữ liệu ở định dạng mà nhà phát triển yêu cầu. Do đó, mặc dù về mặt lý thuyết bất kỳ ai cũng có thể chạy nút của riêng mình, nhưng trên thực tế, người dùng có xu hướng dựa vào các dịch vụ của bên thứ ba.
Để giải quyết vấn đề này, nhà cung cấp nút RPC (cuộc gọi thủ tục từ xa) đã xuất hiện. Các nhà cung cấp này xử lý chi phí và quản lý các nút và cung cấp dữ liệu thông qua các điểm cuối RPC, cho phép người dùng truy cập dữ liệu blockchain mà không cần xây dựng các nút của riêng họ. Các điểm cuối RPC công khai là miễn phí nhưng đi kèm với giới hạn tốc độ, điều này có thể tác động tiêu cực đến trải nghiệm người dùng của dApps. Các điểm cuối RPC riêng cung cấp hiệu suất tốt hơn bằng cách giảm tắc nghẽn, nhưng ngay cả việc truy xuất dữ liệu đơn giản cũng yêu cầu giao tiếp qua lại đáng kể. Điều này làm cho chúng yêu cầu nặng và không hiệu quả cho các truy vấn dữ liệu phức tạp. Hơn nữa, các điểm cuối RPC riêng thường phải đối mặt với những thách thức về khả năng mở rộng và thiếu khả năng tương thích trên các mạng khác nhau. Tuy nhiên, các giao diện API được tiêu chuẩn hóa được cung cấp bởi các nhà cung cấp nút làm giảm các rào cản cho người dùng truy cập dữ liệu trên chuỗi, đặt nền tảng cho các ứng dụng và phân tích dữ liệu tiếp theo.
2.2 Phân tích Dữ liệu: Từ Dữ liệu Gốc đến Dữ liệu Có thể Sử dụng
Dữ liệu thu thập từ các nút blockchain thường là dữ liệu nguyên thô đã được mã hóa và mã hóa. Trong khi dữ liệu này giữ nguyên tính toàn vẹn và bảo mật của blockchain, sự phức tạp của nó làm tăng độ khó trong việc phân tích dữ liệu. Đối với người dùng thông thường hoặc nhà phát triển, việc xử lý trực tiếp dữ liệu nguyên thô này đòi hỏi kiến thức kỹ thuật đáng kể và tài nguyên tính toán.
Trong ngữ cảnh này, quá trình phân tích dữ liệu trở nên đặc biệt quan trọng. Bằng cách phân tích dữ liệu nguyên thô phức tạp và biến đổi nó thành các định dạng dễ hiểu và có thể vận hành hơn, người dùng có thể hiểu một cách trực quan và sử dụng dữ liệu này. Sự thành công của quá trình phân tích dữ liệu trực tiếp ảnh hưởng đến hiệu suất và hiệu quả của các ứng dụng dữ liệu blockchain, khiến nó trở thành một bước quan trọng trong quá trình chỉ mục hóa dữ liệu toàn bộ.
2.3 Tiến hóa của các chỉ mục dữ liệu
Khi khối lượng dữ liệu blockchain tăng lên, nhu cầu về các nhà lập chỉ mục dữ liệu cũng tăng lên. Bộ lập chỉ mục đóng một vai trò quan trọng trong việc tổ chức dữ liệu trên chuỗi và gửi nó đến cơ sở dữ liệu để dễ dàng truy vấn. Nguyên tắc hoạt động của trình lập chỉ mục là lập chỉ mục dữ liệu blockchain và làm cho nó có sẵn thông qua ngôn ngữ truy vấn giống SQL (chẳng hạn như API GraphQL). Bằng cách cung cấp một giao diện thống nhất để truy vấn dữ liệu, các nhà lập chỉ mục cho phép các nhà phát triển truy xuất nhanh chóng và chính xác thông tin họ cần bằng cách sử dụng các ngôn ngữ truy vấn được tiêu chuẩn hóa, đơn giản hóa đáng kể quy trình.
Các loại indexers khác nhau tối ưu hóa việc truy xuất dữ liệu theo cách khác nhau:
· Các chỉ số Node hoàn chỉnh: Những chỉ số này chạy các nút blockchain đầy đủ và trực tiếp trích xuất dữ liệu từ chúng, đảm bảo tính hoàn chỉnh và chính xác của dữ liệu nhưng đòi hỏi lưu trữ và xử lý mạnh mẽ.
· Chỉ mục nhẹ: Những chỉ mục này dựa vào các nút đầy đủ để truy xuất dữ liệu cụ thể khi cần thiết, giảm yêu cầu lưu trữ nhưng có thể làm tăng thời gian truy vấn.
· Chuyên gia chỉ số chuyên ngành: Những chuyên gia chỉ số này tập trung vào các loại dữ liệu cụ thể hoặc các chuỗi khối cụ thể, tối ưu hóa việc truy xuất cho các trường hợp sử dụng cụ thể, như dữ liệu NFT hoặc giao dịch DeFi.
· AggreGated Indexers: Những indexers này trích xuất dữ liệu từ nhiều chuỗi khối và nguồn thông tin khác nhau, bao gồm thông tin off-chain, cung cấp giao diện truy vấn thống nhất, đặc biệt hữu ích cho multi-chain dApps.
Hiện tại, một nút lưu trữ Ethereum trong máy khách Geth ở chế độ lưu trữ chiếm khoảng 13,5 TB dung lượng lưu trữ, trong khi theo ứng dụng khách Erigon, yêu cầu lưu trữ là khoảng 3 TB. Khi blockchain tiếp tục phát triển, các yêu cầu lưu trữ dữ liệu cho các nút lưu trữ cũng sẽ tăng lên. Trước lượng dữ liệu khổng lồ như vậy, các giao thức lập chỉ mục chính thống không chỉ hỗ trợ lập chỉ mục đa chuỗi mà còn tùy chỉnh các khung phân tích dữ liệu phù hợp với các nhu cầu dữ liệu ứng dụng khác nhau. Ví dụ, framework "subgraph" của The Graph là một ví dụ điển hình.
Sự xuất hiện của các chỉ mục gia tăng đáng kể hiệu suất của việc chỉ mục và truy vấn dữ liệu. So với các điểm cuối RPC truyền thống, các chỉ mục gia tăng có thể chỉ mục dữ liệu lớn một cách hiệu quả và hỗ trợ truy vấn tốc độ cao. Các chỉ mục này cho phép người dùng thực hiện các truy vấn phức tạp, dễ dàng lọc dữ liệu và phân tích nó sau khi rút trích. Ngoài ra, một số chỉ mục hỗ trợ tổng hợp nguồn dữ liệu từ nhiều chuỗi khối, tránh việc triển khai nhiều API trong các ứng dụng phi tập trung đa chuỗi. Bằng cách chạy phân phối trên nhiều nút, các chỉ mục cung cấp bảo mật và hiệu suất mạnh hơn trong khi giảm rủi ro gián đoạn và thời gian không hoạt động liên quan đến các nhà cung cấp RPC tập trung.
Ngược lại, các chỉ mục cho phép người dùng thu được thông tin mà họ cần trực tiếp bằng cách sử dụng ngôn ngữ truy vấn được xác định trước mà không cần phải đối mặt với dữ liệu phức tạp ở bên dưới. Cơ chế này cải thiện đáng kể hiệu quả và đáng tin cậy của việc truy xuất dữ liệu, đại diện cho một đổi mới quan trọng trong việc truy cập dữ liệu blockchain.
2.4 Cơ sở dữ liệu Full-Chain: Điều chỉnh hướng đến Streaming First
Sử dụng các nút được lập chỉ mục để truy vấn dữ liệu thường có nghĩa là API trở thành Cổng duy nhất để tiêu hóa dữ liệu trên chuỗi. Tuy nhiên, khi một dự án bước vào giai đoạn mở rộng quy mô, nó thường yêu cầu các nguồn dữ liệu linh hoạt hơn, điều mà các API được tiêu chuẩn hóa không thể cung cấp. Khi nhu cầu ứng dụng trở nên phức tạp hơn, các trình lập chỉ mục dữ liệu chính với các định dạng lập chỉ mục được tiêu chuẩn hóa dần dần phải vật lộn để đáp ứng nhu cầu truy vấn ngày càng đa dạng, chẳng hạn như tìm kiếm, truy cập chuỗi chéo hoặc ánh xạ dữ liệu ngoài chuỗi.
Trong kiến trúc đường ống dữ liệu hiện đại, việc tiếp cận “luồng trước” đã trở thành một giải pháp cho các hạn chế của xử lý hàng loạt truyền thống, cho phép tiếp nhận, xử lý và phân tích dữ liệu theo thời gian thực. Sự thay đổi mô hình này cho phép tổ chức phản ứng ngay lập tức với dữ liệu đầu vào, đem lại cái nhìn và quyết định gần như tức thì. Tương tự, việc phát triển các nhà cung cấp dịch vụ dữ liệu chuỗi khối đang tiến triển hướng việc xây dựng luồng dữ liệu chuỗi khối. Các nhà cung cấp dịch vụ chỉ mục truyền thống đã liên tiếp tung ra các sản phẩm nhận dữ liệu chuỗi khối theo thời gian thực thông qua luồng dữ liệu, như Substreams của The Graph và Mirror của Goldsky, cũng như hồ dữ liệu thời gian thực như Chainbase và SubSquid tạo ra luồng dữ liệu dựa trên chuỗi khối.
Các dịch vụ này nhằm đáp ứng nhu cầu phân tích giao dịch blockchain theo thời gian thực và cung cấp khả năng truy vấn toàn diện hơn. Giống như kiến trúc “trước luồng” cách mạng hóa việc xử lý dữ liệu và tiêu thụ trong đường ống dữ liệu truyền thống bằng cách giảm độ trễ và tăng cường khả năng phản hồi, các nhà cung cấp dữ liệu luồng blockchain cũng tìm kiếm hỗ trợ phát triển các ứng dụng hơn và hỗ trợ phân tích dữ liệu trên chuỗi thông qua các nguồn dữ liệu tiên tiến và chín chắn hơn.
Bằng cách định nghĩa lại những thách thức của dữ liệu on-chain từ quan điểm của các ống dẫn dữ liệu hiện đại, chúng ta có thể nhìn nhận việc quản lý, lưu trữ và cung cấp dữ liệu on-chain từ một góc nhìn mới, thực hiện tiềm năng đầy đủ của nó. Khi chúng ta bắt đầu nhìn vào các subgraph và các dịch vụ chỉ mục Ethereum ETL như là các luồng dữ liệu trong ống dẫn dữ liệu thay vì các kết quả cuối cùng, chúng ta có thể tưởng tượng một thế giới có thể nơi các bộ dữ liệu hiệu suất cao được tùy chỉnh cho bất kỳ trường hợp sử dụng kinh doanh nào.
3.1 Đồ thị
Mạng lưới The Graph đạt được việc lập chỉ mục dữ liệu và các dịch vụ truy vấn đa chuỗi thông qua mạng phân cấp các nút, cho phép các nhà phát triển thuận tiện lập chỉ mục dữ liệu blockchain và xây dựng ứng dụng phi tập trung. Các mô hình sản phẩm chính bao gồm thị trường thực hiện truy vấn dữ liệu và thị trường bộ nhớ cache chỉ mục dữ liệu, cả hai đều phục vụ nhu cầu truy vấn sản phẩm của người dùng. Thị trường thực hiện truy vấn dữ liệu cụ thể đề cập đến người tiêu dùng trả tiền cho các nút chỉ mục thích hợp cho dữ liệu mà họ yêu cầu, trong khi thị trường bộ nhớ cache chỉ mục dữ liệu liên quan đến việc phân bổ tài nguyên cho các nút chỉ mục dựa trên các yếu tố như mức độ phổ biến của việc lập chỉ mục lịch sử của các đồ thị phụ, các khoản phí truy vấn được thu thuế và nhu cầu từ các quản trị viên trên chuỗi cho đầu ra của đồ thị phụ.
Đồ thị con là các cấu trúc dữ liệu cơ bản trong mạng Đồ thị. Họ xác định cách trích xuất và chuyển đổi dữ liệu từ blockchain thành định dạng có thể truy vấn (ví dụ: lược đồ GraphQL). Bất kỳ ai cũng có thể tạo một biểu đồ con và nhiều ứng dụng có thể sử dụng lại các biểu đồ con này, nâng cao khả năng tái sử dụng dữ liệu và hiệu quả hoạt động.
Mạng The Graph bao gồm bốn vai trò chính: Indexers, Delegators, Curators và Developers, tất cả đều cùng nhau làm việc để cung cấp hỗ trợ dữ liệu cho ứng dụng Web3. Trách nhiệm của họ lần lượt như sau:
· Các bộ chỉ mục: Các bộ chỉ mục là các nhà điều hành nút trong mạng The Graph tham gia bằng cách đặt cược GRT (token gốc của The Graph). Họ cung cấp dịch vụ chỉ mục và xử lý truy vấn.
· Delegators: Delegators là người dùng đặt cược token GRT để hỗ trợ hoạt động của các nút chỉ số. Họ kiếm được một phần thưởng dựa trên các nút chỉ số mà họ đại diện.
· Người phục vụ: Người phục vụ chịu trách nhiệm đánh dấu xem subgraph nào nên được lập chỉ mục bởi mạng. Họ giúp đảm bảo rằng subgraphs có giá trị được ưu tiên xử lý.
· Nhà phát triển: Khác với ba vai trò trước đó, Nhà phát triển là phía đòi hỏi và là người dùng chính của The Graph. Họ tạo và gửi các đồ thị con (subgraphs) lên mạng The Graph, đợi mạng đáp ứng nhu cầu dữ liệu của họ.
3.1 The Graph
The Graph hiện đã chuyển hoàn toàn sang dịch vụ lưu trữ đồ thị phụ tập trung, với động lực kinh tế chảy qua các bên tham gia khác nhau để đảm bảo hoạt động của hệ thống:
· Phần thưởng cho Indexer: Indexer kiếm thu nhập thông qua phí truy vấn của người tiêu dùng và một phần phần thưởng khối GRT token.
· Phần Thưởng Người Uỷ Thác: Người uỷ thác nhận một phần thưởng từ những người còn lại mà họ hỗ trợ.
· Phần thưởng người quản lý: Nếu người quản lý tín hiệu các subgraph có giá trị, họ có thể kiếm được một phần phí truy vấn.
Thực tế, các sản phẩm của The Graph đang phát triển nhanh chóng trong làn sóng trí tuệ nhân tạo. Là một trong những nhóm phát triển cốt lõi trong hệ sinh thái The Graph, Semiotic Labs đã tập trung sử dụng công nghệ trí tuệ nhân tạo để tối ưu hóa giá chỉ mục và trải nghiệm truy vấn người dùng. Hiện tại, các công cụ được phát triển bởi Semiotic Labs, như AutoAgora, Allocation Optimizer và AgentC, cải thiện nhiều khía cạnh khác nhau của hiệu suất hệ sinh thái.
· AutoAgora giới thiệu một cơ chế định giá động điều chỉnh giá cả theo thời gian thực dựa trên lượng truy vấn và sử dụng tài nguyên, tối ưu hóa chiến lược định giá để đảm bảo tính cạnh tranh của chỉ số và tối đa hóa doanh thu.
· Allocation Optimizer giải quyết các vấn đề phức tạp về phân bổ tài nguyên đồ thị con, giúp người lập chỉ mục đạt được cấu hình tài nguyên tối ưu để nâng cao doanh thu và hiệu suất.
· AgentC là một công cụ thử nghiệm cho phép người dùng truy cập dữ liệu blockchain của The Graph bằng ngôn ngữ tự nhiên, từ đó cải thiện trải nghiệm người dùng.
Việc áp dụng những công cụ này đã cho phép The Graph nâng cao sự thông minh hệ thống và tính thân thiện với người dùng thông qua sự hỗ trợ của trí tuệ nhân tạo (AI).
3.2 Chainbase
Chainbase là một mạng dữ liệu toàn diện tích hợp tất cả dữ liệu blockchain vào một nền tảng duy nhất, giúp các nhà phát triển xây dựng và duy trì ứng dụng dễ dàng hơn. Các tính năng độc đáo của nó bao gồm:
· Hồ Sơ Dữ Liệu Thời Gian Thực: Chainbase cung cấp một hồ sơ dữ liệu thời gian thực dành riêng cho luồng dữ liệu blockchain, cho phép truy cập ngay lập tức đến dữ liệu khi nó được tạo ra.
· Kiến trúc Dual-chain: Chainbase được xây dựng trên Eigenlayer AVS, tạo ra một lớp thực thi chạy song song với thuật toán đồng thuận CometBFT. Thiết kế này nâng cao khả năng lập trình và kết hợp dữ liệu giữa các chuỗi, hỗ trợ khả năng xử lý cao, độ trễ thấp và khả năng hoàn tất, đồng thời cải thiện bảo mật mạng thông qua mô hình đặt cược đôi.
· Chuẩn định dạng dữ liệu đổi mới: Chainbase giới thiệu một chuẩn định dạng dữ liệu mới gọi là “bản thảo,” tối ưu hóa cấu trúc và sử dụng dữ liệu trong ngành công nghiệp tiền điện tử.
· Mô hình Cryptoworld: Với tài nguyên dữ liệu blockchain mở rộng, Chainbase kết hợp công nghệ mô hình AI để tạo ra các mô hình AI hiệu quả trong việc hiểu, dự đoán và tương tác với giao dịch blockchain. Mô hình cơ bản, Theia, hiện đã có sẵn để sử dụng công khai.
Các tính năng này khiến Chainbase trở nên khác biệt trong các giao thức lập chỉ mục blockchain, tập trung vào khả năng truy cập dữ liệu theo thời gian thực, định dạng dữ liệu sáng tạo và tạo ra các mô hình thông minh hơn thông qua việc tích hợp dữ liệu trên chuỗi và ngoài chuỗi để nâng cao thông tin chi tiết.
Mô hình trí tuệ nhân tạo Theia của Chainbase là một điểm nổi bật quan trọng phân biệt nó so với các giao thức dịch vụ dữ liệu khác. Dựa trên mô hình DORA của NVIDIA, Theia học và phân tích các mẫu mã tiền điện tử bằng cách tích hợp dữ liệu trên chuỗi và ngoài chuỗi cùng với các hoạt động không gian thời gian. Thông qua lý thuyết nguyên nhân, nó phản ứng để tăng cường khám phá giá trị tiềm năng và mẫu mã của dữ liệu trên chuỗi, cung cấp cho người dùng các dịch vụ dữ liệu thông minh hơn.
Các dịch vụ dữ liệu được kích hoạt bởi trí tuệ nhân tạo đã biến Chainbase từ một nền tảng dịch vụ dữ liệu blockchain thành một nhà cung cấp dịch vụ dữ liệu thông minh cạnh tranh hơn. Với tài nguyên dữ liệu mạnh mẽ và phân tích trí tuệ nhân tạo chủ động, Chainbase có thể cung cấp những cái nhìn dữ liệu rộng hơn và tối ưu hóa quy trình xử lý dữ liệu của người dùng.
3.3 Không gian và Thời gian
Space and Time (SxT) nhằm tạo ra một lớp tính toán có thể xác minh mở rộng các chứng minh không biết về một kho dữ liệu phi tập trung, cung cấp xử lý dữ liệu đáng tin cậy cho hợp đồng thông minh, các mô hình ngôn ngữ lớn và doanh nghiệp. Space and Time vừa mới đảm bảo được 20 triệu đô la trong vòng gọi vốn Series A mới nhất của mình, do Framework Ventures, Lightspeed Faction, Arrington Capital và Hivemind Capital dẫn đầu.
Trong lĩnh vực lập chỉ mục và xác minh dữ liệu, Space and Time giới thiệu một cách tiếp cận kỹ thuật mới — Proof of SQL. Đây là một công nghệ bằng chứng không có kiến thức (ZKP) sáng tạo được phát triển bởi Space and Time nhằm đảm bảo các truy vấn SQL được thực hiện trên kho dữ liệu phi tập trung có khả năng chống giả mạo và có thể kiểm chứng được. Khi một truy vấn được chạy, Proof of SQL tạo ra một bằng chứng mật mã xác minh tính toàn vẹn và chính xác của kết quả truy vấn. Bằng chứng này được gắn vào kết quả truy vấn, cho phép bất kỳ trình xác minh nào (chẳng hạn như hợp đồng thông minh) xác nhận độc lập rằng dữ liệu không bị giả mạo trong quá trình xử lý. Các mạng blockchain truyền thống thường dựa vào các cơ chế đồng thuận để xác minh tính xác thực của dữ liệu, trong khi Proof of SQL của Space and Time thực hiện một phương pháp xác minh dữ liệu hiệu quả hơn. Cụ thể, trong hệ thống của Space and Time, một nút chịu trách nhiệm thu thập dữ liệu trong khi các nút khác sử dụng công nghệ zk để xác minh tính xác thực của dữ liệu đó. Cách tiếp cận này làm giảm mức tiêu thụ tài nguyên từ nhiều nút lập chỉ mục dư thừa cùng một dữ liệu để đạt được sự đồng thuận, do đó nâng cao hiệu suất tổng thể của hệ thống. Khi công nghệ này trưởng thành, nó đóng vai trò là nền tảng cho các ngành công nghiệp truyền thống tập trung vào độ tin cậy của dữ liệu để xây dựng các sản phẩm dựa trên dữ liệu blockchain.
Đồng thời, SxT đã chặt chẽ hợp tác với phòng thí nghiệm đổi mới chung của trí tuệ nhân tạo của Microsoft để tăng tốc việc phát triển các công cụ trí tuệ nhân tạo sinh ra, cho phép người dùng dễ dàng xử lý dữ liệu blockchain thông qua ngôn ngữ tự nhiên. Hiện tại, trong Studio Không Gian và Thời Gian, người dùng có thể nhập các truy vấn bằng ngôn ngữ tự nhiên, và trí tuệ nhân tạo sẽ tự động chuyển chúng thành SQL và thực hiện truy vấn thay mặt người dùng để hiển thị kết quả cuối cùng cần thiết.
3.4 So sánh sự khác biệt
Tóm lại, công nghệ chỉ mục dữ liệu blockchain đã phát triển từ các nguồn dữ liệu nút ban đầu, thông qua việc phát triển các công cụ phân tích dữ liệu và chỉ mục, đến dịch vụ dữ liệu toàn bộ chuỗi được hỗ trợ bởi trí tuệ nhân tạo, đánh dấu quá trình cải thiện liên tục. Sự tiến hóa không ngừng này không chỉ nâng cao hiệu quả và độ chính xác của việc truy cập dữ liệu mà còn cung cấp cho người dùng một trải nghiệm thông minh chưa từng có.
Về phía trước, với sự phát triển liên tục của các công nghệ mới như AI và chứng minh không có kiến thức, các dịch vụ dữ liệu blockchain sẽ trở nên thông minh và an toàn hơn. Chúng ta có lý do để tin rằng các dịch vụ dữ liệu blockchain sẽ tiếp tục đóng vai trò quan trọng như cơ sở hạ tầng, cung cấp sự hỗ trợ mạnh mẽ cho tiến bộ và sáng tạo trong ngành công nghiệp.
Bài viết này được sao chép từ [Trustless Labs], bản quyền thuộc về tác giả gốc [Trustless Labs], nếu bạn có bất kỳ ý kiến nào về việc sao chép, vui lòng liên hệ với Cổng học và đội sẽ xử lý trong thời gian sớm nhất theo các thủ tục liên quan.
Disclaimer: Quan điểm và ý kiến được thể hiện trong bài viết này chỉ đại diện cho quan điểm cá nhân của tác giả và không hình thành bất kỳ lời khuyên đầu tư nào.
Các phiên bản ngôn ngữ khác của bài viết được dịch bởi nhóm Gate Learn và không được đề cập trong Gate.io, bài viết dịch có thể không được sao chép, phân phối hoặc đạo văn.