Dari membaca dan mengindeks hingga analisis, singkatnya ringkasan jejak pengindeksan data Web3

Menengah9/27/2024, 3:37:05 PM
Artikel ini mengeksplorasi proses pengembangan aksesibilitas data blockchain, membandingkan arsitektur dan karakteristik aplikasi teknologi AI dari tiga protokol layanan data, The Graph, Chainbase dan Space and Time, dan menunjukkan bahwa layanan data blockchain bergerak menuju kecerdasan dan mengembangkan ke arah keamanan serta akan terus memainkan peran penting sebagai infrastruktur industri di masa depan.

Artikel ini menjelajahi evolusi aksesibilitas data blockchain, membandingkan karakteristik tiga protokol layanan data - The Graph, Chainbase, dan Space and Time - dalam hal arsitektur dan aplikasi teknologi AI. Ini menunjukkan bahwa layanan data blockchain sedang berkembang menuju peningkatan kecerdasan dan keamanan, dan akan terus memainkan peran penting sebagai infrastruktur dasar di industri di masa depan.

1. Pengantar

Mulai dari gelombang pertama dApps pada tahun 2017, termasuk Etheroll, ETHLend, dan CryptoKitties, kita sekarang melihat berbagai dApps keuangan, game, dan sosial yang berkembang berdasarkan blockchain yang berbeda. Ketika membahas aplikasi on-chain terdesentralisasi, pernahkah kita mempertimbangkan sumber berbagai data yang digunakan dApps ini dalam interaksi mereka?

Pada tahun 2024, fokusnya adalah pada AI dan Web3. Dalam dunia kecerdasan buatan, data seperti sumber kehidupan untuk pertumbuhan dan evolusinya. Sama seperti tanaman mengandalkan sinar matahari dan air untuk berkembang, sistem AI bergantung pada sejumlah besar data untuk terus "belajar" dan "berpikir." Tanpa data, bahkan algoritma AI yang paling canggih pun hanyalah kastil di udara, tidak dapat melepaskan kecerdasan dan kemanjuran yang dimaksudkan.

Artikel ini menganalisis evolusi indeks data blockchain dari perspektif aksesibilitas data, membandingkan protokol indeks data yang mapan The Graph dengan protokol layanan data blockchain yang baru muncul, Chainbase dan Space and Time. Ini terutama mengeksplorasi kesamaan dan perbedaan dalam layanan data dan arsitektur produk antara kedua protokol baru yang menggabungkan teknologi AI ini.

2. Kompleksitas dan kesederhanaan indeks data: dari node blockchain hingga database rantai penuh

2.1 Sumber Data: Node Blockchain

Sejak kita mulai memahami "apa itu blockchain," sering kali kita menemui frasa: blockchain adalah sebuah buku besar terdesentralisasi. Node blockchain adalah dasar dari seluruh jaringan blockchain, bertanggung jawab untuk mencatat, menyimpan, dan menyebarkan semua data transaksi on-chain. Setiap node memiliki salinan lengkap data blockchain, memastikan terdesentralisasinya jaringan. Namun, bagi pengguna biasa, membangun dan memelihara node blockchain bukanlah tugas yang mudah. Ini membutuhkan tidak hanya keterampilan teknis khusus tetapi juga biaya perangkat keras dan bandwidth yang tinggi. Selain itu, kemampuan kueri node biasa terbatas, membuat sulit untuk mengambil data dalam format yang dibutuhkan oleh pengembang. Oleh karena itu, meskipun secara teori siapa pun dapat menjalankan node mereka sendiri, dalam praktiknya, pengguna cenderung bergantung pada layanan pihak ketiga.

Untuk menangani masalah ini, penyedia node RPC (Remote Procedure Call) muncul. Penyedia ini menangani biaya dan pengelolaan node dan menawarkan data melalui titik akhir RPC, memungkinkan pengguna untuk mengakses data blockchain tanpa membangun node mereka sendiri. Titik akhir RPC publik gratis tetapi dilengkapi dengan batasan tingkat, yang dapat berdampak negatif pada pengalaman pengguna dApps. Titik akhir RPC pribadi menawarkan kinerja yang lebih baik dengan mengurangi kemacetan, tetapi bahkan pengambilan data sederhana memerlukan komunikasi bolak-balik yang substansial. Hal ini membuatnya membutuhkan permintaan yang banyak dan tidak efisien untuk kueri data yang kompleks. Selain itu, titik akhir RPC pribadi sering menghadapi tantangan skalabilitas dan kekurangan kompatibilitas di seluruh jaringan yang berbeda. Namun, antarmuka API standar yang disediakan oleh penyedia node menurunkan hambatan bagi pengguna untuk mengakses data on-chain, meletakkan dasar untuk parsing data dan aplikasi selanjutnya.

2.2 Parsing Data: Dari Data Mentah ke Data yang Dapat Digunakan

Data yang diperoleh dari node blockchain seringkali merupakan data mentah yang telah dienkripsi dan dikodekan. Meskipun data ini mempertahankan integritas dan keamanan blockchain, kompleksitasnya meningkatkan kesulitan parsing data. Bagi pengguna atau pengembang biasa, menangani data mentah ini secara langsung memerlukan pengetahuan teknis dan sumber daya komputasi yang substansial.

Dalam konteks ini, proses parsing data menjadi sangat penting. Dengan mem-parsing data mentah yang kompleks dan mengubahnya menjadi format yang lebih mudah dipahami dan dapat dioperasikan, pengguna dapat dengan intuitif memahami dan memanfaatkan data ini. Keberhasilan parsing data secara langsung mempengaruhi efisiensi dan efektivitas aplikasi data blockchain, menjadikannya langkah kritis dalam seluruh proses pengindeksan data.

2.3 Evolusi Data Indexers

Seiring dengan meningkatnya volume data blockchain, permintaan akan indexer data juga meningkat. Indexer memainkan peran penting dalam mengorganisir data on-chain dan mengirimkannya ke database untuk pengambilan data yang mudah. Prinsip kerja indexer adalah mengindeks data blockchain dan membuatnya tersedia melalui bahasa kueri yang mirip dengan SQL (seperti GraphQL APIs). Dengan menyediakan antarmuka yang terpadu untuk pengambilan data, indexer memungkinkan pengembang untuk dengan cepat dan akurat mengambil informasi yang mereka butuhkan menggunakan bahasa kueri yang standar, secara signifikan menyederhanakan proses ini.

Berbagai jenis indexer mengoptimalkan pengambilan data dengan berbagai cara:

· Penyusun Indeks Node Lengkap: Penyusun ini menjalankan node blockchain penuh dan langsung mengekstrak data dari mereka, memastikan kelengkapan dan ketepatan data namun memerlukan penyimpanan dan daya pemrosesan yang substansial.

· Indektor Ringan: Indektor ini mengandalkan node penuh untuk mengambil data tertentu sesuai kebutuhan, mengurangi persyaratan penyimpanan tetapi dapat meningkatkan waktu permintaan.

· Penindex Khusus: Para penindex ini fokus pada jenis data tertentu atau blockchain tertentu, mengoptimalkan pengambilan data untuk kasus penggunaan tertentu, seperti data NFT atau transaksi DeFi.

· AggreGated Indexers: Indexer-indexer ini mengekstrak data dari multiple blockchains dan sumber-sumber lainnya, termasuk informasi off-chain, menyediakan antarmuka kueri yang terpadu, yang sangat berguna untuk multi-chain dApps.

Saat ini, node arsip Ethereum di klien Geth dalam mode arsip menempati sekitar 13,5 TB ruang penyimpanan, sedangkan di bawah klien Erigon, persyaratan arsip sekitar 3 TB. Karena blockchain terus berkembang, persyaratan penyimpanan data untuk node arsip juga akan meningkat. Dalam menghadapi sejumlah besar data, protokol pengindeksan utama tidak hanya mendukung pengindeksan multi-rantai tetapi juga menyesuaikan kerangka kerja penguraian data yang disesuaikan dengan kebutuhan data aplikasi yang berbeda. Misalnya, kerangka kerja "subgraf" The Graph adalah contoh tipikal.

Kemunculan indexer secara signifikan meningkatkan efisiensi indeks data dan kueri. Dibandingkan dengan endpoint RPC tradisional, indexer dapat dengan efisien mengindeks jumlah data yang besar dan mendukung kueri berkecepatan tinggi. Indexer ini memungkinkan pengguna untuk melakukan kueri kompleks, dengan mudah menyaring data, dan menganalisanya setelah diekstraksi. Selain itu, beberapa indexer mendukung pengumpulan sumber data dari beberapa blockchain, menghindari kebutuhan untuk mendeploy beberapa API dalam dApps multi-chain. Dengan menjalankan secara terdistribusi di beberapa node, indexer menyediakan keamanan dan performa yang lebih kuat sambil mengurangi risiko gangguan dan waktu tidak aktif yang terkait dengan penyedia RPC terpusat.

Sebaliknya, indexer memungkinkan pengguna untuk mendapatkan informasi yang mereka butuhkan secara langsung menggunakan bahasa kueri yang telah ditentukan sebelumnya tanpa harus berurusan dengan data kompleks yang mendasarinya. Mekanisme ini secara signifikan meningkatkan efisiensi dan kehandalan pengambilan data, mewakili inovasi penting dalam akses data blockchain.

2.4 Database Rantai Penuh: Berpihak pada Streaming Pertama

Menggunakan node yang diindeks untuk mengambil data biasanya berarti bahwa API menjadi satu-satunya Gateway untuk mencerna data on-chain. Namun, ketika sebuah proyek memasuki fase penskalaan, seringkali membutuhkan sumber data yang lebih fleksibel, yang tidak dapat disediakan oleh API standar. Saat tuntutan aplikasi menjadi lebih kompleks, pemicu data primer dengan format indeks standar mereka secara bertahap kesulitan memenuhi kebutuhan pengambilan yang semakin beragam, seperti pencarian, akses lintas-rantai, atau pemetaan data off-chain.

Dalam arsitektur saluran data modern, pendekatan “stream-first” telah menjadi solusi terhadap keterbatasan pemrosesan batch tradisional, memungkinkan penyerapan data, pemrosesan, dan analisis real-time. Perubahan paradigma ini memungkinkan organisasi untuk segera merespons data yang masuk, menghasilkan wawasan, dan membuat keputusan hampir secara instan. Demikian pula, pengembangan penyedia layanan data blockchain sedang menuju ke arah konstruksi aliran data blockchain. Penyedia layanan indeks tradisional telah meluncurkan produk yang mendapatkan data blockchain real-time melalui aliran data, seperti Substreams The Graph dan Mirror Goldsky, serta danau data real-time seperti Chainbase dan SubSquid yang menghasilkan aliran data berdasarkan blockchain.

Layanan-layanan ini bertujuan untuk memenuhi permintaan untuk parsing blockchain real-time dan untuk memberikan kemampuan kueri yang lebih komprehensif. Sama seperti arsitektur 'stream-first' merevolusi pemrosesan data dan konsumsi dalam pipa data tradisional dengan mengurangi laten dan meningkatkan responsifitas, penyedia data stream blockchain juga bertujuan untuk mendukung pengembangan aplikasi lebih banyak dan membantu dalam analisis data on-chain melalui sumber data yang lebih canggih dan matang.

Dengan mendefinisikan tantangan data on-chain dari perspektif alur data modern, kita dapat melihat manajemen, penyimpanan, dan penyediaan data on-chain dari sudut pandang baru, mewujudkan potensinya secara penuh. Saat kita mulai melihat subgraf dan layanan indeksing Ethereum ETL sebagai aliran data dalam alur data bukan sebagai output akhir, kita dapat membayangkan dunia di mana dataset berkinerja tinggi disesuaikan untuk setiap kasus penggunaan bisnis.

3. AI + Database? Perbandingan Mendalam The Graph, Chainbase, dan Space and Time

3.1 Graf

Jaringan Graph mencapai pengindeksan data multi-rantai dan layanan kueri melalui jaringan node yang terdesentralisasi, memungkinkan pengembang untuk dengan mudah mengindeks data blockchain dan membangun aplikasi yang terdesentralisasi. Model produk utamanya meliputi pasar eksekusi kueri data dan pasar cache pengindeksan data, yang keduanya melayani kebutuhan kueri produk pengguna. Pasar eksekusi kueri data secara khusus mengacu pada konsumen yang membayar node indeks yang sesuai untuk data yang mereka butuhkan, sedangkan pasar cache pengindeksan data melibatkan node indeks yang mengalokasikan sumber daya berdasarkan faktor-faktor seperti popularitas pengindeksan historis subgraf, biaya kueri yang dikumpulkan, dan permintaan dari kurator on-chain untuk output subgraf.

Subgraf adalah struktur data fundamental dalam jaringan Graf. Mereka mendefinisikan cara mengekstrak dan mengubah data dari blockchain ke dalam format yang dapat ditanyakan (misalnya, skema GraphQL). Siapa pun dapat membuat subgraf, dan beberapa aplikasi dapat menggunakan kembali subgraf ini, meningkatkan daya pakai data dan efisiensi operasional.

Jaringan Grafik terdiri dari empat peran kunci: Pengeindeks, Delegator, Kurator, dan Pengembang, yang semuanya bekerja sama untuk menyediakan dukungan data untuk aplikasi Web3. Tanggung jawab masing-masing adalah sebagai berikut:

· Indexers: Indexers adalah operator node dalam jaringan The Graph yang berpartisipasi dengan melakukan staking GRT (token asli The Graph). Mereka menyediakan layanan pengindeksan dan pemrosesan kueri.

· Delegators: Delegator adalah pengguna yang mempertaruhkan token GRT untuk mendukung operasi node indeks. Mereka mendapatkan sebagian dari imbalan berdasarkan node indeks yang mereka deleGate.

· Kurator: Kurator bertanggung jawab untuk memberi sinyal subgraf mana yang harus diindeks oleh jaringan. Mereka membantu memastikan bahwa subgraf yang berharga diprioritaskan untuk diproses.

· Pengembang: Tidak seperti tiga peran sebelumnya, Pengembang adalah sisi permintaan dan merupakan pengguna utama The Graph. Mereka membuat dan mengirimkan subgraf ke jaringan The Graph, menunggu jaringan memenuhi kebutuhan data mereka.

3.1 Graf

The Graph sekarang telah sepenuhnya beralih ke layanan hosting subgraf terdesentralisasi, dengan insentif ekonomi mengalir antara peserta yang berbeda untuk memastikan operasi sistem:

· Hadiah Indeksir: Indeksir menghasilkan penghasilan melalui biaya kueri konsumen dan sebagian hadiah blok token GRT.

· Penghargaan Delegator: Delegator menerima bagian dari hadiah dari indexer yang mereka dukung.

· Hadiah Kurator: Jika kurator memberikan sinyal subgraf yang berharga, mereka dapat mendapatkan sebagian dari biaya kueri.

Sebenarnya, produk-produk The Graph sedang berkembang pesat dalam gelombang kecerdasan buatan. Sebagai salah satu tim pengembangan inti dalam ekosistem The Graph, Semiotic Labs telah fokus pada pemanfaatan teknologi kecerdasan buatan untuk mengoptimalkan harga indeks dan pengalaman kueri pengguna. Saat ini, alat-alat yang dikembangkan oleh Semiotic Labs, seperti AutoAgora, Allocation Optimizer, dan AgentC, meningkatkan berbagai aspek kinerja ekosistem.

· AutoAgora memperkenalkan mekanisme penetapan harga dinamis yang menyesuaikan harga secara real time berdasarkan volume permintaan dan penggunaan sumber daya, mengoptimalkan strategi penetapan harga untuk memastikan daya saing indekser dan memaksimalkan pendapatan.

· Alat Pemeliharaan Alokasi mengatasi masalah kompleks alokasi sumber daya subgraf, membantu indexer mencapai konfigurasi sumber daya yang optimal untuk meningkatkan pendapatan dan kinerja.

· AgentC adalah alat eksperimental yang memungkinkan pengguna mengakses data blockchain The Graph menggunakan bahasa alami, sehingga meningkatkan pengalaman pengguna.

Penerapan alat-alat ini telah memungkinkan The Graph untuk meningkatkan kecerdasan sistem dan kemudahan penggunaan dengan bantuan AI.

3.2 Chainbase

Chainbase adalah jaringan data komprehensif yang mengintegrasikan semua data blockchain ke dalam satu platform, sehingga memudahkan pengembang untuk membangun dan memelihara aplikasi. Fitur uniknya meliputi:

· Real-time Data Lake: Chainbase menyediakan danau data real-time khusus untuk aliran data blockchain, memungkinkan akses instan ke data sebagaimana data tersebut dihasilkan.

· Arsitektur Dua Rantai: Chainbase dibangun di atas Eigenlayer AVS, menciptakan lapisan eksekusi yang berjalan secara paralel dengan algoritma konsensus CometBFT. Desain ini meningkatkan pemrograman data lintas-rantai dan komposabilitas, mendukung throughput tinggi, latensi rendah, dan finalitas, sambil meningkatkan keamanan jaringan melalui model staking ganda.

· Standar Format Data Inovatif: Chainbase memperkenalkan standar format data baru yang disebut 'manuscripts', mengoptimalkan struktur dan pemanfaatan data dalam industri kripto.

· Model Dunia Kripto: Dengan sumber daya data blockchain yang luas, Chainbase menggabungkan teknologi model AI untuk membuat model AI yang efektif memahami, memprediksi, dan berinteraksi dengan transaksi blockchain. Model dasar, Theia, kini tersedia untuk penggunaan publik.

Fitur-fitur ini membedakan Chainbase dalam protokol indeks blockchain, berfokus pada aksesibilitas data real-time, format data inovatif, dan penciptaan model yang lebih cerdas melalui integrasi data on-chain dan off-chain untuk meningkatkan wawasan.

Model AI Chainbase, Theia, adalah sorotan utama yang membedakannya dari protokol layanan data lainnya. Berdasarkan model DORA dari NVIDIA, Theia belajar dan menganalisis pola kripto dengan mengintegrasikan data on-chain dan off-chain bersama dengan aktivitas spasial-temporal. Melalui penalaran sebab-akibat, ia merespons untuk mendalami eksplorasi nilai potensial dan pola data on-chain, menyediakan pengguna dengan layanan data yang lebih cerdas.

Layanan data yang didukung AI telah mengubah Chainbase dari sekadar platform layanan data blockchain menjadi penyedia layanan data cerdas yang lebih kompetitif. Dengan sumber daya data yang kuat dan analisis AI proaktif, Chainbase dapat memberikan wawasan data yang lebih luas dan mengoptimalkan alur kerja pemrosesan data pengguna.

3.3 Ruang dan Waktu

Space and Time (SxT) bertujuan untuk menciptakan lapisan perhitungan yang dapat diverifikasi yang memperluas bukti nol pengetahuan pada gudang data terdesentralisasi, menyediakan pemrosesan data yang dapat dipercaya untuk kontrak pintar, model bahasa besar, dan perusahaan. Space and Time baru-baru ini mengamankan $20 juta dalam putaran pendanaan Seri A terbarunya, yang dipimpin oleh Framework Ventures, Lightspeed Faction, Arrington Capital, dan Hivemind Capital.

Dalam bidang pengindeksan dan verifikasi data, Space and Time memperkenalkan pendekatan teknis baru—Proof of SQL. Ini adalah teknologi bukti pengetahuan nol (ZKP) inovatif yang dikembangkan oleh Space and Time yang memastikan kueri SQL yang dieksekusi pada gudang data terdesentralisasi tidak dapat dirusak dan dapat diverifikasi. Ketika sebuah kueri dijalankan, Proof of SQL menghasilkan bukti kriptografis yang memverifikasi integritas dan keakuratan hasil kueri. Bukti ini ditambahkan ke hasil kueri, memungkinkan setiap pemeriksa (seperti kontrak pintar) untuk secara independen mengonfirmasi bahwa data tidak dirusak selama pemrosesan. Jaringan blockchain tradisional biasanya mengandalkan mekanisme konsensus untuk memverifikasi keaslian data, sedangkan Proof of SQL dari Space and Time menerapkan metode verifikasi data yang lebih efisien. Secara khusus, dalam sistem Space and Time, satu node bertanggung jawab atas akuisisi data sementara node lain menggunakan teknologi zk untuk memverifikasi keaslian data tersebut. Pendekatan ini mengurangi konsumsi sumber daya dari beberapa node yang redundan mengindeks data yang sama untuk mencapai konsensus, dengan demikian meningkatkan kinerja sistem secara keseluruhan. Saat teknologi ini berkembang, ini menjadi batu penjuru bagi industri tradisional yang berfokus pada kehandalan data untuk membangun produk berbasis data blockchain.

Pada saat yang sama, SxT telah bekerja sama erat dengan laboratorium inovasi gabungan kecerdasan buatan Microsoft untuk mempercepat pengembangan alat AI generatif, memungkinkan pengguna untuk dengan mudah memproses data blockchain melalui bahasa alami. Saat ini, di Space and Time Studio, pengguna dapat memasukkan kueri bahasa alami, dan AI akan secara otomatis mengonversinya menjadi SQL dan menjalankan kueri atas nama pengguna untuk menyajikan hasil akhir yang dibutuhkan.

3.4 Perbandingan Perbedaan

4. Kesimpulan dan prospek

Secara keseluruhan, teknologi indeks data blockchain telah berkembang dari sumber data simpul awal, melalui pengembangan parsing data dan indexer, menjadi layanan data rantai penuh yang didukung kecerdasan buatan (AI), yang menandai proses perbaikan bertahap. Evolusi teknologi yang berkelanjutan ini tidak hanya meningkatkan efisiensi dan akurasi akses data tetapi juga memberikan pengalaman cerdas yang belum pernah terjadi sebelumnya bagi pengguna.

Ke depan, dengan pengembangan teknologi baru yang sedang berlangsung seperti AI dan zero-knowledge proofs, layanan data blockchain akan menjadi lebih cerdas dan aman. Kami memiliki alasan untuk percaya bahwa layanan data blockchain akan terus memainkan peran penting sebagai infrastruktur, memberikan dukungan kuat untuk kemajuan dan inovasi dalam industri.

Disclaimer:

  1. Artikel ini diperbanyak dari [Trustless Labs], hak cipta dimiliki oleh penulis asli [Trustless Labs], jika Anda memiliki keberatan terhadap penerbitan ulang, silakan hubungi Gate Belajartim, dan tim akan menanganinya sesegera mungkin sesuai dengan prosedur yang relevan.

  2. Penafian: Pandangan dan opini yang terdapat dalam artikel ini hanya mewakili pandangan pribadi penulis dan tidak merupakan saran investasi apa pun.

  3. Versi bahasa lain dari artikel ini diterjemahkan oleh tim Gate Learn dan tidak disebutkan di sini.Gate.io, artikel yang diterjemahkan tidak boleh direproduksi, didistribusikan, atau diplagiatkan.

* Ця інформація не є фінансовою порадою чи будь-якою іншою рекомендацією, запропонованою чи схваленою Gate.io.
* Цю статтю заборонено відтворювати, передавати чи копіювати без посилання на Gate.io. Порушення є порушенням Закону про авторське право і може бути предметом судового розгляду.

Dari membaca dan mengindeks hingga analisis, singkatnya ringkasan jejak pengindeksan data Web3

Menengah9/27/2024, 3:37:05 PM
Artikel ini mengeksplorasi proses pengembangan aksesibilitas data blockchain, membandingkan arsitektur dan karakteristik aplikasi teknologi AI dari tiga protokol layanan data, The Graph, Chainbase dan Space and Time, dan menunjukkan bahwa layanan data blockchain bergerak menuju kecerdasan dan mengembangkan ke arah keamanan serta akan terus memainkan peran penting sebagai infrastruktur industri di masa depan.

Artikel ini menjelajahi evolusi aksesibilitas data blockchain, membandingkan karakteristik tiga protokol layanan data - The Graph, Chainbase, dan Space and Time - dalam hal arsitektur dan aplikasi teknologi AI. Ini menunjukkan bahwa layanan data blockchain sedang berkembang menuju peningkatan kecerdasan dan keamanan, dan akan terus memainkan peran penting sebagai infrastruktur dasar di industri di masa depan.

1. Pengantar

Mulai dari gelombang pertama dApps pada tahun 2017, termasuk Etheroll, ETHLend, dan CryptoKitties, kita sekarang melihat berbagai dApps keuangan, game, dan sosial yang berkembang berdasarkan blockchain yang berbeda. Ketika membahas aplikasi on-chain terdesentralisasi, pernahkah kita mempertimbangkan sumber berbagai data yang digunakan dApps ini dalam interaksi mereka?

Pada tahun 2024, fokusnya adalah pada AI dan Web3. Dalam dunia kecerdasan buatan, data seperti sumber kehidupan untuk pertumbuhan dan evolusinya. Sama seperti tanaman mengandalkan sinar matahari dan air untuk berkembang, sistem AI bergantung pada sejumlah besar data untuk terus "belajar" dan "berpikir." Tanpa data, bahkan algoritma AI yang paling canggih pun hanyalah kastil di udara, tidak dapat melepaskan kecerdasan dan kemanjuran yang dimaksudkan.

Artikel ini menganalisis evolusi indeks data blockchain dari perspektif aksesibilitas data, membandingkan protokol indeks data yang mapan The Graph dengan protokol layanan data blockchain yang baru muncul, Chainbase dan Space and Time. Ini terutama mengeksplorasi kesamaan dan perbedaan dalam layanan data dan arsitektur produk antara kedua protokol baru yang menggabungkan teknologi AI ini.

2. Kompleksitas dan kesederhanaan indeks data: dari node blockchain hingga database rantai penuh

2.1 Sumber Data: Node Blockchain

Sejak kita mulai memahami "apa itu blockchain," sering kali kita menemui frasa: blockchain adalah sebuah buku besar terdesentralisasi. Node blockchain adalah dasar dari seluruh jaringan blockchain, bertanggung jawab untuk mencatat, menyimpan, dan menyebarkan semua data transaksi on-chain. Setiap node memiliki salinan lengkap data blockchain, memastikan terdesentralisasinya jaringan. Namun, bagi pengguna biasa, membangun dan memelihara node blockchain bukanlah tugas yang mudah. Ini membutuhkan tidak hanya keterampilan teknis khusus tetapi juga biaya perangkat keras dan bandwidth yang tinggi. Selain itu, kemampuan kueri node biasa terbatas, membuat sulit untuk mengambil data dalam format yang dibutuhkan oleh pengembang. Oleh karena itu, meskipun secara teori siapa pun dapat menjalankan node mereka sendiri, dalam praktiknya, pengguna cenderung bergantung pada layanan pihak ketiga.

Untuk menangani masalah ini, penyedia node RPC (Remote Procedure Call) muncul. Penyedia ini menangani biaya dan pengelolaan node dan menawarkan data melalui titik akhir RPC, memungkinkan pengguna untuk mengakses data blockchain tanpa membangun node mereka sendiri. Titik akhir RPC publik gratis tetapi dilengkapi dengan batasan tingkat, yang dapat berdampak negatif pada pengalaman pengguna dApps. Titik akhir RPC pribadi menawarkan kinerja yang lebih baik dengan mengurangi kemacetan, tetapi bahkan pengambilan data sederhana memerlukan komunikasi bolak-balik yang substansial. Hal ini membuatnya membutuhkan permintaan yang banyak dan tidak efisien untuk kueri data yang kompleks. Selain itu, titik akhir RPC pribadi sering menghadapi tantangan skalabilitas dan kekurangan kompatibilitas di seluruh jaringan yang berbeda. Namun, antarmuka API standar yang disediakan oleh penyedia node menurunkan hambatan bagi pengguna untuk mengakses data on-chain, meletakkan dasar untuk parsing data dan aplikasi selanjutnya.

2.2 Parsing Data: Dari Data Mentah ke Data yang Dapat Digunakan

Data yang diperoleh dari node blockchain seringkali merupakan data mentah yang telah dienkripsi dan dikodekan. Meskipun data ini mempertahankan integritas dan keamanan blockchain, kompleksitasnya meningkatkan kesulitan parsing data. Bagi pengguna atau pengembang biasa, menangani data mentah ini secara langsung memerlukan pengetahuan teknis dan sumber daya komputasi yang substansial.

Dalam konteks ini, proses parsing data menjadi sangat penting. Dengan mem-parsing data mentah yang kompleks dan mengubahnya menjadi format yang lebih mudah dipahami dan dapat dioperasikan, pengguna dapat dengan intuitif memahami dan memanfaatkan data ini. Keberhasilan parsing data secara langsung mempengaruhi efisiensi dan efektivitas aplikasi data blockchain, menjadikannya langkah kritis dalam seluruh proses pengindeksan data.

2.3 Evolusi Data Indexers

Seiring dengan meningkatnya volume data blockchain, permintaan akan indexer data juga meningkat. Indexer memainkan peran penting dalam mengorganisir data on-chain dan mengirimkannya ke database untuk pengambilan data yang mudah. Prinsip kerja indexer adalah mengindeks data blockchain dan membuatnya tersedia melalui bahasa kueri yang mirip dengan SQL (seperti GraphQL APIs). Dengan menyediakan antarmuka yang terpadu untuk pengambilan data, indexer memungkinkan pengembang untuk dengan cepat dan akurat mengambil informasi yang mereka butuhkan menggunakan bahasa kueri yang standar, secara signifikan menyederhanakan proses ini.

Berbagai jenis indexer mengoptimalkan pengambilan data dengan berbagai cara:

· Penyusun Indeks Node Lengkap: Penyusun ini menjalankan node blockchain penuh dan langsung mengekstrak data dari mereka, memastikan kelengkapan dan ketepatan data namun memerlukan penyimpanan dan daya pemrosesan yang substansial.

· Indektor Ringan: Indektor ini mengandalkan node penuh untuk mengambil data tertentu sesuai kebutuhan, mengurangi persyaratan penyimpanan tetapi dapat meningkatkan waktu permintaan.

· Penindex Khusus: Para penindex ini fokus pada jenis data tertentu atau blockchain tertentu, mengoptimalkan pengambilan data untuk kasus penggunaan tertentu, seperti data NFT atau transaksi DeFi.

· AggreGated Indexers: Indexer-indexer ini mengekstrak data dari multiple blockchains dan sumber-sumber lainnya, termasuk informasi off-chain, menyediakan antarmuka kueri yang terpadu, yang sangat berguna untuk multi-chain dApps.

Saat ini, node arsip Ethereum di klien Geth dalam mode arsip menempati sekitar 13,5 TB ruang penyimpanan, sedangkan di bawah klien Erigon, persyaratan arsip sekitar 3 TB. Karena blockchain terus berkembang, persyaratan penyimpanan data untuk node arsip juga akan meningkat. Dalam menghadapi sejumlah besar data, protokol pengindeksan utama tidak hanya mendukung pengindeksan multi-rantai tetapi juga menyesuaikan kerangka kerja penguraian data yang disesuaikan dengan kebutuhan data aplikasi yang berbeda. Misalnya, kerangka kerja "subgraf" The Graph adalah contoh tipikal.

Kemunculan indexer secara signifikan meningkatkan efisiensi indeks data dan kueri. Dibandingkan dengan endpoint RPC tradisional, indexer dapat dengan efisien mengindeks jumlah data yang besar dan mendukung kueri berkecepatan tinggi. Indexer ini memungkinkan pengguna untuk melakukan kueri kompleks, dengan mudah menyaring data, dan menganalisanya setelah diekstraksi. Selain itu, beberapa indexer mendukung pengumpulan sumber data dari beberapa blockchain, menghindari kebutuhan untuk mendeploy beberapa API dalam dApps multi-chain. Dengan menjalankan secara terdistribusi di beberapa node, indexer menyediakan keamanan dan performa yang lebih kuat sambil mengurangi risiko gangguan dan waktu tidak aktif yang terkait dengan penyedia RPC terpusat.

Sebaliknya, indexer memungkinkan pengguna untuk mendapatkan informasi yang mereka butuhkan secara langsung menggunakan bahasa kueri yang telah ditentukan sebelumnya tanpa harus berurusan dengan data kompleks yang mendasarinya. Mekanisme ini secara signifikan meningkatkan efisiensi dan kehandalan pengambilan data, mewakili inovasi penting dalam akses data blockchain.

2.4 Database Rantai Penuh: Berpihak pada Streaming Pertama

Menggunakan node yang diindeks untuk mengambil data biasanya berarti bahwa API menjadi satu-satunya Gateway untuk mencerna data on-chain. Namun, ketika sebuah proyek memasuki fase penskalaan, seringkali membutuhkan sumber data yang lebih fleksibel, yang tidak dapat disediakan oleh API standar. Saat tuntutan aplikasi menjadi lebih kompleks, pemicu data primer dengan format indeks standar mereka secara bertahap kesulitan memenuhi kebutuhan pengambilan yang semakin beragam, seperti pencarian, akses lintas-rantai, atau pemetaan data off-chain.

Dalam arsitektur saluran data modern, pendekatan “stream-first” telah menjadi solusi terhadap keterbatasan pemrosesan batch tradisional, memungkinkan penyerapan data, pemrosesan, dan analisis real-time. Perubahan paradigma ini memungkinkan organisasi untuk segera merespons data yang masuk, menghasilkan wawasan, dan membuat keputusan hampir secara instan. Demikian pula, pengembangan penyedia layanan data blockchain sedang menuju ke arah konstruksi aliran data blockchain. Penyedia layanan indeks tradisional telah meluncurkan produk yang mendapatkan data blockchain real-time melalui aliran data, seperti Substreams The Graph dan Mirror Goldsky, serta danau data real-time seperti Chainbase dan SubSquid yang menghasilkan aliran data berdasarkan blockchain.

Layanan-layanan ini bertujuan untuk memenuhi permintaan untuk parsing blockchain real-time dan untuk memberikan kemampuan kueri yang lebih komprehensif. Sama seperti arsitektur 'stream-first' merevolusi pemrosesan data dan konsumsi dalam pipa data tradisional dengan mengurangi laten dan meningkatkan responsifitas, penyedia data stream blockchain juga bertujuan untuk mendukung pengembangan aplikasi lebih banyak dan membantu dalam analisis data on-chain melalui sumber data yang lebih canggih dan matang.

Dengan mendefinisikan tantangan data on-chain dari perspektif alur data modern, kita dapat melihat manajemen, penyimpanan, dan penyediaan data on-chain dari sudut pandang baru, mewujudkan potensinya secara penuh. Saat kita mulai melihat subgraf dan layanan indeksing Ethereum ETL sebagai aliran data dalam alur data bukan sebagai output akhir, kita dapat membayangkan dunia di mana dataset berkinerja tinggi disesuaikan untuk setiap kasus penggunaan bisnis.

3. AI + Database? Perbandingan Mendalam The Graph, Chainbase, dan Space and Time

3.1 Graf

Jaringan Graph mencapai pengindeksan data multi-rantai dan layanan kueri melalui jaringan node yang terdesentralisasi, memungkinkan pengembang untuk dengan mudah mengindeks data blockchain dan membangun aplikasi yang terdesentralisasi. Model produk utamanya meliputi pasar eksekusi kueri data dan pasar cache pengindeksan data, yang keduanya melayani kebutuhan kueri produk pengguna. Pasar eksekusi kueri data secara khusus mengacu pada konsumen yang membayar node indeks yang sesuai untuk data yang mereka butuhkan, sedangkan pasar cache pengindeksan data melibatkan node indeks yang mengalokasikan sumber daya berdasarkan faktor-faktor seperti popularitas pengindeksan historis subgraf, biaya kueri yang dikumpulkan, dan permintaan dari kurator on-chain untuk output subgraf.

Subgraf adalah struktur data fundamental dalam jaringan Graf. Mereka mendefinisikan cara mengekstrak dan mengubah data dari blockchain ke dalam format yang dapat ditanyakan (misalnya, skema GraphQL). Siapa pun dapat membuat subgraf, dan beberapa aplikasi dapat menggunakan kembali subgraf ini, meningkatkan daya pakai data dan efisiensi operasional.

Jaringan Grafik terdiri dari empat peran kunci: Pengeindeks, Delegator, Kurator, dan Pengembang, yang semuanya bekerja sama untuk menyediakan dukungan data untuk aplikasi Web3. Tanggung jawab masing-masing adalah sebagai berikut:

· Indexers: Indexers adalah operator node dalam jaringan The Graph yang berpartisipasi dengan melakukan staking GRT (token asli The Graph). Mereka menyediakan layanan pengindeksan dan pemrosesan kueri.

· Delegators: Delegator adalah pengguna yang mempertaruhkan token GRT untuk mendukung operasi node indeks. Mereka mendapatkan sebagian dari imbalan berdasarkan node indeks yang mereka deleGate.

· Kurator: Kurator bertanggung jawab untuk memberi sinyal subgraf mana yang harus diindeks oleh jaringan. Mereka membantu memastikan bahwa subgraf yang berharga diprioritaskan untuk diproses.

· Pengembang: Tidak seperti tiga peran sebelumnya, Pengembang adalah sisi permintaan dan merupakan pengguna utama The Graph. Mereka membuat dan mengirimkan subgraf ke jaringan The Graph, menunggu jaringan memenuhi kebutuhan data mereka.

3.1 Graf

The Graph sekarang telah sepenuhnya beralih ke layanan hosting subgraf terdesentralisasi, dengan insentif ekonomi mengalir antara peserta yang berbeda untuk memastikan operasi sistem:

· Hadiah Indeksir: Indeksir menghasilkan penghasilan melalui biaya kueri konsumen dan sebagian hadiah blok token GRT.

· Penghargaan Delegator: Delegator menerima bagian dari hadiah dari indexer yang mereka dukung.

· Hadiah Kurator: Jika kurator memberikan sinyal subgraf yang berharga, mereka dapat mendapatkan sebagian dari biaya kueri.

Sebenarnya, produk-produk The Graph sedang berkembang pesat dalam gelombang kecerdasan buatan. Sebagai salah satu tim pengembangan inti dalam ekosistem The Graph, Semiotic Labs telah fokus pada pemanfaatan teknologi kecerdasan buatan untuk mengoptimalkan harga indeks dan pengalaman kueri pengguna. Saat ini, alat-alat yang dikembangkan oleh Semiotic Labs, seperti AutoAgora, Allocation Optimizer, dan AgentC, meningkatkan berbagai aspek kinerja ekosistem.

· AutoAgora memperkenalkan mekanisme penetapan harga dinamis yang menyesuaikan harga secara real time berdasarkan volume permintaan dan penggunaan sumber daya, mengoptimalkan strategi penetapan harga untuk memastikan daya saing indekser dan memaksimalkan pendapatan.

· Alat Pemeliharaan Alokasi mengatasi masalah kompleks alokasi sumber daya subgraf, membantu indexer mencapai konfigurasi sumber daya yang optimal untuk meningkatkan pendapatan dan kinerja.

· AgentC adalah alat eksperimental yang memungkinkan pengguna mengakses data blockchain The Graph menggunakan bahasa alami, sehingga meningkatkan pengalaman pengguna.

Penerapan alat-alat ini telah memungkinkan The Graph untuk meningkatkan kecerdasan sistem dan kemudahan penggunaan dengan bantuan AI.

3.2 Chainbase

Chainbase adalah jaringan data komprehensif yang mengintegrasikan semua data blockchain ke dalam satu platform, sehingga memudahkan pengembang untuk membangun dan memelihara aplikasi. Fitur uniknya meliputi:

· Real-time Data Lake: Chainbase menyediakan danau data real-time khusus untuk aliran data blockchain, memungkinkan akses instan ke data sebagaimana data tersebut dihasilkan.

· Arsitektur Dua Rantai: Chainbase dibangun di atas Eigenlayer AVS, menciptakan lapisan eksekusi yang berjalan secara paralel dengan algoritma konsensus CometBFT. Desain ini meningkatkan pemrograman data lintas-rantai dan komposabilitas, mendukung throughput tinggi, latensi rendah, dan finalitas, sambil meningkatkan keamanan jaringan melalui model staking ganda.

· Standar Format Data Inovatif: Chainbase memperkenalkan standar format data baru yang disebut 'manuscripts', mengoptimalkan struktur dan pemanfaatan data dalam industri kripto.

· Model Dunia Kripto: Dengan sumber daya data blockchain yang luas, Chainbase menggabungkan teknologi model AI untuk membuat model AI yang efektif memahami, memprediksi, dan berinteraksi dengan transaksi blockchain. Model dasar, Theia, kini tersedia untuk penggunaan publik.

Fitur-fitur ini membedakan Chainbase dalam protokol indeks blockchain, berfokus pada aksesibilitas data real-time, format data inovatif, dan penciptaan model yang lebih cerdas melalui integrasi data on-chain dan off-chain untuk meningkatkan wawasan.

Model AI Chainbase, Theia, adalah sorotan utama yang membedakannya dari protokol layanan data lainnya. Berdasarkan model DORA dari NVIDIA, Theia belajar dan menganalisis pola kripto dengan mengintegrasikan data on-chain dan off-chain bersama dengan aktivitas spasial-temporal. Melalui penalaran sebab-akibat, ia merespons untuk mendalami eksplorasi nilai potensial dan pola data on-chain, menyediakan pengguna dengan layanan data yang lebih cerdas.

Layanan data yang didukung AI telah mengubah Chainbase dari sekadar platform layanan data blockchain menjadi penyedia layanan data cerdas yang lebih kompetitif. Dengan sumber daya data yang kuat dan analisis AI proaktif, Chainbase dapat memberikan wawasan data yang lebih luas dan mengoptimalkan alur kerja pemrosesan data pengguna.

3.3 Ruang dan Waktu

Space and Time (SxT) bertujuan untuk menciptakan lapisan perhitungan yang dapat diverifikasi yang memperluas bukti nol pengetahuan pada gudang data terdesentralisasi, menyediakan pemrosesan data yang dapat dipercaya untuk kontrak pintar, model bahasa besar, dan perusahaan. Space and Time baru-baru ini mengamankan $20 juta dalam putaran pendanaan Seri A terbarunya, yang dipimpin oleh Framework Ventures, Lightspeed Faction, Arrington Capital, dan Hivemind Capital.

Dalam bidang pengindeksan dan verifikasi data, Space and Time memperkenalkan pendekatan teknis baru—Proof of SQL. Ini adalah teknologi bukti pengetahuan nol (ZKP) inovatif yang dikembangkan oleh Space and Time yang memastikan kueri SQL yang dieksekusi pada gudang data terdesentralisasi tidak dapat dirusak dan dapat diverifikasi. Ketika sebuah kueri dijalankan, Proof of SQL menghasilkan bukti kriptografis yang memverifikasi integritas dan keakuratan hasil kueri. Bukti ini ditambahkan ke hasil kueri, memungkinkan setiap pemeriksa (seperti kontrak pintar) untuk secara independen mengonfirmasi bahwa data tidak dirusak selama pemrosesan. Jaringan blockchain tradisional biasanya mengandalkan mekanisme konsensus untuk memverifikasi keaslian data, sedangkan Proof of SQL dari Space and Time menerapkan metode verifikasi data yang lebih efisien. Secara khusus, dalam sistem Space and Time, satu node bertanggung jawab atas akuisisi data sementara node lain menggunakan teknologi zk untuk memverifikasi keaslian data tersebut. Pendekatan ini mengurangi konsumsi sumber daya dari beberapa node yang redundan mengindeks data yang sama untuk mencapai konsensus, dengan demikian meningkatkan kinerja sistem secara keseluruhan. Saat teknologi ini berkembang, ini menjadi batu penjuru bagi industri tradisional yang berfokus pada kehandalan data untuk membangun produk berbasis data blockchain.

Pada saat yang sama, SxT telah bekerja sama erat dengan laboratorium inovasi gabungan kecerdasan buatan Microsoft untuk mempercepat pengembangan alat AI generatif, memungkinkan pengguna untuk dengan mudah memproses data blockchain melalui bahasa alami. Saat ini, di Space and Time Studio, pengguna dapat memasukkan kueri bahasa alami, dan AI akan secara otomatis mengonversinya menjadi SQL dan menjalankan kueri atas nama pengguna untuk menyajikan hasil akhir yang dibutuhkan.

3.4 Perbandingan Perbedaan

4. Kesimpulan dan prospek

Secara keseluruhan, teknologi indeks data blockchain telah berkembang dari sumber data simpul awal, melalui pengembangan parsing data dan indexer, menjadi layanan data rantai penuh yang didukung kecerdasan buatan (AI), yang menandai proses perbaikan bertahap. Evolusi teknologi yang berkelanjutan ini tidak hanya meningkatkan efisiensi dan akurasi akses data tetapi juga memberikan pengalaman cerdas yang belum pernah terjadi sebelumnya bagi pengguna.

Ke depan, dengan pengembangan teknologi baru yang sedang berlangsung seperti AI dan zero-knowledge proofs, layanan data blockchain akan menjadi lebih cerdas dan aman. Kami memiliki alasan untuk percaya bahwa layanan data blockchain akan terus memainkan peran penting sebagai infrastruktur, memberikan dukungan kuat untuk kemajuan dan inovasi dalam industri.

Disclaimer:

  1. Artikel ini diperbanyak dari [Trustless Labs], hak cipta dimiliki oleh penulis asli [Trustless Labs], jika Anda memiliki keberatan terhadap penerbitan ulang, silakan hubungi Gate Belajartim, dan tim akan menanganinya sesegera mungkin sesuai dengan prosedur yang relevan.

  2. Penafian: Pandangan dan opini yang terdapat dalam artikel ini hanya mewakili pandangan pribadi penulis dan tidak merupakan saran investasi apa pun.

  3. Versi bahasa lain dari artikel ini diterjemahkan oleh tim Gate Learn dan tidak disebutkan di sini.Gate.io, artikel yang diterjemahkan tidak boleh direproduksi, didistribusikan, atau diplagiatkan.

* Ця інформація не є фінансовою порадою чи будь-якою іншою рекомендацією, запропонованою чи схваленою Gate.io.
* Цю статтю заборонено відтворювати, передавати чи копіювати без посилання на Gate.io. Порушення є порушенням Закону про авторське право і може бути предметом судового розгляду.
Розпочати зараз
Зареєструйтеся та отримайте ваучер на
$100
!