Memetakan Lanskap Data Web3

Menengah12/28/2023, 2:32:07 AM
Artikel ini menguraikan sejarah evolusi teknologi informasi, serta model bisnis data dan hubungan antara berbagai peran di era Web3.

Artikel ini awalnya diterbitkan di Decentralised.co. Kami di GCR akan memberikan kepada Anda formulir panjang dari Desentralisasi dua kali setiap Bulan – setiap Kamis bergantian! Decentralised.co dipercaya oleh manajemen di lebih dari 200 perusahaan untuk terus mengikuti perkembangan tren, data, dan wawasan yang penting. Daftar ke buletin mereka di bawah—lebih lanjut tentang kolaborasi ini untuk anggota kami yang paling aktif di Discord.

Berlangganan ke Desentralisasi.co


Hai,

Kami telah menulis pendahuluan untuk artikel ini pada tanggal 18 Juli jika Anda menginginkan konteks yang melampaui apa yang tertulis di sini.

Semua makhluk hidup menyimpan catatan tertentu. Hewan melacak musim untuk memahami kapan harus berburu. Hewan pengerat dan burung menyimpan makanan di tempat-tempat unik. Mereka perlu mengingat di mana mereka menyimpannya ketika mengaksesnya untuk mendapatkan makanan beberapa bulan kemudian. Serigala membuat tanda di sekeliling wilayahnya untuk memberi isyarat kepada hewan lain agar tidak masuk. Bahkan pohon pun mencatat waktu. Setiap tahun, sebuah cincin terbentuk di batang pohon. Seseorang dapat memperkirakan umur pohon berdasarkan jumlah cincinnya.

Meskipun pepohonan dan hewan dapat melacak waktu, mereka tidak dapat mengingat atau menceritakan masa lalu. Mereka tidak memiliki akses ke memori. Inilah yang membuat pencatatan manusia berbeda. Berkat kemampuan komunikasi kita, kita mengetahui bahwa bangsa Sumeria di Mesopotamia (3400 SM) dan Mesir kuno (3200 SM) menggunakan tulisan paku dan hieroglif untuk mencatat informasi.

Umat manusia berevolusi ketika pengetahuan dapat disebarkan tanpa memerlukan sumbernya untuk terlibat secara fisik. Kita membaca dan menikmati karya-karya Plato atau Socrates lama setelah mereka tiada karena kita mempunyai sarana untuk menyimpan ajaran mereka. Menulis adalah platform AR asli.

Menulis dari Iran mencatat gandum. Sumber: Tautan

Jika tulisan hanya menyisakan imajinasi, data membantu menjaga segala sesuatunya tetap objektif. Ini mengurangi kebutuhan individu untuk menyimpan sesuatu dalam memori mereka. Inilah salah satu alasan mengapa beberapa teks manusia tertua memuat catatan utang, pendapatan, atau perdagangan.

Menjadi Digital

Di era pasca-industri, perusahaan membangun parit kompetitif untuk memperkuat posisi pasar mereka dengan beralih ke digital dalam catatan penjualan mereka. Salah satu contohnya adalah perusahaan India bernama Asian Paints. Cat mereka mungkin bukan yang terbaik di pasar, namun mereka menguasai 50%+ pangsa pasar industri cat India senilai $8 miliar.

Mengapa? Jawaban mudahnya adalah merek tersebut merupakan merek rumah tangga, dan perusahaan tersebut memiliki skala ekonomi. Namun cara mereka sampai di sana berakar pada data. Mereka berinvestasi besar-besaran dalam pengumpulan dan pemrosesan data untuk mengoptimalkan rantai pasokan mereka.

Sebagai contoh, saham Asian Paints memiliki CAGR yang mengejutkan sebesar 25% selama 30 tahun terakhir. Pertumbuhan tersebut didukung oleh investasi pada komputer mainframe pada tahun 1970an. Perangkat ini lebih kuat daripada yang digunakan di organisasi penelitian terbaik di India pada saat itu. Mereka mengumpulkan data setiap jam tentang warna dan kuantitas cat yang terjual di seluruh India. Hal ini memungkinkan Asian Paints membuat model yang memprediksi permintaan cat di seluruh India dengan akurasi 98%.

Kekuatan prediktif ini memungkinkan Asian Paints mendapatkan nilai maksimum, karena dapat mengurangi waktu pengisian ulang secara drastis. Pada saat itu, norma menjual barang seperti cat adalah menjualnya ke pedagang grosir, yang kemudian memberikannya kepada distributor, yang kemudian menjualnya ke pedagang. Dealer akan berinteraksi langsung dengan konsumen. Alasan terjadinya rantai pasokan yang begitu rumit adalah karena masing-masing pihak mengadakan inventarisasi aset dan mengendalikan data pasokan dan permintaan cat.

Mr Choksey – pendiri cat Asia, menghapus pedagang grosir dan distributor dari rantai pasokan dengan mempelajari pola konsumsi pengguna akhir dan mengurangi ketergantungan pada perantara. Dengan menghilangkan perantara, Asian Paints memperoleh 97% MRP (3% untuk dealer) dibandingkan dengan 60% yang diperoleh pesaing mereka.


Nilai yang dapat diekstraksi dari telegraf akan menjadi pita ticker terdepan yang disiarkan melalui Telegrap.

Transisi ke digital tidak terjadi dalam semalam. Salah satu hal yang membuat pengumpulan data menarik adalah dunia keuangan dan betapa saling terhubungnya dunia tersebut secara perlahan. Misalnya, pada akhir abad ke-20, data pasar saham disampaikan melalui telegraf menggunakan perangkat seperti di atas. Sejak tahun 1835, para pedagang melatih merpati untuk membawa potongan kertas berisi informasi tentang apa yang terjadi di Eropa. Ketika kapal uap yang membawa barang datang dalam jarak 50 mil dari daratan, merpati akan terbang ke tempat yang ditentukan dengan membawa informasi tersebut. Pedagang biasanya membayar hingga $500 untuk setiap jam di muka agar mereka bisa mendapatkan berita.

Pada tahun 1867, para pedagang mulai berlomba-lomba untuk mengoptimalkan kecepatan penyampaian informasi melalui telegraf. Seorang Karyawan Western Union bernama E. A Calahan membayar lebih dari $200k ke NYSE untuk kemampuan mengirim karyawan di lantai bursa mereka untuk menyampaikan data ticker ke kliennya. Salah satu orang yang bekerja keras dalam mengoptimalkan sistem adalah seorang ilmuwan muda bernama Thomas Alva Edison. Satu abad kemudian, alat seperti terminal Bloomberg akan secara eksponensial mengukur kecepatan dan jumlah data keuangan yang disampaikan pada hari tertentu.

Mencetak Data Mentah

Data, seperti halnya minyak mentah, harus melalui beberapa tahap penyempurnaan sebelum dapat digunakan. Mempelajari bagaimana Bloomberg berkembang akan menjelaskan bagaimana keseluruhan lanskap data berevolusi dan proses apa yang terjadi. Bloomberg bukanlah upaya pertama yang menggunakan teknologi untuk meningkatkan mekanisme perdagangan dan pelaporan. NASDAQ menggunakan terminal Bunker Ramo untuk menyebarkan informasi dan menempatkan pesanan bid/ask. Namun, mengandalkan jaringan komunikasi telepon berarti bahwa penskalaan model ini akan selalu menjadi tantangan.


Sumber – NASDAQ – Evolusi Perdagangan OTC Otomatis

Pada tahun 1981, Michael Bloomberg, mitra di bank investasi Solomon Brothers, dipecat dengan $10 juta untuk ekuitasnya ketika Phibro Corporation mengakuisisi bank tersebut. Ia menyadari bahwa investor siap membayar untuk informasi keuangan yang disederhanakan dengan meningkatnya elektronifikasi pasar keuangan dari New York hingga Jepang. Dia memulai perusahaan layanan data bernama Innovative Market System, yang kemudian berganti nama menjadi Bloomberg pada tahun 1986.

Sebelum internet lepas landas, Terminal Bloomberg diakses menggunakan The Chiclet. Ini terhubung ke pengontrol Bloomberg melalui kabel khusus yang terhubung ke hub lokal melalui saluran telepon khusus. Bloomberg mengumpulkan data melalui kemitraan data, kantor berita dan siaran pers, metode kepemilikan seperti entri data manual dan pengumpulan data berbasis telepon.

Dengan adanya internet, pintu air informasi terbuka. Saat ini, Bloomberg mengadakan, memproses, dan mengirimkan 200 miliar informasi keuangan hampir secara real-time. Itu berarti sekitar 23 juta titik data per detik. Beberapa informasi yang tersedia di Bloomberg bersifat publik. Poin data seperti laporan keuangan perusahaan serta harga saham dan obligasi dapat ditemukan di forum publik.

Namun bagaimana jika Anda seorang analis migas dan ingin memahami pergerakan kontainer minyak mentah? Anda tidak mungkin mendapatkan informasi ini secara real-time jika Anda tidak berlangganan sumber data seperti Bloomberg. Tidak semua data di internet tersedia secara bebas.

Biasanya ada dua kendala bagi individu ketika berhubungan dengan data di Web2: akses yang diizinkan dan hambatan yang tinggi untuk memproses data dalam jumlah besar. Selama bertahun-tahun, penyedia layanan seperti Bloomberg telah membangun efek jaringan yang cukup kuat untuk mendapatkan data melalui afiliasi mereka, hal yang tidak mampu dilakukan oleh analis atau investor.

Lebih baik membayar $20.000 ke Bloomberg untuk berlangganan tahunan daripada mencoba mendapatkan data dari berbagai platform data yang masing-masing mungkin memiliki tingkat harga berbeda. Bahkan jika Anda bekerja cukup keras untuk mendapatkan datanya, Anda tidak dapat memproses dan menjalankan analitik secara real-time tanpa pengeluaran infrastruktur yang signifikan. Di sektor ritel, banyak platform yang pada akhirnya berkembang – adalah mesin pencocokan data.

Anggap saja seperti ini: Google (mesin pencari) adalah perusahaan data yang menawarkan akses bisnis kepada pengguna dengan imbalan uang iklan. Saat restoran atau buletin (seperti milik kami) ingin menargetkan pengguna yang menelusuri informasi di Google, mereka mencocokkan penawaran dan permintaan akan informasi serupa. Seseorang yang mencari informasi tentang buletin khusus Web3 sedang mencari kami. Dan kami sedang mencari orang itu. (Saya menahan keinginan untuk memasukkan program rujukan kami di sini.)

Google membangun monopoli karena skala ekonomi yang digunakannya. Inventaris pengguna dan jumlah pertanyaan yang dibuat pengguna setiap hari tetap tak tertandingi. Google membangun posisi tersebut dengan meluncurkan mesin pencari yang tidak memiliki iklan pada saat iklan merupakan hal yang lumrah, kemudian melalui akuisisi YouTube dan Android, dan pada akhirnya, melalui perusahaan berbayar seperti Apple untuk menjadikan Google sebagai mesin pencari default. Bagi Apple saja, Google membayar $20 miliar per tahun untuk tetap menjadi mesin pencari default di Safari.

Google membayar premi tersebut karena, pada intinya, penawarannya adalah mesin yang cocok. Mesin pencocokan menghubungkan pengguna yang memiliki kebutuhan dengan bisnis yang memiliki penawaran. Sebagian besar monopoli web, pada intinya, adalah mesin pencocokan. Amazon mencocokkan penjual produk dengan pembeli. Instagram mencocokkan audiens dengan pembuat konten. Mesin pencocokan ini berfungsi karena interaksi pada produk ini meninggalkan banyak jejak yang dapat digunakan untuk mengarahkan konteks.

Ben Evans dengan terkenal menulis pada tahun 2022 bahwa tidak ada yang namanya data. Mengetahui konten, makanan, atau preferensi perjalanan saya tidak terlalu berarti bagi pihak ketiga. Hal ini menjadi berharga – untuk perdagangan atau penelitian – hanya jika hal tersebut dikumpulkan atau diperkaya dengan konteks.

Konteks dalam arti bahwa preferensi saya untuk makan biriyani pada Jumat malam dapat digunakan untuk mengiklankan pengiriman biriyani kepada saya pada saat kemungkinan saya membelinya paling tinggi. Secara keseluruhan, membandingkan kemungkinan pembelian saya dengan rekan di wilayah yang sama membantu menargetkan pengguna dengan lebih baik.

Data memerlukan skala (dalam jumlah besar) atau konteks agar bernilai. Perbedaan historis produk Web3 dan Web2 terletak pada jalur yang ditinggalkannya. Hanya Amazon yang mengetahui berapa banyak pengontrol Xbox yang akan terjual dalam minggu tertentu. Namun Anda bisa melihat pola pedagang membeli atau menjual NFT di OpenSea setiap hari. Pasalnya, setiap transaksi tersebut meninggalkan jejak publik.

Produk data di Web3 menggunakan jalur tersebut untuk membangun konteks.

Blockchain seperti Ethereum dan Bitcoin menghasilkan blok masing-masing setiap 12 detik dan ~10 menit. Setiap blok berisi transaksi yang mengubah keadaan blockchain. Penjelajah blok seperti Etherscan menangkap data yang terkait dengan semua transaksi. Misalnya, jika Anda membuka Etherscan dan melihat sebuah blok, gambar di bawah ini adalah gambar yang mungkin Anda lihat.

Transaksi di blockchain kaya akan konteks. Produk seperti Arkham dan Nansen adalah mesin interpretasi bagi peneliti untuk memahami apa yang terjadi ketika suatu transaksi terjadi.

Anda dapat melihat semua blok sejak Ethereum dimulai. Namun apa yang dapat Anda lakukan dengan informasi ini? Hampir tidak ada. Jadi, Anda memerlukan cara untuk menangkap data ini dalam beberapa tabel. Misalnya, setiap kali kontrak NFT dari suatu pasar dipanggil dalam sebuah blok, data yang terkait dengan transaksi tersebut harus ditambahkan ke tabel terkait NFT, atau ketika kontrak Uniswap dipanggil, data terkait harus disimpan dalam tabel terkait DEX . (Dune melakukan ini sebagai layanan.)

Anda tidak dapat menganalisis data mentah tanpa menimbulkan biaya infrastruktur yang signifikan. Jadi, meskipun datanya tersedia secara gratis, Anda mengalami masalah yang sama. Anda mengandalkan data eksternal sebagai investor atau pembuat dApp. Namun fungsi inti Anda tidak terkait dengan pengumpulan dan pengelolaan data. Menghabiskan sumber daya untuk aktivitas-aktivitas penting namun non-inti bukanlah suatu kemewahan yang dapat dinikmati oleh setiap organisasi.

Konteks Mendorong Nilai

Untuk produk data, konteks seputar data menjadikan produk tersebut unik. Bloomberg menerapkan pemahaman finansialnya dan mengubah data ke dalam bentuk yang mudah dikonsumsi oleh para penemu dan pedagang. Situs web seperti Sameweb atau publikasi penelitian seperti Newzoo menggunakan kompetensi inti mereka untuk menerapkan konteks terkait sosial atau game pada data yang mereka lacak.

Produk data asli Blockchain membedakan dirinya dengan menyediakan konteks pengguna melalui pertanyaan yang menjawab pertanyaan yang relevan dengan subkumpulan pengguna tertentu. Misalnya, TokenTerminal menghitung fundamental ekonomi dari protokol. Nansen membantu pelaku pasar memberi label dan memahami pergerakan aset. Parsec menanyakan data on-chain untuk membantu pedagang menganalisis posisi DeFi dengan lebih baik.

Semua produk ini merupakan barang publik: data on-chain. Perbedaannya terletak pada cara produk-produk ini menyajikan datanya, yang membuatnya menarik bagi audiens yang berbeda.

Pembagian kategori produk di industri kami didasarkan pada data apa yang masuk dalam rantai dan informasi apa yang diperoleh dari sumber di luar rantai. (Beberapa sering menggunakan keduanya.) Penyedia data menggunakan filter konteksnya untuk membuat produk. Sama seperti data Web2 yang memiliki ceruk tersendiri, perusahaan data Web3 telah membangun atau secara bertahap membangun parit menggunakan kompetensi inti mereka.

Oleh karena itu, latar belakang pendiri sering kali menentukan sifat produk yang dirilis. Ketika tim inti telah menghabiskan banyak waktu di pasar modal sebelum kripto, produk mereka cenderung meniru Bloomberg, sedangkan produk asli kripto terlihat seperti Nansen. Produk yang berbeda memenuhi kebutuhan yang berbeda, bahkan ketika menanyakan data yang sama.

Misalnya, pertukaran biasanya membuang data setelah interval tetap. Mereka tidak berkecimpung dalam bisnis data, dan menyimpan data lama memerlukan server dan manajemen tambahan. Beberapa penyedia data, seperti Kaiko dan Amberdata, menyimpan data buku pesanan historis dari bursa. Data tersebut memungkinkan pedagang dan investor membangun model untuk menguji hipotesis mereka. Tetapi jika Anda ingin memahami kontrak DeFi mana yang mendapatkan aliran masuk ETH atau stablecoin atau menganalisis perilaku on-chain dari alamat atau entitas tertentu, Anda memerlukan produk dari Nansen atau Arkham.

Peta pasar tidak mewakili setiap pemain di setiap kategori.

Salah satu cara untuk memahami bagaimana produk diposisikan di pasar adalah melalui lensa persona konsumen dalam kripto. Persona ini dapat diklasifikasikan ke dalam empat kategori utama berikut.

Lembaga keuangan

Sebagian besar dolar yang mengalir melalui produk data kripto berasal dari lembaga keuangan selama pasar sedang bearish. Mereka adalah pelanggan besar dengan siklus penjualan yang lebih panjang dan kebutuhan data yang jauh lebih kompleks. Salah satu cara untuk mengetahui apakah suatu produk berorientasi pada lembaga keuangan adalah jika pelanggan harus melalui panggilan penjualan untuk menentukan berapa biayanya. Di dunia Web2, Anda tidak dapat mengetahui berapa biaya PitchBook atau CB Insights. Dalam kripto, Anda tidak tahu berapa harga produk seperti Chainalysis.

Selain bercanda, salah satu alasan proses penjualan tersebut adalah layanan langsung dan praktis yang ditawarkan oleh produk data yang berorientasi pada segmen konsumen ini. Pengguna ini biasanya memilih data yang sangat terperinci dan sering. Mereka memerlukan data tidak hanya untuk pengambilan keputusan sebelum perdagangan tetapi juga untuk penggunaan pasca-perdagangan guna memenuhi persyaratan kepatuhan dan perpajakan.

Misalnya, mereka membutuhkan produk yang memberi tahu mereka berapa nilai portofolio mereka secara historis, membantu mereka dalam perhitungan pajak, dan sebagainya. Perusahaan seperti Amberdata, Kaiko, CoinMetrics, CryptoCompare, dan, sampai batas tertentu, Nansen, melayani pelanggan ini.

Berdasarkan pengalaman saya, hanya para pendiri dengan latar belakang bekerja di institusi atau tim dengan putaran pendanaan besar yang mampu membuka pasar institusional untuk mendapatkan data. Hambatan untuk masuk ke pasar ini relatif tinggi, seperti yang terjadi pada produk perusahaan mana pun.

Pengembang

Kita sering menemukan fitur komposisi Web3, yang berarti aplikasi Web3 dapat saling bergantung. Mereka mungkin memerlukan data satu sama lain. Jadi, mereka terus-menerus perlu membaca data satu sama lain. Misalnya, platform seperti Yearn Finance perlu membaca data dari Aave dan Compound, dan agregator NFT seperti Tensor perlu membaca data dari Magic Eden dan pasar lainnya.

Namun data ini disimpan di seluruh blok pada rantai seperti Ethereum dan Solana. Ethereum membuat blok dalam 12 detik, dan Solana melakukannya dalam 400 ms. Menyortir data blockchain ke dalam tabel dan menyimpannya untuk akses cepat adalah tugas yang tidak sepele. Di sinilah pengindeks seperti Covalent, Graph, Chainlink, dan Powerloom berperan. Mereka memastikan bahwa data mentah blockchain disimpan dalam format yang diinginkan sehingga pengembang dapat mengambilnya melalui panggilan API sederhana.

Segmen yang muncul dalam persona konsumen ini melibatkan alat yang digunakan untuk memahami perilaku pengguna. Misalnya, ARCx memungkinkan pengembang untuk memetakan data off-chain (seperti perilaku browser) dengan data on-chain (seperti alamat dompet) untuk menangkap informasi demografis pengguna yang berinteraksi dengan dApp. Mereka berada dalam ceruk yang relatif kecil namun relevan karena membantu pengembang mengidentifikasi siapa penggunanya.

Peneliti dan Publikasi

Produk data dalam kripto sering kali didistribusikan melalui kolaborasi dengan peneliti dan publikasi. CCData, misalnya, sering dikutip di Bloomberg. Para peneliti diberi insentif untuk bersandar pada produk data karena mereka membantu menghemat waktu dan tenaga saat mengumpulkan, membersihkan, atau melakukan kurasi data. Produk seperti Dune telah membangun parit dengan membangun komunitas analis yang bersaing satu sama lain untuk mendapatkan peringkat lebih tinggi dalam daftar mereka.

Publikasi seperti The Block dan Delphi menampilkan dasbor yang dibuat menggunakan data dari penyedia pihak ketiga. Di Decentralised.co, kami bergantung sepenuhnya pada penyedia data eksternal karena mereka membantu menjaga tim tetap ramping saat menggunakan sumber daya eksternal saat mengumpulkan data.

Tantangan dalam melayani segmen konsumen ini adalah bahwa peneliti kecil mungkin tidak memiliki anggaran yang diperlukan untuk membenarkan pengeluaran sumber daya yang sangat besar guna memunculkan wawasan khusus yang mungkin hanya relevan bagi satu orang. Sebaliknya, perusahaan mendapat insentif yang besar untuk menghabiskan upaya dan sumber daya dengan bermitra dengan publikasi penting seperti Financial Times untuk membantu distribusi.

Investor ritel

Produk yang berorientasi pada investor ritel biasanya memiliki rincian dan frekuensi data yang lebih rendah. Namun mereka merupakan ceruk yang sangat menguntungkan untuk dibangun karena mereka melihat skala ekonominya. Sepuluh ribu pengguna yang membayar $100 masing-masing adalah bisnis ARR senilai $1 juta di dunia di mana tidak ada churn. Hal ini lebih mudah diucapkan daripada dilakukan, tetapi ilmu ekonomi tersebut menjelaskan mengapa kita memiliki begitu banyak produk data kripto yang berorientasi ritel.

Sebagian besar produk berorientasi ritel gratis atau didukung oleh iklan. Misalnya, sumber daya gratis seperti DefiLlama tidak akan memberi tahu Anda cara merutekan pesanan Anda melalui bursa yang berbeda (CEX dan DEX) untuk menghindari selip karena tidak mengambil cuplikan buku pesanan, tetapi menampilkan informasi tentang pembukaan kunci token atau pembukaan hasil.

Salah satu perubahan di segmen konsumen ini adalah bagaimana media pengiriman membuka kategori pasar baru—misalnya, Cielo mengirimkan data sebagai notifikasi melalui Telegram. Ini telah menjangkau lebih dari 40.000 pengguna dengan menyampaikan informasi dengan cara yang mudah dikonsumsi untuk segmen konsumen yang tidak ingin berurusan dengan antarmuka desktop. Jika dilakukan dengan benar, media distribusi yang merata dapat menjadi pembeda bagi usaha tahap awal. Bahkan dalam data.

Meskipun klasifikasinya kabur, perusahaan data dapat dibagi menjadi orientasi B2B atau B2C.

Perusahaan seperti Amberdata dan Kaiko memiliki produk yang diperuntukkan bagi aktor canggih. Produk-produk ini lebih terperinci (rincian datanya tersedia) dan sering (misalnya data tick-by-tick dan buku pesanan real-time), dan memenuhi tuntutan seperti pembuatan dan pengujian model, analisis pra-perdagangan, pelaporan pasca-perdagangan, perpajakan, dan kepatuhan. Data disediakan dalam format yang memungkinkan pelanggan melakukan analisis eksklusif dan membuat visualisasi sesuai selera mereka. Perusahaan-perusahaan ini biasanya menawarkan produk mereka di balik paywall.

Biaya umumnya merupakan fungsi perincian karena kebutuhan infrastruktur, sifat pelanggan yang terlibat, dan lamanya siklus penjualan.

Gambar di atas memetakan produk yang berbeda pada dua sumbu – kedalaman dan rincian vs. harga produk. Harap dicatat bahwa plot ini tidak tepat. Beberapa poin mungkin salah sasaran. Idenya adalah untuk mengembangkan model mental untuk memikirkan beberapa produk dan kedudukannya di pasar.

Produk yang berfokus pada ritel seperti Dune atau CoinGecko menampilkan hampir semua data secara gratis. Pelanggan harus membayar untuk mengakses beberapa data atau jika mereka menginginkan data melalui API untuk menjalankan analisis mereka. Misalnya, Anda dapat melihat semua bagan yang dibuat oleh beberapa penyihir Dune, namun mereka membatasi berapa banyak baris yang dapat Anda unduh dalam bentuk CSV. Anda dapat mendownload file CSV yang lebih besar dan melihat pertanyaan pribadi saat Anda membayar lebih.

Perusahaan yang berfokus pada ritel cenderung memiliki pendapatan per pelanggan yang rendah dan sedikit pelanggan yang membayar sebagai persentase pengguna gratis. Bandingkan ini dengan tingkat konversi untuk model perusahaan internet freemium. Biasanya, rasio konversinya adalah 2%–5%. Tingkat konversi 10% akan menjadi hal yang aneh. Pedoman mereka adalah memiliki pelanggan gratis sebanyak mungkin sehingga tingkat konversi 4% memberikan kontribusi signifikan terhadap pendapatan. Inilah yang kami sebut bagian atas corong.

Jadi, perusahaan data memerlukan bagian atas saluran yang cukup besar untuk menghasilkan pendapatan yang cukup guna mempertahankan diri mereka pada tingkat konversi yang lebih rendah. Perusahaan juga dapat mempertimbangkan untuk menghasilkan pendapatan dari iklan ketika situs tersebut memiliki banyak pengunjung. CoinGecko menggunakan pendapatan iklan sebagai pengaruh untuk terus menyediakan sebagian besar data secara gratis.

Selama bertahun-tahun, perusahaan telah mengisi posisi di kedua ujung spektrum (B2B dan B2C), sehingga menyisakan beberapa kesenjangan di antara keduanya. Jika seseorang ingin melihat bagaimana buku pesanan berubah di bursa terpusat atau bagaimana rasio panggilan, IV, dan kemiringan berubah, tidak banyak produk yang membantu visualisasi. Ada ruang untuk produk yang lebih terperinci daripada CoinGecko di dunia, tetapi kurang terperinci dibandingkan produk dari pemain B2B murni.

Di Parit

Menemukan parit pada bisnis yang bahan bakunya gratis tidaklah mudah. Data Blockchain tersedia secara gratis. Tidak ada hak milik atas data apa yang dapat Anda kumpulkan. Jadi, kegagalan dalam bisnis data tidak hanya didasarkan pada Anda memiliki beberapa data yang tidak dimiliki orang lain. Sebaliknya, data tersebut didasarkan pada kemampuan tim untuk menyediakan data dalam format yang berwawasan luas, dapat dikonsumsi, tepat waktu, dan tanpa kesalahan.

Banyak perusahaan yang mengaku memiliki data yang sama, namun kualitas data dan penyajiannya berbeda. Misalnya, banyak perusahaan mengklaim memiliki data buku pesanan off-chain. Namun, faktor-faktor seperti jumlah pesanan bid/ask, durasi rangkaian waktu, dan jumlah bursa dan pasangan yang tersedia berbeda dari satu penyedia ke penyedia lainnya. Amberdata dan Kaiko memiliki data buku pesanan terlengkap untuk pasar kripto.

Namun mengapa hanya sedikit penyedia yang dapat menyediakan data seperti ini? Penjelasan mengenai munculnya parit dalam data Web3 ada di sini.

Bakat – Dengan risiko menyatakan hal yang sudah jelas, ketika bahan bakunya gratis, cara Anda mencetaknya menentukan nilai produk. Mengubah data mentah menjadi informasi yang berguna memerlukan keahlian domain di banyak bidang dalam kripto dan pasar keuangan tradisional. Tim seperti Velo Data, dengan pengalaman di pasar tradisional, memiliki keunggulan dibandingkan tim lain yang mencoba membangun produk B2C serupa. Jarang ditemukan pengembang berbakat yang memahami struktur data blockchain dan memiliki pengalaman relevan di pasar keuangan.

Infrastruktur – Mengumpulkan dan mengirimkan data dalam jumlah besar memerlukan infrastruktur yang tidak mudah. Operasi semacam ini membutuhkan modal dan bakat. Mengapa infrastruktur berupa parit? Pikirkan data kumpulan memori. Blok berisi data untuk transaksi yang dikonfirmasi. Bagaimana dengan transaksi yang belum dikonfirmasi?

Node jaringan yang berbeda (misalnya, node yang terhubung ke kumpulan yang sama) melihat transaksi berbeda yang belum dikonfirmasi. Menjalankan hanya satu node tidak akan memberikan pandangan global tentang transaksi yang bersaing. Mempertahankan banyak node di beberapa blockchain menambah biaya infrastruktur. Sama seperti AI (dan jaringan konten di masa lalu), kemampuan untuk menjaga biaya perangkat keras tetap rendah sambil melakukan penskalaan akan menentukan pemenang dan pecundang di sektor ini dari waktu ke waktu.

Efek Jaringan – Seseorang dapat berhipotesis bahwa efek jaringan ada di banyak produk data kripto. Ambil Chainlink sebagai contoh. Itu adalah salah satu oracle pertama yang memungkinkan aplikasi membaca data dari aplikasi atau rantai lain. Ini berhasil mengumpulkan dukungan komunitas dan memiliki salah satu komunitas terkuat. Contoh lainnya adalah Nansen. Klaim ketenarannya adalah label alamat yang memungkinkannya mengatribusikan pergerakan aset ke entitas nyata, bukan alamat heksanumerik.

Selanjutnya, ia meluncurkan fitur seperti NFT Paradise dan Token God Mode, memungkinkan pengguna melacak NFT dan token dengan lebih efektif. Arkham meluncurkan produk yang mirip dengan label Nansen, namun investasi pada dasbor dan penelitian memungkinkan Nansen bermanuver ke klien perusahaan dan menawarkan produk yang disesuaikan untuk mereka. Perlu disebutkan bahwa efek jaringan tidak mungkin terjadi tanpa dua poin pertama (bakat dan infrastruktur).

Salah satu tempat kerjanya adalah dengan pengindeks. Semakin tinggi jumlah rantai yang didukung suatu produk, semakin tinggi kemungkinan pengembang akan menggunakan produk tersebut dibandingkan mengandalkan berbagai sumber. Tim seperti Covalent memiliki keunggulan di sini karena mereka telah mengoptimalkan luasnya rantai yang didukung selama beberapa waktu. Namun perlu diingat bahwa kedalaman sama pentingnya dengan keluasan.

Masih terlalu dini untuk mengatakan apakah suatu produk memiliki pengaruh yang berarti dalam kripto. Kita telah menyaksikan keuntungan bagi para penggerak awal dalam skema besar. Ketika kategori seperti sosial Web3 dan tumpang tindih antara AI dan kripto terus meningkat, produk data dalam industri ini mungkin akan tumbuh menjadi Alphabet berikutnya. Tapi itu akan menjadi cerita multi-dekade; kita masih berada di tahun-tahun awal.

Melampaui Spekulasi

Banyak kasus penggunaan yang kami sebutkan dalam artikel ini membahas spekulasi keuangan dalam beberapa bentuk atau lainnya. Bahkan pengembang yang menggunakan API untuk menanyakan data sedang membangun produk keuangan. Ini mungkin tampak aneh, tetapi blockchain (sebagai jaringan baru) mengikuti tren yang sama seperti Telegraph dan Internet.

Hadirnya media baru dan munculnya jaringan baru mempercepat kasus penggunaan finansial. Dengan adanya internet, dibutuhkan waktu hingga awal tahun 2000an bagi masyarakat untuk menyadari bahwa pengguna dapat ditargetkan berdasarkan lokasi mereka. Dengan blockchain, kami masih mencari cara untuk membangun model bisnis dari jalur data yang tersedia untuk umum.

Kami telah melihat satu perubahan penting dalam penggunaan platform ini sehari-hari – Dune Analytics menyematkan AI pada produk mereka. Dune menyediakan antarmuka berbasis SQL bagi pengguna untuk menanyakan data dari blockchain seperti Ethereum dan Solana. Pasar untuk produk semacam itu biasanya terbatas pada pengguna yang memahami cara menulis kueri SQL. Mereka baru-baru ini mulai menggunakan AI untuk membantu analis menghasilkan kueri tanpa menjadi ahli SQL. Ini tidak berfungsi seperti yang diharapkan. Tapi ini masih merupakan langkah menuju masa depan. Mungkin tidak lama lagi kita akan meminta AI (seperti ChatGPT) untuk menanyakan data dari blockchain dan menawarkan analisisnya.

Salah satu cara untuk memikirkan “data” dalam konteks Web3 adalah melalui lensa Google Maps. GPS telah ada setidaknya sejak tahun 1980an. Google melakukan pekerjaan yang diperlukan untuk memetakan dunia. Dalam membuat overlay peta tersedia untuk aplikasi pihak ketiga (menggunakan API), perusahaan ini memungkinkan pembuatan aplikasi generasi baru. Segala sesuatu mulai dari pengiriman hingga ride-hailing berkembang pesat karena satu pemain yang berspesialisasi dalam data mengambil alih beban tersebut dari pengembang.

Produk data di Web3 akan memainkan peran serupa. Kami belum mengetahui secara pasti sifat aplikasi yang dapat dibangun berdasarkan sumber daya yang tersedia untuk umum ini, namun menjadi jelas bahwa ada peluang sebesar Alphabet dalam lanskap data.

Penafian:

  1. Artikel ini dicetak ulang dari [GCR]. Semua hak cipta milik penulis asli [Saurabh Deshpande、 Siddharth、Joel]. Jika ada keberatan terhadap cetak ulang ini, silakan menghubungi tim Gate Learn , dan mereka akan segera menanganinya.
  2. Penafian Tanggung Jawab: Pandangan dan pendapat yang diungkapkan dalam artikel ini adalah sepenuhnya milik penulis dan bukan merupakan nasihat investasi apa pun.
  3. Terjemahan artikel ke bahasa lain dilakukan oleh tim Gate Learn. Kecuali disebutkan, dilarang menyalin, mendistribusikan, atau menjiplak artikel terjemahan.

Memetakan Lanskap Data Web3

Menengah12/28/2023, 2:32:07 AM
Artikel ini menguraikan sejarah evolusi teknologi informasi, serta model bisnis data dan hubungan antara berbagai peran di era Web3.

Artikel ini awalnya diterbitkan di Decentralised.co. Kami di GCR akan memberikan kepada Anda formulir panjang dari Desentralisasi dua kali setiap Bulan – setiap Kamis bergantian! Decentralised.co dipercaya oleh manajemen di lebih dari 200 perusahaan untuk terus mengikuti perkembangan tren, data, dan wawasan yang penting. Daftar ke buletin mereka di bawah—lebih lanjut tentang kolaborasi ini untuk anggota kami yang paling aktif di Discord.

Berlangganan ke Desentralisasi.co


Hai,

Kami telah menulis pendahuluan untuk artikel ini pada tanggal 18 Juli jika Anda menginginkan konteks yang melampaui apa yang tertulis di sini.

Semua makhluk hidup menyimpan catatan tertentu. Hewan melacak musim untuk memahami kapan harus berburu. Hewan pengerat dan burung menyimpan makanan di tempat-tempat unik. Mereka perlu mengingat di mana mereka menyimpannya ketika mengaksesnya untuk mendapatkan makanan beberapa bulan kemudian. Serigala membuat tanda di sekeliling wilayahnya untuk memberi isyarat kepada hewan lain agar tidak masuk. Bahkan pohon pun mencatat waktu. Setiap tahun, sebuah cincin terbentuk di batang pohon. Seseorang dapat memperkirakan umur pohon berdasarkan jumlah cincinnya.

Meskipun pepohonan dan hewan dapat melacak waktu, mereka tidak dapat mengingat atau menceritakan masa lalu. Mereka tidak memiliki akses ke memori. Inilah yang membuat pencatatan manusia berbeda. Berkat kemampuan komunikasi kita, kita mengetahui bahwa bangsa Sumeria di Mesopotamia (3400 SM) dan Mesir kuno (3200 SM) menggunakan tulisan paku dan hieroglif untuk mencatat informasi.

Umat manusia berevolusi ketika pengetahuan dapat disebarkan tanpa memerlukan sumbernya untuk terlibat secara fisik. Kita membaca dan menikmati karya-karya Plato atau Socrates lama setelah mereka tiada karena kita mempunyai sarana untuk menyimpan ajaran mereka. Menulis adalah platform AR asli.

Menulis dari Iran mencatat gandum. Sumber: Tautan

Jika tulisan hanya menyisakan imajinasi, data membantu menjaga segala sesuatunya tetap objektif. Ini mengurangi kebutuhan individu untuk menyimpan sesuatu dalam memori mereka. Inilah salah satu alasan mengapa beberapa teks manusia tertua memuat catatan utang, pendapatan, atau perdagangan.

Menjadi Digital

Di era pasca-industri, perusahaan membangun parit kompetitif untuk memperkuat posisi pasar mereka dengan beralih ke digital dalam catatan penjualan mereka. Salah satu contohnya adalah perusahaan India bernama Asian Paints. Cat mereka mungkin bukan yang terbaik di pasar, namun mereka menguasai 50%+ pangsa pasar industri cat India senilai $8 miliar.

Mengapa? Jawaban mudahnya adalah merek tersebut merupakan merek rumah tangga, dan perusahaan tersebut memiliki skala ekonomi. Namun cara mereka sampai di sana berakar pada data. Mereka berinvestasi besar-besaran dalam pengumpulan dan pemrosesan data untuk mengoptimalkan rantai pasokan mereka.

Sebagai contoh, saham Asian Paints memiliki CAGR yang mengejutkan sebesar 25% selama 30 tahun terakhir. Pertumbuhan tersebut didukung oleh investasi pada komputer mainframe pada tahun 1970an. Perangkat ini lebih kuat daripada yang digunakan di organisasi penelitian terbaik di India pada saat itu. Mereka mengumpulkan data setiap jam tentang warna dan kuantitas cat yang terjual di seluruh India. Hal ini memungkinkan Asian Paints membuat model yang memprediksi permintaan cat di seluruh India dengan akurasi 98%.

Kekuatan prediktif ini memungkinkan Asian Paints mendapatkan nilai maksimum, karena dapat mengurangi waktu pengisian ulang secara drastis. Pada saat itu, norma menjual barang seperti cat adalah menjualnya ke pedagang grosir, yang kemudian memberikannya kepada distributor, yang kemudian menjualnya ke pedagang. Dealer akan berinteraksi langsung dengan konsumen. Alasan terjadinya rantai pasokan yang begitu rumit adalah karena masing-masing pihak mengadakan inventarisasi aset dan mengendalikan data pasokan dan permintaan cat.

Mr Choksey – pendiri cat Asia, menghapus pedagang grosir dan distributor dari rantai pasokan dengan mempelajari pola konsumsi pengguna akhir dan mengurangi ketergantungan pada perantara. Dengan menghilangkan perantara, Asian Paints memperoleh 97% MRP (3% untuk dealer) dibandingkan dengan 60% yang diperoleh pesaing mereka.


Nilai yang dapat diekstraksi dari telegraf akan menjadi pita ticker terdepan yang disiarkan melalui Telegrap.

Transisi ke digital tidak terjadi dalam semalam. Salah satu hal yang membuat pengumpulan data menarik adalah dunia keuangan dan betapa saling terhubungnya dunia tersebut secara perlahan. Misalnya, pada akhir abad ke-20, data pasar saham disampaikan melalui telegraf menggunakan perangkat seperti di atas. Sejak tahun 1835, para pedagang melatih merpati untuk membawa potongan kertas berisi informasi tentang apa yang terjadi di Eropa. Ketika kapal uap yang membawa barang datang dalam jarak 50 mil dari daratan, merpati akan terbang ke tempat yang ditentukan dengan membawa informasi tersebut. Pedagang biasanya membayar hingga $500 untuk setiap jam di muka agar mereka bisa mendapatkan berita.

Pada tahun 1867, para pedagang mulai berlomba-lomba untuk mengoptimalkan kecepatan penyampaian informasi melalui telegraf. Seorang Karyawan Western Union bernama E. A Calahan membayar lebih dari $200k ke NYSE untuk kemampuan mengirim karyawan di lantai bursa mereka untuk menyampaikan data ticker ke kliennya. Salah satu orang yang bekerja keras dalam mengoptimalkan sistem adalah seorang ilmuwan muda bernama Thomas Alva Edison. Satu abad kemudian, alat seperti terminal Bloomberg akan secara eksponensial mengukur kecepatan dan jumlah data keuangan yang disampaikan pada hari tertentu.

Mencetak Data Mentah

Data, seperti halnya minyak mentah, harus melalui beberapa tahap penyempurnaan sebelum dapat digunakan. Mempelajari bagaimana Bloomberg berkembang akan menjelaskan bagaimana keseluruhan lanskap data berevolusi dan proses apa yang terjadi. Bloomberg bukanlah upaya pertama yang menggunakan teknologi untuk meningkatkan mekanisme perdagangan dan pelaporan. NASDAQ menggunakan terminal Bunker Ramo untuk menyebarkan informasi dan menempatkan pesanan bid/ask. Namun, mengandalkan jaringan komunikasi telepon berarti bahwa penskalaan model ini akan selalu menjadi tantangan.


Sumber – NASDAQ – Evolusi Perdagangan OTC Otomatis

Pada tahun 1981, Michael Bloomberg, mitra di bank investasi Solomon Brothers, dipecat dengan $10 juta untuk ekuitasnya ketika Phibro Corporation mengakuisisi bank tersebut. Ia menyadari bahwa investor siap membayar untuk informasi keuangan yang disederhanakan dengan meningkatnya elektronifikasi pasar keuangan dari New York hingga Jepang. Dia memulai perusahaan layanan data bernama Innovative Market System, yang kemudian berganti nama menjadi Bloomberg pada tahun 1986.

Sebelum internet lepas landas, Terminal Bloomberg diakses menggunakan The Chiclet. Ini terhubung ke pengontrol Bloomberg melalui kabel khusus yang terhubung ke hub lokal melalui saluran telepon khusus. Bloomberg mengumpulkan data melalui kemitraan data, kantor berita dan siaran pers, metode kepemilikan seperti entri data manual dan pengumpulan data berbasis telepon.

Dengan adanya internet, pintu air informasi terbuka. Saat ini, Bloomberg mengadakan, memproses, dan mengirimkan 200 miliar informasi keuangan hampir secara real-time. Itu berarti sekitar 23 juta titik data per detik. Beberapa informasi yang tersedia di Bloomberg bersifat publik. Poin data seperti laporan keuangan perusahaan serta harga saham dan obligasi dapat ditemukan di forum publik.

Namun bagaimana jika Anda seorang analis migas dan ingin memahami pergerakan kontainer minyak mentah? Anda tidak mungkin mendapatkan informasi ini secara real-time jika Anda tidak berlangganan sumber data seperti Bloomberg. Tidak semua data di internet tersedia secara bebas.

Biasanya ada dua kendala bagi individu ketika berhubungan dengan data di Web2: akses yang diizinkan dan hambatan yang tinggi untuk memproses data dalam jumlah besar. Selama bertahun-tahun, penyedia layanan seperti Bloomberg telah membangun efek jaringan yang cukup kuat untuk mendapatkan data melalui afiliasi mereka, hal yang tidak mampu dilakukan oleh analis atau investor.

Lebih baik membayar $20.000 ke Bloomberg untuk berlangganan tahunan daripada mencoba mendapatkan data dari berbagai platform data yang masing-masing mungkin memiliki tingkat harga berbeda. Bahkan jika Anda bekerja cukup keras untuk mendapatkan datanya, Anda tidak dapat memproses dan menjalankan analitik secara real-time tanpa pengeluaran infrastruktur yang signifikan. Di sektor ritel, banyak platform yang pada akhirnya berkembang – adalah mesin pencocokan data.

Anggap saja seperti ini: Google (mesin pencari) adalah perusahaan data yang menawarkan akses bisnis kepada pengguna dengan imbalan uang iklan. Saat restoran atau buletin (seperti milik kami) ingin menargetkan pengguna yang menelusuri informasi di Google, mereka mencocokkan penawaran dan permintaan akan informasi serupa. Seseorang yang mencari informasi tentang buletin khusus Web3 sedang mencari kami. Dan kami sedang mencari orang itu. (Saya menahan keinginan untuk memasukkan program rujukan kami di sini.)

Google membangun monopoli karena skala ekonomi yang digunakannya. Inventaris pengguna dan jumlah pertanyaan yang dibuat pengguna setiap hari tetap tak tertandingi. Google membangun posisi tersebut dengan meluncurkan mesin pencari yang tidak memiliki iklan pada saat iklan merupakan hal yang lumrah, kemudian melalui akuisisi YouTube dan Android, dan pada akhirnya, melalui perusahaan berbayar seperti Apple untuk menjadikan Google sebagai mesin pencari default. Bagi Apple saja, Google membayar $20 miliar per tahun untuk tetap menjadi mesin pencari default di Safari.

Google membayar premi tersebut karena, pada intinya, penawarannya adalah mesin yang cocok. Mesin pencocokan menghubungkan pengguna yang memiliki kebutuhan dengan bisnis yang memiliki penawaran. Sebagian besar monopoli web, pada intinya, adalah mesin pencocokan. Amazon mencocokkan penjual produk dengan pembeli. Instagram mencocokkan audiens dengan pembuat konten. Mesin pencocokan ini berfungsi karena interaksi pada produk ini meninggalkan banyak jejak yang dapat digunakan untuk mengarahkan konteks.

Ben Evans dengan terkenal menulis pada tahun 2022 bahwa tidak ada yang namanya data. Mengetahui konten, makanan, atau preferensi perjalanan saya tidak terlalu berarti bagi pihak ketiga. Hal ini menjadi berharga – untuk perdagangan atau penelitian – hanya jika hal tersebut dikumpulkan atau diperkaya dengan konteks.

Konteks dalam arti bahwa preferensi saya untuk makan biriyani pada Jumat malam dapat digunakan untuk mengiklankan pengiriman biriyani kepada saya pada saat kemungkinan saya membelinya paling tinggi. Secara keseluruhan, membandingkan kemungkinan pembelian saya dengan rekan di wilayah yang sama membantu menargetkan pengguna dengan lebih baik.

Data memerlukan skala (dalam jumlah besar) atau konteks agar bernilai. Perbedaan historis produk Web3 dan Web2 terletak pada jalur yang ditinggalkannya. Hanya Amazon yang mengetahui berapa banyak pengontrol Xbox yang akan terjual dalam minggu tertentu. Namun Anda bisa melihat pola pedagang membeli atau menjual NFT di OpenSea setiap hari. Pasalnya, setiap transaksi tersebut meninggalkan jejak publik.

Produk data di Web3 menggunakan jalur tersebut untuk membangun konteks.

Blockchain seperti Ethereum dan Bitcoin menghasilkan blok masing-masing setiap 12 detik dan ~10 menit. Setiap blok berisi transaksi yang mengubah keadaan blockchain. Penjelajah blok seperti Etherscan menangkap data yang terkait dengan semua transaksi. Misalnya, jika Anda membuka Etherscan dan melihat sebuah blok, gambar di bawah ini adalah gambar yang mungkin Anda lihat.

Transaksi di blockchain kaya akan konteks. Produk seperti Arkham dan Nansen adalah mesin interpretasi bagi peneliti untuk memahami apa yang terjadi ketika suatu transaksi terjadi.

Anda dapat melihat semua blok sejak Ethereum dimulai. Namun apa yang dapat Anda lakukan dengan informasi ini? Hampir tidak ada. Jadi, Anda memerlukan cara untuk menangkap data ini dalam beberapa tabel. Misalnya, setiap kali kontrak NFT dari suatu pasar dipanggil dalam sebuah blok, data yang terkait dengan transaksi tersebut harus ditambahkan ke tabel terkait NFT, atau ketika kontrak Uniswap dipanggil, data terkait harus disimpan dalam tabel terkait DEX . (Dune melakukan ini sebagai layanan.)

Anda tidak dapat menganalisis data mentah tanpa menimbulkan biaya infrastruktur yang signifikan. Jadi, meskipun datanya tersedia secara gratis, Anda mengalami masalah yang sama. Anda mengandalkan data eksternal sebagai investor atau pembuat dApp. Namun fungsi inti Anda tidak terkait dengan pengumpulan dan pengelolaan data. Menghabiskan sumber daya untuk aktivitas-aktivitas penting namun non-inti bukanlah suatu kemewahan yang dapat dinikmati oleh setiap organisasi.

Konteks Mendorong Nilai

Untuk produk data, konteks seputar data menjadikan produk tersebut unik. Bloomberg menerapkan pemahaman finansialnya dan mengubah data ke dalam bentuk yang mudah dikonsumsi oleh para penemu dan pedagang. Situs web seperti Sameweb atau publikasi penelitian seperti Newzoo menggunakan kompetensi inti mereka untuk menerapkan konteks terkait sosial atau game pada data yang mereka lacak.

Produk data asli Blockchain membedakan dirinya dengan menyediakan konteks pengguna melalui pertanyaan yang menjawab pertanyaan yang relevan dengan subkumpulan pengguna tertentu. Misalnya, TokenTerminal menghitung fundamental ekonomi dari protokol. Nansen membantu pelaku pasar memberi label dan memahami pergerakan aset. Parsec menanyakan data on-chain untuk membantu pedagang menganalisis posisi DeFi dengan lebih baik.

Semua produk ini merupakan barang publik: data on-chain. Perbedaannya terletak pada cara produk-produk ini menyajikan datanya, yang membuatnya menarik bagi audiens yang berbeda.

Pembagian kategori produk di industri kami didasarkan pada data apa yang masuk dalam rantai dan informasi apa yang diperoleh dari sumber di luar rantai. (Beberapa sering menggunakan keduanya.) Penyedia data menggunakan filter konteksnya untuk membuat produk. Sama seperti data Web2 yang memiliki ceruk tersendiri, perusahaan data Web3 telah membangun atau secara bertahap membangun parit menggunakan kompetensi inti mereka.

Oleh karena itu, latar belakang pendiri sering kali menentukan sifat produk yang dirilis. Ketika tim inti telah menghabiskan banyak waktu di pasar modal sebelum kripto, produk mereka cenderung meniru Bloomberg, sedangkan produk asli kripto terlihat seperti Nansen. Produk yang berbeda memenuhi kebutuhan yang berbeda, bahkan ketika menanyakan data yang sama.

Misalnya, pertukaran biasanya membuang data setelah interval tetap. Mereka tidak berkecimpung dalam bisnis data, dan menyimpan data lama memerlukan server dan manajemen tambahan. Beberapa penyedia data, seperti Kaiko dan Amberdata, menyimpan data buku pesanan historis dari bursa. Data tersebut memungkinkan pedagang dan investor membangun model untuk menguji hipotesis mereka. Tetapi jika Anda ingin memahami kontrak DeFi mana yang mendapatkan aliran masuk ETH atau stablecoin atau menganalisis perilaku on-chain dari alamat atau entitas tertentu, Anda memerlukan produk dari Nansen atau Arkham.

Peta pasar tidak mewakili setiap pemain di setiap kategori.

Salah satu cara untuk memahami bagaimana produk diposisikan di pasar adalah melalui lensa persona konsumen dalam kripto. Persona ini dapat diklasifikasikan ke dalam empat kategori utama berikut.

Lembaga keuangan

Sebagian besar dolar yang mengalir melalui produk data kripto berasal dari lembaga keuangan selama pasar sedang bearish. Mereka adalah pelanggan besar dengan siklus penjualan yang lebih panjang dan kebutuhan data yang jauh lebih kompleks. Salah satu cara untuk mengetahui apakah suatu produk berorientasi pada lembaga keuangan adalah jika pelanggan harus melalui panggilan penjualan untuk menentukan berapa biayanya. Di dunia Web2, Anda tidak dapat mengetahui berapa biaya PitchBook atau CB Insights. Dalam kripto, Anda tidak tahu berapa harga produk seperti Chainalysis.

Selain bercanda, salah satu alasan proses penjualan tersebut adalah layanan langsung dan praktis yang ditawarkan oleh produk data yang berorientasi pada segmen konsumen ini. Pengguna ini biasanya memilih data yang sangat terperinci dan sering. Mereka memerlukan data tidak hanya untuk pengambilan keputusan sebelum perdagangan tetapi juga untuk penggunaan pasca-perdagangan guna memenuhi persyaratan kepatuhan dan perpajakan.

Misalnya, mereka membutuhkan produk yang memberi tahu mereka berapa nilai portofolio mereka secara historis, membantu mereka dalam perhitungan pajak, dan sebagainya. Perusahaan seperti Amberdata, Kaiko, CoinMetrics, CryptoCompare, dan, sampai batas tertentu, Nansen, melayani pelanggan ini.

Berdasarkan pengalaman saya, hanya para pendiri dengan latar belakang bekerja di institusi atau tim dengan putaran pendanaan besar yang mampu membuka pasar institusional untuk mendapatkan data. Hambatan untuk masuk ke pasar ini relatif tinggi, seperti yang terjadi pada produk perusahaan mana pun.

Pengembang

Kita sering menemukan fitur komposisi Web3, yang berarti aplikasi Web3 dapat saling bergantung. Mereka mungkin memerlukan data satu sama lain. Jadi, mereka terus-menerus perlu membaca data satu sama lain. Misalnya, platform seperti Yearn Finance perlu membaca data dari Aave dan Compound, dan agregator NFT seperti Tensor perlu membaca data dari Magic Eden dan pasar lainnya.

Namun data ini disimpan di seluruh blok pada rantai seperti Ethereum dan Solana. Ethereum membuat blok dalam 12 detik, dan Solana melakukannya dalam 400 ms. Menyortir data blockchain ke dalam tabel dan menyimpannya untuk akses cepat adalah tugas yang tidak sepele. Di sinilah pengindeks seperti Covalent, Graph, Chainlink, dan Powerloom berperan. Mereka memastikan bahwa data mentah blockchain disimpan dalam format yang diinginkan sehingga pengembang dapat mengambilnya melalui panggilan API sederhana.

Segmen yang muncul dalam persona konsumen ini melibatkan alat yang digunakan untuk memahami perilaku pengguna. Misalnya, ARCx memungkinkan pengembang untuk memetakan data off-chain (seperti perilaku browser) dengan data on-chain (seperti alamat dompet) untuk menangkap informasi demografis pengguna yang berinteraksi dengan dApp. Mereka berada dalam ceruk yang relatif kecil namun relevan karena membantu pengembang mengidentifikasi siapa penggunanya.

Peneliti dan Publikasi

Produk data dalam kripto sering kali didistribusikan melalui kolaborasi dengan peneliti dan publikasi. CCData, misalnya, sering dikutip di Bloomberg. Para peneliti diberi insentif untuk bersandar pada produk data karena mereka membantu menghemat waktu dan tenaga saat mengumpulkan, membersihkan, atau melakukan kurasi data. Produk seperti Dune telah membangun parit dengan membangun komunitas analis yang bersaing satu sama lain untuk mendapatkan peringkat lebih tinggi dalam daftar mereka.

Publikasi seperti The Block dan Delphi menampilkan dasbor yang dibuat menggunakan data dari penyedia pihak ketiga. Di Decentralised.co, kami bergantung sepenuhnya pada penyedia data eksternal karena mereka membantu menjaga tim tetap ramping saat menggunakan sumber daya eksternal saat mengumpulkan data.

Tantangan dalam melayani segmen konsumen ini adalah bahwa peneliti kecil mungkin tidak memiliki anggaran yang diperlukan untuk membenarkan pengeluaran sumber daya yang sangat besar guna memunculkan wawasan khusus yang mungkin hanya relevan bagi satu orang. Sebaliknya, perusahaan mendapat insentif yang besar untuk menghabiskan upaya dan sumber daya dengan bermitra dengan publikasi penting seperti Financial Times untuk membantu distribusi.

Investor ritel

Produk yang berorientasi pada investor ritel biasanya memiliki rincian dan frekuensi data yang lebih rendah. Namun mereka merupakan ceruk yang sangat menguntungkan untuk dibangun karena mereka melihat skala ekonominya. Sepuluh ribu pengguna yang membayar $100 masing-masing adalah bisnis ARR senilai $1 juta di dunia di mana tidak ada churn. Hal ini lebih mudah diucapkan daripada dilakukan, tetapi ilmu ekonomi tersebut menjelaskan mengapa kita memiliki begitu banyak produk data kripto yang berorientasi ritel.

Sebagian besar produk berorientasi ritel gratis atau didukung oleh iklan. Misalnya, sumber daya gratis seperti DefiLlama tidak akan memberi tahu Anda cara merutekan pesanan Anda melalui bursa yang berbeda (CEX dan DEX) untuk menghindari selip karena tidak mengambil cuplikan buku pesanan, tetapi menampilkan informasi tentang pembukaan kunci token atau pembukaan hasil.

Salah satu perubahan di segmen konsumen ini adalah bagaimana media pengiriman membuka kategori pasar baru—misalnya, Cielo mengirimkan data sebagai notifikasi melalui Telegram. Ini telah menjangkau lebih dari 40.000 pengguna dengan menyampaikan informasi dengan cara yang mudah dikonsumsi untuk segmen konsumen yang tidak ingin berurusan dengan antarmuka desktop. Jika dilakukan dengan benar, media distribusi yang merata dapat menjadi pembeda bagi usaha tahap awal. Bahkan dalam data.

Meskipun klasifikasinya kabur, perusahaan data dapat dibagi menjadi orientasi B2B atau B2C.

Perusahaan seperti Amberdata dan Kaiko memiliki produk yang diperuntukkan bagi aktor canggih. Produk-produk ini lebih terperinci (rincian datanya tersedia) dan sering (misalnya data tick-by-tick dan buku pesanan real-time), dan memenuhi tuntutan seperti pembuatan dan pengujian model, analisis pra-perdagangan, pelaporan pasca-perdagangan, perpajakan, dan kepatuhan. Data disediakan dalam format yang memungkinkan pelanggan melakukan analisis eksklusif dan membuat visualisasi sesuai selera mereka. Perusahaan-perusahaan ini biasanya menawarkan produk mereka di balik paywall.

Biaya umumnya merupakan fungsi perincian karena kebutuhan infrastruktur, sifat pelanggan yang terlibat, dan lamanya siklus penjualan.

Gambar di atas memetakan produk yang berbeda pada dua sumbu – kedalaman dan rincian vs. harga produk. Harap dicatat bahwa plot ini tidak tepat. Beberapa poin mungkin salah sasaran. Idenya adalah untuk mengembangkan model mental untuk memikirkan beberapa produk dan kedudukannya di pasar.

Produk yang berfokus pada ritel seperti Dune atau CoinGecko menampilkan hampir semua data secara gratis. Pelanggan harus membayar untuk mengakses beberapa data atau jika mereka menginginkan data melalui API untuk menjalankan analisis mereka. Misalnya, Anda dapat melihat semua bagan yang dibuat oleh beberapa penyihir Dune, namun mereka membatasi berapa banyak baris yang dapat Anda unduh dalam bentuk CSV. Anda dapat mendownload file CSV yang lebih besar dan melihat pertanyaan pribadi saat Anda membayar lebih.

Perusahaan yang berfokus pada ritel cenderung memiliki pendapatan per pelanggan yang rendah dan sedikit pelanggan yang membayar sebagai persentase pengguna gratis. Bandingkan ini dengan tingkat konversi untuk model perusahaan internet freemium. Biasanya, rasio konversinya adalah 2%–5%. Tingkat konversi 10% akan menjadi hal yang aneh. Pedoman mereka adalah memiliki pelanggan gratis sebanyak mungkin sehingga tingkat konversi 4% memberikan kontribusi signifikan terhadap pendapatan. Inilah yang kami sebut bagian atas corong.

Jadi, perusahaan data memerlukan bagian atas saluran yang cukup besar untuk menghasilkan pendapatan yang cukup guna mempertahankan diri mereka pada tingkat konversi yang lebih rendah. Perusahaan juga dapat mempertimbangkan untuk menghasilkan pendapatan dari iklan ketika situs tersebut memiliki banyak pengunjung. CoinGecko menggunakan pendapatan iklan sebagai pengaruh untuk terus menyediakan sebagian besar data secara gratis.

Selama bertahun-tahun, perusahaan telah mengisi posisi di kedua ujung spektrum (B2B dan B2C), sehingga menyisakan beberapa kesenjangan di antara keduanya. Jika seseorang ingin melihat bagaimana buku pesanan berubah di bursa terpusat atau bagaimana rasio panggilan, IV, dan kemiringan berubah, tidak banyak produk yang membantu visualisasi. Ada ruang untuk produk yang lebih terperinci daripada CoinGecko di dunia, tetapi kurang terperinci dibandingkan produk dari pemain B2B murni.

Di Parit

Menemukan parit pada bisnis yang bahan bakunya gratis tidaklah mudah. Data Blockchain tersedia secara gratis. Tidak ada hak milik atas data apa yang dapat Anda kumpulkan. Jadi, kegagalan dalam bisnis data tidak hanya didasarkan pada Anda memiliki beberapa data yang tidak dimiliki orang lain. Sebaliknya, data tersebut didasarkan pada kemampuan tim untuk menyediakan data dalam format yang berwawasan luas, dapat dikonsumsi, tepat waktu, dan tanpa kesalahan.

Banyak perusahaan yang mengaku memiliki data yang sama, namun kualitas data dan penyajiannya berbeda. Misalnya, banyak perusahaan mengklaim memiliki data buku pesanan off-chain. Namun, faktor-faktor seperti jumlah pesanan bid/ask, durasi rangkaian waktu, dan jumlah bursa dan pasangan yang tersedia berbeda dari satu penyedia ke penyedia lainnya. Amberdata dan Kaiko memiliki data buku pesanan terlengkap untuk pasar kripto.

Namun mengapa hanya sedikit penyedia yang dapat menyediakan data seperti ini? Penjelasan mengenai munculnya parit dalam data Web3 ada di sini.

Bakat – Dengan risiko menyatakan hal yang sudah jelas, ketika bahan bakunya gratis, cara Anda mencetaknya menentukan nilai produk. Mengubah data mentah menjadi informasi yang berguna memerlukan keahlian domain di banyak bidang dalam kripto dan pasar keuangan tradisional. Tim seperti Velo Data, dengan pengalaman di pasar tradisional, memiliki keunggulan dibandingkan tim lain yang mencoba membangun produk B2C serupa. Jarang ditemukan pengembang berbakat yang memahami struktur data blockchain dan memiliki pengalaman relevan di pasar keuangan.

Infrastruktur – Mengumpulkan dan mengirimkan data dalam jumlah besar memerlukan infrastruktur yang tidak mudah. Operasi semacam ini membutuhkan modal dan bakat. Mengapa infrastruktur berupa parit? Pikirkan data kumpulan memori. Blok berisi data untuk transaksi yang dikonfirmasi. Bagaimana dengan transaksi yang belum dikonfirmasi?

Node jaringan yang berbeda (misalnya, node yang terhubung ke kumpulan yang sama) melihat transaksi berbeda yang belum dikonfirmasi. Menjalankan hanya satu node tidak akan memberikan pandangan global tentang transaksi yang bersaing. Mempertahankan banyak node di beberapa blockchain menambah biaya infrastruktur. Sama seperti AI (dan jaringan konten di masa lalu), kemampuan untuk menjaga biaya perangkat keras tetap rendah sambil melakukan penskalaan akan menentukan pemenang dan pecundang di sektor ini dari waktu ke waktu.

Efek Jaringan – Seseorang dapat berhipotesis bahwa efek jaringan ada di banyak produk data kripto. Ambil Chainlink sebagai contoh. Itu adalah salah satu oracle pertama yang memungkinkan aplikasi membaca data dari aplikasi atau rantai lain. Ini berhasil mengumpulkan dukungan komunitas dan memiliki salah satu komunitas terkuat. Contoh lainnya adalah Nansen. Klaim ketenarannya adalah label alamat yang memungkinkannya mengatribusikan pergerakan aset ke entitas nyata, bukan alamat heksanumerik.

Selanjutnya, ia meluncurkan fitur seperti NFT Paradise dan Token God Mode, memungkinkan pengguna melacak NFT dan token dengan lebih efektif. Arkham meluncurkan produk yang mirip dengan label Nansen, namun investasi pada dasbor dan penelitian memungkinkan Nansen bermanuver ke klien perusahaan dan menawarkan produk yang disesuaikan untuk mereka. Perlu disebutkan bahwa efek jaringan tidak mungkin terjadi tanpa dua poin pertama (bakat dan infrastruktur).

Salah satu tempat kerjanya adalah dengan pengindeks. Semakin tinggi jumlah rantai yang didukung suatu produk, semakin tinggi kemungkinan pengembang akan menggunakan produk tersebut dibandingkan mengandalkan berbagai sumber. Tim seperti Covalent memiliki keunggulan di sini karena mereka telah mengoptimalkan luasnya rantai yang didukung selama beberapa waktu. Namun perlu diingat bahwa kedalaman sama pentingnya dengan keluasan.

Masih terlalu dini untuk mengatakan apakah suatu produk memiliki pengaruh yang berarti dalam kripto. Kita telah menyaksikan keuntungan bagi para penggerak awal dalam skema besar. Ketika kategori seperti sosial Web3 dan tumpang tindih antara AI dan kripto terus meningkat, produk data dalam industri ini mungkin akan tumbuh menjadi Alphabet berikutnya. Tapi itu akan menjadi cerita multi-dekade; kita masih berada di tahun-tahun awal.

Melampaui Spekulasi

Banyak kasus penggunaan yang kami sebutkan dalam artikel ini membahas spekulasi keuangan dalam beberapa bentuk atau lainnya. Bahkan pengembang yang menggunakan API untuk menanyakan data sedang membangun produk keuangan. Ini mungkin tampak aneh, tetapi blockchain (sebagai jaringan baru) mengikuti tren yang sama seperti Telegraph dan Internet.

Hadirnya media baru dan munculnya jaringan baru mempercepat kasus penggunaan finansial. Dengan adanya internet, dibutuhkan waktu hingga awal tahun 2000an bagi masyarakat untuk menyadari bahwa pengguna dapat ditargetkan berdasarkan lokasi mereka. Dengan blockchain, kami masih mencari cara untuk membangun model bisnis dari jalur data yang tersedia untuk umum.

Kami telah melihat satu perubahan penting dalam penggunaan platform ini sehari-hari – Dune Analytics menyematkan AI pada produk mereka. Dune menyediakan antarmuka berbasis SQL bagi pengguna untuk menanyakan data dari blockchain seperti Ethereum dan Solana. Pasar untuk produk semacam itu biasanya terbatas pada pengguna yang memahami cara menulis kueri SQL. Mereka baru-baru ini mulai menggunakan AI untuk membantu analis menghasilkan kueri tanpa menjadi ahli SQL. Ini tidak berfungsi seperti yang diharapkan. Tapi ini masih merupakan langkah menuju masa depan. Mungkin tidak lama lagi kita akan meminta AI (seperti ChatGPT) untuk menanyakan data dari blockchain dan menawarkan analisisnya.

Salah satu cara untuk memikirkan “data” dalam konteks Web3 adalah melalui lensa Google Maps. GPS telah ada setidaknya sejak tahun 1980an. Google melakukan pekerjaan yang diperlukan untuk memetakan dunia. Dalam membuat overlay peta tersedia untuk aplikasi pihak ketiga (menggunakan API), perusahaan ini memungkinkan pembuatan aplikasi generasi baru. Segala sesuatu mulai dari pengiriman hingga ride-hailing berkembang pesat karena satu pemain yang berspesialisasi dalam data mengambil alih beban tersebut dari pengembang.

Produk data di Web3 akan memainkan peran serupa. Kami belum mengetahui secara pasti sifat aplikasi yang dapat dibangun berdasarkan sumber daya yang tersedia untuk umum ini, namun menjadi jelas bahwa ada peluang sebesar Alphabet dalam lanskap data.

Penafian:

  1. Artikel ini dicetak ulang dari [GCR]. Semua hak cipta milik penulis asli [Saurabh Deshpande、 Siddharth、Joel]. Jika ada keberatan terhadap cetak ulang ini, silakan menghubungi tim Gate Learn , dan mereka akan segera menanganinya.
  2. Penafian Tanggung Jawab: Pandangan dan pendapat yang diungkapkan dalam artikel ini adalah sepenuhnya milik penulis dan bukan merupakan nasihat investasi apa pun.
  3. Terjemahan artikel ke bahasa lain dilakukan oleh tim Gate Learn. Kecuali disebutkan, dilarang menyalin, mendistribusikan, atau menjiplak artikel terjemahan.
Comece agora
Inscreva-se e ganhe um cupom de
$100
!