Tác phẩm này ban đầu được xuất bản trên Decentralised.co. Chúng tôi tại GCR sẽ mang đến cho bạn các biểu mẫu dài từ Phi tập trung hai lần mỗi tháng – vào thứ Năm luân phiên! Decentralised.co được ban quản lý của hơn 200 công ty tin tưởng để luôn cập nhật các xu hướng, dữ liệu và hiểu biết quan trọng. Đăng ký nhận bản tin của họ bên dưới—thông tin thêm về sự hợp tác này dành cho những thành viên tích cực nhất của chúng tôi trên Discord.
Này,
Chúng tôi đã viết đoạn giới thiệu trước cho phần này vào ngày 18 tháng 7 nếu bạn muốn ngữ cảnh vượt xa những gì được viết ở đây.
Tất cả các sinh vật sống đều giữ một số kỷ lục. Động vật theo dõi các mùa để hiểu khi nào nên đi săn. Loài gặm nhấm và chim lưu trữ thức ăn ở những nơi độc đáo. Họ cần phải nhớ nơi họ đã lưu trữ nó khi truy cập nó để lấy thức ăn trong nhiều tháng sau đó. Sói tạo ra các dấu hiệu xung quanh chu vi lãnh thổ của chúng để báo hiệu cho các động vật khác tránh xa. Ngay cả cây cối cũng theo dõi thời gian. Hàng năm, một vòng được hình thành trong thân cây. Người ta có thể ước tính tuổi của cây dựa trên số vòng.
Mặc dù cây cối và động vật có thể theo dõi thời gian nhưng chúng không thể nhớ lại hoặc thuật lại quá khứ. Họ không có quyền truy cập vào bộ nhớ. Đó là điều làm cho việc ghi chép của con người trở nên khác biệt. Nhờ khả năng giao tiếp, chúng ta biết rằng người Sumer ở Lưỡng Hà (3400 TCN) và người Ai Cập cổ đại (3200 TCN) đã sử dụng chữ hình nêm và chữ tượng hình để ghi lại thông tin.
Nhân loại tiến hóa khi kiến thức có thể được truyền đi mà không cần đến nguồn gốc vật chất. Chúng ta đọc và thưởng thức các tác phẩm của Plato hay Socrates rất lâu sau khi chúng không còn nữa vì chúng ta có phương tiện để lưu giữ những lời dạy của họ. Viết là nền tảng AR ban đầu.
Viết từ Iran theo dõi ngũ cốc. Nguồn: Liên kết
Trong khi việc viết lách để mọi thứ nằm trong trí tưởng tượng thì dữ liệu lại giúp mọi thứ trở nên khách quan. Nó làm giảm yêu cầu của các cá nhân về việc lưu trữ mọi thứ trong trí nhớ của họ. Đây là một phần lý do tại sao một số văn bản cổ xưa nhất của con người liên quan đến nợ nần, thu nhập hoặc hồ sơ thương mại.
Trong thời đại hậu công nghiệp, các công ty đã xây dựng các con hào cạnh tranh để củng cố vị thế trên thị trường bằng cách chuyển sang kỹ thuật số với hồ sơ bán hàng của họ. Một ví dụ về điều này là công ty Ấn Độ có tên Asian Paints. Sơn của họ có thể không phải là loại sơn tốt nhất trên thị trường, nhưng họ kiểm soát hơn 50% thị phần trong ngành sơn trị giá 8 tỷ USD của Ấn Độ.
Tại sao? Câu trả lời dễ dàng là đây là một thương hiệu gia đình và công ty có lợi thế kinh tế nhờ quy mô. Nhưng cách họ đến đó có nguồn gốc từ dữ liệu. Họ đầu tư rất nhiều vào việc thu thập và xử lý dữ liệu để tối ưu hóa chuỗi cung ứng của mình.
Trong bối cảnh đó, cổ phiếu Asian Paints đã có tốc độ CAGR đáng kinh ngạc là 25% trong 30 năm qua. Hỗ trợ cho sự tăng trưởng đó là khoản đầu tư vào máy tính lớn vào những năm 1970. Thiết bị này mạnh hơn những thiết bị được sử dụng tại các tổ chức nghiên cứu tốt nhất ở Ấn Độ vào thời điểm đó. Nó thu thập dữ liệu hàng giờ về màu sắc và số lượng sơn được bán trên khắp Ấn Độ. Điều này cho phép Asian Paints xây dựng một mô hình dự đoán nhu cầu sơn trên khắp Ấn Độ với độ chính xác 98%.
Khả năng dự đoán này cho phép Asian Paints đạt được giá trị tối đa vì nó có thể giảm đáng kể thời gian bổ sung. Vào thời điểm đó, tiêu chuẩn bán hàng hóa như sơn là bán cho người bán buôn, người này sau đó sẽ giao cho nhà phân phối, người này sẽ bán lại cho đại lý. Các đại lý sẽ tương tác trực tiếp với người tiêu dùng. Lý do cho chuỗi cung ứng phức tạp như vậy là vì mỗi bên nắm giữ một bản kiểm kê tài sản và kiểm soát dữ liệu về cung và cầu sơn.
Ông Choksey – người sáng lập Asian Paints, đã loại bỏ các nhà bán buôn và nhà phân phối khỏi chuỗi cung ứng bằng cách nghiên cứu mô hình tiêu dùng của người dùng cuối và giảm sự phụ thuộc vào người trung gian. Thông qua việc loại bỏ những người trung gian, Asian Paints đã thu được 97% MRP (3% cho các đại lý) so với 60% mà các đối thủ cạnh tranh của họ thu được.
Giá trị có thể trích xuất được của điện báo sẽ là các băng mã đánh dấu chạy trước được chuyển tiếp qua Điện báo.
Quá trình chuyển đổi sang kỹ thuật số không xảy ra chỉ sau một đêm. Một phần khiến việc thu thập dữ liệu trở nên thú vị là thế giới tài chính và mức độ kết nối giữa nó dần dần. Ví dụ, vào cuối thế kỷ 20, dữ liệu thị trường chứng khoán được chuyển tiếp qua điện báo bằng các thiết bị như thiết bị trên. Ngay từ năm 1835, các thương nhân đã huấn luyện chim bồ câu mang những mảnh giấy có thông tin về những gì đang xảy ra ở châu Âu. Khi tàu hơi nước chở hàng hóa cách đất liền 50 dặm, chim bồ câu sẽ bay đến những điểm được chỉ định để cung cấp thông tin. Các nhà giao dịch thường trả trước tới 500 USD cho mỗi giờ họ có thể nhận được tin tức.
Đến năm 1867, các nhà giao dịch bắt đầu cạnh tranh để tối ưu hóa tốc độ truyền tải thông tin qua điện báo. Một nhân viên của Western Union tên là E. A Calahan đã trả hơn 200 nghìn đô la cho NYSE để có thể cử nhân viên đến sàn giao dịch của họ để chuyển tiếp dữ liệu về mã cổ phiếu cho khách hàng của mình. Một trong những cá nhân đang nỗ lực tối ưu hóa hệ thống là nhà khoa học trẻ tên là Thomas Alva Edison. Một thế kỷ sau, các công cụ như thiết bị đầu cuối Bloomberg sẽ tăng tốc độ và lượng dữ liệu tài chính được chuyển tiếp theo cấp số nhân vào bất kỳ ngày nào.
Dữ liệu, giống như dầu thô, phải trải qua nhiều bước sàng lọc trước khi có thể sử dụng. Tìm hiểu cách Bloomberg phát triển sẽ làm sáng tỏ toàn bộ bối cảnh dữ liệu đã phát triển như thế nào và quy trình nào. Bloomberg không phải là nỗ lực đầu tiên sử dụng công nghệ để cải thiện cơ chế giao dịch và báo cáo. NASDAQ đã sử dụng thiết bị đầu cuối Bunker Ramo để phổ biến thông tin và đặt lệnh mua/bán. Tuy nhiên, việc dựa vào các mạng liên lạc qua điện thoại trước đây có nghĩa là việc mở rộng mô hình này sẽ luôn gặp nhiều thách thức.
Nguồn - NASDAQ - Sự phát triển của giao dịch OTC tự động
Năm 1981, Michael Bloomberg, một đối tác của ngân hàng đầu tư Solomon Brothers, đã bị sa thải với 10 triệu USD vốn cổ phần của mình khi Tập đoàn Phibro mua lại ngân hàng này. Ông nhận ra rằng các nhà đầu tư sẵn sàng trả tiền cho thông tin tài chính hợp lý với quá trình điện tử hóa ngày càng tăng của các thị trường tài chính từ New York đến Nhật Bản. Ông thành lập một công ty dịch vụ dữ liệu có tên Innovative Market System, được đổi tên thành Bloomberg vào năm 1986.
Trước khi Internet phát triển, Bloomberg Terminal được truy cập bằng The Chiclet. Thiết bị này được kết nối với bộ điều khiển Bloomberg thông qua một cáp đặc biệt được kết nối với trung tâm cục bộ thông qua đường dây điện thoại chuyên dụng. Bloomberg thu thập dữ liệu thông qua quan hệ đối tác dữ liệu, hãng tin và thông cáo báo chí, các phương pháp độc quyền như nhập dữ liệu thủ công và thu thập dữ liệu qua điện thoại.
Với Internet, các cánh cổng thông tin đã mở ra. Ngày nay, Bloomberg thu thập, xử lý và cung cấp 200 tỷ thông tin tài chính gần như theo thời gian thực. Đó là khoảng 23 triệu điểm dữ liệu mỗi giây. Một số thông tin có sẵn trên Bloomberg là công khai. Các điểm dữ liệu như báo cáo tài chính, giá cổ phiếu và trái phiếu của công ty có thể được tìm thấy trên các diễn đàn công cộng.
Nhưng nếu bạn là một nhà phân tích dầu khí và muốn tìm hiểu chuyển động của các thùng chứa dầu thô thì sao? Bạn khó có thể nhận được thông tin này trong thời gian thực nếu bạn không đăng ký nguồn dữ liệu như Bloomberg. Không phải tất cả dữ liệu trên internet đều có sẵn miễn phí.
Thông thường có hai hạn chế đối với các cá nhân khi nói đến dữ liệu trong Web2: quyền truy cập được cấp phép và rào cản cao trong việc xử lý lượng lớn dữ liệu. Trong những năm qua, các nhà cung cấp như Bloomberg đã xây dựng hiệu ứng mạng đủ mạnh để lấy dữ liệu thông qua các chi nhánh của họ, điều mà các nhà phân tích hoặc nhà đầu tư không đủ khả năng để làm.
Tốt hơn là trả 20.000 USD cho Bloomberg để đăng ký hàng năm hơn là cố gắng lấy dữ liệu từ nhiều nền tảng dữ liệu mà mỗi nền tảng có thể có các mức giá khác nhau. Ngay cả khi bạn nỗ lực hết sức để có được dữ liệu, bạn cũng không thể xử lý và chạy phân tích trong thời gian thực nếu không có chi tiêu cơ sở hạ tầng đáng kể. Về mặt bán lẻ, nhiều nền tảng cuối cùng đã mở rộng quy mô – là các công cụ khớp dữ liệu.
Hãy nghĩ theo cách này: Google (công cụ tìm kiếm) là một công ty dữ liệu cung cấp cho các doanh nghiệp quyền truy cập vào người dùng để đổi lấy tiền quảng cáo. Khi một nhà hàng hoặc một bản tin (như của chúng tôi) muốn nhắm mục tiêu đến người dùng đang tìm kiếm thông tin trên Google, họ sẽ khớp cung và cầu về thông tin tương tự. Ai đó đang tìm kiếm thông tin về một bản tin cụ thể cho Web3 đang tìm kiếm chúng tôi. Và chúng tôi đang tìm kiếm người đó. (Tôi đang chống lại sự thôi thúc đưa chương trình giới thiệu của chúng tôi vào đây.)
Google đã tạo dựng được sự độc quyền nhờ vào quy mô kinh tế mà nó hoạt động. Danh sách người dùng của họ và số lượng truy vấn mà người dùng của họ thực hiện mỗi ngày vẫn không có đối thủ. Google đã xây dựng vị trí đó bằng cách tung ra một công cụ tìm kiếm không có quảng cáo vào thời điểm mà quảng cáo là tiêu chuẩn, sau đó thông qua việc mua lại YouTube và Android, và cuối cùng, thông qua việc trả tiền cho các công ty ngang hàng như Apple để biến Google thành công cụ tìm kiếm mặc định. Riêng đối với Apple, Google trả 20 tỷ USD mỗi năm để duy trì là công cụ tìm kiếm mặc định trên Safari.
Google trả khoản phí bảo hiểm đó vì về cốt lõi, sản phẩm của họ là một công cụ phù hợp. Công cụ kết hợp giúp người dùng có nhu cầu liên hệ với các doanh nghiệp cung cấp sản phẩm. Về cốt lõi, hầu hết các công ty độc quyền về web đều là các công cụ phù hợp. Amazon kết nối người bán sản phẩm với người mua. Instagram kết nối khán giả với người sáng tạo. Các công cụ so khớp này hoạt động vì các tương tác trên các sản phẩm này để lại những dấu vết phong phú từ đó có thể điều khiển bối cảnh.
Ben Evans đã viết một câu nổi tiếng vào năm 2022 rằng không có thứ gọi là dữ liệu. Việc biết nội dung, món ăn hoặc sở thích du lịch của tôi không có giá trị nhiều đối với bên thứ ba. Nó trở nên có giá trị – đối với thương mại hoặc nghiên cứu – chỉ khi nó được tổng hợp hoặc làm phong phú thêm ngữ cảnh.
Bối cảnh theo nghĩa là sở thích ăn biriyani của tôi vào tối thứ Sáu có thể được sử dụng để quảng cáo việc giao biriyani cho tôi một cách chính xác khi xác suất tôi mua nó là cao nhất. Nhìn chung, việc so sánh xác suất mua hàng của tôi với một đối tác ngang hàng trong cùng khu vực sẽ giúp nhắm mục tiêu người dùng tốt hơn.
Dữ liệu cần có quy mô (với số lượng lớn) hoặc ngữ cảnh mới có giá trị. Điểm khác biệt giữa các sản phẩm Web3 và Web2 về mặt lịch sử nằm ở dấu vết mà chúng để lại. Chỉ Amazon mới biết có bao nhiêu bộ điều khiển Xbox sẽ bán được trong một tuần nhất định. Nhưng bạn có thể thấy mô hình mà các nhà giao dịch mua hoặc bán NFT trên OpenSea vào bất kỳ ngày nào. Lý do là mỗi giao dịch đó đều để lại dấu vết công khai.
Các sản phẩm dữ liệu trong Web3 sử dụng những đường dẫn đó để xây dựng ngữ cảnh.
Các chuỗi khối như Ethereum và Bitcoin tạo ra các khối tương ứng cứ sau 12 giây và ~ 10 phút. Mỗi khối chứa các giao dịch thay đổi trạng thái của blockchain. Các trình khám phá khối như Etherscan thu thập dữ liệu liên quan đến tất cả các giao dịch. Ví dụ: nếu bạn truy cập Etherscan và thấy một khối, hình ảnh bên dưới là những gì bạn có thể thấy.
Các giao dịch trên blockchain rất phong phú về ngữ cảnh. Các sản phẩm như Arkham và Nansen là công cụ giải thích để các nhà nghiên cứu hiểu điều gì đang xảy ra khi giao dịch xảy ra.
Bạn có thể xem tất cả các khối kể từ khi Ethereum bắt đầu. Nhưng bạn có thể làm gì với thông tin này? Hầu như không có gì. Vì vậy, bạn cần một cách để thu thập dữ liệu này trong một số bảng. Ví dụ: bất cứ khi nào hợp đồng NFT của thị trường được gọi trong một khối, dữ liệu liên quan đến giao dịch đó sẽ được thêm vào các bảng liên quan đến NFT hoặc khi hợp đồng Uniswap được gọi, dữ liệu liên quan sẽ được lưu trữ trong các bảng liên quan đến DEX . (Dune thực hiện việc này như một dịch vụ.)
Bạn không thể phân tích dữ liệu thô mà không phải chịu chi phí cơ sở hạ tầng đáng kể. Vì vậy, mặc dù dữ liệu được cung cấp miễn phí nhưng bạn vẫn gặp phải những vấn đề tương tự. Bạn dựa vào dữ liệu bên ngoài với tư cách là nhà đầu tư hoặc người xây dựng dApp. Nhưng chức năng cốt lõi của bạn không liên quan đến việc thu thập và quản lý dữ liệu. Việc sử dụng nguồn lực cho các hoạt động thiết yếu nhưng không cốt lõi không phải là điều xa xỉ mà mọi tổ chức đều có thể tận hưởng.
Đối với các sản phẩm dữ liệu, bối cảnh xung quanh dữ liệu làm cho sản phẩm trở nên độc đáo. Bloomberg áp dụng hiểu biết về tài chính của mình và chuyển đổi dữ liệu thành dạng mà các nhà phát minh và nhà giao dịch có thể dễ dàng sử dụng. Các trang web như Sameweb hoặc các ấn phẩm nghiên cứu như Newzoo sử dụng năng lực cốt lõi của mình để áp dụng bối cảnh liên quan đến xã hội hoặc trò chơi vào dữ liệu họ theo dõi.
Các sản phẩm dữ liệu gốc của chuỗi khối tự phân biệt bằng cách cung cấp ngữ cảnh của người dùng thông qua các truy vấn trả lời các câu hỏi có liên quan đến các tập hợp con người dùng cụ thể. Ví dụ: TokenTerminal tính toán các nguyên tắc cơ bản về kinh tế của các giao thức. Nansen giúp những người tham gia thị trường gắn nhãn và hiểu được sự chuyển động của tài sản. Parsec truy vấn dữ liệu trên chuỗi để giúp các nhà giao dịch phân tích tốt hơn các vị trí DeFi.
Tất cả những sản phẩm này đều có nguồn gốc từ hàng hóa công cộng: dữ liệu trên chuỗi. Sự khác biệt là cách các sản phẩm này trình bày dữ liệu của chúng, điều này khiến chúng thu hút các đối tượng khác nhau.
Sự phân chia danh mục sản phẩm trong ngành của chúng tôi dựa trên dữ liệu nào được đưa vào chuỗi và thông tin nào được lấy từ các nguồn ngoài chuỗi. (Một số thường sử dụng cả hai.) Nhà cung cấp dữ liệu sử dụng bộ lọc ngữ cảnh của họ để tạo ra sản phẩm. Giống như dữ liệu Web2 có những vị trí thích hợp, các công ty dữ liệu Web3 đã xây dựng hoặc đang dần xây dựng những con hào bằng cách sử dụng năng lực cốt lõi của họ.
Vì vậy, lý lịch của những người sáng lập thường quyết định tính chất của các sản phẩm được phát hành. Khi một nhóm nòng cốt đã dành thời gian đáng kể trên thị trường vốn trước tiền điện tử, các sản phẩm của họ có xu hướng bắt chước Bloomberg, trong khi các sản phẩm gốc tiền điện tử trông giống Nansen. Các sản phẩm khác nhau đáp ứng các nhu cầu khác nhau, ngay cả khi truy vấn cùng một dữ liệu.
Chẳng hạn, các sàn giao dịch thường loại bỏ dữ liệu sau những khoảng thời gian cố định. Họ không kinh doanh dữ liệu và việc lưu trữ dữ liệu cũ đòi hỏi phải có thêm máy chủ và quản lý. Một số nhà cung cấp dữ liệu, như Kaiko và Amberdata, duy trì dữ liệu sổ đặt hàng lịch sử từ các sàn giao dịch. Dữ liệu như vậy cho phép các nhà giao dịch và nhà đầu tư xây dựng các mô hình để kiểm tra giả thuyết của họ. Nhưng nếu bạn muốn hiểu hợp đồng DeFi nào đang tràn vào dòng ETH hoặc stablecoin hoặc phân tích hành vi trên chuỗi của các địa chỉ hoặc tổ chức cụ thể, bạn sẽ cần một sản phẩm của Nansen hoặc Arkham.
Bản đồ thị trường không đại diện cho mọi người chơi ở mọi danh mục.
Một cách để hiểu cách các sản phẩm được định vị trên thị trường là thông qua lăng kính của người tiêu dùng trong lĩnh vực tiền điện tử. Những tính cách này có thể được phân loại thành bốn loại chính sau đây.
Hầu hết đô la chảy qua các sản phẩm dữ liệu tiền điện tử đều đến từ các tổ chức tài chính trong thời kỳ thị trường giá xuống. Đây là những khách hàng có giá trị lớn với chu kỳ bán hàng dài hơn và yêu cầu dữ liệu phức tạp hơn nhiều. Một cách để biết liệu một sản phẩm có hướng đến các tổ chức tài chính hay không là liệu khách hàng có phải trải qua một cuộc gọi bán hàng để xác định giá của sản phẩm đó hay không. Trong thế giới Web2, bạn không thể tìm thấy PitchBook hoặc CB Insights có giá bao nhiêu. Trong tiền điện tử, bạn không biết một sản phẩm như Chainalysis sẽ có giá bao nhiêu.
Bỏ chuyện đùa sang một bên, một phần lý do của quy trình bán hàng như vậy là do dịch vụ thực hành, găng tay trắng được cung cấp bởi các sản phẩm dữ liệu hướng đến phân khúc người tiêu dùng này. Những người dùng này thường chọn dữ liệu có độ chi tiết cao và thường xuyên. Họ yêu cầu dữ liệu không chỉ cho các quyết định trước giao dịch mà còn cho mục đích sử dụng sau giao dịch để đáp ứng các yêu cầu tuân thủ và thuế.
Ví dụ: họ cần các sản phẩm cho họ biết giá trị lịch sử của danh mục đầu tư của họ, giúp họ tính thuế, v.v. Các công ty như Amberdata, Kaiko, CoinMetrics, CryptoCompare và ở một mức độ nào đó là Nansen phục vụ những khách hàng này.
Theo kinh nghiệm của tôi, chỉ những người sáng lập có nền tảng làm việc trong các tổ chức hoặc nhóm có vòng tài trợ lớn mới có thể mở cửa thị trường dữ liệu của tổ chức. Rào cản gia nhập ở đây tương đối cao, giống như trường hợp của bất kỳ sản phẩm doanh nghiệp nào.
Chúng ta thường bắt gặp tính năng tổng hợp của Web3, điều đó có nghĩa là các ứng dụng Web3 có thể phụ thuộc lẫn nhau. Họ có thể yêu cầu dữ liệu từ nhau. Vì vậy, họ liên tục cần đọc dữ liệu từ nhau. Ví dụ: một nền tảng như Yearn Finance cần đọc dữ liệu từ Aave và Hợp chất, đồng thời một công cụ tổng hợp NFT như Tensor cần đọc dữ liệu từ Magic Eden và các thị trường khác.
Nhưng dữ liệu này được lưu trữ trên các khối trên các chuỗi như Ethereum và Solana. Ethereum tạo một khối trong 12 giây và Solana thực hiện điều đó trong 400 mili giây. Sắp xếp dữ liệu blockchain thành các bảng và lưu trữ để truy cập nhanh là một nhiệm vụ không hề đơn giản. Đây là lúc những người lập chỉ mục như Covalent, Graph, Chainlink và Powerloom xuất hiện. Họ đảm bảo rằng dữ liệu blockchain thô được lưu trữ ở định dạng mong muốn để các nhà phát triển có thể tìm nạp dữ liệu đó thông qua các lệnh gọi API đơn giản.
Một phân khúc mới nổi trong tính cách người tiêu dùng này liên quan đến các công cụ được sử dụng để hiểu hành vi của người dùng. Chẳng hạn, ARCx cho phép các nhà phát triển ánh xạ dữ liệu ngoài chuỗi (như hành vi của trình duyệt) với dữ liệu trên chuỗi (như địa chỉ ví) để nắm bắt thông tin nhân khẩu học của người dùng tương tác với dApp. Chúng nằm trong một phân khúc tương đối nhỏ nhưng phù hợp vì chúng giúp các nhà phát triển xác định người dùng của họ là ai.
Các sản phẩm dữ liệu trong tiền điện tử thường được phân phối bằng cách cộng tác với các nhà nghiên cứu và nhà xuất bản. Ví dụ, CCData thường được trích dẫn trên Bloomberg. Các nhà nghiên cứu được khuyến khích dựa vào các sản phẩm dữ liệu vì chúng giúp tiết kiệm thời gian và công sức khi thu thập, làm sạch hoặc quản lý dữ liệu. Những sản phẩm như Dune đã tạo dựng được hào quang bằng cách xây dựng một cộng đồng các nhà phân tích cạnh tranh với nhau để được xếp hạng cao hơn trong danh sách của họ.
Các ấn phẩm như The Block và Delphi giới thiệu các trang tổng quan được xây dựng bằng dữ liệu từ các nhà cung cấp bên thứ ba. Tại Decentralised.co, chúng tôi hoàn toàn dựa vào các nhà cung cấp dữ liệu bên ngoài vì họ giúp nhóm luôn tinh gọn trong khi sử dụng các tài nguyên bên ngoài khi thu thập dữ liệu.
Thách thức trong việc phục vụ phân khúc người tiêu dùng này là các nhà nghiên cứu nhỏ hơn có thể không có đủ ngân sách cần thiết để biện minh cho việc chi tiêu những nguồn lực to lớn để tìm ra những hiểu biết sâu sắc có thể chỉ liên quan đến một người. Ngược lại, các công ty được khuyến khích dành nhiều công sức và nguồn lực để hợp tác với các ấn phẩm quan trọng như Financial Times vì nó giúp ích cho việc phân phối.
Các sản phẩm hướng tới các nhà đầu tư bán lẻ thường có độ chi tiết và tần suất dữ liệu thấp hơn. Nhưng họ là những ngóc ngách có lợi nhuận cao để xây dựng vì họ nhận thấy tính kinh tế nhờ quy mô. Mười nghìn người dùng trả 100 USD cho mỗi người dùng là một hoạt động kinh doanh ARR trị giá 1 triệu USD trong một thế giới không tồn tại dịch vụ rời bỏ. Nói thì dễ hơn làm, nhưng những vấn đề kinh tế đó giải thích tại sao chúng ta có rất nhiều sản phẩm dữ liệu tiền điện tử hướng đến bán lẻ.
Phần lớn các sản phẩm hướng tới bán lẻ đều miễn phí hoặc được hỗ trợ bởi quảng cáo. Ví dụ: một tài nguyên miễn phí như DefiLlama sẽ không cho bạn biết cách bạn có thể định tuyến đơn đặt hàng của mình qua các sàn giao dịch khác nhau (CEX và DEX) để tránh trượt giá vì nó không chụp ảnh nhanh sổ đặt hàng nhưng nó hiển thị thông tin về việc mở khóa mã thông báo hoặc mở khóa lợi nhuận.
Một thay đổi trong phân khúc người tiêu dùng này là cách phương tiện phân phối mở ra một danh mục thị trường mới—ví dụ: Cielo cung cấp dữ liệu dưới dạng thông báo qua Telegram. Nó đã mở rộng quy mô tới hơn 40.000 người dùng bằng cách chuyển tiếp thông tin theo cách dễ sử dụng cho phân khúc người tiêu dùng không muốn sử dụng giao diện máy tính để bàn. Khi thực hiện đúng, ngay cả các phương tiện phân phối cũng có thể trở thành điểm khác biệt cho các dự án kinh doanh ở giai đoạn đầu. Ngay cả trong dữ liệu.
Mặc dù việc phân loại có nhiều điểm mờ nhạt, nhưng các công ty dữ liệu có thể được chia thành các hướng B2B hoặc B2C.
Các công ty như Amberdata và Kaiko có những sản phẩm phục vụ cho những diễn viên sành điệu. Các sản phẩm này chi tiết hơn (chi tiết về dữ liệu có sẵn) và thường xuyên (ví dụ: dữ liệu sổ đặt hàng theo từng tích tắc và thời gian thực), đồng thời đáp ứng các nhu cầu như xây dựng và thử nghiệm mô hình, phân tích trước giao dịch, báo cáo sau giao dịch, thuế và tuân thủ. Dữ liệu được cung cấp ở định dạng cho phép khách hàng thực hiện các phân tích độc quyền và xây dựng hình ảnh trực quan theo sở thích của họ. Các công ty này thường cung cấp sản phẩm của họ sau một bức tường phí.
Chi phí nói chung là một hàm số chi tiết do các yêu cầu về cơ sở hạ tầng, tính chất của nhóm khách hàng liên quan và độ dài của chu kỳ bán hàng.
Hình ảnh trên ánh xạ các sản phẩm khác nhau trên hai trục – độ sâu và độ chi tiết so với giá của sản phẩm. Xin lưu ý rằng những lô này không chính xác. Một số điểm có thể bị đặt nhầm chỗ. Ý tưởng là phát triển một mô hình tư duy để suy nghĩ về một số sản phẩm và vị thế của chúng trên thị trường.
Các sản phẩm tập trung vào bán lẻ như Dune hoặc CoinGecko hiển thị gần như tất cả dữ liệu miễn phí. Khách hàng phải trả tiền để truy cập một số dữ liệu hoặc nếu họ muốn dữ liệu qua API để chạy phân tích của họ. Ví dụ: bạn có thể xem tất cả các biểu đồ được tạo bởi một số trình hướng dẫn Dune, nhưng chúng giới hạn số lượng hàng bạn có thể tải xuống ở dạng CSV. Bạn có thể tải xuống các tệp CSV lớn hơn và xem các truy vấn riêng tư khi bạn trả nhiều tiền hơn.
Các công ty tập trung vào bán lẻ có xu hướng có doanh thu trên mỗi khách hàng thấp và ít khách hàng trả tiền tính theo phần trăm người dùng miễn phí. So sánh tỷ lệ này với tỷ lệ chuyển đổi cho các mô hình freemium của các công ty internet. Thông thường, tỷ lệ chuyển đổi là 2%–5%. Tỷ lệ chuyển đổi 10% sẽ là một ngoại lệ. Bí quyết của họ là có càng nhiều khách hàng miễn phí càng tốt để tỷ lệ chuyển đổi 4% đóng góp đáng kể vào doanh thu. Đây là những gì chúng tôi gọi là đỉnh của kênh.
Vì vậy, các công ty dữ liệu cần phần trên cùng của kênh đủ lớn để tạo ra đủ doanh thu nhằm duy trì hoạt động của mình ở mức tỷ lệ chuyển đổi thấp hơn. Các công ty cũng có thể xem xét việc tạo doanh thu từ quảng cáo khi trang web có nhiều người truy cập. CoinGecko sử dụng doanh thu quảng cáo làm đòn bẩy để tiếp tục cung cấp hầu hết dữ liệu miễn phí.
Trong những năm qua, các công ty đã lấp đầy các điểm ở cả hai đầu của phổ (B2B và B2C), để lại một số khoảng trống ở giữa. Nếu ai đó muốn xem sổ đặt lệnh đang thay đổi như thế nào trên các sàn giao dịch tập trung hoặc tỷ lệ quyền chọn bán, IV và độ lệch đang thay đổi như thế nào thì sẽ không có nhiều sản phẩm hỗ trợ trực quan hóa. Có không gian cho một sản phẩm chi tiết hơn CoinGeckos trên thế giới nhưng ít chi tiết hơn các sản phẩm của người chơi B2B thuần túy.
Tìm được con hào ở những doanh nghiệp có nguồn nguyên liệu miễn phí không phải là điều dễ dàng. Dữ liệu chuỗi khối có sẵn miễn phí. Không có gì độc quyền về dữ liệu bạn có thể thu thập. Vì vậy, lợi thế trong kinh doanh dữ liệu không chỉ dựa vào việc bạn có một số dữ liệu mà người khác không có. Thay vào đó, chúng dựa trên khả năng của nhóm trong việc cung cấp dữ liệu theo định dạng sâu sắc, dễ sử dụng, đúng thời gian và không có lỗi.
Nhiều công ty tuyên bố có cùng một dữ liệu, nhưng chất lượng dữ liệu và cách trình bày của nó khác nhau. Ví dụ: nhiều công ty tuyên bố có dữ liệu sổ đặt hàng ngoài chuỗi. Tuy nhiên, các yếu tố như số lượng đơn đặt hàng/đặt mua, độ dài chuỗi thời gian cũng như số lượng sàn giao dịch và cặp giao dịch có sẵn sẽ khác nhau tùy theo nhà cung cấp. Amberdata và Kaiko có dữ liệu sổ đặt hàng toàn diện nhất cho thị trường tiền điện tử.
Tuy nhiên, tại sao chỉ có một số nhà cung cấp có thể cung cấp loại dữ liệu này? Lời giải thích về nơi xuất hiện các hào trong dữ liệu Web3 nằm ở đây.
Tài năng – Có nguy cơ nói lên điều hiển nhiên, khi nguyên liệu miễn phí, cách bạn nhào nặn sẽ quyết định giá trị của sản phẩm. Việc biến dữ liệu thô thành thông tin hữu ích đòi hỏi phải có kiến thức chuyên môn về lĩnh vực ở nhiều lĩnh vực trong thị trường tiền điện tử và tài chính truyền thống. Các nhóm như Velo Data, với kinh nghiệm trong các thị trường truyền thống, có lợi thế hơn những nhóm khác đang cố gắng xây dựng các sản phẩm B2C tương tự. Việc tìm kiếm các nhà phát triển tài năng hiểu cấu trúc dữ liệu blockchain và có kinh nghiệm liên quan trên thị trường tài chính là rất hiếm.
Cơ sở hạ tầng – Việc thu thập và phân phối lượng lớn dữ liệu đòi hỏi cơ sở hạ tầng không hề dễ dàng. Loại hoạt động này đòi hỏi vốn và tài năng. Tại sao cơ sở hạ tầng lại là một con hào? Hãy nghĩ về dữ liệu vùng bộ nhớ. Các khối chứa dữ liệu cho các giao dịch được xác nhận. Còn những giao dịch chưa được xác nhận thì sao?
Các nút mạng khác nhau (ví dụ: các nút được kết nối với cùng một nhóm) sẽ thấy các giao dịch chưa được xác nhận khác nhau. Chỉ chạy một nút sẽ không cung cấp cái nhìn toàn cảnh về các giao dịch cạnh tranh. Việc duy trì nhiều nút trên một số chuỗi khối sẽ làm tăng thêm chi phí cơ sở hạ tầng. Giống như AI (và mạng nội dung trước đây), khả năng giữ chi phí phần cứng ở mức thấp trong khi mở rộng quy mô sẽ quyết định người thắng và người thua trong lĩnh vực này theo thời gian.
Hiệu ứng mạng –Người ta có thể đưa ra giả thuyết rằng hiệu ứng mạng tồn tại trong nhiều sản phẩm dữ liệu tiền điện tử. Lấy Chainlink làm ví dụ. Đó là một trong những oracle đầu tiên cho phép ứng dụng đọc dữ liệu từ các ứng dụng hoặc chuỗi khác. Nó đã thu hút được sự ủng hộ của cộng đồng và có một trong những cộng đồng mạnh nhất. Một ví dụ khác là Nansen. Tuyên bố nổi tiếng của nó là nhãn địa chỉ cho phép nó quy chuyển động tài sản cho các thực thể thực thay vì địa chỉ thập lục phân.
Sau đó, nó đã ra mắt các tính năng như NFT Paradise và Token God Mode, cho phép người dùng theo dõi NFT và token hiệu quả hơn. Arkham đã tung ra một sản phẩm tương tự như nhãn của Nansen, nhưng việc đầu tư vào bảng điều khiển và nghiên cứu đã cho phép Nansen hướng tới các khách hàng doanh nghiệp và cung cấp các sản phẩm phù hợp với họ. Điều đáng nói là không thể có hiệu ứng mạng nếu không có hai điểm đầu tiên (tài năng và cơ sở hạ tầng).
Một nơi mà tính năng này hoạt động hiệu quả là với những người lập chỉ mục. Số lượng chuỗi mà sản phẩm hỗ trợ càng cao thì khả năng nhà phát triển sử dụng sản phẩm đó thay vì dựa vào nhiều nguồn càng cao. Các nhóm như Covalent có lợi thế ở đây vì họ đã tối ưu hóa độ rộng của các chuỗi được hỗ trợ trong một thời gian khá lâu. Nhưng hãy nhớ rằng chiều sâu cũng quan trọng như chiều rộng.
Còn quá sớm để nói liệu có sản phẩm nào có lợi thế quan trọng trong tiền điện tử hay không. Chúng ta đã chứng kiến những lợi thế của người đi đầu trong kế hoạch lớn của mọi việc. Khi các danh mục như mạng xã hội Web3 và sự chồng chéo giữa AI và tiền điện tử tiếp tục mở rộng quy mô, các sản phẩm dữ liệu trong ngành có thể phát triển thành Bảng chữ cái tiếp theo. Nhưng đó sẽ là câu chuyện kéo dài nhiều thập kỷ; chúng ta vẫn đang trong những năm đầu của nó.
Nhiều trường hợp sử dụng mà chúng tôi đề cập trong bài viết này xem xét hoạt động đầu cơ tài chính dưới hình thức này hay hình thức khác. Ngay cả các nhà phát triển sử dụng API để truy vấn dữ liệu cũng đang xây dựng các sản phẩm tài chính. Nghe có vẻ kỳ lạ, nhưng blockchain (như một mạng mới) cũng đi theo xu hướng tương tự như Telegraph và Internet đã làm.
Sự xuất hiện của một phương tiện mới và sự xuất hiện của một mạng lưới mới sẽ đẩy nhanh các trường hợp sử dụng tài chính. Với Internet, phải đến đầu những năm 2000, mọi người mới nhận ra rằng người dùng có thể bị nhắm mục tiêu dựa trên vị trí của họ. Với blockchain, chúng tôi vẫn đang tìm cách xây dựng các mô hình kinh doanh dựa trên các dữ liệu có sẵn công khai.
Chúng tôi đã thấy một thay đổi quan trọng trong việc sử dụng các nền tảng này hàng ngày – Dune Analytics nhúng AI vào sản phẩm của họ. Dune cung cấp giao diện dựa trên SQL để người dùng truy vấn dữ liệu trên các chuỗi khối như Ethereum và Solana. Thị trường cho một sản phẩm như vậy thường chỉ dành cho những người dùng hiểu cách viết truy vấn SQL. Gần đây họ đã bắt đầu sử dụng AI để giúp các nhà phân tích tạo ra các truy vấn mà không cần phải là chuyên gia SQL. Nó không có chức năng như người ta mong đợi. Nhưng đó vẫn là một bước tiến tới tương lai. Có thể không lâu nữa chúng ta sẽ yêu cầu AI (như ChatGPT) truy vấn dữ liệu trên blockchain và đưa ra phân tích về dữ liệu đó.
Một cách để nghĩ về “dữ liệu” trong bối cảnh Web3 là qua lăng kính của Google Maps. GPS đã xuất hiện ít nhất từ những năm 1980. Google đã thực hiện công việc cần thiết để vạch ra thế giới. Khi cung cấp lớp phủ cho bản đồ cho các ứng dụng của bên thứ ba (sử dụng API), công ty đã cho phép xây dựng một thế hệ ứng dụng mới. Mọi thứ từ giao hàng đến gọi xe đều bùng nổ vì một người chơi chuyên về dữ liệu đã gánh gánh nặng đó từ các nhà phát triển.
Các sản phẩm dữ liệu trong Web3 cũng đóng vai trò tương tự. Chúng tôi vẫn chưa biết bản chất chính xác của các ứng dụng có thể được xây dựng trên nguồn tài nguyên có sẵn công khai này, nhưng ngày càng rõ ràng rằng có một cơ hội có quy mô bảng chữ cái trong bối cảnh dữ liệu.
Tác phẩm này ban đầu được xuất bản trên Decentralised.co. Chúng tôi tại GCR sẽ mang đến cho bạn các biểu mẫu dài từ Phi tập trung hai lần mỗi tháng – vào thứ Năm luân phiên! Decentralised.co được ban quản lý của hơn 200 công ty tin tưởng để luôn cập nhật các xu hướng, dữ liệu và hiểu biết quan trọng. Đăng ký nhận bản tin của họ bên dưới—thông tin thêm về sự hợp tác này dành cho những thành viên tích cực nhất của chúng tôi trên Discord.
Này,
Chúng tôi đã viết đoạn giới thiệu trước cho phần này vào ngày 18 tháng 7 nếu bạn muốn ngữ cảnh vượt xa những gì được viết ở đây.
Tất cả các sinh vật sống đều giữ một số kỷ lục. Động vật theo dõi các mùa để hiểu khi nào nên đi săn. Loài gặm nhấm và chim lưu trữ thức ăn ở những nơi độc đáo. Họ cần phải nhớ nơi họ đã lưu trữ nó khi truy cập nó để lấy thức ăn trong nhiều tháng sau đó. Sói tạo ra các dấu hiệu xung quanh chu vi lãnh thổ của chúng để báo hiệu cho các động vật khác tránh xa. Ngay cả cây cối cũng theo dõi thời gian. Hàng năm, một vòng được hình thành trong thân cây. Người ta có thể ước tính tuổi của cây dựa trên số vòng.
Mặc dù cây cối và động vật có thể theo dõi thời gian nhưng chúng không thể nhớ lại hoặc thuật lại quá khứ. Họ không có quyền truy cập vào bộ nhớ. Đó là điều làm cho việc ghi chép của con người trở nên khác biệt. Nhờ khả năng giao tiếp, chúng ta biết rằng người Sumer ở Lưỡng Hà (3400 TCN) và người Ai Cập cổ đại (3200 TCN) đã sử dụng chữ hình nêm và chữ tượng hình để ghi lại thông tin.
Nhân loại tiến hóa khi kiến thức có thể được truyền đi mà không cần đến nguồn gốc vật chất. Chúng ta đọc và thưởng thức các tác phẩm của Plato hay Socrates rất lâu sau khi chúng không còn nữa vì chúng ta có phương tiện để lưu giữ những lời dạy của họ. Viết là nền tảng AR ban đầu.
Viết từ Iran theo dõi ngũ cốc. Nguồn: Liên kết
Trong khi việc viết lách để mọi thứ nằm trong trí tưởng tượng thì dữ liệu lại giúp mọi thứ trở nên khách quan. Nó làm giảm yêu cầu của các cá nhân về việc lưu trữ mọi thứ trong trí nhớ của họ. Đây là một phần lý do tại sao một số văn bản cổ xưa nhất của con người liên quan đến nợ nần, thu nhập hoặc hồ sơ thương mại.
Trong thời đại hậu công nghiệp, các công ty đã xây dựng các con hào cạnh tranh để củng cố vị thế trên thị trường bằng cách chuyển sang kỹ thuật số với hồ sơ bán hàng của họ. Một ví dụ về điều này là công ty Ấn Độ có tên Asian Paints. Sơn của họ có thể không phải là loại sơn tốt nhất trên thị trường, nhưng họ kiểm soát hơn 50% thị phần trong ngành sơn trị giá 8 tỷ USD của Ấn Độ.
Tại sao? Câu trả lời dễ dàng là đây là một thương hiệu gia đình và công ty có lợi thế kinh tế nhờ quy mô. Nhưng cách họ đến đó có nguồn gốc từ dữ liệu. Họ đầu tư rất nhiều vào việc thu thập và xử lý dữ liệu để tối ưu hóa chuỗi cung ứng của mình.
Trong bối cảnh đó, cổ phiếu Asian Paints đã có tốc độ CAGR đáng kinh ngạc là 25% trong 30 năm qua. Hỗ trợ cho sự tăng trưởng đó là khoản đầu tư vào máy tính lớn vào những năm 1970. Thiết bị này mạnh hơn những thiết bị được sử dụng tại các tổ chức nghiên cứu tốt nhất ở Ấn Độ vào thời điểm đó. Nó thu thập dữ liệu hàng giờ về màu sắc và số lượng sơn được bán trên khắp Ấn Độ. Điều này cho phép Asian Paints xây dựng một mô hình dự đoán nhu cầu sơn trên khắp Ấn Độ với độ chính xác 98%.
Khả năng dự đoán này cho phép Asian Paints đạt được giá trị tối đa vì nó có thể giảm đáng kể thời gian bổ sung. Vào thời điểm đó, tiêu chuẩn bán hàng hóa như sơn là bán cho người bán buôn, người này sau đó sẽ giao cho nhà phân phối, người này sẽ bán lại cho đại lý. Các đại lý sẽ tương tác trực tiếp với người tiêu dùng. Lý do cho chuỗi cung ứng phức tạp như vậy là vì mỗi bên nắm giữ một bản kiểm kê tài sản và kiểm soát dữ liệu về cung và cầu sơn.
Ông Choksey – người sáng lập Asian Paints, đã loại bỏ các nhà bán buôn và nhà phân phối khỏi chuỗi cung ứng bằng cách nghiên cứu mô hình tiêu dùng của người dùng cuối và giảm sự phụ thuộc vào người trung gian. Thông qua việc loại bỏ những người trung gian, Asian Paints đã thu được 97% MRP (3% cho các đại lý) so với 60% mà các đối thủ cạnh tranh của họ thu được.
Giá trị có thể trích xuất được của điện báo sẽ là các băng mã đánh dấu chạy trước được chuyển tiếp qua Điện báo.
Quá trình chuyển đổi sang kỹ thuật số không xảy ra chỉ sau một đêm. Một phần khiến việc thu thập dữ liệu trở nên thú vị là thế giới tài chính và mức độ kết nối giữa nó dần dần. Ví dụ, vào cuối thế kỷ 20, dữ liệu thị trường chứng khoán được chuyển tiếp qua điện báo bằng các thiết bị như thiết bị trên. Ngay từ năm 1835, các thương nhân đã huấn luyện chim bồ câu mang những mảnh giấy có thông tin về những gì đang xảy ra ở châu Âu. Khi tàu hơi nước chở hàng hóa cách đất liền 50 dặm, chim bồ câu sẽ bay đến những điểm được chỉ định để cung cấp thông tin. Các nhà giao dịch thường trả trước tới 500 USD cho mỗi giờ họ có thể nhận được tin tức.
Đến năm 1867, các nhà giao dịch bắt đầu cạnh tranh để tối ưu hóa tốc độ truyền tải thông tin qua điện báo. Một nhân viên của Western Union tên là E. A Calahan đã trả hơn 200 nghìn đô la cho NYSE để có thể cử nhân viên đến sàn giao dịch của họ để chuyển tiếp dữ liệu về mã cổ phiếu cho khách hàng của mình. Một trong những cá nhân đang nỗ lực tối ưu hóa hệ thống là nhà khoa học trẻ tên là Thomas Alva Edison. Một thế kỷ sau, các công cụ như thiết bị đầu cuối Bloomberg sẽ tăng tốc độ và lượng dữ liệu tài chính được chuyển tiếp theo cấp số nhân vào bất kỳ ngày nào.
Dữ liệu, giống như dầu thô, phải trải qua nhiều bước sàng lọc trước khi có thể sử dụng. Tìm hiểu cách Bloomberg phát triển sẽ làm sáng tỏ toàn bộ bối cảnh dữ liệu đã phát triển như thế nào và quy trình nào. Bloomberg không phải là nỗ lực đầu tiên sử dụng công nghệ để cải thiện cơ chế giao dịch và báo cáo. NASDAQ đã sử dụng thiết bị đầu cuối Bunker Ramo để phổ biến thông tin và đặt lệnh mua/bán. Tuy nhiên, việc dựa vào các mạng liên lạc qua điện thoại trước đây có nghĩa là việc mở rộng mô hình này sẽ luôn gặp nhiều thách thức.
Nguồn - NASDAQ - Sự phát triển của giao dịch OTC tự động
Năm 1981, Michael Bloomberg, một đối tác của ngân hàng đầu tư Solomon Brothers, đã bị sa thải với 10 triệu USD vốn cổ phần của mình khi Tập đoàn Phibro mua lại ngân hàng này. Ông nhận ra rằng các nhà đầu tư sẵn sàng trả tiền cho thông tin tài chính hợp lý với quá trình điện tử hóa ngày càng tăng của các thị trường tài chính từ New York đến Nhật Bản. Ông thành lập một công ty dịch vụ dữ liệu có tên Innovative Market System, được đổi tên thành Bloomberg vào năm 1986.
Trước khi Internet phát triển, Bloomberg Terminal được truy cập bằng The Chiclet. Thiết bị này được kết nối với bộ điều khiển Bloomberg thông qua một cáp đặc biệt được kết nối với trung tâm cục bộ thông qua đường dây điện thoại chuyên dụng. Bloomberg thu thập dữ liệu thông qua quan hệ đối tác dữ liệu, hãng tin và thông cáo báo chí, các phương pháp độc quyền như nhập dữ liệu thủ công và thu thập dữ liệu qua điện thoại.
Với Internet, các cánh cổng thông tin đã mở ra. Ngày nay, Bloomberg thu thập, xử lý và cung cấp 200 tỷ thông tin tài chính gần như theo thời gian thực. Đó là khoảng 23 triệu điểm dữ liệu mỗi giây. Một số thông tin có sẵn trên Bloomberg là công khai. Các điểm dữ liệu như báo cáo tài chính, giá cổ phiếu và trái phiếu của công ty có thể được tìm thấy trên các diễn đàn công cộng.
Nhưng nếu bạn là một nhà phân tích dầu khí và muốn tìm hiểu chuyển động của các thùng chứa dầu thô thì sao? Bạn khó có thể nhận được thông tin này trong thời gian thực nếu bạn không đăng ký nguồn dữ liệu như Bloomberg. Không phải tất cả dữ liệu trên internet đều có sẵn miễn phí.
Thông thường có hai hạn chế đối với các cá nhân khi nói đến dữ liệu trong Web2: quyền truy cập được cấp phép và rào cản cao trong việc xử lý lượng lớn dữ liệu. Trong những năm qua, các nhà cung cấp như Bloomberg đã xây dựng hiệu ứng mạng đủ mạnh để lấy dữ liệu thông qua các chi nhánh của họ, điều mà các nhà phân tích hoặc nhà đầu tư không đủ khả năng để làm.
Tốt hơn là trả 20.000 USD cho Bloomberg để đăng ký hàng năm hơn là cố gắng lấy dữ liệu từ nhiều nền tảng dữ liệu mà mỗi nền tảng có thể có các mức giá khác nhau. Ngay cả khi bạn nỗ lực hết sức để có được dữ liệu, bạn cũng không thể xử lý và chạy phân tích trong thời gian thực nếu không có chi tiêu cơ sở hạ tầng đáng kể. Về mặt bán lẻ, nhiều nền tảng cuối cùng đã mở rộng quy mô – là các công cụ khớp dữ liệu.
Hãy nghĩ theo cách này: Google (công cụ tìm kiếm) là một công ty dữ liệu cung cấp cho các doanh nghiệp quyền truy cập vào người dùng để đổi lấy tiền quảng cáo. Khi một nhà hàng hoặc một bản tin (như của chúng tôi) muốn nhắm mục tiêu đến người dùng đang tìm kiếm thông tin trên Google, họ sẽ khớp cung và cầu về thông tin tương tự. Ai đó đang tìm kiếm thông tin về một bản tin cụ thể cho Web3 đang tìm kiếm chúng tôi. Và chúng tôi đang tìm kiếm người đó. (Tôi đang chống lại sự thôi thúc đưa chương trình giới thiệu của chúng tôi vào đây.)
Google đã tạo dựng được sự độc quyền nhờ vào quy mô kinh tế mà nó hoạt động. Danh sách người dùng của họ và số lượng truy vấn mà người dùng của họ thực hiện mỗi ngày vẫn không có đối thủ. Google đã xây dựng vị trí đó bằng cách tung ra một công cụ tìm kiếm không có quảng cáo vào thời điểm mà quảng cáo là tiêu chuẩn, sau đó thông qua việc mua lại YouTube và Android, và cuối cùng, thông qua việc trả tiền cho các công ty ngang hàng như Apple để biến Google thành công cụ tìm kiếm mặc định. Riêng đối với Apple, Google trả 20 tỷ USD mỗi năm để duy trì là công cụ tìm kiếm mặc định trên Safari.
Google trả khoản phí bảo hiểm đó vì về cốt lõi, sản phẩm của họ là một công cụ phù hợp. Công cụ kết hợp giúp người dùng có nhu cầu liên hệ với các doanh nghiệp cung cấp sản phẩm. Về cốt lõi, hầu hết các công ty độc quyền về web đều là các công cụ phù hợp. Amazon kết nối người bán sản phẩm với người mua. Instagram kết nối khán giả với người sáng tạo. Các công cụ so khớp này hoạt động vì các tương tác trên các sản phẩm này để lại những dấu vết phong phú từ đó có thể điều khiển bối cảnh.
Ben Evans đã viết một câu nổi tiếng vào năm 2022 rằng không có thứ gọi là dữ liệu. Việc biết nội dung, món ăn hoặc sở thích du lịch của tôi không có giá trị nhiều đối với bên thứ ba. Nó trở nên có giá trị – đối với thương mại hoặc nghiên cứu – chỉ khi nó được tổng hợp hoặc làm phong phú thêm ngữ cảnh.
Bối cảnh theo nghĩa là sở thích ăn biriyani của tôi vào tối thứ Sáu có thể được sử dụng để quảng cáo việc giao biriyani cho tôi một cách chính xác khi xác suất tôi mua nó là cao nhất. Nhìn chung, việc so sánh xác suất mua hàng của tôi với một đối tác ngang hàng trong cùng khu vực sẽ giúp nhắm mục tiêu người dùng tốt hơn.
Dữ liệu cần có quy mô (với số lượng lớn) hoặc ngữ cảnh mới có giá trị. Điểm khác biệt giữa các sản phẩm Web3 và Web2 về mặt lịch sử nằm ở dấu vết mà chúng để lại. Chỉ Amazon mới biết có bao nhiêu bộ điều khiển Xbox sẽ bán được trong một tuần nhất định. Nhưng bạn có thể thấy mô hình mà các nhà giao dịch mua hoặc bán NFT trên OpenSea vào bất kỳ ngày nào. Lý do là mỗi giao dịch đó đều để lại dấu vết công khai.
Các sản phẩm dữ liệu trong Web3 sử dụng những đường dẫn đó để xây dựng ngữ cảnh.
Các chuỗi khối như Ethereum và Bitcoin tạo ra các khối tương ứng cứ sau 12 giây và ~ 10 phút. Mỗi khối chứa các giao dịch thay đổi trạng thái của blockchain. Các trình khám phá khối như Etherscan thu thập dữ liệu liên quan đến tất cả các giao dịch. Ví dụ: nếu bạn truy cập Etherscan và thấy một khối, hình ảnh bên dưới là những gì bạn có thể thấy.
Các giao dịch trên blockchain rất phong phú về ngữ cảnh. Các sản phẩm như Arkham và Nansen là công cụ giải thích để các nhà nghiên cứu hiểu điều gì đang xảy ra khi giao dịch xảy ra.
Bạn có thể xem tất cả các khối kể từ khi Ethereum bắt đầu. Nhưng bạn có thể làm gì với thông tin này? Hầu như không có gì. Vì vậy, bạn cần một cách để thu thập dữ liệu này trong một số bảng. Ví dụ: bất cứ khi nào hợp đồng NFT của thị trường được gọi trong một khối, dữ liệu liên quan đến giao dịch đó sẽ được thêm vào các bảng liên quan đến NFT hoặc khi hợp đồng Uniswap được gọi, dữ liệu liên quan sẽ được lưu trữ trong các bảng liên quan đến DEX . (Dune thực hiện việc này như một dịch vụ.)
Bạn không thể phân tích dữ liệu thô mà không phải chịu chi phí cơ sở hạ tầng đáng kể. Vì vậy, mặc dù dữ liệu được cung cấp miễn phí nhưng bạn vẫn gặp phải những vấn đề tương tự. Bạn dựa vào dữ liệu bên ngoài với tư cách là nhà đầu tư hoặc người xây dựng dApp. Nhưng chức năng cốt lõi của bạn không liên quan đến việc thu thập và quản lý dữ liệu. Việc sử dụng nguồn lực cho các hoạt động thiết yếu nhưng không cốt lõi không phải là điều xa xỉ mà mọi tổ chức đều có thể tận hưởng.
Đối với các sản phẩm dữ liệu, bối cảnh xung quanh dữ liệu làm cho sản phẩm trở nên độc đáo. Bloomberg áp dụng hiểu biết về tài chính của mình và chuyển đổi dữ liệu thành dạng mà các nhà phát minh và nhà giao dịch có thể dễ dàng sử dụng. Các trang web như Sameweb hoặc các ấn phẩm nghiên cứu như Newzoo sử dụng năng lực cốt lõi của mình để áp dụng bối cảnh liên quan đến xã hội hoặc trò chơi vào dữ liệu họ theo dõi.
Các sản phẩm dữ liệu gốc của chuỗi khối tự phân biệt bằng cách cung cấp ngữ cảnh của người dùng thông qua các truy vấn trả lời các câu hỏi có liên quan đến các tập hợp con người dùng cụ thể. Ví dụ: TokenTerminal tính toán các nguyên tắc cơ bản về kinh tế của các giao thức. Nansen giúp những người tham gia thị trường gắn nhãn và hiểu được sự chuyển động của tài sản. Parsec truy vấn dữ liệu trên chuỗi để giúp các nhà giao dịch phân tích tốt hơn các vị trí DeFi.
Tất cả những sản phẩm này đều có nguồn gốc từ hàng hóa công cộng: dữ liệu trên chuỗi. Sự khác biệt là cách các sản phẩm này trình bày dữ liệu của chúng, điều này khiến chúng thu hút các đối tượng khác nhau.
Sự phân chia danh mục sản phẩm trong ngành của chúng tôi dựa trên dữ liệu nào được đưa vào chuỗi và thông tin nào được lấy từ các nguồn ngoài chuỗi. (Một số thường sử dụng cả hai.) Nhà cung cấp dữ liệu sử dụng bộ lọc ngữ cảnh của họ để tạo ra sản phẩm. Giống như dữ liệu Web2 có những vị trí thích hợp, các công ty dữ liệu Web3 đã xây dựng hoặc đang dần xây dựng những con hào bằng cách sử dụng năng lực cốt lõi của họ.
Vì vậy, lý lịch của những người sáng lập thường quyết định tính chất của các sản phẩm được phát hành. Khi một nhóm nòng cốt đã dành thời gian đáng kể trên thị trường vốn trước tiền điện tử, các sản phẩm của họ có xu hướng bắt chước Bloomberg, trong khi các sản phẩm gốc tiền điện tử trông giống Nansen. Các sản phẩm khác nhau đáp ứng các nhu cầu khác nhau, ngay cả khi truy vấn cùng một dữ liệu.
Chẳng hạn, các sàn giao dịch thường loại bỏ dữ liệu sau những khoảng thời gian cố định. Họ không kinh doanh dữ liệu và việc lưu trữ dữ liệu cũ đòi hỏi phải có thêm máy chủ và quản lý. Một số nhà cung cấp dữ liệu, như Kaiko và Amberdata, duy trì dữ liệu sổ đặt hàng lịch sử từ các sàn giao dịch. Dữ liệu như vậy cho phép các nhà giao dịch và nhà đầu tư xây dựng các mô hình để kiểm tra giả thuyết của họ. Nhưng nếu bạn muốn hiểu hợp đồng DeFi nào đang tràn vào dòng ETH hoặc stablecoin hoặc phân tích hành vi trên chuỗi của các địa chỉ hoặc tổ chức cụ thể, bạn sẽ cần một sản phẩm của Nansen hoặc Arkham.
Bản đồ thị trường không đại diện cho mọi người chơi ở mọi danh mục.
Một cách để hiểu cách các sản phẩm được định vị trên thị trường là thông qua lăng kính của người tiêu dùng trong lĩnh vực tiền điện tử. Những tính cách này có thể được phân loại thành bốn loại chính sau đây.
Hầu hết đô la chảy qua các sản phẩm dữ liệu tiền điện tử đều đến từ các tổ chức tài chính trong thời kỳ thị trường giá xuống. Đây là những khách hàng có giá trị lớn với chu kỳ bán hàng dài hơn và yêu cầu dữ liệu phức tạp hơn nhiều. Một cách để biết liệu một sản phẩm có hướng đến các tổ chức tài chính hay không là liệu khách hàng có phải trải qua một cuộc gọi bán hàng để xác định giá của sản phẩm đó hay không. Trong thế giới Web2, bạn không thể tìm thấy PitchBook hoặc CB Insights có giá bao nhiêu. Trong tiền điện tử, bạn không biết một sản phẩm như Chainalysis sẽ có giá bao nhiêu.
Bỏ chuyện đùa sang một bên, một phần lý do của quy trình bán hàng như vậy là do dịch vụ thực hành, găng tay trắng được cung cấp bởi các sản phẩm dữ liệu hướng đến phân khúc người tiêu dùng này. Những người dùng này thường chọn dữ liệu có độ chi tiết cao và thường xuyên. Họ yêu cầu dữ liệu không chỉ cho các quyết định trước giao dịch mà còn cho mục đích sử dụng sau giao dịch để đáp ứng các yêu cầu tuân thủ và thuế.
Ví dụ: họ cần các sản phẩm cho họ biết giá trị lịch sử của danh mục đầu tư của họ, giúp họ tính thuế, v.v. Các công ty như Amberdata, Kaiko, CoinMetrics, CryptoCompare và ở một mức độ nào đó là Nansen phục vụ những khách hàng này.
Theo kinh nghiệm của tôi, chỉ những người sáng lập có nền tảng làm việc trong các tổ chức hoặc nhóm có vòng tài trợ lớn mới có thể mở cửa thị trường dữ liệu của tổ chức. Rào cản gia nhập ở đây tương đối cao, giống như trường hợp của bất kỳ sản phẩm doanh nghiệp nào.
Chúng ta thường bắt gặp tính năng tổng hợp của Web3, điều đó có nghĩa là các ứng dụng Web3 có thể phụ thuộc lẫn nhau. Họ có thể yêu cầu dữ liệu từ nhau. Vì vậy, họ liên tục cần đọc dữ liệu từ nhau. Ví dụ: một nền tảng như Yearn Finance cần đọc dữ liệu từ Aave và Hợp chất, đồng thời một công cụ tổng hợp NFT như Tensor cần đọc dữ liệu từ Magic Eden và các thị trường khác.
Nhưng dữ liệu này được lưu trữ trên các khối trên các chuỗi như Ethereum và Solana. Ethereum tạo một khối trong 12 giây và Solana thực hiện điều đó trong 400 mili giây. Sắp xếp dữ liệu blockchain thành các bảng và lưu trữ để truy cập nhanh là một nhiệm vụ không hề đơn giản. Đây là lúc những người lập chỉ mục như Covalent, Graph, Chainlink và Powerloom xuất hiện. Họ đảm bảo rằng dữ liệu blockchain thô được lưu trữ ở định dạng mong muốn để các nhà phát triển có thể tìm nạp dữ liệu đó thông qua các lệnh gọi API đơn giản.
Một phân khúc mới nổi trong tính cách người tiêu dùng này liên quan đến các công cụ được sử dụng để hiểu hành vi của người dùng. Chẳng hạn, ARCx cho phép các nhà phát triển ánh xạ dữ liệu ngoài chuỗi (như hành vi của trình duyệt) với dữ liệu trên chuỗi (như địa chỉ ví) để nắm bắt thông tin nhân khẩu học của người dùng tương tác với dApp. Chúng nằm trong một phân khúc tương đối nhỏ nhưng phù hợp vì chúng giúp các nhà phát triển xác định người dùng của họ là ai.
Các sản phẩm dữ liệu trong tiền điện tử thường được phân phối bằng cách cộng tác với các nhà nghiên cứu và nhà xuất bản. Ví dụ, CCData thường được trích dẫn trên Bloomberg. Các nhà nghiên cứu được khuyến khích dựa vào các sản phẩm dữ liệu vì chúng giúp tiết kiệm thời gian và công sức khi thu thập, làm sạch hoặc quản lý dữ liệu. Những sản phẩm như Dune đã tạo dựng được hào quang bằng cách xây dựng một cộng đồng các nhà phân tích cạnh tranh với nhau để được xếp hạng cao hơn trong danh sách của họ.
Các ấn phẩm như The Block và Delphi giới thiệu các trang tổng quan được xây dựng bằng dữ liệu từ các nhà cung cấp bên thứ ba. Tại Decentralised.co, chúng tôi hoàn toàn dựa vào các nhà cung cấp dữ liệu bên ngoài vì họ giúp nhóm luôn tinh gọn trong khi sử dụng các tài nguyên bên ngoài khi thu thập dữ liệu.
Thách thức trong việc phục vụ phân khúc người tiêu dùng này là các nhà nghiên cứu nhỏ hơn có thể không có đủ ngân sách cần thiết để biện minh cho việc chi tiêu những nguồn lực to lớn để tìm ra những hiểu biết sâu sắc có thể chỉ liên quan đến một người. Ngược lại, các công ty được khuyến khích dành nhiều công sức và nguồn lực để hợp tác với các ấn phẩm quan trọng như Financial Times vì nó giúp ích cho việc phân phối.
Các sản phẩm hướng tới các nhà đầu tư bán lẻ thường có độ chi tiết và tần suất dữ liệu thấp hơn. Nhưng họ là những ngóc ngách có lợi nhuận cao để xây dựng vì họ nhận thấy tính kinh tế nhờ quy mô. Mười nghìn người dùng trả 100 USD cho mỗi người dùng là một hoạt động kinh doanh ARR trị giá 1 triệu USD trong một thế giới không tồn tại dịch vụ rời bỏ. Nói thì dễ hơn làm, nhưng những vấn đề kinh tế đó giải thích tại sao chúng ta có rất nhiều sản phẩm dữ liệu tiền điện tử hướng đến bán lẻ.
Phần lớn các sản phẩm hướng tới bán lẻ đều miễn phí hoặc được hỗ trợ bởi quảng cáo. Ví dụ: một tài nguyên miễn phí như DefiLlama sẽ không cho bạn biết cách bạn có thể định tuyến đơn đặt hàng của mình qua các sàn giao dịch khác nhau (CEX và DEX) để tránh trượt giá vì nó không chụp ảnh nhanh sổ đặt hàng nhưng nó hiển thị thông tin về việc mở khóa mã thông báo hoặc mở khóa lợi nhuận.
Một thay đổi trong phân khúc người tiêu dùng này là cách phương tiện phân phối mở ra một danh mục thị trường mới—ví dụ: Cielo cung cấp dữ liệu dưới dạng thông báo qua Telegram. Nó đã mở rộng quy mô tới hơn 40.000 người dùng bằng cách chuyển tiếp thông tin theo cách dễ sử dụng cho phân khúc người tiêu dùng không muốn sử dụng giao diện máy tính để bàn. Khi thực hiện đúng, ngay cả các phương tiện phân phối cũng có thể trở thành điểm khác biệt cho các dự án kinh doanh ở giai đoạn đầu. Ngay cả trong dữ liệu.
Mặc dù việc phân loại có nhiều điểm mờ nhạt, nhưng các công ty dữ liệu có thể được chia thành các hướng B2B hoặc B2C.
Các công ty như Amberdata và Kaiko có những sản phẩm phục vụ cho những diễn viên sành điệu. Các sản phẩm này chi tiết hơn (chi tiết về dữ liệu có sẵn) và thường xuyên (ví dụ: dữ liệu sổ đặt hàng theo từng tích tắc và thời gian thực), đồng thời đáp ứng các nhu cầu như xây dựng và thử nghiệm mô hình, phân tích trước giao dịch, báo cáo sau giao dịch, thuế và tuân thủ. Dữ liệu được cung cấp ở định dạng cho phép khách hàng thực hiện các phân tích độc quyền và xây dựng hình ảnh trực quan theo sở thích của họ. Các công ty này thường cung cấp sản phẩm của họ sau một bức tường phí.
Chi phí nói chung là một hàm số chi tiết do các yêu cầu về cơ sở hạ tầng, tính chất của nhóm khách hàng liên quan và độ dài của chu kỳ bán hàng.
Hình ảnh trên ánh xạ các sản phẩm khác nhau trên hai trục – độ sâu và độ chi tiết so với giá của sản phẩm. Xin lưu ý rằng những lô này không chính xác. Một số điểm có thể bị đặt nhầm chỗ. Ý tưởng là phát triển một mô hình tư duy để suy nghĩ về một số sản phẩm và vị thế của chúng trên thị trường.
Các sản phẩm tập trung vào bán lẻ như Dune hoặc CoinGecko hiển thị gần như tất cả dữ liệu miễn phí. Khách hàng phải trả tiền để truy cập một số dữ liệu hoặc nếu họ muốn dữ liệu qua API để chạy phân tích của họ. Ví dụ: bạn có thể xem tất cả các biểu đồ được tạo bởi một số trình hướng dẫn Dune, nhưng chúng giới hạn số lượng hàng bạn có thể tải xuống ở dạng CSV. Bạn có thể tải xuống các tệp CSV lớn hơn và xem các truy vấn riêng tư khi bạn trả nhiều tiền hơn.
Các công ty tập trung vào bán lẻ có xu hướng có doanh thu trên mỗi khách hàng thấp và ít khách hàng trả tiền tính theo phần trăm người dùng miễn phí. So sánh tỷ lệ này với tỷ lệ chuyển đổi cho các mô hình freemium của các công ty internet. Thông thường, tỷ lệ chuyển đổi là 2%–5%. Tỷ lệ chuyển đổi 10% sẽ là một ngoại lệ. Bí quyết của họ là có càng nhiều khách hàng miễn phí càng tốt để tỷ lệ chuyển đổi 4% đóng góp đáng kể vào doanh thu. Đây là những gì chúng tôi gọi là đỉnh của kênh.
Vì vậy, các công ty dữ liệu cần phần trên cùng của kênh đủ lớn để tạo ra đủ doanh thu nhằm duy trì hoạt động của mình ở mức tỷ lệ chuyển đổi thấp hơn. Các công ty cũng có thể xem xét việc tạo doanh thu từ quảng cáo khi trang web có nhiều người truy cập. CoinGecko sử dụng doanh thu quảng cáo làm đòn bẩy để tiếp tục cung cấp hầu hết dữ liệu miễn phí.
Trong những năm qua, các công ty đã lấp đầy các điểm ở cả hai đầu của phổ (B2B và B2C), để lại một số khoảng trống ở giữa. Nếu ai đó muốn xem sổ đặt lệnh đang thay đổi như thế nào trên các sàn giao dịch tập trung hoặc tỷ lệ quyền chọn bán, IV và độ lệch đang thay đổi như thế nào thì sẽ không có nhiều sản phẩm hỗ trợ trực quan hóa. Có không gian cho một sản phẩm chi tiết hơn CoinGeckos trên thế giới nhưng ít chi tiết hơn các sản phẩm của người chơi B2B thuần túy.
Tìm được con hào ở những doanh nghiệp có nguồn nguyên liệu miễn phí không phải là điều dễ dàng. Dữ liệu chuỗi khối có sẵn miễn phí. Không có gì độc quyền về dữ liệu bạn có thể thu thập. Vì vậy, lợi thế trong kinh doanh dữ liệu không chỉ dựa vào việc bạn có một số dữ liệu mà người khác không có. Thay vào đó, chúng dựa trên khả năng của nhóm trong việc cung cấp dữ liệu theo định dạng sâu sắc, dễ sử dụng, đúng thời gian và không có lỗi.
Nhiều công ty tuyên bố có cùng một dữ liệu, nhưng chất lượng dữ liệu và cách trình bày của nó khác nhau. Ví dụ: nhiều công ty tuyên bố có dữ liệu sổ đặt hàng ngoài chuỗi. Tuy nhiên, các yếu tố như số lượng đơn đặt hàng/đặt mua, độ dài chuỗi thời gian cũng như số lượng sàn giao dịch và cặp giao dịch có sẵn sẽ khác nhau tùy theo nhà cung cấp. Amberdata và Kaiko có dữ liệu sổ đặt hàng toàn diện nhất cho thị trường tiền điện tử.
Tuy nhiên, tại sao chỉ có một số nhà cung cấp có thể cung cấp loại dữ liệu này? Lời giải thích về nơi xuất hiện các hào trong dữ liệu Web3 nằm ở đây.
Tài năng – Có nguy cơ nói lên điều hiển nhiên, khi nguyên liệu miễn phí, cách bạn nhào nặn sẽ quyết định giá trị của sản phẩm. Việc biến dữ liệu thô thành thông tin hữu ích đòi hỏi phải có kiến thức chuyên môn về lĩnh vực ở nhiều lĩnh vực trong thị trường tiền điện tử và tài chính truyền thống. Các nhóm như Velo Data, với kinh nghiệm trong các thị trường truyền thống, có lợi thế hơn những nhóm khác đang cố gắng xây dựng các sản phẩm B2C tương tự. Việc tìm kiếm các nhà phát triển tài năng hiểu cấu trúc dữ liệu blockchain và có kinh nghiệm liên quan trên thị trường tài chính là rất hiếm.
Cơ sở hạ tầng – Việc thu thập và phân phối lượng lớn dữ liệu đòi hỏi cơ sở hạ tầng không hề dễ dàng. Loại hoạt động này đòi hỏi vốn và tài năng. Tại sao cơ sở hạ tầng lại là một con hào? Hãy nghĩ về dữ liệu vùng bộ nhớ. Các khối chứa dữ liệu cho các giao dịch được xác nhận. Còn những giao dịch chưa được xác nhận thì sao?
Các nút mạng khác nhau (ví dụ: các nút được kết nối với cùng một nhóm) sẽ thấy các giao dịch chưa được xác nhận khác nhau. Chỉ chạy một nút sẽ không cung cấp cái nhìn toàn cảnh về các giao dịch cạnh tranh. Việc duy trì nhiều nút trên một số chuỗi khối sẽ làm tăng thêm chi phí cơ sở hạ tầng. Giống như AI (và mạng nội dung trước đây), khả năng giữ chi phí phần cứng ở mức thấp trong khi mở rộng quy mô sẽ quyết định người thắng và người thua trong lĩnh vực này theo thời gian.
Hiệu ứng mạng –Người ta có thể đưa ra giả thuyết rằng hiệu ứng mạng tồn tại trong nhiều sản phẩm dữ liệu tiền điện tử. Lấy Chainlink làm ví dụ. Đó là một trong những oracle đầu tiên cho phép ứng dụng đọc dữ liệu từ các ứng dụng hoặc chuỗi khác. Nó đã thu hút được sự ủng hộ của cộng đồng và có một trong những cộng đồng mạnh nhất. Một ví dụ khác là Nansen. Tuyên bố nổi tiếng của nó là nhãn địa chỉ cho phép nó quy chuyển động tài sản cho các thực thể thực thay vì địa chỉ thập lục phân.
Sau đó, nó đã ra mắt các tính năng như NFT Paradise và Token God Mode, cho phép người dùng theo dõi NFT và token hiệu quả hơn. Arkham đã tung ra một sản phẩm tương tự như nhãn của Nansen, nhưng việc đầu tư vào bảng điều khiển và nghiên cứu đã cho phép Nansen hướng tới các khách hàng doanh nghiệp và cung cấp các sản phẩm phù hợp với họ. Điều đáng nói là không thể có hiệu ứng mạng nếu không có hai điểm đầu tiên (tài năng và cơ sở hạ tầng).
Một nơi mà tính năng này hoạt động hiệu quả là với những người lập chỉ mục. Số lượng chuỗi mà sản phẩm hỗ trợ càng cao thì khả năng nhà phát triển sử dụng sản phẩm đó thay vì dựa vào nhiều nguồn càng cao. Các nhóm như Covalent có lợi thế ở đây vì họ đã tối ưu hóa độ rộng của các chuỗi được hỗ trợ trong một thời gian khá lâu. Nhưng hãy nhớ rằng chiều sâu cũng quan trọng như chiều rộng.
Còn quá sớm để nói liệu có sản phẩm nào có lợi thế quan trọng trong tiền điện tử hay không. Chúng ta đã chứng kiến những lợi thế của người đi đầu trong kế hoạch lớn của mọi việc. Khi các danh mục như mạng xã hội Web3 và sự chồng chéo giữa AI và tiền điện tử tiếp tục mở rộng quy mô, các sản phẩm dữ liệu trong ngành có thể phát triển thành Bảng chữ cái tiếp theo. Nhưng đó sẽ là câu chuyện kéo dài nhiều thập kỷ; chúng ta vẫn đang trong những năm đầu của nó.
Nhiều trường hợp sử dụng mà chúng tôi đề cập trong bài viết này xem xét hoạt động đầu cơ tài chính dưới hình thức này hay hình thức khác. Ngay cả các nhà phát triển sử dụng API để truy vấn dữ liệu cũng đang xây dựng các sản phẩm tài chính. Nghe có vẻ kỳ lạ, nhưng blockchain (như một mạng mới) cũng đi theo xu hướng tương tự như Telegraph và Internet đã làm.
Sự xuất hiện của một phương tiện mới và sự xuất hiện của một mạng lưới mới sẽ đẩy nhanh các trường hợp sử dụng tài chính. Với Internet, phải đến đầu những năm 2000, mọi người mới nhận ra rằng người dùng có thể bị nhắm mục tiêu dựa trên vị trí của họ. Với blockchain, chúng tôi vẫn đang tìm cách xây dựng các mô hình kinh doanh dựa trên các dữ liệu có sẵn công khai.
Chúng tôi đã thấy một thay đổi quan trọng trong việc sử dụng các nền tảng này hàng ngày – Dune Analytics nhúng AI vào sản phẩm của họ. Dune cung cấp giao diện dựa trên SQL để người dùng truy vấn dữ liệu trên các chuỗi khối như Ethereum và Solana. Thị trường cho một sản phẩm như vậy thường chỉ dành cho những người dùng hiểu cách viết truy vấn SQL. Gần đây họ đã bắt đầu sử dụng AI để giúp các nhà phân tích tạo ra các truy vấn mà không cần phải là chuyên gia SQL. Nó không có chức năng như người ta mong đợi. Nhưng đó vẫn là một bước tiến tới tương lai. Có thể không lâu nữa chúng ta sẽ yêu cầu AI (như ChatGPT) truy vấn dữ liệu trên blockchain và đưa ra phân tích về dữ liệu đó.
Một cách để nghĩ về “dữ liệu” trong bối cảnh Web3 là qua lăng kính của Google Maps. GPS đã xuất hiện ít nhất từ những năm 1980. Google đã thực hiện công việc cần thiết để vạch ra thế giới. Khi cung cấp lớp phủ cho bản đồ cho các ứng dụng của bên thứ ba (sử dụng API), công ty đã cho phép xây dựng một thế hệ ứng dụng mới. Mọi thứ từ giao hàng đến gọi xe đều bùng nổ vì một người chơi chuyên về dữ liệu đã gánh gánh nặng đó từ các nhà phát triển.
Các sản phẩm dữ liệu trong Web3 cũng đóng vai trò tương tự. Chúng tôi vẫn chưa biết bản chất chính xác của các ứng dụng có thể được xây dựng trên nguồn tài nguyên có sẵn công khai này, nhưng ngày càng rõ ràng rằng có một cơ hội có quy mô bảng chữ cái trong bối cảnh dữ liệu.