Составление карты ландшафта данных Web3

Средний12/28/2023, 2:32:07 AM
В этой статье подробно рассматривается история развития информационных технологий, а также бизнес-модели данных и взаимоотношения между различными ролями в эпоху Web3.

Эта статья была первоначально опубликована на сайте Decentralised.co. Мы в GCR будем представлять Вам длинные формы от Decentralised дважды в месяц - каждый альтернативный четверг! Decentralised.co доверяют руководители более 200 компаний, чтобы быть в курсе тенденций, данных и идей, которые имеют значение. Подпишитесь на их рассылку ниже - подробнее об этом сотрудничестве для наших самых активных участников Discord.

Подпишитесь на Decentralised.co


Привет,

Мы написали предисловие к этой статье 18 июля, если Вам нужен контекст, выходящий за рамки того, что здесь написано.

Все живые существа ведут какие-то записи. Животные отслеживают времена года, чтобы понять, когда нужно охотиться. Грызуны и птицы хранят пищу в уникальных местах. Им нужно вспомнить, где они хранили его, когда спустя месяцы они будут доставать его для пропитания. Волки ставят метки по периметру своей территории, чтобы дать сигнал другим животным держаться подальше. Даже деревья ведут счет времени. Каждый год на стволах деревьев образуется кольцо. Возраст дерева можно определить по количеству колец.

Хотя деревья и животные ведут счет времени, они не могут восстановить или рассказать о прошлом. У них нет доступа к памяти. Это то, что отличает человеческий учет. Благодаря нашим коммуникативным способностям мы знаем, что шумеры в Месопотамии (3400 г. до н.э.) и древние египтяне (3200 г. до н.э.) использовали клинопись и иероглифы для записи информации.

Человечество развивалось, когда знания можно было передавать, не требуя физического присутствия источника. Мы читаем и наслаждаемся работами Платона или Сократа еще долгое время после того, как их не стало, потому что у нас есть средства для хранения их учений. Письменность была оригинальной платформой AR.

Пишу из Ирана, отслеживая запасы зерна. Источник: Ссылка

Там, где письмо оставляло простор для воображения, данные помогали сохранять объективность. Это уменьшило потребность людей хранить вещи в памяти. Отчасти именно поэтому некоторые из самых древних человеческих текстов содержат записи о долгах, доходах или торговле.

Переход на цифровые технологии

В постиндустриальную эпоху компании строили конкурентные рвы, чтобы укрепить свои позиции на рынке, переходя на цифровые технологии ведения учета продаж. Один из примеров - индийская компания Asian Paints. Возможно, их краска не самая лучшая на рынке, но они контролируют более 50% рынка в индийской лакокрасочной промышленности стоимостью 8 миллиардов долларов.

Почему? Простой ответ - это домашний бренд, и у компании есть экономия на масштабе. Но то, как они этого добились, имеет свои корни в данных. Они инвестировали значительные средства в сбор и обработку данных, чтобы оптимизировать свою цепочку поставок.

Для сравнения: за последние 30 лет годовые темпы роста акций Asian Paints составили 25%. Этот рост был подкреплен инвестициями в мейнфреймовый компьютер в 1970-х годах. Этот прибор был мощнее тех, что использовались в лучших исследовательских организациях Индии того времени. Он ежечасно собирал данные о цвете и количестве краски, продаваемой по всей Индии. Это позволило компании Asian Paints построить модель, которая предсказывает спрос на краску по всей Индии с 98% точностью.

Эта способность к прогнозированию позволила компании Asian Paints получить максимальную выгоду, так как она смогла значительно сократить время пополнения запасов. В то время нормой продажи таких товаров, как краски, было продать их оптовику, который затем передавал их дистрибьютору, который, в свою очередь, продавал их дилеру. Дилер будет взаимодействовать с потребителем напрямую. Причина такой сложной цепочки поставок заключалась в том, что каждая сторона владела инвентаризацией активов и контролировала данные о спросе и предложении краски.

Г-н Чокси - основатель компании Asian paints- исключил оптовиков и дистрибьюторов из цепочки поставок, изучив структуру потребления конечного потребителя и уменьшив зависимость от посредников. Устранив посредников, Asian Paints получила 97% от MRP (3% дилерам) по сравнению с 60%, которые получили их конкуренты.


Извлекаемой из телеграфа ценностью будут бегущие строки, передаваемые по телеграфу.

Переход на цифровые технологии не произошел в одночасье. Частью того, что делало сбор данных интересным, был мир финансов и то, насколько взаимосвязанным он постепенно становился. Например, в конце 20-го века данные о фондовом рынке передавались по телеграфу с помощью устройств, подобных приведенному выше. Уже в 1835 году торговцы обучали голубей переносить кусочки бумаги с информацией о том, что происходит в Европе. Когда пароходы с товарами приближались к суше на расстояние 50 миль, голуби прилетали в указанные места с информацией. Раньше трейдеры платили до 500 долларов за каждый час, когда они могли получить новости.

К 1867 году торговцы начали соревноваться в оптимизации скорости передачи информации по телеграфу. Сотрудник Western Union по имени E. A Calahan заплатил более 200 тысяч долларов Нью-Йоркской фондовой бирже за возможность посылать сотрудников на торговую площадку, чтобы они передавали данные о тикерах его клиентам. Одним из тех, кто усердно работал над оптимизацией системы, был молодой ученый по имени Томас Алва Эдисон. Столетие спустя такие инструменты, как терминал Bloomberg, экспоненциально увеличили темп и объем финансовых данных, передаваемых в любой день.

Сырые данные для формовки

Данные, как и сырая нефть, должны пройти несколько этапов очистки, прежде чем их можно будет использовать. Изучение того, как развивался Bloomberg, проливает свет на то, как развивался весь ландшафт данных и какой процесс. Bloomberg был не первой попыткой использовать технологию для улучшения механизмов торговли и отчетности. NASDAQ использовал терминалы Bunker Ramo для распространения информации и размещения ордеров на покупку/продажу. Однако опора на старые телефонные сети связи означала, что масштабирование этой модели всегда будет сопряжено с трудностями.


Источник - NASDAQ - Эволюция автоматизированной внебиржевой торговли

В 1981 году Майкл Блумберг, партнер инвестиционного банка Solomon Brothers, был уволен, получив 10 миллионов долларов за свой капитал, когда корпорация Phibro приобрела банк. Он понял, что инвесторы готовы платить за упорядоченную финансовую информацию с растущей электронизацией финансовых рынков от Нью-Йорка до Японии. Он основал компанию по предоставлению данных под названием Innovative Market System, которая в 1986 году была переименована в Bloomberg.

До того, как появился Интернет, доступ к терминалу Bloomberg осуществлялся с помощью " Chiclet". Он был подключен к контроллеру Bloomberg через специальный кабель, соединенный с локальным концентратором по выделенным телефонным линиям. Bloomberg собирал данные с помощью партнерств, новостных агентств и пресс-релизов, собственных методов, таких как ручной ввод данных и сбор данных по телефону.

С появлением Интернета открылись шлюзы информации. Сегодня Bloomberg добывает, обрабатывает и предоставляет 200 миллиардов единиц финансовой информации практически в режиме реального времени. Это примерно 23 миллиона точек данных в секунду. Часть информации, доступной на Bloomberg, является общедоступной. Такие данные, как финансовые отчеты компаний и цены на акции и облигации, можно найти на публичных форумах.

Но что, если Вы аналитик в области нефти и газа и хотите понять движение контейнеров с сырой нефтью? Вы вряд ли сможете получать эту информацию в режиме реального времени, если не подпишитесь на источник данных, например, Bloomberg. Не все данные в Интернете находятся в свободном доступе.

Как правило, при работе с данными в Web2 у людей есть два ограничения: разрешенный доступ и высокий барьер для обработки больших объемов данных. За годы работы такие провайдеры, как Bloomberg, создали достаточно сильные сетевые эффекты, чтобы получать данные через своих филиалов, чего аналитики или инвесторы не могут себе позволить.

Лучше заплатить $20 000 компании Bloomberg за годовую подписку, чем пытаться получить данные из различных информационных платформ, которые могут иметь разные ценовые уровни. Даже если Вы будете усердно работать над данными, Вы не сможете обрабатывать их и проводить аналитику в режиме реального времени без значительных затрат на инфраструктуру. Что касается розничной торговли, то многие платформы, которые в конечном итоге масштабировались, представляли собой системы сопоставления данных.

Подумайте об этом так: Google (поисковая система) - это компания, занимающаяся сбором данных, которая предлагает бизнесу доступ к пользователям в обмен на рекламные доллары. Когда ресторан или информационный бюллетень (например, наш) хочет нацелиться на пользователей, ищущих информацию в Google, они сопоставляют спрос и предложение на подобную информацию. Тот, кто ищет информацию о рассылке, специфичной для Web3, ищет нас. И мы ищем такого человека. (Я сопротивляюсь желанию подключить здесь нашу реферальную программу).

Google построил монополию благодаря экономии на масштабе, в которой он функционирует. Их количество пользователей и количество запросов, которые пользователи делают каждый день, остаются непревзойденными. Google завоевал это положение, запустив поисковую систему без рекламы в то время, когда реклама была нормой, затем приобретя YouTube и Android, и, в конце концов, заплатив коллегам, таким как Apple, за то, чтобы Google стал поисковой системой по умолчанию. Только для компании Apple Google платит 20 миллиардов долларов в год за то, чтобы оставаться поисковой системой по умолчанию в Safari.

Google платит такую премию, потому что в основе его предложения лежит механизм подбора. Система подбора позволяет пользователям, у которых есть потребность, связаться с компаниями, у которых есть предложение. Большинство монополий в Интернете - это, по сути, поисковые системы. Amazon сводит продавцов товаров с покупателями. Instagram объединяет аудиторию с создателями. Эти системы подбора работают потому, что взаимодействие с этими продуктами оставляет богатые следы, по которым можно определить контекст.

Бен Эванс (Ben Evans) в 2022 году знаменито написал, что не существует такой вещи, как данные. Знание моего контента, предпочтений в еде или путешествиях не имеет большой ценности для третьей стороны. Она становится ценной - для коммерции или исследований - только тогда, когда она агрегирована или обогащена контекстом.

Контекст в том смысле, что мои предпочтения по поводу того, чтобы съесть бирияни в пятницу вечером, могут быть использованы для рекламы доставки бирияни именно тогда, когда вероятность того, что я его куплю, наиболее высока. В целом, сравнение вероятности моей покупки с аналогичной покупкой в том же регионе помогает лучше ориентироваться на пользователей.

Чтобы данные были ценными, они должны быть либо масштабными (в большом количестве), либо контекстными. Где продукты Web3 и Web2 исторически различаются, так это в следах, которые они оставляют. Только Amazon знает, сколько контроллеров Xbox будет продано за определенную неделю. Но Вы можете увидеть, по каким схемам трейдеры покупают или продают NFT на OpenSea в любой день. Причина в том, что каждая из этих транзакций оставляет за собой публичный след.

Продукты данных в Web3 используют эти маршруты для создания контекста.

Такие блокчейны, как Ethereum и Bitcoin, создают блоки каждые 12 секунд и ~10 минут, соответственно. Каждый блок содержит транзакции, которые изменяют состояние блокчейна. Такие блокчейн-исследователи, как Etherscan, собирают данные, относящиеся ко всем транзакциям. Например, если Вы зайдете в Etherscan и увидите блок, то ниже Вы увидите следующее изображение.

Транзакции в блокчейне имеют богатый контекст. Такие продукты, как Arkham и Nansen, представляют собой интерпретационные механизмы для исследователей, позволяющие понять, что происходит во время транзакции.

Вы можете просмотреть все блоки с момента создания Ethereum. Но что Вы можете сделать с этой информацией? Почти ничего. Поэтому Вам нужен способ собрать эти данные в нескольких таблицах. Например, каждый раз, когда в блоке вызывается NFT-контракт торговой площадки, данные, относящиеся к этой транзакции, должны быть добавлены в таблицы, связанные с NFT, или когда вызывается Uniswap-контракт, соответствующие данные должны храниться в таблицах, связанных с DEX. (Dune делает это в качестве услуги).

Вы не сможете проанализировать необработанные данные, не понеся значительных затрат на инфраструктуру. Поэтому, несмотря на то, что данные находятся в свободном доступе, Вы сталкиваетесь с теми же проблемами. Вы полагаетесь на внешние данные как инвестор или создатель dApp. Но Ваша основная функция не связана со сбором и управлением данными. Расходование ресурсов на важные, но неосновные виды деятельности - это не та роскошь, которой может наслаждаться каждая организация.

Контекст определяет ценность

Для продуктов данных контекст, окружающий данные, делает продукт уникальным. Bloomberg применяет свое финансовое понимание и преобразует данные в форму, которую могут легко использовать изобретатели и трейдеры. Такие сайты, как Similarweb, или исследовательские издания, такие как Newzoo, используют свою основную компетенцию, чтобы применить социальный или игровой контекст к данным, которые они отслеживают.

Продукты данных, основанные на блокчейне, отличаются тем, что предоставляют пользовательский контекст с помощью запросов, которые отвечают на вопросы, относящиеся к определенным подгруппам пользователей. Например, TokenTerminal вычисляет экономические основы протоколов. Нансен помогает участникам рынка маркировать и понимать движение активов. Parsec запрашивает данные о цепочке, чтобы помочь трейдерам лучше анализировать позиции DeFi.

Все эти продукты работают за счет общественного блага: данных о цепочке. Разница заключается в том, как эти продукты представляют свои данные, что делает их привлекательными для разных аудиторий.

Разделение продуктов на категории в нашей отрасли основано на том, какие данные поступают в цепочку, а какая информация берется из источников вне цепочки. (Некоторые часто используют и то, и другое). Поставщики данных используют свои контекстные фильтры для создания продуктов. Подобно тому, как у данных Web2 есть свои ниши, компании, работающие с данными Web3, создали или постепенно создают рвы, используя свои ключевые компетенции.

Таким образом, биография основателей часто диктует характер выпускаемых продуктов. Когда основная команда провела значительное время на рынках капитала до криптовалют, их продукты склонны подражать Bloomberg, в то время как криптовалютные продукты похожи на Nansen. Разные продукты отвечают разным потребностям, даже при запросе одних и тех же данных.

Например, биржи обычно сбрасывают данные через фиксированные промежутки времени. Они не занимаются данными, а хранение старых данных требует дополнительных серверов и управления. Некоторые поставщики данных, например, Kaiko и Amberdata, хранят исторические данные о портфеле заказов с бирж. Такие данные позволяют трейдерам и инвесторам строить модели для проверки своих гипотез. Но если Вы хотите понять, какие контракты DeFi вымываются притоком ETH или стейблкоинов, или проанализировать поведение конкретных адресов или организаций на цепи, Вам понадобится продукт от Nansen или Arkham.

Карта рынка не отражает всех игроков в каждой категории.

Один из способов понять, как продукты позиционируются на рынках, - это анализ потребительских персон в криптовалюте. Эти персоны можно разделить на следующие четыре основные категории.

Финансовые учреждения

Большинство долларов, проходящих через криптовалютные продукты, поступает от финансовых учреждений во время медвежьего рынка. Это крупные клиенты с более длительным циклом продаж и гораздо более сложными требованиями к данным. Один из способов понять, ориентирован ли продукт на финансовые учреждения, - это если клиенту приходится звонить продавцу, чтобы узнать, сколько он стоит. В мире Web2 Вы не сможете узнать, сколько стоит PitchBook или CB Insights. В криптовалюте Вы не знаете, сколько будет стоить такой продукт, как Chainalysis.

Шутки в сторону, но отчасти такой процесс продаж объясняется тем, что продукты для работы с данными, ориентированные на этот сегмент потребителей, предлагают практическое, "белое пальто" обслуживание. Эти пользователи обычно предпочитают использовать очень подробные и частые данные. Им нужны данные не только для принятия решений перед торговлей, но и для использования после торговли, чтобы соответствовать требованиям по соблюдению норм и налогообложению.

Например, им нужны продукты, которые расскажут им, какой была стоимость их портфеля в прошлом, помогут им с налоговыми расчетами и т.д. Такие фирмы, как Amberdata, Kaiko, CoinMetrics, CryptoCompare и, в некоторой степени, Nansen, обслуживают этих клиентов.

По моему опыту, только основатели с опытом работы в учреждениях или команды с крупными раундами финансирования смогли открыть институциональный рынок данных. Барьер для входа здесь относительно высок, как и в случае с любым корпоративным продуктом.

Разработчики

Мы часто сталкиваемся с функцией композитности Web3, которая означает, что приложения Web3 могут быть взаимозависимыми. Они могут требовать данные друг от друга. Поэтому им постоянно нужно считывать данные друг с друга. Например, такая платформа, как Yearn Finance, должна считывать данные с Aave и Compound, а такой агрегатор NFT, как Tensor, должен считывать данные с Magic Eden и других торговых площадок.

Но эти данные хранятся в блоках на таких цепочках, как Ethereum и Solana. Ethereum создает блок за 12 секунд, а Solana делает это за 400 мс. Сортировка данных блокчейна в таблицы и их хранение для быстрого доступа - нетривиальная задача. Именно здесь на помощь приходят такие индексаторы, как Covalent, Graph, Chainlink и Powerloom. Они обеспечивают хранение необработанных данных блокчейна в нужном формате, чтобы разработчики могли получить их с помощью простых вызовов API.

Появившийся сегмент этой потребительской персоны включает в себя инструменты, используемые для понимания поведения пользователей. Например, ARCx позволяет разработчикам сопоставлять данные вне цепочки (например, поведение браузера) с данными на цепочке (например, адресами кошельков), чтобы собрать демографическую информацию о пользователях, взаимодействующих с dApp. Они занимают относительно небольшую, но актуальную нишу, поскольку помогают разработчикам определить, кто их пользователи.

Исследователи и публикации

Продукты данных в криптовалюте часто находят распространение благодаря сотрудничеству с исследователями и публикациями. CCData, например, часто цитируется на Bloomberg. Исследователи заинтересованы в использовании продуктов данных, поскольку они помогают сэкономить время и усилия при сборе, очистке или обработке данных. Такие продукты, как Dune, построили ров, создав сообщество аналитиков, которые конкурируют друг с другом, чтобы занять более высокое место в их списке.

Такие издания, как The Block и Delphi, демонстрируют приборные панели, созданные на основе данных, полученных от сторонних поставщиков. Здесь, в Decentralised.co, мы полностью полагаемся на внешних поставщиков данных, поскольку они помогают сохранить команду в тонусе, используя внешние ресурсы при сборе данных.

Сложность работы с этим сегментом потребителей заключается в том, что небольшие исследователи могут не располагать необходимым бюджетом, чтобы оправдать трату огромных ресурсов на получение нишевых сведений, которые могут быть актуальны только для одного человека. И наоборот, у компаний есть стимул тратить усилия и ресурсы на партнерство с такими значимыми изданиями, как Financial Times, поскольку это помогает в распространении.

Розничные инвесторы

Продукты, ориентированные на розничных инвесторов, обычно имеют меньшую детализацию и частоту данных. Но это очень выгодные ниши, в которых можно строить, поскольку они дают эффект масштаба. Десять тысяч пользователей, платящих по 100 долларов, - это бизнес ARR на 1 миллион долларов в мире, где оттока не существует. Легче сказать, чем сделать, но эта экономика объясняет, почему у нас так много продуктов, ориентированных на розничную торговлю криптовалютой.

Большая часть продуктов, ориентированных на розничную торговлю, бесплатна или поддерживается рекламой. Например, такой бесплатный ресурс, как DefiLlama, не расскажет Вам, как направить ордер через различные биржи (CEX и DEX), чтобы избежать проскальзывания, поскольку он не делает снимков книги ордеров, но он демонстрирует информацию о разблокировке токенов или разблокировке доходности.

Одним из изменений в этом сегменте потребителей является то, как средство доставки открывает новую категорию рынка - например, Cielo доставляет данные в виде уведомлений через Telegram. Она достигла масштабов более 40 000 пользователей, передавая информацию в удобной форме для потребителей, которые предпочитают не иметь дело с настольными интерфейсами. При правильном подходе даже средства распространения могут стать отличительными факторами для предприятий на ранних стадиях развития. Даже в данных.

Несмотря на то, что в некоторых моментах классификация размывается, фирмы, предоставляющие данные, можно разделить на B2B- и B2C-ориентированные.

Такие компании, как Amberdata и Kaiko, предлагают продукты, рассчитанные на искушенных актеров. Эти продукты являются более детализированными (детали, в которых доступны данные) и частыми (например. тик за тиком и данные книги заявок в реальном времени), и они удовлетворяют таким требованиям, как построение и тестирование моделей, предторговый анализ, послеторговая отчетность, налогообложение и соответствие нормативным требованиям. Данные предоставляются в формате, позволяющем клиентам проводить собственные анализы и создавать визуализации по своему вкусу. Эти компании обычно предлагают свои продукты за платной стеной.

Стоимость, как правило, зависит от степени детализации, обусловленной требованиями к инфраструктуре, характером клиентуры и длительностью цикла продаж.

На изображении выше различные продукты отображаются на двух осях - глубина и детализация в сравнении с ценами на продукты. Пожалуйста, обратите внимание, что эти участки не являются точными. Несколько пунктов могут быть ошибочными. Идея состоит в том, чтобы разработать ментальную модель, позволяющую продумать несколько продуктов и их положение на рынке.

Продукты, ориентированные на розничную торговлю, такие как Dune или CoinGecko, отображают почти все данные бесплатно. Клиенты должны платить за доступ к некоторым данным или если им нужны данные через API для проведения анализов. Например, Вы можете просмотреть все графики, созданные несколькими мастерами Dune, но они ограничивают количество строк, которые Вы можете загрузить в формате CSV. Вы можете загружать большие CSV-файлы и просматривать частные запросы по мере увеличения оплаты.

Компании, ориентированные на розничную торговлю, как правило, имеют низкий доход на одного клиента и небольшое количество платящих клиентов в процентном соотношении к бесплатным пользователям. Сравните это с показателями конверсии в freemium-моделях интернет-компаний. Обычно коэффициент конверсии составляет 2%–5%. Коэффициент конверсии в 10% будет исключением. Их игровая программа заключается в том, чтобы иметь как можно больше бесплатных клиентов, чтобы коэффициент конверсии в 4% значительно увеличивал доход. Это то, что мы называем вершиной воронки.

Поэтому компаниям, работающим с данными, необходимо, чтобы верхняя часть воронки была достаточно большой и приносила достаточный доход, чтобы обеспечить себе существование при более низком коэффициенте конверсии. Компании также могут рассмотреть возможность получения дохода от рекламы, когда на сайте будет много посетителей. CoinGecko использует доходы от рекламы в качестве рычага, чтобы продолжать предоставлять большую часть данных бесплатно.

За годы своего существования компании заполнили места на обоих концах спектра (B2B и B2C), оставив некоторые пробелы между ними. Если кто-то хочет посмотреть, как меняются книги заявок на централизованных биржах или как меняются коэффициенты пут-колл, IV и перекосы, существует не так много продуктов, которые помогут с визуализацией. Есть место для более детализированного продукта, чем CoinGecko мира, но менее детализированного, чем продукты чистых игроков B2B.

На рвах

Найти "рвы" в бизнесе, где сырье является бесплатным, не так-то просто. Данные блокчейна находятся в свободном доступе. В том, какие данные Вы можете собрать, нет ничего закрытого. Таким образом, "рвы" в бизнесе, связанном с данными, основаны не только на том, что у Вас есть какие-то данные, которых нет у других. Вместо этого они основаны на способности команды предоставлять данные в понятном, удобном для использования формате, вовремя и без ошибок.

Многие компании утверждают, что у них одни и те же данные, но качество данных и их представление отличаются. Например, многие компании утверждают, что у них есть данные о портфеле заказов вне цепочки. Однако такие факторы, как количество ордеров на покупку/продажу, длина временного ряда, количество доступных бирж и пар, различаются у разных поставщиков. Amberdata и Kaiko располагают наиболее полными данными о портфеле заказов на криптовалютных рынках.

Почему же только несколько поставщиков могут предоставлять такие данные? Объяснение того, где появляются рвы в данных Web3, лежит здесь.

Талант - Рискуя заявить очевидное, скажу, что когда сырье бесплатно, то то, как Вы придадите ему форму, определяет ценность продукта. Превращение необработанных данных в полезную информацию требует специальных знаний во многих нишах криптовалютного и традиционного финансового рынков. Команды, подобные Velo Data, имеющие опыт работы на традиционных рынках, имеют преимущество перед другими, пытающимися создать подобные B2C-продукты. Найти талантливых разработчиков, которые понимают структуры данных блокчейна и имеют соответствующий опыт работы на финансовых рынках, - большая редкость.

Инфраструктура - Сбор и передача больших объемов данных требует инфраструктуры, которая не так-то просто создается. Для такого рода операций требуется капитал и талант. Почему инфраструктура - это ров? Подумайте о данных пула памяти. Блоки содержат данные для подтвержденных транзакций. Что делать с неподтвержденными транзакциями?

Разные узлы сети (например, узлы, подключенные к одному пулу) видят разные неподтвержденные транзакции. Запуск только одного узла не даст глобального представления о конкурирующих транзакциях. Поддержание нескольких узлов на нескольких блокчейнах увеличивает затраты на инфраструктуру. Как и в случае с искусственным интеллектом (и контентными сетями в прошлом), способность поддерживать низкую стоимость оборудования при одновременном масштабировании будет определять победителей и проигравших в этом секторе с течением времени.

Сетевые эффекты - Можно предположить, что сетевые эффекты существуют во многих криптовалютных продуктах. Возьмем, к примеру, Chainlink. Это был один из первых оракулов, который позволял приложениям считывать данные из других приложений или цепочек. Он сумел заручиться поддержкой сообщества и является одним из самых сильных сообществ. Другой пример - Нансен. Его славой стали адресные метки, которые позволяли относить движение активов к реальным объектам, а не к шестнадцатизначным адресам.

Впоследствии он запустил такие функции, как NFT Paradise и Token God Mode, позволяющие пользователям более эффективно отслеживать NFT и токены. Компания Arkham выпустила продукт, похожий на этикетки Nansen, но инвестиции в информационные панели и исследования позволили Nansen продвинуться в сторону корпоративных клиентов и предложить продукты, разработанные специально для них. Стоит отметить, что сетевые эффекты невозможны без первых двух пунктов (таланты и инфраструктура).

Одно из мест, где это работает, - индексаторы. Чем больше цепочек поддерживает продукт, тем выше вероятность того, что разработчик будет использовать этот продукт вместо того, чтобы полагаться на несколько источников. Такие команды, как Covalent, имеют здесь преимущество, поскольку они уже давно оптимизируют широту поддерживаемых цепочек. Но помните, что глубина так же важна, как и широта.

Пока еще слишком рано говорить о том, есть ли у какого-либо продукта значимый "ров" в криптовалюте. Мы стали свидетелями того, что в грандиозной схеме вещей мы имеем преимущество на первых порах. По мере того, как такие категории, как социальный Web3 и пересечение ИИ и криптовалют, продолжают расширяться, продукты данных в этой отрасли могут стать следующим Alphabet. Но это будет история, рассчитанная на несколько десятилетий; мы же пока находимся в самом начале ее развития.

За пределами спекуляций

Многие из примеров использования, которые мы привели в этой статье, в той или иной форме касаются финансовых спекуляций. Даже разработчики, использующие API для запросов данных, создают финансовые продукты. Это может показаться странным, но блокчейн (как новая сеть) следует той же тенденции, что и Телеграф и Интернет.

Появление нового носителя информации и новой сети ускоряет использование финансовых возможностей. С появлением Интернета только в начале 2000-х годов люди поняли, что на пользователей можно ориентироваться, основываясь на их местоположении. Что касается блокчейн, то мы все еще выясняем, как строить бизнес-модели на основе общедоступных данных.

В повседневном использовании этих платформ мы увидели одно ключевое изменение - компания Dune Analytics внедрила искусственный интеллект в свой продукт. Dune предоставляет пользователям интерфейс на основе SQL для запросов данных из таких блокчейнов, как Ethereum и Solana. Рынок для такого продукта обычно ограничен пользователями, которые понимают, как писать SQL-запросы. Недавно они начали использовать искусственный интеллект, чтобы помочь аналитикам составлять запросы, не будучи экспертами по SQL. Он не настолько функционален, как хотелось бы. Но это все равно шаг в будущее. Возможно, пройдет немного времени, и мы попросим искусственный интеллект (например, ChatGPT) запрашивать данные из блокчейна и предлагать свой анализ.

Один из способов представить себе "данные" в контексте Web3 - через призму Google Maps. GPS существует, по крайней мере, с 1980-х годов. Компания Google приложила все усилия, чтобы составить карту мира. Сделав наложения на карты доступными для сторонних приложений (с помощью API), компания позволила создать новое поколение приложений. Все, начиная от доставки и заканчивая поездками на автомобиле, процветает, потому что один игрок, специализирующийся на данных, взял на себя это бремя разработчиков.

Продукты данных в Web3 призваны сыграть аналогичную роль. Мы еще не знаем, какие именно приложения могут быть созданы на основе этого общедоступного ресурса, но становится очевидным, что в области данных существует возможность размером с Алфавит.

Отказ от ответственности:

  1. Эта статья перепечатана из[GCR]. Все авторские права принадлежат авторам[Saurabh Deshpande, Siddharth, Joel]. Если у Вас есть возражения против этой перепечатки, пожалуйста, свяжитесь с командой Gate Learn, и они незамедлительно рассмотрят их.
  2. Предупреждение об ответственности: Мнения и взгляды, выраженные в этой статье, принадлежат исключительно автору и не являются инвестиционным советом.
  3. Перевод статьи на другие языки осуществляется командой Gate Learn. Если не указано, копирование, распространение или плагиат переведенных статей запрещены.

Составление карты ландшафта данных Web3

Средний12/28/2023, 2:32:07 AM
В этой статье подробно рассматривается история развития информационных технологий, а также бизнес-модели данных и взаимоотношения между различными ролями в эпоху Web3.

Эта статья была первоначально опубликована на сайте Decentralised.co. Мы в GCR будем представлять Вам длинные формы от Decentralised дважды в месяц - каждый альтернативный четверг! Decentralised.co доверяют руководители более 200 компаний, чтобы быть в курсе тенденций, данных и идей, которые имеют значение. Подпишитесь на их рассылку ниже - подробнее об этом сотрудничестве для наших самых активных участников Discord.

Подпишитесь на Decentralised.co


Привет,

Мы написали предисловие к этой статье 18 июля, если Вам нужен контекст, выходящий за рамки того, что здесь написано.

Все живые существа ведут какие-то записи. Животные отслеживают времена года, чтобы понять, когда нужно охотиться. Грызуны и птицы хранят пищу в уникальных местах. Им нужно вспомнить, где они хранили его, когда спустя месяцы они будут доставать его для пропитания. Волки ставят метки по периметру своей территории, чтобы дать сигнал другим животным держаться подальше. Даже деревья ведут счет времени. Каждый год на стволах деревьев образуется кольцо. Возраст дерева можно определить по количеству колец.

Хотя деревья и животные ведут счет времени, они не могут восстановить или рассказать о прошлом. У них нет доступа к памяти. Это то, что отличает человеческий учет. Благодаря нашим коммуникативным способностям мы знаем, что шумеры в Месопотамии (3400 г. до н.э.) и древние египтяне (3200 г. до н.э.) использовали клинопись и иероглифы для записи информации.

Человечество развивалось, когда знания можно было передавать, не требуя физического присутствия источника. Мы читаем и наслаждаемся работами Платона или Сократа еще долгое время после того, как их не стало, потому что у нас есть средства для хранения их учений. Письменность была оригинальной платформой AR.

Пишу из Ирана, отслеживая запасы зерна. Источник: Ссылка

Там, где письмо оставляло простор для воображения, данные помогали сохранять объективность. Это уменьшило потребность людей хранить вещи в памяти. Отчасти именно поэтому некоторые из самых древних человеческих текстов содержат записи о долгах, доходах или торговле.

Переход на цифровые технологии

В постиндустриальную эпоху компании строили конкурентные рвы, чтобы укрепить свои позиции на рынке, переходя на цифровые технологии ведения учета продаж. Один из примеров - индийская компания Asian Paints. Возможно, их краска не самая лучшая на рынке, но они контролируют более 50% рынка в индийской лакокрасочной промышленности стоимостью 8 миллиардов долларов.

Почему? Простой ответ - это домашний бренд, и у компании есть экономия на масштабе. Но то, как они этого добились, имеет свои корни в данных. Они инвестировали значительные средства в сбор и обработку данных, чтобы оптимизировать свою цепочку поставок.

Для сравнения: за последние 30 лет годовые темпы роста акций Asian Paints составили 25%. Этот рост был подкреплен инвестициями в мейнфреймовый компьютер в 1970-х годах. Этот прибор был мощнее тех, что использовались в лучших исследовательских организациях Индии того времени. Он ежечасно собирал данные о цвете и количестве краски, продаваемой по всей Индии. Это позволило компании Asian Paints построить модель, которая предсказывает спрос на краску по всей Индии с 98% точностью.

Эта способность к прогнозированию позволила компании Asian Paints получить максимальную выгоду, так как она смогла значительно сократить время пополнения запасов. В то время нормой продажи таких товаров, как краски, было продать их оптовику, который затем передавал их дистрибьютору, который, в свою очередь, продавал их дилеру. Дилер будет взаимодействовать с потребителем напрямую. Причина такой сложной цепочки поставок заключалась в том, что каждая сторона владела инвентаризацией активов и контролировала данные о спросе и предложении краски.

Г-н Чокси - основатель компании Asian paints- исключил оптовиков и дистрибьюторов из цепочки поставок, изучив структуру потребления конечного потребителя и уменьшив зависимость от посредников. Устранив посредников, Asian Paints получила 97% от MRP (3% дилерам) по сравнению с 60%, которые получили их конкуренты.


Извлекаемой из телеграфа ценностью будут бегущие строки, передаваемые по телеграфу.

Переход на цифровые технологии не произошел в одночасье. Частью того, что делало сбор данных интересным, был мир финансов и то, насколько взаимосвязанным он постепенно становился. Например, в конце 20-го века данные о фондовом рынке передавались по телеграфу с помощью устройств, подобных приведенному выше. Уже в 1835 году торговцы обучали голубей переносить кусочки бумаги с информацией о том, что происходит в Европе. Когда пароходы с товарами приближались к суше на расстояние 50 миль, голуби прилетали в указанные места с информацией. Раньше трейдеры платили до 500 долларов за каждый час, когда они могли получить новости.

К 1867 году торговцы начали соревноваться в оптимизации скорости передачи информации по телеграфу. Сотрудник Western Union по имени E. A Calahan заплатил более 200 тысяч долларов Нью-Йоркской фондовой бирже за возможность посылать сотрудников на торговую площадку, чтобы они передавали данные о тикерах его клиентам. Одним из тех, кто усердно работал над оптимизацией системы, был молодой ученый по имени Томас Алва Эдисон. Столетие спустя такие инструменты, как терминал Bloomberg, экспоненциально увеличили темп и объем финансовых данных, передаваемых в любой день.

Сырые данные для формовки

Данные, как и сырая нефть, должны пройти несколько этапов очистки, прежде чем их можно будет использовать. Изучение того, как развивался Bloomberg, проливает свет на то, как развивался весь ландшафт данных и какой процесс. Bloomberg был не первой попыткой использовать технологию для улучшения механизмов торговли и отчетности. NASDAQ использовал терминалы Bunker Ramo для распространения информации и размещения ордеров на покупку/продажу. Однако опора на старые телефонные сети связи означала, что масштабирование этой модели всегда будет сопряжено с трудностями.


Источник - NASDAQ - Эволюция автоматизированной внебиржевой торговли

В 1981 году Майкл Блумберг, партнер инвестиционного банка Solomon Brothers, был уволен, получив 10 миллионов долларов за свой капитал, когда корпорация Phibro приобрела банк. Он понял, что инвесторы готовы платить за упорядоченную финансовую информацию с растущей электронизацией финансовых рынков от Нью-Йорка до Японии. Он основал компанию по предоставлению данных под названием Innovative Market System, которая в 1986 году была переименована в Bloomberg.

До того, как появился Интернет, доступ к терминалу Bloomberg осуществлялся с помощью " Chiclet". Он был подключен к контроллеру Bloomberg через специальный кабель, соединенный с локальным концентратором по выделенным телефонным линиям. Bloomberg собирал данные с помощью партнерств, новостных агентств и пресс-релизов, собственных методов, таких как ручной ввод данных и сбор данных по телефону.

С появлением Интернета открылись шлюзы информации. Сегодня Bloomberg добывает, обрабатывает и предоставляет 200 миллиардов единиц финансовой информации практически в режиме реального времени. Это примерно 23 миллиона точек данных в секунду. Часть информации, доступной на Bloomberg, является общедоступной. Такие данные, как финансовые отчеты компаний и цены на акции и облигации, можно найти на публичных форумах.

Но что, если Вы аналитик в области нефти и газа и хотите понять движение контейнеров с сырой нефтью? Вы вряд ли сможете получать эту информацию в режиме реального времени, если не подпишитесь на источник данных, например, Bloomberg. Не все данные в Интернете находятся в свободном доступе.

Как правило, при работе с данными в Web2 у людей есть два ограничения: разрешенный доступ и высокий барьер для обработки больших объемов данных. За годы работы такие провайдеры, как Bloomberg, создали достаточно сильные сетевые эффекты, чтобы получать данные через своих филиалов, чего аналитики или инвесторы не могут себе позволить.

Лучше заплатить $20 000 компании Bloomberg за годовую подписку, чем пытаться получить данные из различных информационных платформ, которые могут иметь разные ценовые уровни. Даже если Вы будете усердно работать над данными, Вы не сможете обрабатывать их и проводить аналитику в режиме реального времени без значительных затрат на инфраструктуру. Что касается розничной торговли, то многие платформы, которые в конечном итоге масштабировались, представляли собой системы сопоставления данных.

Подумайте об этом так: Google (поисковая система) - это компания, занимающаяся сбором данных, которая предлагает бизнесу доступ к пользователям в обмен на рекламные доллары. Когда ресторан или информационный бюллетень (например, наш) хочет нацелиться на пользователей, ищущих информацию в Google, они сопоставляют спрос и предложение на подобную информацию. Тот, кто ищет информацию о рассылке, специфичной для Web3, ищет нас. И мы ищем такого человека. (Я сопротивляюсь желанию подключить здесь нашу реферальную программу).

Google построил монополию благодаря экономии на масштабе, в которой он функционирует. Их количество пользователей и количество запросов, которые пользователи делают каждый день, остаются непревзойденными. Google завоевал это положение, запустив поисковую систему без рекламы в то время, когда реклама была нормой, затем приобретя YouTube и Android, и, в конце концов, заплатив коллегам, таким как Apple, за то, чтобы Google стал поисковой системой по умолчанию. Только для компании Apple Google платит 20 миллиардов долларов в год за то, чтобы оставаться поисковой системой по умолчанию в Safari.

Google платит такую премию, потому что в основе его предложения лежит механизм подбора. Система подбора позволяет пользователям, у которых есть потребность, связаться с компаниями, у которых есть предложение. Большинство монополий в Интернете - это, по сути, поисковые системы. Amazon сводит продавцов товаров с покупателями. Instagram объединяет аудиторию с создателями. Эти системы подбора работают потому, что взаимодействие с этими продуктами оставляет богатые следы, по которым можно определить контекст.

Бен Эванс (Ben Evans) в 2022 году знаменито написал, что не существует такой вещи, как данные. Знание моего контента, предпочтений в еде или путешествиях не имеет большой ценности для третьей стороны. Она становится ценной - для коммерции или исследований - только тогда, когда она агрегирована или обогащена контекстом.

Контекст в том смысле, что мои предпочтения по поводу того, чтобы съесть бирияни в пятницу вечером, могут быть использованы для рекламы доставки бирияни именно тогда, когда вероятность того, что я его куплю, наиболее высока. В целом, сравнение вероятности моей покупки с аналогичной покупкой в том же регионе помогает лучше ориентироваться на пользователей.

Чтобы данные были ценными, они должны быть либо масштабными (в большом количестве), либо контекстными. Где продукты Web3 и Web2 исторически различаются, так это в следах, которые они оставляют. Только Amazon знает, сколько контроллеров Xbox будет продано за определенную неделю. Но Вы можете увидеть, по каким схемам трейдеры покупают или продают NFT на OpenSea в любой день. Причина в том, что каждая из этих транзакций оставляет за собой публичный след.

Продукты данных в Web3 используют эти маршруты для создания контекста.

Такие блокчейны, как Ethereum и Bitcoin, создают блоки каждые 12 секунд и ~10 минут, соответственно. Каждый блок содержит транзакции, которые изменяют состояние блокчейна. Такие блокчейн-исследователи, как Etherscan, собирают данные, относящиеся ко всем транзакциям. Например, если Вы зайдете в Etherscan и увидите блок, то ниже Вы увидите следующее изображение.

Транзакции в блокчейне имеют богатый контекст. Такие продукты, как Arkham и Nansen, представляют собой интерпретационные механизмы для исследователей, позволяющие понять, что происходит во время транзакции.

Вы можете просмотреть все блоки с момента создания Ethereum. Но что Вы можете сделать с этой информацией? Почти ничего. Поэтому Вам нужен способ собрать эти данные в нескольких таблицах. Например, каждый раз, когда в блоке вызывается NFT-контракт торговой площадки, данные, относящиеся к этой транзакции, должны быть добавлены в таблицы, связанные с NFT, или когда вызывается Uniswap-контракт, соответствующие данные должны храниться в таблицах, связанных с DEX. (Dune делает это в качестве услуги).

Вы не сможете проанализировать необработанные данные, не понеся значительных затрат на инфраструктуру. Поэтому, несмотря на то, что данные находятся в свободном доступе, Вы сталкиваетесь с теми же проблемами. Вы полагаетесь на внешние данные как инвестор или создатель dApp. Но Ваша основная функция не связана со сбором и управлением данными. Расходование ресурсов на важные, но неосновные виды деятельности - это не та роскошь, которой может наслаждаться каждая организация.

Контекст определяет ценность

Для продуктов данных контекст, окружающий данные, делает продукт уникальным. Bloomberg применяет свое финансовое понимание и преобразует данные в форму, которую могут легко использовать изобретатели и трейдеры. Такие сайты, как Similarweb, или исследовательские издания, такие как Newzoo, используют свою основную компетенцию, чтобы применить социальный или игровой контекст к данным, которые они отслеживают.

Продукты данных, основанные на блокчейне, отличаются тем, что предоставляют пользовательский контекст с помощью запросов, которые отвечают на вопросы, относящиеся к определенным подгруппам пользователей. Например, TokenTerminal вычисляет экономические основы протоколов. Нансен помогает участникам рынка маркировать и понимать движение активов. Parsec запрашивает данные о цепочке, чтобы помочь трейдерам лучше анализировать позиции DeFi.

Все эти продукты работают за счет общественного блага: данных о цепочке. Разница заключается в том, как эти продукты представляют свои данные, что делает их привлекательными для разных аудиторий.

Разделение продуктов на категории в нашей отрасли основано на том, какие данные поступают в цепочку, а какая информация берется из источников вне цепочки. (Некоторые часто используют и то, и другое). Поставщики данных используют свои контекстные фильтры для создания продуктов. Подобно тому, как у данных Web2 есть свои ниши, компании, работающие с данными Web3, создали или постепенно создают рвы, используя свои ключевые компетенции.

Таким образом, биография основателей часто диктует характер выпускаемых продуктов. Когда основная команда провела значительное время на рынках капитала до криптовалют, их продукты склонны подражать Bloomberg, в то время как криптовалютные продукты похожи на Nansen. Разные продукты отвечают разным потребностям, даже при запросе одних и тех же данных.

Например, биржи обычно сбрасывают данные через фиксированные промежутки времени. Они не занимаются данными, а хранение старых данных требует дополнительных серверов и управления. Некоторые поставщики данных, например, Kaiko и Amberdata, хранят исторические данные о портфеле заказов с бирж. Такие данные позволяют трейдерам и инвесторам строить модели для проверки своих гипотез. Но если Вы хотите понять, какие контракты DeFi вымываются притоком ETH или стейблкоинов, или проанализировать поведение конкретных адресов или организаций на цепи, Вам понадобится продукт от Nansen или Arkham.

Карта рынка не отражает всех игроков в каждой категории.

Один из способов понять, как продукты позиционируются на рынках, - это анализ потребительских персон в криптовалюте. Эти персоны можно разделить на следующие четыре основные категории.

Финансовые учреждения

Большинство долларов, проходящих через криптовалютные продукты, поступает от финансовых учреждений во время медвежьего рынка. Это крупные клиенты с более длительным циклом продаж и гораздо более сложными требованиями к данным. Один из способов понять, ориентирован ли продукт на финансовые учреждения, - это если клиенту приходится звонить продавцу, чтобы узнать, сколько он стоит. В мире Web2 Вы не сможете узнать, сколько стоит PitchBook или CB Insights. В криптовалюте Вы не знаете, сколько будет стоить такой продукт, как Chainalysis.

Шутки в сторону, но отчасти такой процесс продаж объясняется тем, что продукты для работы с данными, ориентированные на этот сегмент потребителей, предлагают практическое, "белое пальто" обслуживание. Эти пользователи обычно предпочитают использовать очень подробные и частые данные. Им нужны данные не только для принятия решений перед торговлей, но и для использования после торговли, чтобы соответствовать требованиям по соблюдению норм и налогообложению.

Например, им нужны продукты, которые расскажут им, какой была стоимость их портфеля в прошлом, помогут им с налоговыми расчетами и т.д. Такие фирмы, как Amberdata, Kaiko, CoinMetrics, CryptoCompare и, в некоторой степени, Nansen, обслуживают этих клиентов.

По моему опыту, только основатели с опытом работы в учреждениях или команды с крупными раундами финансирования смогли открыть институциональный рынок данных. Барьер для входа здесь относительно высок, как и в случае с любым корпоративным продуктом.

Разработчики

Мы часто сталкиваемся с функцией композитности Web3, которая означает, что приложения Web3 могут быть взаимозависимыми. Они могут требовать данные друг от друга. Поэтому им постоянно нужно считывать данные друг с друга. Например, такая платформа, как Yearn Finance, должна считывать данные с Aave и Compound, а такой агрегатор NFT, как Tensor, должен считывать данные с Magic Eden и других торговых площадок.

Но эти данные хранятся в блоках на таких цепочках, как Ethereum и Solana. Ethereum создает блок за 12 секунд, а Solana делает это за 400 мс. Сортировка данных блокчейна в таблицы и их хранение для быстрого доступа - нетривиальная задача. Именно здесь на помощь приходят такие индексаторы, как Covalent, Graph, Chainlink и Powerloom. Они обеспечивают хранение необработанных данных блокчейна в нужном формате, чтобы разработчики могли получить их с помощью простых вызовов API.

Появившийся сегмент этой потребительской персоны включает в себя инструменты, используемые для понимания поведения пользователей. Например, ARCx позволяет разработчикам сопоставлять данные вне цепочки (например, поведение браузера) с данными на цепочке (например, адресами кошельков), чтобы собрать демографическую информацию о пользователях, взаимодействующих с dApp. Они занимают относительно небольшую, но актуальную нишу, поскольку помогают разработчикам определить, кто их пользователи.

Исследователи и публикации

Продукты данных в криптовалюте часто находят распространение благодаря сотрудничеству с исследователями и публикациями. CCData, например, часто цитируется на Bloomberg. Исследователи заинтересованы в использовании продуктов данных, поскольку они помогают сэкономить время и усилия при сборе, очистке или обработке данных. Такие продукты, как Dune, построили ров, создав сообщество аналитиков, которые конкурируют друг с другом, чтобы занять более высокое место в их списке.

Такие издания, как The Block и Delphi, демонстрируют приборные панели, созданные на основе данных, полученных от сторонних поставщиков. Здесь, в Decentralised.co, мы полностью полагаемся на внешних поставщиков данных, поскольку они помогают сохранить команду в тонусе, используя внешние ресурсы при сборе данных.

Сложность работы с этим сегментом потребителей заключается в том, что небольшие исследователи могут не располагать необходимым бюджетом, чтобы оправдать трату огромных ресурсов на получение нишевых сведений, которые могут быть актуальны только для одного человека. И наоборот, у компаний есть стимул тратить усилия и ресурсы на партнерство с такими значимыми изданиями, как Financial Times, поскольку это помогает в распространении.

Розничные инвесторы

Продукты, ориентированные на розничных инвесторов, обычно имеют меньшую детализацию и частоту данных. Но это очень выгодные ниши, в которых можно строить, поскольку они дают эффект масштаба. Десять тысяч пользователей, платящих по 100 долларов, - это бизнес ARR на 1 миллион долларов в мире, где оттока не существует. Легче сказать, чем сделать, но эта экономика объясняет, почему у нас так много продуктов, ориентированных на розничную торговлю криптовалютой.

Большая часть продуктов, ориентированных на розничную торговлю, бесплатна или поддерживается рекламой. Например, такой бесплатный ресурс, как DefiLlama, не расскажет Вам, как направить ордер через различные биржи (CEX и DEX), чтобы избежать проскальзывания, поскольку он не делает снимков книги ордеров, но он демонстрирует информацию о разблокировке токенов или разблокировке доходности.

Одним из изменений в этом сегменте потребителей является то, как средство доставки открывает новую категорию рынка - например, Cielo доставляет данные в виде уведомлений через Telegram. Она достигла масштабов более 40 000 пользователей, передавая информацию в удобной форме для потребителей, которые предпочитают не иметь дело с настольными интерфейсами. При правильном подходе даже средства распространения могут стать отличительными факторами для предприятий на ранних стадиях развития. Даже в данных.

Несмотря на то, что в некоторых моментах классификация размывается, фирмы, предоставляющие данные, можно разделить на B2B- и B2C-ориентированные.

Такие компании, как Amberdata и Kaiko, предлагают продукты, рассчитанные на искушенных актеров. Эти продукты являются более детализированными (детали, в которых доступны данные) и частыми (например. тик за тиком и данные книги заявок в реальном времени), и они удовлетворяют таким требованиям, как построение и тестирование моделей, предторговый анализ, послеторговая отчетность, налогообложение и соответствие нормативным требованиям. Данные предоставляются в формате, позволяющем клиентам проводить собственные анализы и создавать визуализации по своему вкусу. Эти компании обычно предлагают свои продукты за платной стеной.

Стоимость, как правило, зависит от степени детализации, обусловленной требованиями к инфраструктуре, характером клиентуры и длительностью цикла продаж.

На изображении выше различные продукты отображаются на двух осях - глубина и детализация в сравнении с ценами на продукты. Пожалуйста, обратите внимание, что эти участки не являются точными. Несколько пунктов могут быть ошибочными. Идея состоит в том, чтобы разработать ментальную модель, позволяющую продумать несколько продуктов и их положение на рынке.

Продукты, ориентированные на розничную торговлю, такие как Dune или CoinGecko, отображают почти все данные бесплатно. Клиенты должны платить за доступ к некоторым данным или если им нужны данные через API для проведения анализов. Например, Вы можете просмотреть все графики, созданные несколькими мастерами Dune, но они ограничивают количество строк, которые Вы можете загрузить в формате CSV. Вы можете загружать большие CSV-файлы и просматривать частные запросы по мере увеличения оплаты.

Компании, ориентированные на розничную торговлю, как правило, имеют низкий доход на одного клиента и небольшое количество платящих клиентов в процентном соотношении к бесплатным пользователям. Сравните это с показателями конверсии в freemium-моделях интернет-компаний. Обычно коэффициент конверсии составляет 2%–5%. Коэффициент конверсии в 10% будет исключением. Их игровая программа заключается в том, чтобы иметь как можно больше бесплатных клиентов, чтобы коэффициент конверсии в 4% значительно увеличивал доход. Это то, что мы называем вершиной воронки.

Поэтому компаниям, работающим с данными, необходимо, чтобы верхняя часть воронки была достаточно большой и приносила достаточный доход, чтобы обеспечить себе существование при более низком коэффициенте конверсии. Компании также могут рассмотреть возможность получения дохода от рекламы, когда на сайте будет много посетителей. CoinGecko использует доходы от рекламы в качестве рычага, чтобы продолжать предоставлять большую часть данных бесплатно.

За годы своего существования компании заполнили места на обоих концах спектра (B2B и B2C), оставив некоторые пробелы между ними. Если кто-то хочет посмотреть, как меняются книги заявок на централизованных биржах или как меняются коэффициенты пут-колл, IV и перекосы, существует не так много продуктов, которые помогут с визуализацией. Есть место для более детализированного продукта, чем CoinGecko мира, но менее детализированного, чем продукты чистых игроков B2B.

На рвах

Найти "рвы" в бизнесе, где сырье является бесплатным, не так-то просто. Данные блокчейна находятся в свободном доступе. В том, какие данные Вы можете собрать, нет ничего закрытого. Таким образом, "рвы" в бизнесе, связанном с данными, основаны не только на том, что у Вас есть какие-то данные, которых нет у других. Вместо этого они основаны на способности команды предоставлять данные в понятном, удобном для использования формате, вовремя и без ошибок.

Многие компании утверждают, что у них одни и те же данные, но качество данных и их представление отличаются. Например, многие компании утверждают, что у них есть данные о портфеле заказов вне цепочки. Однако такие факторы, как количество ордеров на покупку/продажу, длина временного ряда, количество доступных бирж и пар, различаются у разных поставщиков. Amberdata и Kaiko располагают наиболее полными данными о портфеле заказов на криптовалютных рынках.

Почему же только несколько поставщиков могут предоставлять такие данные? Объяснение того, где появляются рвы в данных Web3, лежит здесь.

Талант - Рискуя заявить очевидное, скажу, что когда сырье бесплатно, то то, как Вы придадите ему форму, определяет ценность продукта. Превращение необработанных данных в полезную информацию требует специальных знаний во многих нишах криптовалютного и традиционного финансового рынков. Команды, подобные Velo Data, имеющие опыт работы на традиционных рынках, имеют преимущество перед другими, пытающимися создать подобные B2C-продукты. Найти талантливых разработчиков, которые понимают структуры данных блокчейна и имеют соответствующий опыт работы на финансовых рынках, - большая редкость.

Инфраструктура - Сбор и передача больших объемов данных требует инфраструктуры, которая не так-то просто создается. Для такого рода операций требуется капитал и талант. Почему инфраструктура - это ров? Подумайте о данных пула памяти. Блоки содержат данные для подтвержденных транзакций. Что делать с неподтвержденными транзакциями?

Разные узлы сети (например, узлы, подключенные к одному пулу) видят разные неподтвержденные транзакции. Запуск только одного узла не даст глобального представления о конкурирующих транзакциях. Поддержание нескольких узлов на нескольких блокчейнах увеличивает затраты на инфраструктуру. Как и в случае с искусственным интеллектом (и контентными сетями в прошлом), способность поддерживать низкую стоимость оборудования при одновременном масштабировании будет определять победителей и проигравших в этом секторе с течением времени.

Сетевые эффекты - Можно предположить, что сетевые эффекты существуют во многих криптовалютных продуктах. Возьмем, к примеру, Chainlink. Это был один из первых оракулов, который позволял приложениям считывать данные из других приложений или цепочек. Он сумел заручиться поддержкой сообщества и является одним из самых сильных сообществ. Другой пример - Нансен. Его славой стали адресные метки, которые позволяли относить движение активов к реальным объектам, а не к шестнадцатизначным адресам.

Впоследствии он запустил такие функции, как NFT Paradise и Token God Mode, позволяющие пользователям более эффективно отслеживать NFT и токены. Компания Arkham выпустила продукт, похожий на этикетки Nansen, но инвестиции в информационные панели и исследования позволили Nansen продвинуться в сторону корпоративных клиентов и предложить продукты, разработанные специально для них. Стоит отметить, что сетевые эффекты невозможны без первых двух пунктов (таланты и инфраструктура).

Одно из мест, где это работает, - индексаторы. Чем больше цепочек поддерживает продукт, тем выше вероятность того, что разработчик будет использовать этот продукт вместо того, чтобы полагаться на несколько источников. Такие команды, как Covalent, имеют здесь преимущество, поскольку они уже давно оптимизируют широту поддерживаемых цепочек. Но помните, что глубина так же важна, как и широта.

Пока еще слишком рано говорить о том, есть ли у какого-либо продукта значимый "ров" в криптовалюте. Мы стали свидетелями того, что в грандиозной схеме вещей мы имеем преимущество на первых порах. По мере того, как такие категории, как социальный Web3 и пересечение ИИ и криптовалют, продолжают расширяться, продукты данных в этой отрасли могут стать следующим Alphabet. Но это будет история, рассчитанная на несколько десятилетий; мы же пока находимся в самом начале ее развития.

За пределами спекуляций

Многие из примеров использования, которые мы привели в этой статье, в той или иной форме касаются финансовых спекуляций. Даже разработчики, использующие API для запросов данных, создают финансовые продукты. Это может показаться странным, но блокчейн (как новая сеть) следует той же тенденции, что и Телеграф и Интернет.

Появление нового носителя информации и новой сети ускоряет использование финансовых возможностей. С появлением Интернета только в начале 2000-х годов люди поняли, что на пользователей можно ориентироваться, основываясь на их местоположении. Что касается блокчейн, то мы все еще выясняем, как строить бизнес-модели на основе общедоступных данных.

В повседневном использовании этих платформ мы увидели одно ключевое изменение - компания Dune Analytics внедрила искусственный интеллект в свой продукт. Dune предоставляет пользователям интерфейс на основе SQL для запросов данных из таких блокчейнов, как Ethereum и Solana. Рынок для такого продукта обычно ограничен пользователями, которые понимают, как писать SQL-запросы. Недавно они начали использовать искусственный интеллект, чтобы помочь аналитикам составлять запросы, не будучи экспертами по SQL. Он не настолько функционален, как хотелось бы. Но это все равно шаг в будущее. Возможно, пройдет немного времени, и мы попросим искусственный интеллект (например, ChatGPT) запрашивать данные из блокчейна и предлагать свой анализ.

Один из способов представить себе "данные" в контексте Web3 - через призму Google Maps. GPS существует, по крайней мере, с 1980-х годов. Компания Google приложила все усилия, чтобы составить карту мира. Сделав наложения на карты доступными для сторонних приложений (с помощью API), компания позволила создать новое поколение приложений. Все, начиная от доставки и заканчивая поездками на автомобиле, процветает, потому что один игрок, специализирующийся на данных, взял на себя это бремя разработчиков.

Продукты данных в Web3 призваны сыграть аналогичную роль. Мы еще не знаем, какие именно приложения могут быть созданы на основе этого общедоступного ресурса, но становится очевидным, что в области данных существует возможность размером с Алфавит.

Отказ от ответственности:

  1. Эта статья перепечатана из[GCR]. Все авторские права принадлежат авторам[Saurabh Deshpande, Siddharth, Joel]. Если у Вас есть возражения против этой перепечатки, пожалуйста, свяжитесь с командой Gate Learn, и они незамедлительно рассмотрят их.
  2. Предупреждение об ответственности: Мнения и взгляды, выраженные в этой статье, принадлежат исключительно автору и не являются инвестиционным советом.
  3. Перевод статьи на другие языки осуществляется командой Gate Learn. Если не указано, копирование, распространение или плагиат переведенных статей запрещены.
Начните торговать сейчас
Зарегистрируйтесь сейчас и получите ваучер на
$100
!