Трава - Революция данных

Средний12/9/2024, 8:36:14 AM
Grass дает моделям и приложениям искусственного интеллекта доступ ко всему Интернету в качестве набора данных, который собирается с помощью сети узлов по всему миру, которые вносят свой простаивающий Интернет-полосу. У них есть сильное начальное притяжение более чем 2,5 миллиона пользователей.

Executive Summary

Генеративное искусственное интеллект - самое важное достижение в последнее время и становится еще более важным по мере того, как идет время. Генеративный искусственный интеллект в основном представляет собой продукт трех элементов:

Алгоритмы + Данные + Вычисления = Интеллект

Это означает, что данные и вычисления, скорее всего, станут двумя самыми важными активами в мире, и доступ к ним будет чрезвычайно важным.

Generative AI-модели требуют множество данных. Данные, на которых работают самые значимые Generative AI-модели, представляют собой сумму данных Интернета, что является приближением к общей сумме человеческих знаний.

Криптовалюта - это возможность получить доступ к новым цифровым ресурсам по всему миру и превратить в активы то, что раньше ими не являлось, с помощью токенов. Grass делает это для данных.

Grass дает моделям и приложениям искусственного интеллекта доступ ко всему Интернету в качестве набора данных, живых, которые собираются через сеть узлов по всему миру, которые вносят свой неиспользуемый интернет-трафик. У них есть сильное начальное притяжение более чем у 2,5 миллионов пользователей.[1]

Долгосрочный потенциальный рынок для Grass огромен и пропорционален размеру рынка искусственного интеллекта и его будущему росту. В прошлом сбор наборов данных такого масштаба был доступен только крупнейшим технологическим гигантам. Grass вносит новую экономику в область данных, снижая затраты. Это демократизирует доступ к данным, обеспечивая не только крупные элитные компании, но и более малые предприятия в сфере искусственного интеллекта.

Проблема

Обучение и настройка искусственного интеллекта требуют огромных объемов данных. Исторически большая часть этих данных была собрана создателями моделей искусственного интеллекта, скрывающих данные с веб-сайтов. Процесс скрапинга имеет ряд сложностей:

  • Веб-скрапинг затратен. Есть только пара крупных организаций, способных периодически скрэпить весь веб. Это исключает меньших разработчиков искусственного интеллекта от доступа к данным.
  • Блокировка IP-адреса. Между службами сбора информации и создателями контента ведется настоящая игра в кошки-мышки. Довольно просто заблокировать IP-адрес, чтобы прекратить сбор информации, что затрудняет достижение целей сбора информации и сбор необходимых данных для обучения и настройки искусственного интеллекта.
  • Нерациональное использование ресурсов. Сбор информации с Интернета - задача, которая может быть полезна многим клиентам. Однако использование аппаратного обеспечения, пропускной способности и вычислительной мощности для этого неэффективно, если она выполняется одним клиентом.
  • Свежесть данных. Сканирование всего Интернета является трудоемким и дорогостоящим процессом. Это делает его непрактичным для большинства пользователей, что делает данные менее свежими/актуальными и влияет на качество моделей искусственного интеллекта.

Решение Grass

Grass стремится решить эти проблемы, создав федерированную сеть веб-скрейперов. Каждый участник, принимающий участие в сети Grass, вносит свою долю неиспользуемой интернет-пропускной способности, чтобы обеспечить небольшое количество скрейпинга с его IP-адреса. Затем Grass собирает данные с каждого из этих узлов, чтобы сформировать объединенный набор данных, полезный для обучения и настройки искусственного интеллекта. Это элегантное и подходящее использование распределенных сетей, снабженных криптовалютой.

Есть и другие деловые случаи использования неиспользуемого Интернета, такие как:

  • Сбор местных/географических данных, таких как реклама
  • Проведение академических исследований
  • Проверка местных цен

Сегодня Grass собирает данные, используя существующее оборудование (ноутбуки, настольные компьютеры и т. д.). В будущем Grass планирует предложить устройство для сбора данных, являющееся специализированным аппаратным устройством, полностью посвященным сбору данных, что позволит повысить эффективность, так как аппаратное обеспечение оптимизировано для этой конкретной задачи.

Преимущества травы

Существует несколько преимуществ использования распределенной сети для сбора данных:

  • Демократизированный доступ к веб-данным, который становится дешевле при масштабировании. Вместо того, чтобы единственный клиент собирал данные для своих собственных нужд, Grass собирает данные от имени многих клиентов. Эти данные могут быть перепроданы несколько раз, создавая экономию масштаба на данных, снижая экономические затраты на скрейпинг и делая рынок более эффективным. При масштабировании Grass может, гипотетически, стать наиболее экономичным решением для сбора данных для клиентов, создавая экономический эффект сетевого взаимодействия вокруг своего протокола. Это означает, что сбор данных теперь доступен каждому, а не только нескольким большим компаниям, которые имеют ресурсы для скрейпинга веб-сайтов.
  • Блокировка IP становится невозможной. Распределение скрапинга делает его намного сложнее обнаружить и остановить, поскольку каждый узел выполняет лишь относительно небольшой объем захвата данных и трудно отличить от типичного интернет-трафика. Это приводит к более полным наборам данных для обучения.
  • Интернет-трафик используется более эффективно. Поскольку Grass эффективно использует неиспользуемый интернет-трафик, это более эффективно, чем предоставление нового трафика только для скрэппинга.
  • Данные более точные и актуальные. Становится экономически целесообразным скрейпить их чаще, чем это мог бы сделать обычный клиент. В результате это приводит к тому, что данные становятся менее устаревшими. Это важно, поскольку модели искусственного интеллекта, полученные в результате, более актуальны.

The Challenge: Создатели контента, монетизирующие свои данные

Одной из сложностей при сборе данных является взаимодействие с создателями контента. Это включает такие сайты, как NY Times и Reddit, которые начали монетизировать свои данные, предоставляя лицензии третьим лицам для обучения моделей искусственного интеллекта. Естественно, они защищают данные на своих сайтах, поскольку эти данные представляют собой очень прибыльные источники дохода для них. Действительно, Reddit запретил использование его разработчиками API для машинного обучения, чтобы защитить свою бизнес-модель предоставления лицензий на использование своих данных моделям искусственного интеллекта (см. условия предоставления услуг).здесь).

Что ждет создателей контента в будущем? Подумайте о том, что для пользовательского контента (UGC), такого как Reddit, есть аргумент, что пользователи владеют своими данными (а не платформа), поскольку контент создан пользователями и должен принадлежать им. Этот аргумент еще не был полностью изучен с юридической точки зрения. Будет интересно следить за этим впереди. Однако, если пользователи действительно владеют своими внесенными данными, то Grass может представлять гипотетический путь помощи этим пользователям в монетизации их собственных внесенных данных. Например, Grass может вознаградить самих участников Reddit за то, что они добровольно вносят свои данные, которые они создали на Reddit.

Для платных создателей контента, таких как NY Times, контент создается оплаченными писателями, и поэтому нет аргументов в пользу данных, принадлежащих пользователю. Таким образом, Grass может просто исключить эти сайты из сканирования. В качестве альтернативы Grass может масштабироваться до того уровня, когда станет возможным для самого Grass стать клиентом этих сайтов и платить лицензионные сборы. Теоретически это могло бы работать так, что клиенты Grass могли бы платить за данные, а затем Grass могло бы делиться доходами с создателями контента, тем самым обеспечивая создание моделей искусственного интеллекта в рамках гибкого бюджета. В качестве альтернативы Grass могло бы достичь такого масштаба, что оно могло бы договориться о массовом лицензионном соглашении от имени всех своих клиентов.

Запуск Grass

У Grаss в начале этого года был очень впечатляющий запуск:

  • У травы был самый широко распространенный воздушный заброс в истории Соланы.[2]
  • Более 2 миллионов кошельковзаявленопроведение эйрдропа привело к перегрузке сети Solana.
  • По всему миру число пользователей Grass превышает 2,5 миллиона.[3]
  • У Grass уже есть возможности и данные для обучения модели ChatGPT 3.5 от OpenAI.
  • В качестве демонстрации своей платформы Grass опубликовал набор данных, состоящий из 600 миллионов сообщений и комментариев с Reddit за 2024 год (см. здесьдля объявления издесьдля набора данных).

На момент написания токен Grass имелпозитивная ценовая динамикапост-запуск (+115%), что необычно, так как большинство токенов падают в дни/недели после листинга. Вероятно, это отражение их умного подхода к распределению эйрдропа, а также веры в будущее и потенциал Grass. В целом, это отличный старт для сети, и мы считаем, что он проложит путь к многим процветающим годам впереди.

Производительность токена Grass с момента запуска 28 октября 2024 года

Источник: TradingView.

Начните вносить вкладподключив свой кошелек Solana и заработав токен Grass.

Хотите использовать наборы данных Grass для вашего бизнеса, исследований или проекта? Свяжитесь с командой на Gate.iodiscover@grassfoundation.io.

Сноски

[1] Источник: https://www.getgrass.io/.
[2] Source: https://www.google.com/url?q=https://www.theblock.co/post/323805/grass-becomes-most-distributed-solana-airdrop-as-nearly-1-5-million-addresses-claim-tokens&sa=D&source=docs&ust=1732646335082707&usg=AOvVaw0oVvhJL661rmE1ABmJqOyP.
[3] Source: https://www.getgrass.io/.

Отказ от ответственности:

  1. Эта статья взята из [Hack VC], Все авторские права принадлежат оригинальному автору [Ed Roman]. Если есть возражения по поводу этого переиздания, пожалуйста, свяжитесь с Gate Learnкоманда и они оперативно займутся этим.
  2. Отказ от ответственности: Взгляды и мнения, выраженные в этой статье, являются исключительно мнениями автора и не являются инвестиционными советами.
  3. Переводы статьи на другие языки выполняются командой gate Learn. Если не указано иное, копирование, распространение или плагиат переведенных статей запрещено.

Трава - Революция данных

Средний12/9/2024, 8:36:14 AM
Grass дает моделям и приложениям искусственного интеллекта доступ ко всему Интернету в качестве набора данных, который собирается с помощью сети узлов по всему миру, которые вносят свой простаивающий Интернет-полосу. У них есть сильное начальное притяжение более чем 2,5 миллиона пользователей.

Executive Summary

Генеративное искусственное интеллект - самое важное достижение в последнее время и становится еще более важным по мере того, как идет время. Генеративный искусственный интеллект в основном представляет собой продукт трех элементов:

Алгоритмы + Данные + Вычисления = Интеллект

Это означает, что данные и вычисления, скорее всего, станут двумя самыми важными активами в мире, и доступ к ним будет чрезвычайно важным.

Generative AI-модели требуют множество данных. Данные, на которых работают самые значимые Generative AI-модели, представляют собой сумму данных Интернета, что является приближением к общей сумме человеческих знаний.

Криптовалюта - это возможность получить доступ к новым цифровым ресурсам по всему миру и превратить в активы то, что раньше ими не являлось, с помощью токенов. Grass делает это для данных.

Grass дает моделям и приложениям искусственного интеллекта доступ ко всему Интернету в качестве набора данных, живых, которые собираются через сеть узлов по всему миру, которые вносят свой неиспользуемый интернет-трафик. У них есть сильное начальное притяжение более чем у 2,5 миллионов пользователей.[1]

Долгосрочный потенциальный рынок для Grass огромен и пропорционален размеру рынка искусственного интеллекта и его будущему росту. В прошлом сбор наборов данных такого масштаба был доступен только крупнейшим технологическим гигантам. Grass вносит новую экономику в область данных, снижая затраты. Это демократизирует доступ к данным, обеспечивая не только крупные элитные компании, но и более малые предприятия в сфере искусственного интеллекта.

Проблема

Обучение и настройка искусственного интеллекта требуют огромных объемов данных. Исторически большая часть этих данных была собрана создателями моделей искусственного интеллекта, скрывающих данные с веб-сайтов. Процесс скрапинга имеет ряд сложностей:

  • Веб-скрапинг затратен. Есть только пара крупных организаций, способных периодически скрэпить весь веб. Это исключает меньших разработчиков искусственного интеллекта от доступа к данным.
  • Блокировка IP-адреса. Между службами сбора информации и создателями контента ведется настоящая игра в кошки-мышки. Довольно просто заблокировать IP-адрес, чтобы прекратить сбор информации, что затрудняет достижение целей сбора информации и сбор необходимых данных для обучения и настройки искусственного интеллекта.
  • Нерациональное использование ресурсов. Сбор информации с Интернета - задача, которая может быть полезна многим клиентам. Однако использование аппаратного обеспечения, пропускной способности и вычислительной мощности для этого неэффективно, если она выполняется одним клиентом.
  • Свежесть данных. Сканирование всего Интернета является трудоемким и дорогостоящим процессом. Это делает его непрактичным для большинства пользователей, что делает данные менее свежими/актуальными и влияет на качество моделей искусственного интеллекта.

Решение Grass

Grass стремится решить эти проблемы, создав федерированную сеть веб-скрейперов. Каждый участник, принимающий участие в сети Grass, вносит свою долю неиспользуемой интернет-пропускной способности, чтобы обеспечить небольшое количество скрейпинга с его IP-адреса. Затем Grass собирает данные с каждого из этих узлов, чтобы сформировать объединенный набор данных, полезный для обучения и настройки искусственного интеллекта. Это элегантное и подходящее использование распределенных сетей, снабженных криптовалютой.

Есть и другие деловые случаи использования неиспользуемого Интернета, такие как:

  • Сбор местных/географических данных, таких как реклама
  • Проведение академических исследований
  • Проверка местных цен

Сегодня Grass собирает данные, используя существующее оборудование (ноутбуки, настольные компьютеры и т. д.). В будущем Grass планирует предложить устройство для сбора данных, являющееся специализированным аппаратным устройством, полностью посвященным сбору данных, что позволит повысить эффективность, так как аппаратное обеспечение оптимизировано для этой конкретной задачи.

Преимущества травы

Существует несколько преимуществ использования распределенной сети для сбора данных:

  • Демократизированный доступ к веб-данным, который становится дешевле при масштабировании. Вместо того, чтобы единственный клиент собирал данные для своих собственных нужд, Grass собирает данные от имени многих клиентов. Эти данные могут быть перепроданы несколько раз, создавая экономию масштаба на данных, снижая экономические затраты на скрейпинг и делая рынок более эффективным. При масштабировании Grass может, гипотетически, стать наиболее экономичным решением для сбора данных для клиентов, создавая экономический эффект сетевого взаимодействия вокруг своего протокола. Это означает, что сбор данных теперь доступен каждому, а не только нескольким большим компаниям, которые имеют ресурсы для скрейпинга веб-сайтов.
  • Блокировка IP становится невозможной. Распределение скрапинга делает его намного сложнее обнаружить и остановить, поскольку каждый узел выполняет лишь относительно небольшой объем захвата данных и трудно отличить от типичного интернет-трафика. Это приводит к более полным наборам данных для обучения.
  • Интернет-трафик используется более эффективно. Поскольку Grass эффективно использует неиспользуемый интернет-трафик, это более эффективно, чем предоставление нового трафика только для скрэппинга.
  • Данные более точные и актуальные. Становится экономически целесообразным скрейпить их чаще, чем это мог бы сделать обычный клиент. В результате это приводит к тому, что данные становятся менее устаревшими. Это важно, поскольку модели искусственного интеллекта, полученные в результате, более актуальны.

The Challenge: Создатели контента, монетизирующие свои данные

Одной из сложностей при сборе данных является взаимодействие с создателями контента. Это включает такие сайты, как NY Times и Reddit, которые начали монетизировать свои данные, предоставляя лицензии третьим лицам для обучения моделей искусственного интеллекта. Естественно, они защищают данные на своих сайтах, поскольку эти данные представляют собой очень прибыльные источники дохода для них. Действительно, Reddit запретил использование его разработчиками API для машинного обучения, чтобы защитить свою бизнес-модель предоставления лицензий на использование своих данных моделям искусственного интеллекта (см. условия предоставления услуг).здесь).

Что ждет создателей контента в будущем? Подумайте о том, что для пользовательского контента (UGC), такого как Reddit, есть аргумент, что пользователи владеют своими данными (а не платформа), поскольку контент создан пользователями и должен принадлежать им. Этот аргумент еще не был полностью изучен с юридической точки зрения. Будет интересно следить за этим впереди. Однако, если пользователи действительно владеют своими внесенными данными, то Grass может представлять гипотетический путь помощи этим пользователям в монетизации их собственных внесенных данных. Например, Grass может вознаградить самих участников Reddit за то, что они добровольно вносят свои данные, которые они создали на Reddit.

Для платных создателей контента, таких как NY Times, контент создается оплаченными писателями, и поэтому нет аргументов в пользу данных, принадлежащих пользователю. Таким образом, Grass может просто исключить эти сайты из сканирования. В качестве альтернативы Grass может масштабироваться до того уровня, когда станет возможным для самого Grass стать клиентом этих сайтов и платить лицензионные сборы. Теоретически это могло бы работать так, что клиенты Grass могли бы платить за данные, а затем Grass могло бы делиться доходами с создателями контента, тем самым обеспечивая создание моделей искусственного интеллекта в рамках гибкого бюджета. В качестве альтернативы Grass могло бы достичь такого масштаба, что оно могло бы договориться о массовом лицензионном соглашении от имени всех своих клиентов.

Запуск Grass

У Grаss в начале этого года был очень впечатляющий запуск:

  • У травы был самый широко распространенный воздушный заброс в истории Соланы.[2]
  • Более 2 миллионов кошельковзаявленопроведение эйрдропа привело к перегрузке сети Solana.
  • По всему миру число пользователей Grass превышает 2,5 миллиона.[3]
  • У Grass уже есть возможности и данные для обучения модели ChatGPT 3.5 от OpenAI.
  • В качестве демонстрации своей платформы Grass опубликовал набор данных, состоящий из 600 миллионов сообщений и комментариев с Reddit за 2024 год (см. здесьдля объявления издесьдля набора данных).

На момент написания токен Grass имелпозитивная ценовая динамикапост-запуск (+115%), что необычно, так как большинство токенов падают в дни/недели после листинга. Вероятно, это отражение их умного подхода к распределению эйрдропа, а также веры в будущее и потенциал Grass. В целом, это отличный старт для сети, и мы считаем, что он проложит путь к многим процветающим годам впереди.

Производительность токена Grass с момента запуска 28 октября 2024 года

Источник: TradingView.

Начните вносить вкладподключив свой кошелек Solana и заработав токен Grass.

Хотите использовать наборы данных Grass для вашего бизнеса, исследований или проекта? Свяжитесь с командой на Gate.iodiscover@grassfoundation.io.

Сноски

[1] Источник: https://www.getgrass.io/.
[2] Source: https://www.google.com/url?q=https://www.theblock.co/post/323805/grass-becomes-most-distributed-solana-airdrop-as-nearly-1-5-million-addresses-claim-tokens&sa=D&source=docs&ust=1732646335082707&usg=AOvVaw0oVvhJL661rmE1ABmJqOyP.
[3] Source: https://www.getgrass.io/.

Отказ от ответственности:

  1. Эта статья взята из [Hack VC], Все авторские права принадлежат оригинальному автору [Ed Roman]. Если есть возражения по поводу этого переиздания, пожалуйста, свяжитесь с Gate Learnкоманда и они оперативно займутся этим.
  2. Отказ от ответственности: Взгляды и мнения, выраженные в этой статье, являются исключительно мнениями автора и не являются инвестиционными советами.
  3. Переводы статьи на другие языки выполняются командой gate Learn. Если не указано иное, копирование, распространение или плагиат переведенных статей запрещено.
Начните торговать сейчас
Зарегистрируйтесь сейчас и получите ваучер на
$100
!