Автор: Mirror Tang | Salus; Yixin Ren | Hongshan capital; Lingzhi Shi | Salus; Jiangyue Wang | Salus
Минулого року, коли генеративний штучний інтелект неодноразово перевершував очікування громадськості, хвиля революції продуктивності штучного інтелекту прокотилася по колу криптовалют. Ми бачили, що багато концептуальних проектів штучного інтелекту викликали хвилю міфів про створення багатства на вторинному ринку.Водночас все більше і більше розробників почали розробляти власні проекти «AI+Crypto».
Однак більш уважний погляд показує, що однотипність цих проектів є дуже серйозною, і більшість проектів зосереджуються лише на покращенні «виробничих відносин», таких як організація обчислювальної потужності через децентралізовані мережі або створення «децентралізованого Hugging Face» тощо. Дуже небагато проектів намагаються справжньої інтеграції та інновацій із базової технології. Ми вважаємо, що причина цього явища полягає в тому, що існує «зміщення домену» між полями ШІ та блокчейну. Незважаючи на їх широкий перетин, мало хто має глибоке розуміння обох сфер. Наприклад, розробникам штучного інтелекту важко зрозуміти технічну реалізацію та історичний статус інфраструктури Ethereum, а ще важче запропонувати детальні плани оптимізації.
Візьмемо для прикладу машинне навчання (ML), найосновнішу галузь штучного інтелекту. Це технологія, яка дозволяє машинам приймати рішення на основі даних без явних інструкцій програмування. Машинне навчання показало великий потенціал в аналізі даних і розпізнаванні образів і стало звичним явищем у web2. Однак через обмеження часів, коли він уперше народився, навіть на передньому краї інноваційних технологій блокчейн, таких як Ethereum, його архітектура, мережа та механізми управління ще не використовували машинне навчання як ефективний інструмент для вирішення складних проблем.
«Великі інновації часто народжуються в різних областях.» Наша початкова мета під час написання цієї статті — дозволити розробникам штучного інтелекту краще зрозуміти світ блокчейну, а також надати нові ідеї розробникам у спільноті Ethereum. У статті ми спочатку представили технічну реалізацію Ethereum, а потім запропонували рішення для застосування машинного навчання, базового алгоритму ШІ, до мережі Ethereum для підвищення її безпеки, ефективності та масштабованості. Ми сподіваємось використати цей випадок як відправну точку, щоб представити деякі перспективи, які відрізняються від тих, що є на ринку, і надихнути на більш інноваційні крос-комбінації «AI+Blockchain» в екосистемі розробників.
Технічна реалізація Ethereum
Базова структура даних
Суть блокчейну полягає в ланцюжку, що з’єднує блоки. Ключем до розрізнення ланцюжків є конфігурація ланцюга, яка також є невід’ємною частиною створення блокчейну. Для Ethereum конфігурація ланцюжка використовується для розрізнення різних ланцюжків в Ethereum і визначення деяких важливих протоколів оновлення та позначення подій. Наприклад, DAOForkBlock позначає висоту хардфорку, на якій Ethereum зазнав атаки DAO, а ConstantinopleBlock позначає висоту блоку, на якій було оновлено Constantinople. Для більш масштабних оновлень, які містять багато пропозицій щодо вдосконалення, будуть встановлені спеціальні поля для ідентифікації відповідної висоти блоку.Крім того, Ethereum включає різні тестові мережі та основні мережі, а відповідна екологія мережі унікально ідентифікується за допомогою ChainID.
Блок генезису є нульовим блоком усього блокчейну, а інші блоки прямо чи опосередковано посилаються на блок генезису. Таким чином, правильна інформація про блок генезису повинна бути завантажена під час запуску вузла і не повинна змінюватися довільно. Інформація про конфігурацію блоку генезису включає вищезазначену конфігурацію ланцюга, а також додає такі поля, як відповідні винагороди за майнінг, часові позначки, складність і ліміти газу.Слід зазначити, що механізм консенсусу Ethereum розвинувся з майнінгу з підтвердженням роботи Механізм перетворюється на доказ частки.
Облікові записи Ethereum поділяються на зовнішні облікові записи та облікові записи контракту. Зовнішній обліковий запис унікально контролюється приватним ключем, тоді як обліковий запис контракту не має контролю закритого ключа, і ним можна керувати лише викликом контракту із зовнішнього облікового запису для виконання коду контракту. Усі вони містять унікальну адресу. Світовий стан Ethereum — це дерево облікових записів Ethereum.Кожен обліковий запис відповідає кінцевому вузлу, у якому зберігається статус облікового запису (різна інформація про обліковий запис і інформація про код).
Транзакції: як децентралізована платформа, суть Ethereum полягає в транзакціях і контрактах. Блоки Ethereum — це пакетні транзакції, а також додаткова відповідна інформація. Конкретні блоки поділяються на дві частини, а саме заголовок блоку та область. Блок, у якому Дані заголовка блоку містять докази, які з’єднують усі блоки в ланцюжок, який ми можемо зрозуміти як хеш попереднього блоку, а також корінь стану, корінь транзакції, корінь квитанції та доказ стану всього світу Ethereum.Кілька інших індикаторів вказати складність, підрахунок одноразових та інші додаткові дані. Тіло блоку зберігає список транзакцій і список заголовків блоків uncle (оскільки Ethereum перетворився на proof of stake, посилання на блок uncle більше не існує).
Квитанції про транзакцію надають результати та додаткову інформацію після того, як транзакцію було виконано, яку неможливо отримати безпосередньо, просто переглянувши саму транзакцію. Зокрема, інформацію, що міститься в ньому, можна розділити на: консенсусний вміст, інформацію про транзакції та інформацію про блоки, включаючи інформацію про успішність обробки транзакцій та інформацію про споживання, таку як журнали транзакцій і газ. Налагодьте код смарт-контракту та оптимізуйте споживання газу, аналізуючи інформацію в квитанції. і надає форму підтвердження того, що транзакція була оброблена мережею, і можна переглянути результати та вплив транзакції.
В Ethereum комісію за газ можна просто розуміти як комісію за обробку. Коли ви надсилаєте токен, виконуєте контракт, передаєте Ethereum або виконуєте різні операції на цьому блоці, операції в цих транзакціях вимагають комісії за газ. Ether Під час обробки цієї транзакції комп’ютер потрібно виконувати обчислення та споживати мережеві ресурси, тому вам доведеться платити за газ, щоб комп’ютер працював на вас. Остаточна комісія за паливо виплачується майнерам як комісія за обробку. Формулу розрахунку конкретної комісії можна розуміти як Комісія = Використаний газ * Ціна газу, тобто фактичне споживання, помножене на ціну за одиницю споживання. ціна встановлюється ініціатором транзакції, а її сума часто визначає, наскільки швидко трансакції завантажуються в ланцюг. Якщо значення занадто низьке, транзакція може бути не виконана.Водночас необхідно також встановити верхню межу споживання ліміту газу, щоб уникнути помилок у договорі, які призведуть до непередбачуваного споживання газу.
2. Торговий пул
В Ethereum існує велика кількість транзакцій. Порівняно з централізованою системою, кількість транзакцій за секунду, оброблених децентралізованою системою, явно похмура. Через велику кількість транзакцій, що надходять у вузол, вузол повинен підтримувати пул транзакцій, щоб належним чином керувати цими транзакціями. Трансляція транзакцій здійснюється через p2p. Зокрема, вузол транслюватиме виконувану транзакцію на сусідні вузли, а потім сусідні вузли транслюватимуть транзакцію на сусідні вузли вузла. Таким чином транзакція може поширюватися на всю мережу Ethereum протягом 6 секунд.
Транзакції в пулі транзакцій поділяються на виконувані транзакції та невиконувані транзакції. Виконувані транзакції мають вищий пріоритет і будуть виконані та упаковані в блок, тоді як усі транзакції, які щойно увійшли до пулу транзакцій, є невиконуваними транзакціями. Це буде потім стане виконуваним. Виконувані транзакції та невиконувані транзакції записуються в контейнер очікування та контейнер черги відповідно.
Крім того, пул транзакцій також підтримуватиме список локальних транзакцій. Локальні транзакції мають багато переваг. Вони мають вищий пріоритет, на них не впливають обмеження щодо обсягу транзакцій і їх можна перезавантажувати в пул транзакцій одразу після перезапуску вузла. Локальне постійне зберігання локальних транзакцій реалізовано за допомогою журналу (перезавантаження при перезапуску вузла), його мета — не втрачати незавершені локальні транзакції та буде регулярно оновлюватися.
Законність транзакції перевірятиметься перед входом у чергу, включаючи різні типи перевірок, такі як: анти-DOS-атака, анти-негативна транзакція, ліміт газу для транзакцій тощо. Простий склад пулу транзакцій можна розділити на: черга+очікування (обидва становлять усі транзакції).Після завершення тесту на законність будуть проведені наступні перевірки, зокрема перевірка того, чи черга транзакцій досягла верхньої межі, а потім оцінка віддалених транзакцій (віддалені транзакції – це нелокальні транзакції)) є найнижчою в торговому пулі, замінює транзакцію з найнижчою ціною в торговому пулі. Для заміни виконуваних транзакцій за замовчуванням лише транзакції, які збільшують комісію за обробку на 10%, можуть замінювати транзакції, які вже очікують на виконання, і після заміни зберігатимуться як невиконувані транзакції. Крім того, під час обслуговування пулу транзакцій недійсні транзакції та транзакції, що перевищують ліміт, будуть видалені, а транзакції, які відповідають умовам, буде замінено.
3. Механізм консенсусу
Рання консенсусна теорія Ethereum все ще базувалася на методі обчислення хеш-значення складності. Тобто, хеш-значення блоку має бути обчислено відповідно до умов цільового значення складності, перш ніж блок стане законним. Оскільки поточний консенсусний алгоритм Ethereum було змінено з POW на POS, теорії, пов’язані з майнінгом, детально обговорюватися не будуть. Ось короткий опис алгоритму POS. Ethereum завершив злиття ланцюга маяків у вересні 2022 року та впровадив алгоритм POS. Зокрема, для Ethereum на базі POS час блокування кожного блоку стабільно становить 12 секунд, і користувачі заставляють власні монети Ethereum, щоб отримати право стати валідатор. Після цього користувачі, які беруть участь у стейкінгу, будуть випадковим чином обрані для отримання партії валідаторів. У кожному раунді валідатори будуть вибрані з кожного з 32 слотів, і один із них буде обрано для перевірки. Пропонент виконує роль пропонент, і пропонент реалізує виробництво блоку, а інші валідатори, що відповідають слоту, служать комітетом для перевірки законності блоку пропонента та винесення судження щодо законності блоку в попередньому циклі. Алгоритм POS суттєво стабілізує та покращує швидкість виробництва блоків, значно уникаючи марної витрати обчислювальних ресурсів.
4. Алгоритм підпису
Ethereum дотримується стандарту алгоритму підпису біткойнів, а також використовує криву secp256k1. Його спеціальний алгоритм підпису використовує ECDSA, що означає, що розрахований підпис обчислюється на основі хешу вихідного повідомлення. Композиція всього підпису проста. Це R+S +V. Кожне обчислення вводитиме випадкові числа відповідно, де R+S є вихідним результатом ECDSA. Останнє поле V називається полем відновлення, яке вказує на кількість пошуків, необхідних для успішного відновлення відкритого ключа з вмісту та підпису, оскільки на еліптичній кривій може бути кілька точок координат, які відповідають вимогам на основі значення R.
Увесь процес можна коротко описати так: дані транзакції та інформація, пов’язана з підписувачем, хешуються після кодування RLP і підписуються закритим ключем через ECDSA для отримання остаточного підпису, а крива, яка використовується в ECDSA, є еліптичною кривою secp256k1. Нарешті, поєднавши дані підпису з даними транзакції, ви можете отримати підписані дані транзакції та транслювати їх.
Структура даних Ethereum не тільки покладається на традиційну технологію блокчейну, але також представляє дерева Merkle Patricia, також відомі як дерева стислих префіксів Merkle, для ефективного зберігання та перевірки великих обсягів даних. MPT поєднує функцію криптографічного хешування дерев Merkle та властивості стиснення ключового шляху дерев Patricia, щоб забезпечити рішення, яке гарантує цілісність даних і підтримує швидкий пошук.
5. Дерево стислих префіксів Merkle
В Ethereum MPT використовується для зберігання всіх даних про стан і транзакції, забезпечуючи відображення будь-яких змін даних у кореневому хеші дерева. Це означає, що, перевіряючи кореневий хеш, ви можете довести цілісність і точність даних без необхідності перевіряти всю базу даних. MPT складається з чотирьох типів вузлів: листових вузлів, вузлів розширення, вузлів розгалужень і порожніх вузлів. Ці вузли разом утворюють дерево, яке може адаптуватися до динамічних змін даних. Кожного разу, коли дані оновлюються, MPT відображає ці зміни, додаючи, видаляючи або змінюючи вузли, одночасно оновлюючи кореневий хеш дерева. Оскільки кожен вузол зашифровано хеш-функцією, будь-які невеликі зміни в даних призведуть до величезних змін у кореневому хеші, таким чином забезпечуючи безпеку та послідовність даних. Крім того, MPT розроблено для підтримки верифікації «легкого клієнта», що дозволяє вузлам перевіряти існування або статус певної інформації, просто зберігаючи кореневий хеш дерева та необхідні вузли шляху, що значно зменшує потребу в зберіганні та обробці даних.
Завдяки MPT Ethereum не тільки забезпечує ефективне управління та швидкий доступ до даних, але й забезпечує безпеку та децентралізацію мережі, підтримуючи роботу та розвиток усієї мережі Ethereum.
6. Державна машина
Основна архітектура Ethereum містить концепцію кінцевих автоматів. Віртуальна машина Ethereum (EVM) — це середовище виконання для виконання всіх кодів смарт-контрактів, а сам Ethereum можна розглядати як глобальну систему переходу між станами. Виконання кожного блоку можна розглядати як процес переходу між станами, перехід від одного глобально спільного стану до іншого. Ця конструкція не тільки забезпечує узгодженість і децентралізацію мережі Ethereum, але й робить результати виконання смарт-контрактів передбачуваними та такими, що не піддаються втручанню.
В Ethereum статус стосується поточної інформації про всі облікові записи, включаючи баланс кожного рахунку, дані зберігання та код смарт-контракту. Щоразу, коли відбувається транзакція, EVM обчислює та перетворює стан на основі вмісту транзакції.Цей процес ефективно та безпечно записується через MPT. Кожен перехід стану не тільки змінює дані облікового запису, але також викликає оновлення MPT, що відображається у зміні кореневого хешу дерева.
Взаємозв’язок між EVM і MPT має вирішальне значення, оскільки MPT забезпечує гарантії цілісності даних для переходів між станами Ethereum. Коли EVM виконує транзакції та змінює статус рахунку, відповідні вузли MPT оновлюються, щоб відобразити ці зміни. Оскільки кожен вузол MPT пов’язаний хешем, будь-яка зміна стану призведе до зміни кореневого хешу. Цей новий кореневий хеш потім включається в новий блок, забезпечуючи стабільність усього стану Ethereum. . Далі ми представляємо віртуальну машину EVM.
7. EVM
Віртуальна машина EVM є основою для всього Ethereum для побудови смарт-контрактів і виконання переходів станів.Саме завдяки EVM Ethereum можна уявити як світовий комп’ютер у справжньому сенсі. Віртуальна машина EVM є Turing complete, що означає, що смарт-контракти на Ethereum можуть виконувати будь-які складні логічні обчислення, а впровадження газового механізму успішно запобігає нескінченним циклам у контракті та забезпечує стабільність і безпеку мережі. На більш технічному рівні EVM — це стекова віртуальна машина, яка використовує специфічний для Ethereum байт-код для виконання смарт-контрактів. Розробники зазвичай використовують мови високого рівня, такі як Solidity, для написання розумних контрактів, а потім компілюють їх у байт-код, який може зрозуміти EVM для викликів виконання EVM. EVM є ключем до інноваційних можливостей блокчейну Ethereum.Він не тільки підтримує роботу смарт-контрактів, але й забезпечує надійну основу для розробки децентралізованих програм. Завдяки EVM Ethereum формує децентралізоване, безпечне та відкрите цифрове майбутнє.
Огляд історії Ethereum
Рисунок 1 Історичний огляд Ethereum
Проблеми безпеки Ethereum
Розумні контракти — це комп’ютерні програми, які працюють на блокчейні Ethereum. Вони дозволяють розробникам створювати та публікувати різноманітні додатки, включаючи, але не обмежуючись програмами кредитування, децентралізованими біржами, страхуванням, вторинним фінансуванням, соціальними мережами та NFT. Безпека смарт-контрактів має вирішальне значення для цих програм. Ці додатки безпосередньо відповідають за обробку та контроль криптовалют. Будь-які лазівки в смарт-контрактах або зловмисні атаки на них створять пряму загрозу безпеці коштів і навіть призведуть до величезних економічних втрат. Наприклад, 26 лютого 2024 року протокол кредитування DeFi Blueberry Protocol зазнав атаки через логічну помилку в смарт-контракті, що призвело до втрати приблизно 1 400 000 доларів США.
Уразливості смарт-контрактів є багатогранними, охоплюючи необґрунтовану бізнес-логіку (бізнес-логіку), неналежний контроль доступу, недостатню перевірку даних, атаки повторного входу та атаки DOS (відмова в обслуговуванні). Ці вразливості можуть спричинити проблеми під час виконання контракту та вплинути на ефективну роботу смарт-контракту. Візьміть як приклад DOS-атаку. Цей метод атаки використовує зловмисника для надсилання великої кількості транзакцій для споживання мережевих ресурсів. Тоді транзакції, ініційовані звичайними користувачами, не можуть бути оброблені вчасно, що призведе до погіршення взаємодії з користувачем. Крім того, це також призведе до збільшення комісії за транзакційний газ. Тому що, коли мережеві ресурси обмежені, користувачам може знадобитися платити вищі комісії, щоб їхні транзакції були пріоритетними.
Крім того, користувачі Ethereum також стикаються з інвестиційними ризиками, і безпека коштів буде під загрозою. Наприклад, спамкойни використовуються для опису криптовалют, які вважаються такими, що мають низьку цінність або не мають потенціалу для довгострокового зростання. Спам-койни часто використовуються як інструмент для шахрайства або для маніпулювання цінами в стратегіях насоса та дампу. Інвестиції в сміттєві монети дуже ризиковані і можуть призвести до значних фінансових втрат. Через низьку ціну та низьку ринкову капіталізацію вони дуже сприйнятливі до маніпуляцій та нестабільності. Монета часто використовується в схемах «накачування та скидання» та шахрайствах з приманками, де фальшиві проекти використовуються для заманювання інвесторів та викрадення їхніх коштів. Іншим поширеним ризиком спамкойнів є те, що творець раптово забирає всю ліквідність із проекту, що призводить до різкого падіння вартості токена. Ці шахрайства часто продаються за допомогою фальшивих партнерських відносин і підтримки, і коли ціна токенів зростає, шахраї продають свої токени, отримують прибуток і зникають, залишаючи інвесторам нікчемні токени. У той же час інвестиції в шиткойни відволікають увагу та ресурси від законних криптовалют, які мають реальне застосування та потенціал зростання. На додаток до сміттєвих монет, повітряні монети та монети MLM також є способами отримати швидкий прибуток. Відрізнити їх від законних криптовалют особливо важко для користувачів, яким бракує знань і досвіду.
ефективність
Двома дуже прямими показниками для оцінки ефективності Ethereum є швидкість транзакцій і плата за газ. Швидкість транзакцій означає кількість транзакцій, які мережа Ethereum може обробити за одиницю часу. Цей показник безпосередньо відображає обчислювальну потужність мережі Ethereum, при цьому більша швидкість означає вищу ефективність. Кожна транзакція в Ethereum вимагає певної комісії за газ для компенсації майнерам, які виконують перевірку транзакцій. Чим нижча вартість газу, тим вища ефективність Ethereum.
Зменшення швидкості транзакцій призведе до підвищення комісії за газ. Загалом, коли швидкість обробки транзакцій сповільнюється, може спостерігатися збільшення кількості транзакцій, які конкурують за входження до наступного блоку через обмежений простір для блоків. Щоб виділитися серед конкурентів, трейдери часто підвищують комісію за газ, оскільки майнери, як правило, віддають пріоритет транзакціям із вищою комісією за газ під час перевірки транзакцій. Тоді вищі збори за газ зменшать взаємодію з користувачем.
Транзакції – це лише основна діяльність в Ethereum. У цій екосистемі користувачі також можуть здійснювати різні види діяльності, такі як кредитування, застава, інвестиції та страхування. Усе це можна зробити за допомогою спеціальних DApps. Однак, враховуючи широкий вибір DApps і відсутність персоналізованих рекомендаційних служб, подібних до традиційних галузей, користувачі почуватимуться розгубленими, вибираючи програми та продукти, які їм підходять. Така ситуація призведе до зниження задоволеності користувачів, що вплине на ефективність всієї екосистеми Ethereum.
Візьмемо як приклад кредитування. Щоб підтримувати безпеку та стабільність своїх власних платформ, деякі платформи кредитування DeFi використовуватимуть механізм надмірної застави. Це означає, що позичальнику необхідно закласти більше активів як заставу, і ці активи не можуть бути використані позичальником для іншої діяльності протягом періоду позики. Це призведе до зниження використання капіталу позичальників, тим самим зменшуючи ліквідність ринку.
Застосування машинного навчання в Ethereum
Моделі машинного навчання, такі як модель RMF, генеративна змагальна мережа (GAN), модель дерева рішень, K-алгоритм найближчого сусіда (KNN), алгоритм кластеризації DBSCAN тощо, відіграють важливу роль в Ethereum. Застосування цих моделей машинного навчання в Ethereum може допомогти оптимізувати ефективність обробки транзакцій, покращити безпеку смарт-контрактів, реалізувати стратифікацію користувачів для надання більш персоналізованих послуг і допомогти підтримувати стабільну роботу мережі.
Введення в алгоритм
Алгоритм машинного навчання — це набір інструкцій або правил для синтаксичного аналізу даних, вивчення шаблонів у даних і прийняття прогнозів або рішень на основі цих знань. Вони навчаються та вдосконалюються автоматично на основі даних, які їм надають, без потреби в явних програмних інструкціях від людей. Моделі машинного навчання, такі як модель RMF, генеративна змагальна мережа (GAN), модель дерева рішень, K-алгоритм найближчого сусіда (KNN), алгоритм кластеризації DBSCAN тощо, відіграють важливу роль в Ethereum. Застосування цих моделей машинного навчання в Ethereum може допомогти оптимізувати ефективність обробки транзакцій, покращити безпеку смарт-контрактів, реалізувати стратифікацію користувачів для надання більш персоналізованих послуг і допомогти підтримувати стабільну роботу мережі.
Байєсівський класифікатор
Байєсівський класифікатор — це ефективний класифікатор, який спрямований на мінімізацію ймовірності помилки класифікації або мінімізацію середнього ризику за конкретною структурою витрат серед різних статистичних методів класифікації. Його філософія проектування глибоко вкорінена в теоремі Байєса, яка дозволяє йому приймати рішення, обчислюючи апостеріорну ймовірність об’єкта, враховуючи ймовірність того, що об’єкт належить до певного класу з певними характеристиками. Зокрема, байєсівський класифікатор спочатку враховує попередню ймовірність об’єкта, а потім застосовує байєсівську формулу для комплексного розгляду даних спостереження, щоб оновити переконання щодо класифікації об’єкта. Серед усіх можливих класифікацій байєсівський класифікатор вибирає ту з найбільшою апостеріорною ймовірністю класифікації об’єкта в цю категорію. Основною перевагою цього підходу є його здатність природним чином справлятися з невизначеністю та неповною інформацією, що робить його потужним і гнучким інструментом, придатним для широкого діапазону прикладних сценаріїв.
Рисунок 2 Байєсівський класифікатор
Як показано на малюнку 2, у керованому машинному навчанні для прийняття рішень щодо класифікації використовуються дані та ймовірнісна модель на основі теореми Байєса. Використовуючи правдоподібність і попередні ймовірності категорій і ознак, байєсівський класифікатор обчислює апостеріорну ймовірність того, що точки даних належать до кожної категорії, і призначає точки даних до категорії з найбільшою апостеріорною ймовірністю. На діаграмі розсіювання праворуч класифікатор намагатиметься знайти криву, яка найкраще розділяє точки різних кольорів, таким чином мінімізуючи помилку класифікації.
Дерево рішень
Алгоритм дерева рішень часто використовується в задачах класифікації та регресії. Він використовує ідею ієрархічного судження. На основі відомих даних дерево рішень навчається шляхом вибору функцій із великим коефіцієнтом приросту інформації та їх подальшого поділу на дерева. Простіше кажучи, весь алгоритм може самостійно вивчати правило прийняття рішень на основі даних, щоб судити про значення змінної. З точки зору реалізації, він може розкласти складний процес прийняття рішень на кілька простих процесів прийняття додаткових рішень За допомогою такого похідного методу кожне простіше рішення виводиться з батьківського критерію рішення, утворюючи структуру дерева.
Як видно з рисунка 3, кожен вузол представляє рішення та встановлює критерії оцінки для певного атрибута, а гілки представляють результати рішення. Кожен листовий вузол представляє кінцевий прогнозований результат і категорію. З точки зору композиції алгоритму, модель дерева рішень є відносно інтуїтивно зрозумілою, легкою для розуміння та добре інтерпретованою.
Рисунок 3. Модель дерева рішень
Алгоритм DBSCAN
DBSCAN (Density-Based Spatial Clustering of Applications with Noise) — це алгоритм просторової кластеризації на основі щільності з шумом, який, здається, особливо добре працює для незв’язаних наборів даних. Цей алгоритм може виявляти кластери довільної форми, не вказуючи кількість кластерів заздалегідь, і має хорошу стійкість до викидів у наборі даних. Алгоритм також може ефективно ідентифікувати викиди в масивних наборах даних. Шум або викиди визначаються як точки в областях з низькою щільністю, як показано на малюнку 4.
Рисунок 4 Алгоритм DBSCAN ідентифікує шум
Алгоритм KNN
Алгоритм KNN (K-Nearest Neighbors) можна використовувати як для класифікації, так і для регресії. У задачі класифікації механізм голосування використовується для визначення категорії елемента, який потрібно класифікувати; у задачі регресії для прогнозу обчислюється середнє або зважене середнє k найближчих сусідніх вибірок.
Як показано на малюнку 5, принцип роботи алгоритму KNN у класифікації полягає в тому, щоб знайти K найближчих сусідів нової точки даних, а потім передбачити категорію нової точки даних на основі категорій цих сусідів. Якщо K=1, то нові точки даних просто призначаються найближчим
Категорія сусіда. Якщо K > 1, то для визначення класу нової точки даних зазвичай використовується метод голосування, тобто нова точка даних буде призначена класу, до якого належить більшість сусідів. Коли алгоритм KNN використовується для задач регресії, основна ідея та сама, а результатом є середнє K вихідних значень вибірки найближчих сусідів.
Рисунок 5. Алгоритм KNN, використаний для класифікації
Генеративний штучний інтелект
Генеративний штучний інтелект — це технологія штучного інтелекту, яка може генерувати новий вміст (наприклад, текст, зображення, музику тощо) на основі вхідних даних. Його підґрунтя базується на досягненнях у машинному та глибокому навчанні, зокрема в таких сферах, як обробка природної мови та розпізнавання зображень. Генеративний штучний інтелект вивчає шаблони та асоціації з великої кількості даних, а потім генерує новий вихідний вміст на основі цієї вивченої інформації. Ключ до генеративного штучного інтелекту лежить у навчанні моделі, яке потребує відмінних даних для навчання та навчання. У цьому процесі модель поступово покращує свою здатність генерувати новий вміст шляхом аналізу та розуміння структури, шаблонів і зв’язків у наборі даних.
Трансформер
Будучи наріжним каменем генеративного штучного інтелекту, Transformer став піонером у впровадженні механізму уваги, який дозволяє обробці інформації зосереджуватися на ключових моментах, одночасно маючи огляд. Ця унікальна здатність робить Transformer сяючим у сфері генерації тексту. Використання найновіших моделей мови обробки природної мови, таких як GPT (Generative Pre-trained Transformer), для розуміння вимог до додатків користувачів, виражених природною мовою, і автоматичного перетворення їх у виконуваний код, може зменшити труднощі розробки та значно підвищити ефективність.
Як показано на малюнку 6, завдяки введенню механізму уваги з кількома головами та механізму самоуважності в поєднанні із залишковим зв’язком і повністю зв’язаною нейронною мережею, а також за допомогою попередньої технології вбудовування слів, продуктивність генеративних моделей, пов’язаних із природною мовою обробка була значно покращена Земля піднімається.
Рисунок 6 Модель трансформатора
Представлення моделі RFM**:**
Модель RFM – це модель аналізу, заснована на поведінці користувачів при купівлі. Аналізуючи поведінку користувачів у транзакціях, вона може ідентифікувати групи користувачів з різними цінностями. Ця модель розподіляє користувачів за часом останнього споживання (R), частотою споживання (F) і кількістю споживання (M).
Як показано на малюнку 7. Ці три показники разом утворюють ядро моделі RFM. Модель оцінює користувачів на основі цих трьох параметрів і сортує їх відповідно до їхніх балів, щоб визначити найцінніші групи користувачів. Крім того, ця модель може ефективно розділити клієнтів на різні групи для реалізації функції стратифікації користувачів.
Рисунок 7 Багатошарова модель RFM
Можливі застосування
Застосовуючи технологію машинного навчання для вирішення проблем безпеки Ethereum, ми провели дослідження з чотирьох основних аспектів:
Визначайте та фільтруйте зловмисні транзакції на основі байєсівського класифікатора
Завдяки створенню байєсівського класифікатора можливі спам-транзакції ідентифікуються та фільтруються, включаючи, але не обмежуючись великими, частими та малими транзакціями, які призводять до атак DOS. Цей метод ефективно підтримує працездатність мережі та забезпечує стабільну роботу мережі Ethereum шляхом аналізу характеристик транзакцій, таких як ціна на газ, частота транзакцій тощо.
Створіть код смарт-контракту, який є безпечним і відповідає певним вимогам
Як генеративні змагальні мережі (GAN), так і генеративні мережі на основі трансформаторів можна використовувати для створення коду смарт-контракту, який відповідає певним вимогам і забезпечує максимальну безпеку коду. Однак між ними є відмінності в типі даних, на які вони покладаються для навчання своїх моделей.Процес навчання перших покладається в основному на небезпечні зразки коду, а для других — навпаки.
Навчаючи GAN вивчати існуючі шаблони контрактів безпеки, побудувати самоконфронтаційну модель для генерації потенційно небезпечного коду, а потім навчитися визначати ці небезпеки за допомогою вивчення моделі, зрештою досягнувши здатності автоматично генерувати високоякісний і безпечніший код смарт-контракту. . Використання моделі генераторної мережі на основі трансформатора та вивчення великої кількості прикладів контрактів безпеки для створення коду контракту, який відповідає конкретним потребам і оптимізує споживання газу, безсумнівно, ще більше підвищить ефективність і безпеку розробки смарт-контракту.
3. Аналіз ризиків смарт-контракту на основі дерева рішень
Використання дерев рішень для аналізу характеристик смарт-контрактів, таких як частота викликів функцій, вартість транзакції, складність вихідного коду тощо, може ефективно визначити потенційний рівень ризику контракту. Аналізуючи режим роботи контракту та структуру коду, можна передбачити можливі вразливості та точки ризику, таким чином надаючи розробникам і користувачам оцінку безпеки. Очікується, що такий підхід значно покращить безпеку смарт-контрактів в екосистемі Ethereum, тим самим зменшивши втрати через уразливості або шкідливий код.
4. Побудуйте модель оцінки криптовалюти для зменшення інвестиційних ризиків
Використовуйте алгоритми машинного навчання для аналізу багатовимірної інформації, такої як дані про трансакції криптовалюти, дії в соціальних мережах і показники ринку, щоб побудувати модель оцінки, яка може передбачити можливість спаму монет. Ця модель може надати інвесторам цінну довідкову інформацію, яка допоможе їм уникнути інвестиційних ризиків, таким чином сприяючи здоровому розвитку ринку криптовалют.
Крім того, використання машинного навчання також має потенціал для подальшого підвищення ефективності Ethereum. Ми можемо глибше розглянути наступні три ключові аспекти:
Додаток дерева рішень для оптимізації моделі черги пулу транзакцій
На основі дерев рішень можна ефективно оптимізувати механізм черги пулу транзакцій Ethereum. Аналізуючи характеристики транзакцій, такі як ціна на газ і розмір транзакцій, дерева рішень можуть оптимізувати вибір транзакцій і порядок постановки в чергу. Цей метод може значно підвищити ефективність обробки транзакцій, ефективно зменшити перевантаження мережі та зменшити час очікування транзакцій користувачів.
Розшарувати користувачів і надавати персоналізовані послуги
Модель RFM (Recency, Monetary value, Frequency) — це аналітичний інструмент, який широко використовується в управлінні відносинами з клієнтами. Він може оцінити час останньої транзакції користувача (Recency), частоту транзакцій (Frequency) і суму транзакції (Monetary value). розшарування. Застосування моделі RFM на платформі Ethereum може допомогти визначити високоцінні групи користувачів, оптимізувати розподіл ресурсів і надавати більш персоналізовані послуги, тим самим покращуючи задоволеність користувачів і загальну ефективність платформи.
Алгоритм DBSCAN також може аналізувати торгову поведінку користувачів, допомагати ідентифікувати різні групи користувачів на Ethereum і надавати більш індивідуальні фінансові послуги для різних користувачів. Ця стратегія стратифікації користувачів може оптимізувати маркетингові стратегії та підвищити задоволеність клієнтів і ефективність обслуговування.
3. Кредитний скоринг на основі КНН
Алгоритм K-найближчого сусіда (KNN) може оцінювати кредит користувачів, аналізуючи історію транзакцій і моделі поведінки користувачів Ethereum, що відіграє надзвичайно важливу роль у фінансовій діяльності, наприклад у кредитуванні. Кредитні оцінки можуть допомогти фінансовим установам і кредитним платформам оцінити платоспроможність позичальників і кредитний ризик, що дозволить приймати точніші рішення про позику. Це дозволяє уникнути надмірних запозичень і покращити ліквідність ринку.
Майбутні напрямки
З точки зору макророзподілу коштів, Ethereum, як найбільший у світі розподілений комп’ютер, не може інвестувати занадто багато в інфрарівень, і йому потрібно залучати розробників з більшої кількості професій до участі у спільному будівництві. У цій статті, розбираючи технічну реалізацію та проблеми, з якими стикається Ethereum, ми уявили низку відносно інтуїтивно зрозумілих можливих застосувань машинного навчання.Ми також дуже сподіваємося на розробників штучного інтелекту в спільноті, які зможуть реалізувати ці бачення з реальною ціною. Приземлився.
Оскільки обчислювальна потужність у ланцюжку поступово зростає, ми можемо передбачити, що будуть розроблені більш складні моделі для керування мережею, моніторингу транзакцій, аудиту безпеки та інших аспектів для підвищення ефективності та безпеки мережі Ethereum.
Йдучи далі, штучний інтелект/керовані агентами механізми управління також можуть стати головною інноваційною точкою в екосистемі Ethereum. Ефективніший, прозоріший і більш автоматизований процес прийняття рішень, створений за допомогою цього механізму, створює більш гнучку та надійну структуру управління платформою Ethereum. Ці майбутні напрямки розвитку не тільки сприятимуть інноваціям технології Ethereum, але й забезпечать користувачам кращий досвід роботи в мережі.
Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
Як AI може революціонізувати Ethereum? Погляд на «AI+Blockchain» з іншого боку
Автор: Mirror Tang | Salus; Yixin Ren | Hongshan capital; Lingzhi Shi | Salus; Jiangyue Wang | Salus
Минулого року, коли генеративний штучний інтелект неодноразово перевершував очікування громадськості, хвиля революції продуктивності штучного інтелекту прокотилася по колу криптовалют. Ми бачили, що багато концептуальних проектів штучного інтелекту викликали хвилю міфів про створення багатства на вторинному ринку.Водночас все більше і більше розробників почали розробляти власні проекти «AI+Crypto».
Однак більш уважний погляд показує, що однотипність цих проектів є дуже серйозною, і більшість проектів зосереджуються лише на покращенні «виробничих відносин», таких як організація обчислювальної потужності через децентралізовані мережі або створення «децентралізованого Hugging Face» тощо. Дуже небагато проектів намагаються справжньої інтеграції та інновацій із базової технології. Ми вважаємо, що причина цього явища полягає в тому, що існує «зміщення домену» між полями ШІ та блокчейну. Незважаючи на їх широкий перетин, мало хто має глибоке розуміння обох сфер. Наприклад, розробникам штучного інтелекту важко зрозуміти технічну реалізацію та історичний статус інфраструктури Ethereum, а ще важче запропонувати детальні плани оптимізації.
Візьмемо для прикладу машинне навчання (ML), найосновнішу галузь штучного інтелекту. Це технологія, яка дозволяє машинам приймати рішення на основі даних без явних інструкцій програмування. Машинне навчання показало великий потенціал в аналізі даних і розпізнаванні образів і стало звичним явищем у web2. Однак через обмеження часів, коли він уперше народився, навіть на передньому краї інноваційних технологій блокчейн, таких як Ethereum, його архітектура, мережа та механізми управління ще не використовували машинне навчання як ефективний інструмент для вирішення складних проблем.
«Великі інновації часто народжуються в різних областях.» Наша початкова мета під час написання цієї статті — дозволити розробникам штучного інтелекту краще зрозуміти світ блокчейну, а також надати нові ідеї розробникам у спільноті Ethereum. У статті ми спочатку представили технічну реалізацію Ethereum, а потім запропонували рішення для застосування машинного навчання, базового алгоритму ШІ, до мережі Ethereum для підвищення її безпеки, ефективності та масштабованості. Ми сподіваємось використати цей випадок як відправну точку, щоб представити деякі перспективи, які відрізняються від тих, що є на ринку, і надихнути на більш інноваційні крос-комбінації «AI+Blockchain» в екосистемі розробників.
Технічна реалізація Ethereum
Блок генезису є нульовим блоком усього блокчейну, а інші блоки прямо чи опосередковано посилаються на блок генезису. Таким чином, правильна інформація про блок генезису повинна бути завантажена під час запуску вузла і не повинна змінюватися довільно. Інформація про конфігурацію блоку генезису включає вищезазначену конфігурацію ланцюга, а також додає такі поля, як відповідні винагороди за майнінг, часові позначки, складність і ліміти газу.Слід зазначити, що механізм консенсусу Ethereum розвинувся з майнінгу з підтвердженням роботи Механізм перетворюється на доказ частки.
Облікові записи Ethereum поділяються на зовнішні облікові записи та облікові записи контракту. Зовнішній обліковий запис унікально контролюється приватним ключем, тоді як обліковий запис контракту не має контролю закритого ключа, і ним можна керувати лише викликом контракту із зовнішнього облікового запису для виконання коду контракту. Усі вони містять унікальну адресу. Світовий стан Ethereum — це дерево облікових записів Ethereum.Кожен обліковий запис відповідає кінцевому вузлу, у якому зберігається статус облікового запису (різна інформація про обліковий запис і інформація про код).
Транзакції: як децентралізована платформа, суть Ethereum полягає в транзакціях і контрактах. Блоки Ethereum — це пакетні транзакції, а також додаткова відповідна інформація. Конкретні блоки поділяються на дві частини, а саме заголовок блоку та область. Блок, у якому Дані заголовка блоку містять докази, які з’єднують усі блоки в ланцюжок, який ми можемо зрозуміти як хеш попереднього блоку, а також корінь стану, корінь транзакції, корінь квитанції та доказ стану всього світу Ethereum.Кілька інших індикаторів вказати складність, підрахунок одноразових та інші додаткові дані. Тіло блоку зберігає список транзакцій і список заголовків блоків uncle (оскільки Ethereum перетворився на proof of stake, посилання на блок uncle більше не існує).
Квитанції про транзакцію надають результати та додаткову інформацію після того, як транзакцію було виконано, яку неможливо отримати безпосередньо, просто переглянувши саму транзакцію. Зокрема, інформацію, що міститься в ньому, можна розділити на: консенсусний вміст, інформацію про транзакції та інформацію про блоки, включаючи інформацію про успішність обробки транзакцій та інформацію про споживання, таку як журнали транзакцій і газ. Налагодьте код смарт-контракту та оптимізуйте споживання газу, аналізуючи інформацію в квитанції. і надає форму підтвердження того, що транзакція була оброблена мережею, і можна переглянути результати та вплив транзакції.
В Ethereum комісію за газ можна просто розуміти як комісію за обробку. Коли ви надсилаєте токен, виконуєте контракт, передаєте Ethereum або виконуєте різні операції на цьому блоці, операції в цих транзакціях вимагають комісії за газ. Ether Під час обробки цієї транзакції комп’ютер потрібно виконувати обчислення та споживати мережеві ресурси, тому вам доведеться платити за газ, щоб комп’ютер працював на вас. Остаточна комісія за паливо виплачується майнерам як комісія за обробку. Формулу розрахунку конкретної комісії можна розуміти як Комісія = Використаний газ * Ціна газу, тобто фактичне споживання, помножене на ціну за одиницю споживання. ціна встановлюється ініціатором транзакції, а її сума часто визначає, наскільки швидко трансакції завантажуються в ланцюг. Якщо значення занадто низьке, транзакція може бути не виконана.Водночас необхідно також встановити верхню межу споживання ліміту газу, щоб уникнути помилок у договорі, які призведуть до непередбачуваного споживання газу. 2. Торговий пул В Ethereum існує велика кількість транзакцій. Порівняно з централізованою системою, кількість транзакцій за секунду, оброблених децентралізованою системою, явно похмура. Через велику кількість транзакцій, що надходять у вузол, вузол повинен підтримувати пул транзакцій, щоб належним чином керувати цими транзакціями. Трансляція транзакцій здійснюється через p2p. Зокрема, вузол транслюватиме виконувану транзакцію на сусідні вузли, а потім сусідні вузли транслюватимуть транзакцію на сусідні вузли вузла. Таким чином транзакція може поширюватися на всю мережу Ethereum протягом 6 секунд.
Транзакції в пулі транзакцій поділяються на виконувані транзакції та невиконувані транзакції. Виконувані транзакції мають вищий пріоритет і будуть виконані та упаковані в блок, тоді як усі транзакції, які щойно увійшли до пулу транзакцій, є невиконуваними транзакціями. Це буде потім стане виконуваним. Виконувані транзакції та невиконувані транзакції записуються в контейнер очікування та контейнер черги відповідно.
Крім того, пул транзакцій також підтримуватиме список локальних транзакцій. Локальні транзакції мають багато переваг. Вони мають вищий пріоритет, на них не впливають обмеження щодо обсягу транзакцій і їх можна перезавантажувати в пул транзакцій одразу після перезапуску вузла. Локальне постійне зберігання локальних транзакцій реалізовано за допомогою журналу (перезавантаження при перезапуску вузла), його мета — не втрачати незавершені локальні транзакції та буде регулярно оновлюватися.
Законність транзакції перевірятиметься перед входом у чергу, включаючи різні типи перевірок, такі як: анти-DOS-атака, анти-негативна транзакція, ліміт газу для транзакцій тощо. Простий склад пулу транзакцій можна розділити на: черга+очікування (обидва становлять усі транзакції).Після завершення тесту на законність будуть проведені наступні перевірки, зокрема перевірка того, чи черга транзакцій досягла верхньої межі, а потім оцінка віддалених транзакцій (віддалені транзакції – це нелокальні транзакції)) є найнижчою в торговому пулі, замінює транзакцію з найнижчою ціною в торговому пулі. Для заміни виконуваних транзакцій за замовчуванням лише транзакції, які збільшують комісію за обробку на 10%, можуть замінювати транзакції, які вже очікують на виконання, і після заміни зберігатимуться як невиконувані транзакції. Крім того, під час обслуговування пулу транзакцій недійсні транзакції та транзакції, що перевищують ліміт, будуть видалені, а транзакції, які відповідають умовам, буде замінено. 3. Механізм консенсусу Рання консенсусна теорія Ethereum все ще базувалася на методі обчислення хеш-значення складності. Тобто, хеш-значення блоку має бути обчислено відповідно до умов цільового значення складності, перш ніж блок стане законним. Оскільки поточний консенсусний алгоритм Ethereum було змінено з POW на POS, теорії, пов’язані з майнінгом, детально обговорюватися не будуть. Ось короткий опис алгоритму POS. Ethereum завершив злиття ланцюга маяків у вересні 2022 року та впровадив алгоритм POS. Зокрема, для Ethereum на базі POS час блокування кожного блоку стабільно становить 12 секунд, і користувачі заставляють власні монети Ethereum, щоб отримати право стати валідатор. Після цього користувачі, які беруть участь у стейкінгу, будуть випадковим чином обрані для отримання партії валідаторів. У кожному раунді валідатори будуть вибрані з кожного з 32 слотів, і один із них буде обрано для перевірки. Пропонент виконує роль пропонент, і пропонент реалізує виробництво блоку, а інші валідатори, що відповідають слоту, служать комітетом для перевірки законності блоку пропонента та винесення судження щодо законності блоку в попередньому циклі. Алгоритм POS суттєво стабілізує та покращує швидкість виробництва блоків, значно уникаючи марної витрати обчислювальних ресурсів. 4. Алгоритм підпису Ethereum дотримується стандарту алгоритму підпису біткойнів, а також використовує криву secp256k1. Його спеціальний алгоритм підпису використовує ECDSA, що означає, що розрахований підпис обчислюється на основі хешу вихідного повідомлення. Композиція всього підпису проста. Це R+S +V. Кожне обчислення вводитиме випадкові числа відповідно, де R+S є вихідним результатом ECDSA. Останнє поле V називається полем відновлення, яке вказує на кількість пошуків, необхідних для успішного відновлення відкритого ключа з вмісту та підпису, оскільки на еліптичній кривій може бути кілька точок координат, які відповідають вимогам на основі значення R.
Увесь процес можна коротко описати так: дані транзакції та інформація, пов’язана з підписувачем, хешуються після кодування RLP і підписуються закритим ключем через ECDSA для отримання остаточного підпису, а крива, яка використовується в ECDSA, є еліптичною кривою secp256k1. Нарешті, поєднавши дані підпису з даними транзакції, ви можете отримати підписані дані транзакції та транслювати їх.
Структура даних Ethereum не тільки покладається на традиційну технологію блокчейну, але також представляє дерева Merkle Patricia, також відомі як дерева стислих префіксів Merkle, для ефективного зберігання та перевірки великих обсягів даних. MPT поєднує функцію криптографічного хешування дерев Merkle та властивості стиснення ключового шляху дерев Patricia, щоб забезпечити рішення, яке гарантує цілісність даних і підтримує швидкий пошук. 5. Дерево стислих префіксів Merkle В Ethereum MPT використовується для зберігання всіх даних про стан і транзакції, забезпечуючи відображення будь-яких змін даних у кореневому хеші дерева. Це означає, що, перевіряючи кореневий хеш, ви можете довести цілісність і точність даних без необхідності перевіряти всю базу даних. MPT складається з чотирьох типів вузлів: листових вузлів, вузлів розширення, вузлів розгалужень і порожніх вузлів. Ці вузли разом утворюють дерево, яке може адаптуватися до динамічних змін даних. Кожного разу, коли дані оновлюються, MPT відображає ці зміни, додаючи, видаляючи або змінюючи вузли, одночасно оновлюючи кореневий хеш дерева. Оскільки кожен вузол зашифровано хеш-функцією, будь-які невеликі зміни в даних призведуть до величезних змін у кореневому хеші, таким чином забезпечуючи безпеку та послідовність даних. Крім того, MPT розроблено для підтримки верифікації «легкого клієнта», що дозволяє вузлам перевіряти існування або статус певної інформації, просто зберігаючи кореневий хеш дерева та необхідні вузли шляху, що значно зменшує потребу в зберіганні та обробці даних.
Завдяки MPT Ethereum не тільки забезпечує ефективне управління та швидкий доступ до даних, але й забезпечує безпеку та децентралізацію мережі, підтримуючи роботу та розвиток усієї мережі Ethereum. 6. Державна машина Основна архітектура Ethereum містить концепцію кінцевих автоматів. Віртуальна машина Ethereum (EVM) — це середовище виконання для виконання всіх кодів смарт-контрактів, а сам Ethereum можна розглядати як глобальну систему переходу між станами. Виконання кожного блоку можна розглядати як процес переходу між станами, перехід від одного глобально спільного стану до іншого. Ця конструкція не тільки забезпечує узгодженість і децентралізацію мережі Ethereum, але й робить результати виконання смарт-контрактів передбачуваними та такими, що не піддаються втручанню.
В Ethereum статус стосується поточної інформації про всі облікові записи, включаючи баланс кожного рахунку, дані зберігання та код смарт-контракту. Щоразу, коли відбувається транзакція, EVM обчислює та перетворює стан на основі вмісту транзакції.Цей процес ефективно та безпечно записується через MPT. Кожен перехід стану не тільки змінює дані облікового запису, але також викликає оновлення MPT, що відображається у зміні кореневого хешу дерева.
Взаємозв’язок між EVM і MPT має вирішальне значення, оскільки MPT забезпечує гарантії цілісності даних для переходів між станами Ethereum. Коли EVM виконує транзакції та змінює статус рахунку, відповідні вузли MPT оновлюються, щоб відобразити ці зміни. Оскільки кожен вузол MPT пов’язаний хешем, будь-яка зміна стану призведе до зміни кореневого хешу. Цей новий кореневий хеш потім включається в новий блок, забезпечуючи стабільність усього стану Ethereum. . Далі ми представляємо віртуальну машину EVM. 7. EVM
Віртуальна машина EVM є основою для всього Ethereum для побудови смарт-контрактів і виконання переходів станів.Саме завдяки EVM Ethereum можна уявити як світовий комп’ютер у справжньому сенсі. Віртуальна машина EVM є Turing complete, що означає, що смарт-контракти на Ethereum можуть виконувати будь-які складні логічні обчислення, а впровадження газового механізму успішно запобігає нескінченним циклам у контракті та забезпечує стабільність і безпеку мережі. На більш технічному рівні EVM — це стекова віртуальна машина, яка використовує специфічний для Ethereum байт-код для виконання смарт-контрактів. Розробники зазвичай використовують мови високого рівня, такі як Solidity, для написання розумних контрактів, а потім компілюють їх у байт-код, який може зрозуміти EVM для викликів виконання EVM. EVM є ключем до інноваційних можливостей блокчейну Ethereum.Він не тільки підтримує роботу смарт-контрактів, але й забезпечує надійну основу для розробки децентралізованих програм. Завдяки EVM Ethereum формує децентралізоване, безпечне та відкрите цифрове майбутнє.
Огляд історії Ethereum
Рисунок 1 Історичний огляд Ethereum
Проблеми безпеки Ethereum
Розумні контракти — це комп’ютерні програми, які працюють на блокчейні Ethereum. Вони дозволяють розробникам створювати та публікувати різноманітні додатки, включаючи, але не обмежуючись програмами кредитування, децентралізованими біржами, страхуванням, вторинним фінансуванням, соціальними мережами та NFT. Безпека смарт-контрактів має вирішальне значення для цих програм. Ці додатки безпосередньо відповідають за обробку та контроль криптовалют. Будь-які лазівки в смарт-контрактах або зловмисні атаки на них створять пряму загрозу безпеці коштів і навіть призведуть до величезних економічних втрат. Наприклад, 26 лютого 2024 року протокол кредитування DeFi Blueberry Protocol зазнав атаки через логічну помилку в смарт-контракті, що призвело до втрати приблизно 1 400 000 доларів США.
Уразливості смарт-контрактів є багатогранними, охоплюючи необґрунтовану бізнес-логіку (бізнес-логіку), неналежний контроль доступу, недостатню перевірку даних, атаки повторного входу та атаки DOS (відмова в обслуговуванні). Ці вразливості можуть спричинити проблеми під час виконання контракту та вплинути на ефективну роботу смарт-контракту. Візьміть як приклад DOS-атаку. Цей метод атаки використовує зловмисника для надсилання великої кількості транзакцій для споживання мережевих ресурсів. Тоді транзакції, ініційовані звичайними користувачами, не можуть бути оброблені вчасно, що призведе до погіршення взаємодії з користувачем. Крім того, це також призведе до збільшення комісії за транзакційний газ. Тому що, коли мережеві ресурси обмежені, користувачам може знадобитися платити вищі комісії, щоб їхні транзакції були пріоритетними.
Крім того, користувачі Ethereum також стикаються з інвестиційними ризиками, і безпека коштів буде під загрозою. Наприклад, спамкойни використовуються для опису криптовалют, які вважаються такими, що мають низьку цінність або не мають потенціалу для довгострокового зростання. Спам-койни часто використовуються як інструмент для шахрайства або для маніпулювання цінами в стратегіях насоса та дампу. Інвестиції в сміттєві монети дуже ризиковані і можуть призвести до значних фінансових втрат. Через низьку ціну та низьку ринкову капіталізацію вони дуже сприйнятливі до маніпуляцій та нестабільності. Монета часто використовується в схемах «накачування та скидання» та шахрайствах з приманками, де фальшиві проекти використовуються для заманювання інвесторів та викрадення їхніх коштів. Іншим поширеним ризиком спамкойнів є те, що творець раптово забирає всю ліквідність із проекту, що призводить до різкого падіння вартості токена. Ці шахрайства часто продаються за допомогою фальшивих партнерських відносин і підтримки, і коли ціна токенів зростає, шахраї продають свої токени, отримують прибуток і зникають, залишаючи інвесторам нікчемні токени. У той же час інвестиції в шиткойни відволікають увагу та ресурси від законних криптовалют, які мають реальне застосування та потенціал зростання. На додаток до сміттєвих монет, повітряні монети та монети MLM також є способами отримати швидкий прибуток. Відрізнити їх від законних криптовалют особливо важко для користувачів, яким бракує знань і досвіду.
ефективність
Двома дуже прямими показниками для оцінки ефективності Ethereum є швидкість транзакцій і плата за газ. Швидкість транзакцій означає кількість транзакцій, які мережа Ethereum може обробити за одиницю часу. Цей показник безпосередньо відображає обчислювальну потужність мережі Ethereum, при цьому більша швидкість означає вищу ефективність. Кожна транзакція в Ethereum вимагає певної комісії за газ для компенсації майнерам, які виконують перевірку транзакцій. Чим нижча вартість газу, тим вища ефективність Ethereum.
Зменшення швидкості транзакцій призведе до підвищення комісії за газ. Загалом, коли швидкість обробки транзакцій сповільнюється, може спостерігатися збільшення кількості транзакцій, які конкурують за входження до наступного блоку через обмежений простір для блоків. Щоб виділитися серед конкурентів, трейдери часто підвищують комісію за газ, оскільки майнери, як правило, віддають пріоритет транзакціям із вищою комісією за газ під час перевірки транзакцій. Тоді вищі збори за газ зменшать взаємодію з користувачем.
Транзакції – це лише основна діяльність в Ethereum. У цій екосистемі користувачі також можуть здійснювати різні види діяльності, такі як кредитування, застава, інвестиції та страхування. Усе це можна зробити за допомогою спеціальних DApps. Однак, враховуючи широкий вибір DApps і відсутність персоналізованих рекомендаційних служб, подібних до традиційних галузей, користувачі почуватимуться розгубленими, вибираючи програми та продукти, які їм підходять. Така ситуація призведе до зниження задоволеності користувачів, що вплине на ефективність всієї екосистеми Ethereum.
Візьмемо як приклад кредитування. Щоб підтримувати безпеку та стабільність своїх власних платформ, деякі платформи кредитування DeFi використовуватимуть механізм надмірної застави. Це означає, що позичальнику необхідно закласти більше активів як заставу, і ці активи не можуть бути використані позичальником для іншої діяльності протягом періоду позики. Це призведе до зниження використання капіталу позичальників, тим самим зменшуючи ліквідність ринку.
Застосування машинного навчання в Ethereum
Моделі машинного навчання, такі як модель RMF, генеративна змагальна мережа (GAN), модель дерева рішень, K-алгоритм найближчого сусіда (KNN), алгоритм кластеризації DBSCAN тощо, відіграють важливу роль в Ethereum. Застосування цих моделей машинного навчання в Ethereum може допомогти оптимізувати ефективність обробки транзакцій, покращити безпеку смарт-контрактів, реалізувати стратифікацію користувачів для надання більш персоналізованих послуг і допомогти підтримувати стабільну роботу мережі.
Введення в алгоритм
Алгоритм машинного навчання — це набір інструкцій або правил для синтаксичного аналізу даних, вивчення шаблонів у даних і прийняття прогнозів або рішень на основі цих знань. Вони навчаються та вдосконалюються автоматично на основі даних, які їм надають, без потреби в явних програмних інструкціях від людей. Моделі машинного навчання, такі як модель RMF, генеративна змагальна мережа (GAN), модель дерева рішень, K-алгоритм найближчого сусіда (KNN), алгоритм кластеризації DBSCAN тощо, відіграють важливу роль в Ethereum. Застосування цих моделей машинного навчання в Ethereum може допомогти оптимізувати ефективність обробки транзакцій, покращити безпеку смарт-контрактів, реалізувати стратифікацію користувачів для надання більш персоналізованих послуг і допомогти підтримувати стабільну роботу мережі.
Байєсівський класифікатор — це ефективний класифікатор, який спрямований на мінімізацію ймовірності помилки класифікації або мінімізацію середнього ризику за конкретною структурою витрат серед різних статистичних методів класифікації. Його філософія проектування глибоко вкорінена в теоремі Байєса, яка дозволяє йому приймати рішення, обчислюючи апостеріорну ймовірність об’єкта, враховуючи ймовірність того, що об’єкт належить до певного класу з певними характеристиками. Зокрема, байєсівський класифікатор спочатку враховує попередню ймовірність об’єкта, а потім застосовує байєсівську формулу для комплексного розгляду даних спостереження, щоб оновити переконання щодо класифікації об’єкта. Серед усіх можливих класифікацій байєсівський класифікатор вибирає ту з найбільшою апостеріорною ймовірністю класифікації об’єкта в цю категорію. Основною перевагою цього підходу є його здатність природним чином справлятися з невизначеністю та неповною інформацією, що робить його потужним і гнучким інструментом, придатним для широкого діапазону прикладних сценаріїв.
Рисунок 2 Байєсівський класифікатор
Як показано на малюнку 2, у керованому машинному навчанні для прийняття рішень щодо класифікації використовуються дані та ймовірнісна модель на основі теореми Байєса. Використовуючи правдоподібність і попередні ймовірності категорій і ознак, байєсівський класифікатор обчислює апостеріорну ймовірність того, що точки даних належать до кожної категорії, і призначає точки даних до категорії з найбільшою апостеріорною ймовірністю. На діаграмі розсіювання праворуч класифікатор намагатиметься знайти криву, яка найкраще розділяє точки різних кольорів, таким чином мінімізуючи помилку класифікації.
Алгоритм дерева рішень часто використовується в задачах класифікації та регресії. Він використовує ідею ієрархічного судження. На основі відомих даних дерево рішень навчається шляхом вибору функцій із великим коефіцієнтом приросту інформації та їх подальшого поділу на дерева. Простіше кажучи, весь алгоритм може самостійно вивчати правило прийняття рішень на основі даних, щоб судити про значення змінної. З точки зору реалізації, він може розкласти складний процес прийняття рішень на кілька простих процесів прийняття додаткових рішень За допомогою такого похідного методу кожне простіше рішення виводиться з батьківського критерію рішення, утворюючи структуру дерева.
Як видно з рисунка 3, кожен вузол представляє рішення та встановлює критерії оцінки для певного атрибута, а гілки представляють результати рішення. Кожен листовий вузол представляє кінцевий прогнозований результат і категорію. З точки зору композиції алгоритму, модель дерева рішень є відносно інтуїтивно зрозумілою, легкою для розуміння та добре інтерпретованою.
Рисунок 3. Модель дерева рішень
DBSCAN (Density-Based Spatial Clustering of Applications with Noise) — це алгоритм просторової кластеризації на основі щільності з шумом, який, здається, особливо добре працює для незв’язаних наборів даних. Цей алгоритм може виявляти кластери довільної форми, не вказуючи кількість кластерів заздалегідь, і має хорошу стійкість до викидів у наборі даних. Алгоритм також може ефективно ідентифікувати викиди в масивних наборах даних. Шум або викиди визначаються як точки в областях з низькою щільністю, як показано на малюнку 4.
Рисунок 4 Алгоритм DBSCAN ідентифікує шум
Алгоритм KNN (K-Nearest Neighbors) можна використовувати як для класифікації, так і для регресії. У задачі класифікації механізм голосування використовується для визначення категорії елемента, який потрібно класифікувати; у задачі регресії для прогнозу обчислюється середнє або зважене середнє k найближчих сусідніх вибірок.
Як показано на малюнку 5, принцип роботи алгоритму KNN у класифікації полягає в тому, щоб знайти K найближчих сусідів нової точки даних, а потім передбачити категорію нової точки даних на основі категорій цих сусідів. Якщо K=1, то нові точки даних просто призначаються найближчим
Категорія сусіда. Якщо K > 1, то для визначення класу нової точки даних зазвичай використовується метод голосування, тобто нова точка даних буде призначена класу, до якого належить більшість сусідів. Коли алгоритм KNN використовується для задач регресії, основна ідея та сама, а результатом є середнє K вихідних значень вибірки найближчих сусідів.
Рисунок 5. Алгоритм KNN, використаний для класифікації
Генеративний штучний інтелект — це технологія штучного інтелекту, яка може генерувати новий вміст (наприклад, текст, зображення, музику тощо) на основі вхідних даних. Його підґрунтя базується на досягненнях у машинному та глибокому навчанні, зокрема в таких сферах, як обробка природної мови та розпізнавання зображень. Генеративний штучний інтелект вивчає шаблони та асоціації з великої кількості даних, а потім генерує новий вихідний вміст на основі цієї вивченої інформації. Ключ до генеративного штучного інтелекту лежить у навчанні моделі, яке потребує відмінних даних для навчання та навчання. У цьому процесі модель поступово покращує свою здатність генерувати новий вміст шляхом аналізу та розуміння структури, шаблонів і зв’язків у наборі даних.
Як показано на малюнку 6, завдяки введенню механізму уваги з кількома головами та механізму самоуважності в поєднанні із залишковим зв’язком і повністю зв’язаною нейронною мережею, а також за допомогою попередньої технології вбудовування слів, продуктивність генеративних моделей, пов’язаних із природною мовою обробка була значно покращена Земля піднімається.
Рисунок 6 Модель трансформатора
Модель RFM – це модель аналізу, заснована на поведінці користувачів при купівлі. Аналізуючи поведінку користувачів у транзакціях, вона може ідентифікувати групи користувачів з різними цінностями. Ця модель розподіляє користувачів за часом останнього споживання (R), частотою споживання (F) і кількістю споживання (M).
Як показано на малюнку 7. Ці три показники разом утворюють ядро моделі RFM. Модель оцінює користувачів на основі цих трьох параметрів і сортує їх відповідно до їхніх балів, щоб визначити найцінніші групи користувачів. Крім того, ця модель може ефективно розділити клієнтів на різні групи для реалізації функції стратифікації користувачів.
Рисунок 7 Багатошарова модель RFM
Можливі застосування
Застосовуючи технологію машинного навчання для вирішення проблем безпеки Ethereum, ми провели дослідження з чотирьох основних аспектів:
Навчаючи GAN вивчати існуючі шаблони контрактів безпеки, побудувати самоконфронтаційну модель для генерації потенційно небезпечного коду, а потім навчитися визначати ці небезпеки за допомогою вивчення моделі, зрештою досягнувши здатності автоматично генерувати високоякісний і безпечніший код смарт-контракту. . Використання моделі генераторної мережі на основі трансформатора та вивчення великої кількості прикладів контрактів безпеки для створення коду контракту, який відповідає конкретним потребам і оптимізує споживання газу, безсумнівно, ще більше підвищить ефективність і безпеку розробки смарт-контракту. 3. Аналіз ризиків смарт-контракту на основі дерева рішень Використання дерев рішень для аналізу характеристик смарт-контрактів, таких як частота викликів функцій, вартість транзакції, складність вихідного коду тощо, може ефективно визначити потенційний рівень ризику контракту. Аналізуючи режим роботи контракту та структуру коду, можна передбачити можливі вразливості та точки ризику, таким чином надаючи розробникам і користувачам оцінку безпеки. Очікується, що такий підхід значно покращить безпеку смарт-контрактів в екосистемі Ethereum, тим самим зменшивши втрати через уразливості або шкідливий код. 4. Побудуйте модель оцінки криптовалюти для зменшення інвестиційних ризиків
Використовуйте алгоритми машинного навчання для аналізу багатовимірної інформації, такої як дані про трансакції криптовалюти, дії в соціальних мережах і показники ринку, щоб побудувати модель оцінки, яка може передбачити можливість спаму монет. Ця модель може надати інвесторам цінну довідкову інформацію, яка допоможе їм уникнути інвестиційних ризиків, таким чином сприяючи здоровому розвитку ринку криптовалют.
Крім того, використання машинного навчання також має потенціал для подальшого підвищення ефективності Ethereum. Ми можемо глибше розглянути наступні три ключові аспекти:
Алгоритм DBSCAN також може аналізувати торгову поведінку користувачів, допомагати ідентифікувати різні групи користувачів на Ethereum і надавати більш індивідуальні фінансові послуги для різних користувачів. Ця стратегія стратифікації користувачів може оптимізувати маркетингові стратегії та підвищити задоволеність клієнтів і ефективність обслуговування. 3. Кредитний скоринг на основі КНН
Алгоритм K-найближчого сусіда (KNN) може оцінювати кредит користувачів, аналізуючи історію транзакцій і моделі поведінки користувачів Ethereum, що відіграє надзвичайно важливу роль у фінансовій діяльності, наприклад у кредитуванні. Кредитні оцінки можуть допомогти фінансовим установам і кредитним платформам оцінити платоспроможність позичальників і кредитний ризик, що дозволить приймати точніші рішення про позику. Це дозволяє уникнути надмірних запозичень і покращити ліквідність ринку.
Майбутні напрямки
З точки зору макророзподілу коштів, Ethereum, як найбільший у світі розподілений комп’ютер, не може інвестувати занадто багато в інфрарівень, і йому потрібно залучати розробників з більшої кількості професій до участі у спільному будівництві. У цій статті, розбираючи технічну реалізацію та проблеми, з якими стикається Ethereum, ми уявили низку відносно інтуїтивно зрозумілих можливих застосувань машинного навчання.Ми також дуже сподіваємося на розробників штучного інтелекту в спільноті, які зможуть реалізувати ці бачення з реальною ціною. Приземлився.
Оскільки обчислювальна потужність у ланцюжку поступово зростає, ми можемо передбачити, що будуть розроблені більш складні моделі для керування мережею, моніторингу транзакцій, аудиту безпеки та інших аспектів для підвищення ефективності та безпеки мережі Ethereum.
Йдучи далі, штучний інтелект/керовані агентами механізми управління також можуть стати головною інноваційною точкою в екосистемі Ethereum. Ефективніший, прозоріший і більш автоматизований процес прийняття рішень, створений за допомогою цього механізму, створює більш гнучку та надійну структуру управління платформою Ethereum. Ці майбутні напрямки розвитку не тільки сприятимуть інноваціям технології Ethereum, але й забезпечать користувачам кращий досвід роботи в мережі.