AI 如何革新以太坊?

中級3/18/2024, 5:29:31 AM
隨著鏈上算力逐步增加,我們可以預見更加覆雜的模型被開髮出來,用於網絡管理、交易監控、安全審核等方方麵麵,提高以太坊網絡的效率和安全性,併且拋出一些和市場上不一樣的角度,激髮開髮者生態中更多「AI+Blockchain」的創新交叉組合。

轉髮原文標題:另一個角度看「AI+Blockchain」:AI 如何革新以太坊?
過去一年隨著 generative AI 一次次打破大衆的預期,AI 生産力革命的浪潮席卷加密貨幣圈層。我們看到,許多 AI 概念項目在二級市場上帶來一波造富神話,衕時,越來越多的開髮者開始著手開髮自己的「AI+Crypto」項目。

然而,仔細觀察可以髮現,這些項目的衕質化現象非常嚴重,且大多數項目僅僅停留在改善「生産關繫」的層麵,例如通過去中心化網絡來組織算力,或者創建「去中心化的 Hugging Face」等。很少有項目嘗試從底層技術進行真正的融合和創新。我們認爲,這種現象的原因在於 AI 和區塊鏈領域之間存在一種「領域偏見」。盡管兩者的交集廣泛,但很少有人能夠深入理解這兩個領域。例如,AI 開髮者很難了解以太坊的技術實現和歷史基建狀態,也就更難提出深入的優化方案。

以機器學習(ML)這一最基本的 AI 分支爲例,它是一種無需明確編程指令,機器便能通過數據做出決策的技術。機器學習在數據分析和模式識別方麵展現出巨大潛力,且在 web2 中已飛入尋常。然而由於誕生之初的時代局限,即使是在區塊鏈技術創新的前沿陣地如以太坊,其架構、網絡和治理機製也尚未將機器學習作爲解決覆雜問題的有效工具。

「偉大的創新往往誕生於交叉領域。」我們撰寫本文的初衷是爲了讓 AI 開髮者更好地理解區塊鏈世界,衕時也爲以太坊社區的開髮者提供新的思路。在文章中,我們首先介紹了以太坊的技術實現,隨後提出將機器學習這一基礎 AI 算法應用於以太坊網絡的方案以提高其安全性、效率和可擴展性。我們希望以這個案例爲起點,拋出一些和市場上不一樣的角度,激髮開髮者生態中更多「AI+Blockchain」的創新交叉組合。

以太坊的技術實現

  • 基礎數據結構

區塊鏈本質是一條連接區塊的鏈,用於區分鏈的關鍵就是鏈配置,這也是一條區塊鏈在創世中所必不可少的一部分。對於以太坊,鏈配置用於區分以太坊中不衕鏈,衕時標識出其中的一些重要升級協議以及標誌事件。例如 DAOForkBlock 標誌了以太坊經歷 DAO 攻擊的硬分叉高度,以及 ConstantinopleBlock 標識了君士坦丁堡升級的區塊高度。對於包含衆多改進提案的較大升級,會設置特別的字段以標識對應的區塊高度,此外以太坊包含各種測試網絡以及主網絡,通過 ChainID 獨一無二地標識了對應的網絡生態。

創世區塊作爲整個區塊鏈的第零個區塊,其他區塊直接或間接引用到創世區塊。 因此節點啟動之初必鬚載入正確的創世區塊信息,且不得任意修改。創世區塊的配置信息包含了前述的鏈配置,衕時還附加了例如相關挖礦獎勵、時間戳、難度和 gas 設限等字段,需要註意以太坊的共識機製已經從工作量證明的挖礦機製轉爲權益證明。

以太坊賬戶分爲外部賬戶和合約賬戶,其中外部賬戶由私鑰唯一控製,而合約賬戶無私鑰控製,隻能通過外部賬戶調用合約執行合約代碼來操作。他們都包含一個唯一地址。以太坊世界態是一個以太坊賬戶樹,每個都賬戶對應一個葉子結點,其中存儲了該賬戶的狀態(各種賬戶信息及代碼信息)。

交易:以太坊作爲一種去中心化平颱,其本質是爲了交易和合約,以太坊的區塊就是打包的交易,以及附加一些其他相關信息,具體區塊分爲兩部分,即區塊頭和區塊體,其中區塊頭數據蘊含了將所有區塊連接爲鏈的證據,我們可以理解爲前區塊哈希,以及證明整個以太坊世界狀態的狀態根,交易根,回執(receipt)根,和其他若幹標識難度,計數 nonce 等額外數據。而區塊體存儲了交易列錶和叔塊頭的列錶(由於以太坊已經轉爲權益證明,因此叔塊引用不覆存在)。

交易回執提供了交易執行後的結果和額外信息,這些是不能僅僅通過查看交易本身來直接穫得的。具體來講,其中包含的信息可以分爲:共識內容,交易信息和區塊信息,包含了交易處理是否成功以及交易日誌和 gas 等消耗的信息。通過分析回執中的信息來調試智能合約代碼和優化 gas 消耗。併提供了一種確證,錶明交易已經被網絡處理,併且可以查看交易的結果和影響。

在以太坊中,gas 費用可以簡單的理解爲手續費,當你髮送 Token、執行合約、轉移以太幣或者在此區塊上所出的各種操作,這些交易中的操作都需要 gas 費,以太坊計算機在處理這筆交易時需要進行計算消耗網絡資源,這樣你必鬚支付 gas 費才能讓計算機爲你工作。最終燃料費作爲手續費支付給礦工,其具體費用的計算公式可理解爲 Fee = Gas Used * Gas Price,也就是實際消耗乘以消耗單價,其中單價由交易的髮起者自行設置,其多少往往決定了交易上鏈的快慢。如果設置過低有可能交易不會被執行,衕時還需要設置費用的 gas limit 消耗上限,避免出現合約中的錯誤引起不可預計的 gas 消耗的情況。

  • 交易池

在以太坊中,存在大量的交易,相比於中心化繫統,去中心化繫統的每秒處理交易數顯然黯然神傷。由於大量的交易進入結點,結點需要維護一個交易池以正確的管理這些交易。交易的廣播是通過 p2p 進行的,具體來講一個節點會將可執行交易廣播到其鄰結點中,繼而鄰結點又會將該交易廣播到該節點的鄰節點中,通過這樣的形式,一筆交易可以在 6 秒內擴散至整個以太坊網絡。

在交易池中的交易分爲可執行交易和非可執行交易,可執行交易具有更高的優先級會被執行併打包的區塊中,而所有剛進入交易池的交易都是非可執行交易,之後才會變爲可執行。可執行交易和非可執行交易分別記録在 pending 容器中和 queue 容器中。

此外交易池還會維護一個 local 交易列錶,local 交易具備多種優勢,其優先級更高,不受交易量限製的影響,且在重啟結點時可以立刻重新加載到交易池中。而 local 交易的本地持久化存儲就是通過 journal 來實現的(重啟節點時的重新加載),其目的就是爲了不丟失未完成的本地交易,併會定期更新。

交易在入隊列之前會檢驗交易合法性,具體包括各種類型的檢查,例如:防 DOS 攻擊、防負數交易、交易 gas 上限等等。交易池簡單組成可以分爲:queue+pending(兩個組成 all 交易),在完成合法性檢測之後會進行後續的檢查,包括檢查交易隊列是否達到上限,之後判斷 remote 交易(remote 交易就是非 local 交易)是否是交易池中最低的,替換交易池中最低價格交易。對於可執行交易的替換,默認隻有上調 10% 手續費的交易才允許替換掉已在等待執行的交易,替換後存儲爲非可執行交易。此外在交易池的維護過程中還會刪除無效和超上限交易,併對滿足條件的交易進行替換。

  • 共識機製

以太坊前期的共識理論還是基於難度值哈希計算的方法,也就是説,需要計算區塊的哈希值,以滿足目標難度值的條件,該區塊才合法。由於以太坊現在的共識算法已經從 POW 轉爲 POS,因此對於挖礦相關的理論不再贅述。在這裡簡述 POS 算法。以太坊於 2022 年 9 月完成了信標鏈的合併實現了 POS 算法,具體來講,基於 POS 的以太坊,其每個區塊的出塊時間穩定在 12s,用戶質押自己的以太幣以穫得成爲驗證者的權利,之後對參與質押的用戶隨機進行選擇得到一批驗證者,併在每一輪周期包含 32 個插槽的每一個插槽中會進行驗證者的選拔,選出其一驗證者作爲提議者,該提議者實現出塊,而對應該插槽的其餘驗證者作爲委員會,以驗證提議者區塊的合法性,衕時對上一輪周期中的區塊合法性做出判決。POS 算法顯著穩定併提高了區塊的出塊速度,衕時極大地避免了計算資源的浪費。

  • 簽名算法

以太坊沿襲了比特幣的簽名算法標準,衕樣採用 secp256k1 曲線,其具體的簽名算法採用了 ECDSA,也就是説計算的簽名是根據原始消息的哈希計算得來的,整個簽名的組成簡單來看就是 R+S+V。每次計算都會對應地引入隨機數,其中 R+S 就是 ECDSA 的原始輸出。而末尾字段 V 稱之爲恢覆字段,錶示從內容和簽名中成功恢覆出公鑰時需要查找的次數,因爲根據 R 值在橢圓曲線中查找符合要求的坐標點可能有多個。

整個過程可以簡單梳理爲:交易數據與簽名器相關信息經 RLP 編碼後哈希,與私鑰通過 ECDSA 簽名就可以穫得最終簽名,而 ECDSA 中所使用的曲線就是 secp256k1 橢圓曲線。最後將簽名數據與交易數據組合,就可以穫得一筆已經簽名的交易數據併廣播出去。

以太坊的數據結構不僅僅依賴於傳統的區塊鏈技術,還引入了默剋爾帕特裡夏樹,也稱爲默剋爾壓縮前綴樹,用於高效地存儲和驗證大量數據。MPT 結合了默剋爾樹的加密哈希功能和帕特裡夏樹的鍵路徑壓縮特性,提供了一種既保障數據完整性又支持快速查找的解決方案。

  • 默剋爾壓縮前綴樹

在以太坊中,MPT 用於存儲所有狀態和交易數據,確保任何數據的變更都會反映在樹的根哈希上。這意味著,通過驗證根哈希,就可以證明數據的完整性和準確性,無需檢查整個數據庫。MPT 由四種類型的節點組成:葉子節點、擴展節點、分支節點和空節點,這些節點共衕構成了一棵能夠適應動態數據變化的樹。每次數據更新時,MPT 通過節點的添加、刪除或修改來反映這些變更,衕時更新樹的根哈希值。由於每個節點都通過哈希函數加密,任何對數據的微小改動都會導緻根哈希的巨大變化,從而保證了數據的安全性和一緻性。此外,MPT 的設計支持「輕客戶端」驗證,允許節點僅通過存儲樹的根哈希和必要的路徑節點,就能驗證特定信息的存在或狀態,極大地減少了數據存儲和處理的需求。

通過 MPT,以太坊不僅實現了數據的高效管理和快速訪問,還確保了網絡的安全性和去中心化特性,支撐起整個以太坊網絡的運行和髮展。

  • 狀態機

以太坊的核心架構融合了狀態機的概念,其中,以太坊虛擬機 EVM 是執行所有智能合約代碼的運行時環境,而以太坊本身可視爲一個全球共享的、狀態轉換繫統。每個區塊的執行都可以被看作是一個狀態轉換過程,從一個全球共享狀態轉移到另一個狀態。這種設計不僅確保了以太坊網絡的一緻性和去中心化特性,還使得智能合約的執行結果可預測且不可篡改。

在以太坊中,狀態指的是所有賬戶的當前信息,包括每個賬戶的餘額、存儲數據以及智能合約的代碼。每當髮生交易時,EVM 根據交易內容計算併轉換狀態,這一過程通過 MPT 來高效、安全地記録。每個狀態轉換不僅改變了賬戶數據,也導緻了 MPT 的更新,反映在樹的根哈希值的變化上。

EVM 和 MPT 之間的關繫至關重要,因爲 MPT 爲以太坊的狀態轉換提供了數據完整性的保證。當 EVM 執行交易,更改賬戶狀態時,相關的 MPT 節點被更新以反映這些變更。由於 MPT 的每個節點都是通過哈希鏈接的,任何對狀態的修改都會引起根哈希的變化,這個新的根哈希隨後被包含在新的區塊中,確保了整個以太坊狀態的一緻性和安全性。下麵我們介紹一下 EVM 虛擬機。

  • EVM

EVM 虛擬機是整個以太坊構建智能合約執行狀態轉換的根本,正是得益於 EVM,以太坊才能在真正意義上被想象成一個世界計算機。EVM 虛擬機是圖靈完備的,這也就意味著以太坊上的智能合約能夠執行任意覆雜邏輯計算,而 gas 機製的引入又成功防止合約中無限循環的情況,確保網絡的穩定性和安全性。從更加深入一些的技術層麵講,EVM 是一個基於堆棧的虛擬機,使用以太坊專用的字節碼執行智能合約。開髮者通常使用高級語言,如 Solidity,來編寫智能合約,然後將其編譯成 EVM 可以理解的字節碼,供 EVM 進行執行調用。EVM 是以太坊區塊鏈創新能力的關鍵,它不僅支撐著智能合約的運行,也爲去中心化應用的開髮提供了堅實的基礎。通過 EVM,以太坊正塑造著一個去中心化、安全且開放的數字未來。

歷史回顧

圖 1 以太坊歷史回顧

以太坊麵臨的挑戰

安全性

智能合約是運行在以太坊區塊鏈上的計算機程序。它們允許開髮者創建和髮布各種應用,包括但不限於借貸應用、去中心化交易所、保險、二次融資、社交網絡和 NFT。智能合約的安全性對於這些應用至關重要。這些應用直接負責處理和控製加密貨幣,智能合約的任何漏洞或者對其的惡意攻擊,都會對資金安全構成直接威脅,甚至導緻巨大的經濟損失。比如,2024 年 2 月 26 日,DeFi 借貸協議 Blueberry Protocol 因智能合約邏輯缺陷遭到攻擊,損失約 1,400,000 美元。

智能合約的漏洞是多方麵的,涵蓋了不合理的業務邏輯(Business Logic)、訪問權限控製不當、數據驗證不足、重入攻擊,以及 DOS(Denial of Service)攻擊等多個方麵。這些漏洞可能會導緻合約的執行出現問題,影響到智能合約的有效運行。以 DOS 攻擊爲例,這種攻擊方式是通過攻擊者髮送大量交易來消耗網絡的資源,那麽,正常用戶髮起的交易無法得到及時處理,這會導緻用戶體驗下降。而且,這也會導緻交易 gas 費上漲。因爲在網絡資源緊張的情況下,用戶可能需要支付更高的費用來讓他們的交易得到優先處理。

除此之外,以太坊上的用戶也麵臨著投資風險,資金安全會收到威脅。比如,垃圾幣,用於描述被認爲幾乎沒有價值或沒有長期增長潛力的加密貨幣。垃圾幣經常被利用作爲詐騙工具或是用於價格操控的拉升和拋售策略。垃圾幣的投資風險很高,可能導緻重大財務損失。由於其低價和低市值,它們極易受到操縱和波動。這種幣種常被用於拉高拋售計畫和蜜罐騙局,即利用虛假項目誘騙投資者併竊取其資金。另一種常見的垃圾幣風險是 Rug Pull,即創造者從項目中突然移除所有流動性,使代幣價值暴跌。這些騙局通常會通過虛假的合作伙伴關繫和背書來進行營銷,一旦代幣價格上漲,騙子就會出售他們的代幣,穫利後消失,留給投資者的卻是一文不值的代幣。衕時,投資垃圾幣還會分散人們對擁有實際應用和增長潛力的合法加密貨幣的註意力和資源。

除了垃圾幣,空氣幣和傳銷幣也是快速穫利的方式。對於缺乏專業知識和經驗的用戶來説,將它們與合法的加密貨幣進行區分尤爲睏難。

效率

評估以太坊效率的兩個非常直接的指標是交易速度和 gas 費。交易速度是指以太坊網絡能夠在單位時間內處理的交易數量。這個指標直接反映了以太坊網絡的處理能力,速度越快意味著效率越高。以太坊中的每一筆交易都需要支付一定的 gas 費用,用於補償進行交易驗證的礦工。gas 費用越低,説明以太坊的效率越高。

交易速度降低會導緻 gas 費用升高。一般來説,當交易處理速度降低時,由於區塊空間有限,競爭進入下一個區塊的交易可能會增多。爲了在競爭中脫穎而出,交易者通常會提高 gas 費用,因爲礦工在驗證交易時往往優先選擇 Gas 費用較高的交易。那麽,更高的 gas 費會降低用戶體驗感。

交易僅僅是以太坊中的基礎活動。在該生態繫統中,用戶還可以進行各項借貸、質押、投資、保險等活動。這些都可以通過特定的 DApp 來完成。然而,鑒於 DApp 的種類繁多,併且缺乏與傳統行業相似的個性化推薦服務,用戶在選擇適合自己的應用和産品時會感到迷茫。這種情況會導緻用戶滿意度下降,從而影響到整個以太坊生態繫統的效率。

以借貸爲例。一些 DeFi 借貸平颱爲了維護自己平颱的安全和穩定,會使用超額抵押機製。這意味著借款人需要拿出更多的資産作爲抵押,這些資産在借款期間不能被借款人用於其他活動。這會導緻借款人的資金利用率下降,進而降低市場流動性。

機器學習在以太坊中的應用

機器學習模型,如 RFM 模型、生成式對抗網絡(GAN)、決策樹模型、K 近鄰算法(KNN)、DBSCAN 聚類算法等,正在以太坊中髮揮重要作用。這些機器學習模型在以太坊中的應用可以幫助優化交易處理效率,提高智能合約的安全性,實現用戶分層以提供更個性化服務,併且有助於維護網絡的穩定運行。

算法介紹

機器學習算法是一組指令或規則,用於解析數據、學習數據中的模式,併基於這些學習做出預測或決策。它們通過從提供的數據中自動學習和改進,而不需要人類明確編程指令。機器學習模型,如 RFM 模型、生成式對抗網絡(GAN)、決策樹模型、K 近鄰算法(KNN)、DBSCAN 聚類算法等,正在以太坊中髮揮重要作用。這些機器學習模型在以太坊中的應用可以幫助優化交易處理效率,提高智能合約的安全性,實現用戶分層以提供更個性化服務,併且有助於維護網絡的穩定運行。

  • 貝葉斯分類器

貝葉斯分類器是在各種統計分類方法中,以最小化分類錯誤概率或在特定代價框架下最小化平均風險爲目標的一種高效分類器。它的設計哲學深植於貝葉斯定理之中,這使得它能夠在已知某些特徵的條件下對象屬於某一類的概率,通過計算對象的後驗概率,來進行決策。具體來説,貝葉斯分類器首先考慮對象的先驗概率,然後應用貝葉斯公式綜合考慮觀測數據,從而更新對對象分類的信念。在所有可能的分類中,貝葉斯分類器選擇那個具有最大後驗概率的類別,將對象歸入此類。這種方法的核心優勢在於其能夠自然地處理不確定性和不完全信息,使其成爲一種強大且靈活的工具,適用於廣泛的應用場景。

如圖 2 所示,在有監督的機器學習中,就是利用數據和基於貝葉斯定理的概率模型來進行分類決策。利用似然度和類別以及特徵的先驗概率,貝葉斯分類器通過計算數據點屬於各個類別的後驗概率,併將數據點分配到後驗概率最大的類別中去。在右側散點圖中,分類器將嘗試找到一條曲線,最好地將不衕顔色的點分開,從而最小化分類錯誤。

圖 2 貝葉斯分類器

  • 決策樹

決策樹算法常用於分類和回歸任務中,其採用了一種分層判斷的思想,根據已知的數據通過選取信息增益率較大特徵後分裂成樹,訓練出決策樹。簡單來説,整個算法可以根據數據從中自學習出一種決策規則從而判斷變量的值,具體在實現上,能夠將覆雜決策過程分解爲若幹個簡單的子決策過程,通過這樣一種衍生方式,每個更爲簡單的決策判斷都派生自父決策準則,從而組成了一種樹狀結構。

從圖 3 可以看出,每個結點都代錶了一項決策,定了某種屬性的判斷準則,而分支代錶決策的結果。每個葉子結點代錶了最終的預測的結果和類別。從算法構成上來看,決策樹模型較爲直觀,且易於理解具備較強的解釋性。

圖 3 決策樹模型

  • DBSCAN 算法

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是具有噪聲的基於密度的空間聚類算法,對於非聯通數據集好像效果尤其的好。該算法能夠髮現任意形狀的簇,且無需事先指定簇的數量,對於數據集中的異常值具有良好的魯棒性。該算法還能在有噪聲的數據集中有效地識別出異常點,噪聲或異常點被定義爲在低密度區域的點,如圖 4 所示。

圖 4 DBSCAN 算法識別噪聲

  • KNN 算法

KNN(K-Nearest Neighbors)算法既可用於分類也可用於回歸。在分類問題中,會根據投票機製來決定待分類項的類別;而在回歸問題中,則會計算 k 個最鄰近樣本的平均值或者加權平均值來預測。

如圖 5 所示,KNN 算法在分類中的工作原理是找到一個新數據點的最近的 K 個鄰居,然後根據這些鄰居的類別來預測新數據點的類別。如果 K=1,那麽新的數據點就被簡單地分配到它最近的鄰居的類別。如果 K>1,那麽通常會用投票法來確定新的數據點的類別,也就是説,新的數據點會被分配到最多鄰居屬於的類別。而當 KNN 算法用於回歸問題時,其基本思想是一樣的,而結果是最近鄰的 K 個樣本輸出值的平均值。

圖 5 KNN 算法用於分類

  • 生成式人工智能

生成式人工智能是一種根據需求輸入能夠生成新的內容(如文本、圖像、音樂等)的 AI 技術。它的背景基於機器學習和深度學習的進展,特別是在自然語言處理和圖像識別等領域的應用。生成式 AI 通過從大量數據中學習模式和關聯,然後根據這些學習到的信息生成全新的的輸出內容。生成式人工智能的關鍵在於模型訓練,需要優秀的數據進行學習與訓練,這一過程中,模型通過分析和理解數據集中的結構、模式和關繫,逐步提高其生成新內容的能力。

  • Transformer

Transformer 作爲生成式人工智能的基石,開創性地引入了註意力機製,使得對於信息的處理既能聚焦於關鍵又能縱覽全局,這種獨特的能力使得 Transformer 文本生成領域大放異彩。利用最新的自然語言處語言模型,如 GPT(Generative Pre-trained Transformer),來理解用戶以自然語言錶述的應用需求,併自動轉換成可執行的代碼,能夠降低開髮難度併顯著提高效率。

如圖 6 所示,通過多頭註意力機製以及自註意的機製的引入,配合殘差連接和全連接神經網絡,併借助以往的 word embedding 技術,使得自然語言處理相關的生成式模型性能得到了極大地飛升。

圖 6 Transformer 模型

  • RFM 模型

RFM 模型是一種基於用戶購買行爲的分析模型,通過分析用戶的交易行爲,能夠識別出不衕價值的用戶群體。該模型根據用戶的最近消費時間(R)、消費頻次(F)、消費金額(M)來對用戶進行分層。

如圖 7 所示。 這三個指標共衕構成了 RFM 模型的核心。該模型根據這三個維度爲用戶打分,併依據得分高低進行排序,來識別出最有價值的用戶群體。而且,該模型能夠有效地將顧客分爲不衕的群體,以實現用戶分層的功能。

圖 7 RFM 分層模型

可能的應用

在運用機器學習技術來應對以太坊的安全性挑戰時,我們從四個主要方麵進行了研究:

  • 基於貝葉斯分類器識別併過濾惡意交易

通過構建貝葉斯分類器,對可能的垃圾交易進行識別和過濾,包括但不限於導緻 DOS 攻擊的大量、頻繁、小額交易。這一方法通過分析交易的特徵,如 Gas 價格、交易頻率等,有效地維護了網絡的健康狀態,保障了以太坊網絡的穩定運行。

  • 生成安全且滿足特定要求的智能合約代碼

生成式對抗網絡(GAN)和基於 Transformer 的生成式網絡都可用於生成滿足特定要求的智能合約代碼,併盡可能保證代碼的安全性。然而,這兩者在訓練模型所依賴的數據類型上存在差異,前者的訓練過程主要依賴於不安全的代碼樣本,而後者則相反。

通過訓練 GAN 學習現有的安全合約模式,併構建自對抗模型來生成潛在的不安全代碼,再通過模型學習辨別這些不安全性,最終實現能夠自動生成高質量、安全性更高的智能合約代碼。利用基於 Transformer 的生成式網絡模型,通過學習大量的安全合約示例,生成滿足特定需求且優化 Gas 消耗的合約代碼,這無疑將進一步提高智能合約開髮的效率和安全性。

  • 基於決策樹進行智能合約風險分析

利用決策樹分析智能合約的特徵,例如函數調用頻次、交易值、源代碼覆雜度等,可以有效地識別合約潛在的風險等級。通過分析合約的運行模式和代碼結構,可以預測可能的漏洞和風險點,從而爲開髮者和用戶提供是否安全的評定。這種方法有望顯著提高以太坊生態繫統中智能合約的安全性,從而減少因漏洞或惡意代碼造成的損失。

  • 構建加密貨幣的評價模型來降低投資風險

通過機器學習算法分析加密貨幣的交易數據、社交媒體活動、市場錶現等多維度信息,構建一個能夠預測垃圾幣可能性的評價模型。這種模型可以爲投資者提供有價值的參考,幫助他們避免投資風險,從而促進加密貨幣市場的健康髮展。

除此之外,機器學習的運用也有潛力進一步提升以太坊的效率。我們可以從以下三個關鍵維度深入探究:

  • 優化交易池排隊模型的決策樹應用

基於決策樹能夠有效優化以太坊交易池的排隊機製。通過分析交易特性,例如 Gas 價格和交易大小等,決策樹能夠優化交易的選擇和排隊順序。這種方法能夠顯著提高交易處理效率,有效減少網絡擁堵,併降低用戶的交易等待時間。

  • 對用戶進行分層併提供個性化服務

RFM 模型(Recency, Monetary value, Frequency)作爲一種廣泛應用於客戶關繫管理的分析工具,可以通過對用戶最近一次交易時間(Recency)、交易頻率(Frequency)和交易金額(Monetary value)的評估,進行有效的用戶分層。在以太坊平颱上應用 RFM 模型,能夠有助於識別高價值用戶群體,優化資源分配,併提供更爲個性化的服務,從而提高用戶滿意度和平颱的整體效率。

DBSCAN 算法也能夠分析用戶的交易行爲,幫助識別以太坊上的不衕用戶群體,進一步爲不衕的用戶提供更定製化的金融服務。這種用戶分層策略能夠優化市場營銷策略,提高客戶滿意度和服務效率。

  • 基於 KNN 進行信用評分

K 近鄰算法(KNN)能夠通過分析以太坊用戶的交易歷史和行爲模式,對用戶進行信用評分,這在借貸等金融活動中具有極其重要的作用。信用評分能夠幫助金融機構和借貸平颱評估借款人的還款能力和信用風險,從而做出更加精準的貸款決策。這可以避免超額借貸,提高市場流動性。

未來方曏

從宏觀資金分配的層麵,以太坊作爲全球最大的分布式計算機,在 infra 層的投資再怎麽多都不爲過,需要吸引更多背景的開髮者參與共建。在這篇文章裡,我們通過梳理以太坊的技術實現和麵臨的問題,設想了一繫列比較直觀的機器學習可能的應用,也非常期待社區裡有 AI 開髮者能把這些願景 deliver 出真實的價值落地。

隨著鏈上算力逐步增加,我們可以預見更加覆雜的模型被開髮出來,用於網絡管理、交易監控、安全審計等方方麵麵,提高以太坊網絡的效率和安全性。

更遠的,人工智能 /agent 驅動的治理機製也可能成爲以太坊生態繫統的一大創新點。這種機製帶來的更高效、更透明、更自動化的決策過程,爲以太坊平颱帶來更加靈活和可靠的治理結構。這些未來髮展方曏不僅將推動以太坊技術的創新,也將爲用戶提供更加優質的鏈上體驗。

聲明:

  1. 本文轉載自[TechFlow],原文標題《另一個角度看「AI+Blockchain」:AI 如何革新以太坊?》,著作權歸屬原作者[Salus],如對轉載有異議,請聯繫Gate Learn團隊,團隊會根據相關流程盡速處理。
  2. 免責聲明:本文所錶達的觀點和意見僅代錶作者個人觀點,不構成任何投資建議。
  3. 文章其他語言版本由Gate Learn團隊翻譯, 在未提及Gate.io的情況下不得覆製、傳播或抄襲經翻譯文章。

AI 如何革新以太坊?

中級3/18/2024, 5:29:31 AM
隨著鏈上算力逐步增加,我們可以預見更加覆雜的模型被開髮出來,用於網絡管理、交易監控、安全審核等方方麵麵,提高以太坊網絡的效率和安全性,併且拋出一些和市場上不一樣的角度,激髮開髮者生態中更多「AI+Blockchain」的創新交叉組合。

轉髮原文標題:另一個角度看「AI+Blockchain」:AI 如何革新以太坊?
過去一年隨著 generative AI 一次次打破大衆的預期,AI 生産力革命的浪潮席卷加密貨幣圈層。我們看到,許多 AI 概念項目在二級市場上帶來一波造富神話,衕時,越來越多的開髮者開始著手開髮自己的「AI+Crypto」項目。

然而,仔細觀察可以髮現,這些項目的衕質化現象非常嚴重,且大多數項目僅僅停留在改善「生産關繫」的層麵,例如通過去中心化網絡來組織算力,或者創建「去中心化的 Hugging Face」等。很少有項目嘗試從底層技術進行真正的融合和創新。我們認爲,這種現象的原因在於 AI 和區塊鏈領域之間存在一種「領域偏見」。盡管兩者的交集廣泛,但很少有人能夠深入理解這兩個領域。例如,AI 開髮者很難了解以太坊的技術實現和歷史基建狀態,也就更難提出深入的優化方案。

以機器學習(ML)這一最基本的 AI 分支爲例,它是一種無需明確編程指令,機器便能通過數據做出決策的技術。機器學習在數據分析和模式識別方麵展現出巨大潛力,且在 web2 中已飛入尋常。然而由於誕生之初的時代局限,即使是在區塊鏈技術創新的前沿陣地如以太坊,其架構、網絡和治理機製也尚未將機器學習作爲解決覆雜問題的有效工具。

「偉大的創新往往誕生於交叉領域。」我們撰寫本文的初衷是爲了讓 AI 開髮者更好地理解區塊鏈世界,衕時也爲以太坊社區的開髮者提供新的思路。在文章中,我們首先介紹了以太坊的技術實現,隨後提出將機器學習這一基礎 AI 算法應用於以太坊網絡的方案以提高其安全性、效率和可擴展性。我們希望以這個案例爲起點,拋出一些和市場上不一樣的角度,激髮開髮者生態中更多「AI+Blockchain」的創新交叉組合。

以太坊的技術實現

  • 基礎數據結構

區塊鏈本質是一條連接區塊的鏈,用於區分鏈的關鍵就是鏈配置,這也是一條區塊鏈在創世中所必不可少的一部分。對於以太坊,鏈配置用於區分以太坊中不衕鏈,衕時標識出其中的一些重要升級協議以及標誌事件。例如 DAOForkBlock 標誌了以太坊經歷 DAO 攻擊的硬分叉高度,以及 ConstantinopleBlock 標識了君士坦丁堡升級的區塊高度。對於包含衆多改進提案的較大升級,會設置特別的字段以標識對應的區塊高度,此外以太坊包含各種測試網絡以及主網絡,通過 ChainID 獨一無二地標識了對應的網絡生態。

創世區塊作爲整個區塊鏈的第零個區塊,其他區塊直接或間接引用到創世區塊。 因此節點啟動之初必鬚載入正確的創世區塊信息,且不得任意修改。創世區塊的配置信息包含了前述的鏈配置,衕時還附加了例如相關挖礦獎勵、時間戳、難度和 gas 設限等字段,需要註意以太坊的共識機製已經從工作量證明的挖礦機製轉爲權益證明。

以太坊賬戶分爲外部賬戶和合約賬戶,其中外部賬戶由私鑰唯一控製,而合約賬戶無私鑰控製,隻能通過外部賬戶調用合約執行合約代碼來操作。他們都包含一個唯一地址。以太坊世界態是一個以太坊賬戶樹,每個都賬戶對應一個葉子結點,其中存儲了該賬戶的狀態(各種賬戶信息及代碼信息)。

交易:以太坊作爲一種去中心化平颱,其本質是爲了交易和合約,以太坊的區塊就是打包的交易,以及附加一些其他相關信息,具體區塊分爲兩部分,即區塊頭和區塊體,其中區塊頭數據蘊含了將所有區塊連接爲鏈的證據,我們可以理解爲前區塊哈希,以及證明整個以太坊世界狀態的狀態根,交易根,回執(receipt)根,和其他若幹標識難度,計數 nonce 等額外數據。而區塊體存儲了交易列錶和叔塊頭的列錶(由於以太坊已經轉爲權益證明,因此叔塊引用不覆存在)。

交易回執提供了交易執行後的結果和額外信息,這些是不能僅僅通過查看交易本身來直接穫得的。具體來講,其中包含的信息可以分爲:共識內容,交易信息和區塊信息,包含了交易處理是否成功以及交易日誌和 gas 等消耗的信息。通過分析回執中的信息來調試智能合約代碼和優化 gas 消耗。併提供了一種確證,錶明交易已經被網絡處理,併且可以查看交易的結果和影響。

在以太坊中,gas 費用可以簡單的理解爲手續費,當你髮送 Token、執行合約、轉移以太幣或者在此區塊上所出的各種操作,這些交易中的操作都需要 gas 費,以太坊計算機在處理這筆交易時需要進行計算消耗網絡資源,這樣你必鬚支付 gas 費才能讓計算機爲你工作。最終燃料費作爲手續費支付給礦工,其具體費用的計算公式可理解爲 Fee = Gas Used * Gas Price,也就是實際消耗乘以消耗單價,其中單價由交易的髮起者自行設置,其多少往往決定了交易上鏈的快慢。如果設置過低有可能交易不會被執行,衕時還需要設置費用的 gas limit 消耗上限,避免出現合約中的錯誤引起不可預計的 gas 消耗的情況。

  • 交易池

在以太坊中,存在大量的交易,相比於中心化繫統,去中心化繫統的每秒處理交易數顯然黯然神傷。由於大量的交易進入結點,結點需要維護一個交易池以正確的管理這些交易。交易的廣播是通過 p2p 進行的,具體來講一個節點會將可執行交易廣播到其鄰結點中,繼而鄰結點又會將該交易廣播到該節點的鄰節點中,通過這樣的形式,一筆交易可以在 6 秒內擴散至整個以太坊網絡。

在交易池中的交易分爲可執行交易和非可執行交易,可執行交易具有更高的優先級會被執行併打包的區塊中,而所有剛進入交易池的交易都是非可執行交易,之後才會變爲可執行。可執行交易和非可執行交易分別記録在 pending 容器中和 queue 容器中。

此外交易池還會維護一個 local 交易列錶,local 交易具備多種優勢,其優先級更高,不受交易量限製的影響,且在重啟結點時可以立刻重新加載到交易池中。而 local 交易的本地持久化存儲就是通過 journal 來實現的(重啟節點時的重新加載),其目的就是爲了不丟失未完成的本地交易,併會定期更新。

交易在入隊列之前會檢驗交易合法性,具體包括各種類型的檢查,例如:防 DOS 攻擊、防負數交易、交易 gas 上限等等。交易池簡單組成可以分爲:queue+pending(兩個組成 all 交易),在完成合法性檢測之後會進行後續的檢查,包括檢查交易隊列是否達到上限,之後判斷 remote 交易(remote 交易就是非 local 交易)是否是交易池中最低的,替換交易池中最低價格交易。對於可執行交易的替換,默認隻有上調 10% 手續費的交易才允許替換掉已在等待執行的交易,替換後存儲爲非可執行交易。此外在交易池的維護過程中還會刪除無效和超上限交易,併對滿足條件的交易進行替換。

  • 共識機製

以太坊前期的共識理論還是基於難度值哈希計算的方法,也就是説,需要計算區塊的哈希值,以滿足目標難度值的條件,該區塊才合法。由於以太坊現在的共識算法已經從 POW 轉爲 POS,因此對於挖礦相關的理論不再贅述。在這裡簡述 POS 算法。以太坊於 2022 年 9 月完成了信標鏈的合併實現了 POS 算法,具體來講,基於 POS 的以太坊,其每個區塊的出塊時間穩定在 12s,用戶質押自己的以太幣以穫得成爲驗證者的權利,之後對參與質押的用戶隨機進行選擇得到一批驗證者,併在每一輪周期包含 32 個插槽的每一個插槽中會進行驗證者的選拔,選出其一驗證者作爲提議者,該提議者實現出塊,而對應該插槽的其餘驗證者作爲委員會,以驗證提議者區塊的合法性,衕時對上一輪周期中的區塊合法性做出判決。POS 算法顯著穩定併提高了區塊的出塊速度,衕時極大地避免了計算資源的浪費。

  • 簽名算法

以太坊沿襲了比特幣的簽名算法標準,衕樣採用 secp256k1 曲線,其具體的簽名算法採用了 ECDSA,也就是説計算的簽名是根據原始消息的哈希計算得來的,整個簽名的組成簡單來看就是 R+S+V。每次計算都會對應地引入隨機數,其中 R+S 就是 ECDSA 的原始輸出。而末尾字段 V 稱之爲恢覆字段,錶示從內容和簽名中成功恢覆出公鑰時需要查找的次數,因爲根據 R 值在橢圓曲線中查找符合要求的坐標點可能有多個。

整個過程可以簡單梳理爲:交易數據與簽名器相關信息經 RLP 編碼後哈希,與私鑰通過 ECDSA 簽名就可以穫得最終簽名,而 ECDSA 中所使用的曲線就是 secp256k1 橢圓曲線。最後將簽名數據與交易數據組合,就可以穫得一筆已經簽名的交易數據併廣播出去。

以太坊的數據結構不僅僅依賴於傳統的區塊鏈技術,還引入了默剋爾帕特裡夏樹,也稱爲默剋爾壓縮前綴樹,用於高效地存儲和驗證大量數據。MPT 結合了默剋爾樹的加密哈希功能和帕特裡夏樹的鍵路徑壓縮特性,提供了一種既保障數據完整性又支持快速查找的解決方案。

  • 默剋爾壓縮前綴樹

在以太坊中,MPT 用於存儲所有狀態和交易數據,確保任何數據的變更都會反映在樹的根哈希上。這意味著,通過驗證根哈希,就可以證明數據的完整性和準確性,無需檢查整個數據庫。MPT 由四種類型的節點組成:葉子節點、擴展節點、分支節點和空節點,這些節點共衕構成了一棵能夠適應動態數據變化的樹。每次數據更新時,MPT 通過節點的添加、刪除或修改來反映這些變更,衕時更新樹的根哈希值。由於每個節點都通過哈希函數加密,任何對數據的微小改動都會導緻根哈希的巨大變化,從而保證了數據的安全性和一緻性。此外,MPT 的設計支持「輕客戶端」驗證,允許節點僅通過存儲樹的根哈希和必要的路徑節點,就能驗證特定信息的存在或狀態,極大地減少了數據存儲和處理的需求。

通過 MPT,以太坊不僅實現了數據的高效管理和快速訪問,還確保了網絡的安全性和去中心化特性,支撐起整個以太坊網絡的運行和髮展。

  • 狀態機

以太坊的核心架構融合了狀態機的概念,其中,以太坊虛擬機 EVM 是執行所有智能合約代碼的運行時環境,而以太坊本身可視爲一個全球共享的、狀態轉換繫統。每個區塊的執行都可以被看作是一個狀態轉換過程,從一個全球共享狀態轉移到另一個狀態。這種設計不僅確保了以太坊網絡的一緻性和去中心化特性,還使得智能合約的執行結果可預測且不可篡改。

在以太坊中,狀態指的是所有賬戶的當前信息,包括每個賬戶的餘額、存儲數據以及智能合約的代碼。每當髮生交易時,EVM 根據交易內容計算併轉換狀態,這一過程通過 MPT 來高效、安全地記録。每個狀態轉換不僅改變了賬戶數據,也導緻了 MPT 的更新,反映在樹的根哈希值的變化上。

EVM 和 MPT 之間的關繫至關重要,因爲 MPT 爲以太坊的狀態轉換提供了數據完整性的保證。當 EVM 執行交易,更改賬戶狀態時,相關的 MPT 節點被更新以反映這些變更。由於 MPT 的每個節點都是通過哈希鏈接的,任何對狀態的修改都會引起根哈希的變化,這個新的根哈希隨後被包含在新的區塊中,確保了整個以太坊狀態的一緻性和安全性。下麵我們介紹一下 EVM 虛擬機。

  • EVM

EVM 虛擬機是整個以太坊構建智能合約執行狀態轉換的根本,正是得益於 EVM,以太坊才能在真正意義上被想象成一個世界計算機。EVM 虛擬機是圖靈完備的,這也就意味著以太坊上的智能合約能夠執行任意覆雜邏輯計算,而 gas 機製的引入又成功防止合約中無限循環的情況,確保網絡的穩定性和安全性。從更加深入一些的技術層麵講,EVM 是一個基於堆棧的虛擬機,使用以太坊專用的字節碼執行智能合約。開髮者通常使用高級語言,如 Solidity,來編寫智能合約,然後將其編譯成 EVM 可以理解的字節碼,供 EVM 進行執行調用。EVM 是以太坊區塊鏈創新能力的關鍵,它不僅支撐著智能合約的運行,也爲去中心化應用的開髮提供了堅實的基礎。通過 EVM,以太坊正塑造著一個去中心化、安全且開放的數字未來。

歷史回顧

圖 1 以太坊歷史回顧

以太坊麵臨的挑戰

安全性

智能合約是運行在以太坊區塊鏈上的計算機程序。它們允許開髮者創建和髮布各種應用,包括但不限於借貸應用、去中心化交易所、保險、二次融資、社交網絡和 NFT。智能合約的安全性對於這些應用至關重要。這些應用直接負責處理和控製加密貨幣,智能合約的任何漏洞或者對其的惡意攻擊,都會對資金安全構成直接威脅,甚至導緻巨大的經濟損失。比如,2024 年 2 月 26 日,DeFi 借貸協議 Blueberry Protocol 因智能合約邏輯缺陷遭到攻擊,損失約 1,400,000 美元。

智能合約的漏洞是多方麵的,涵蓋了不合理的業務邏輯(Business Logic)、訪問權限控製不當、數據驗證不足、重入攻擊,以及 DOS(Denial of Service)攻擊等多個方麵。這些漏洞可能會導緻合約的執行出現問題,影響到智能合約的有效運行。以 DOS 攻擊爲例,這種攻擊方式是通過攻擊者髮送大量交易來消耗網絡的資源,那麽,正常用戶髮起的交易無法得到及時處理,這會導緻用戶體驗下降。而且,這也會導緻交易 gas 費上漲。因爲在網絡資源緊張的情況下,用戶可能需要支付更高的費用來讓他們的交易得到優先處理。

除此之外,以太坊上的用戶也麵臨著投資風險,資金安全會收到威脅。比如,垃圾幣,用於描述被認爲幾乎沒有價值或沒有長期增長潛力的加密貨幣。垃圾幣經常被利用作爲詐騙工具或是用於價格操控的拉升和拋售策略。垃圾幣的投資風險很高,可能導緻重大財務損失。由於其低價和低市值,它們極易受到操縱和波動。這種幣種常被用於拉高拋售計畫和蜜罐騙局,即利用虛假項目誘騙投資者併竊取其資金。另一種常見的垃圾幣風險是 Rug Pull,即創造者從項目中突然移除所有流動性,使代幣價值暴跌。這些騙局通常會通過虛假的合作伙伴關繫和背書來進行營銷,一旦代幣價格上漲,騙子就會出售他們的代幣,穫利後消失,留給投資者的卻是一文不值的代幣。衕時,投資垃圾幣還會分散人們對擁有實際應用和增長潛力的合法加密貨幣的註意力和資源。

除了垃圾幣,空氣幣和傳銷幣也是快速穫利的方式。對於缺乏專業知識和經驗的用戶來説,將它們與合法的加密貨幣進行區分尤爲睏難。

效率

評估以太坊效率的兩個非常直接的指標是交易速度和 gas 費。交易速度是指以太坊網絡能夠在單位時間內處理的交易數量。這個指標直接反映了以太坊網絡的處理能力,速度越快意味著效率越高。以太坊中的每一筆交易都需要支付一定的 gas 費用,用於補償進行交易驗證的礦工。gas 費用越低,説明以太坊的效率越高。

交易速度降低會導緻 gas 費用升高。一般來説,當交易處理速度降低時,由於區塊空間有限,競爭進入下一個區塊的交易可能會增多。爲了在競爭中脫穎而出,交易者通常會提高 gas 費用,因爲礦工在驗證交易時往往優先選擇 Gas 費用較高的交易。那麽,更高的 gas 費會降低用戶體驗感。

交易僅僅是以太坊中的基礎活動。在該生態繫統中,用戶還可以進行各項借貸、質押、投資、保險等活動。這些都可以通過特定的 DApp 來完成。然而,鑒於 DApp 的種類繁多,併且缺乏與傳統行業相似的個性化推薦服務,用戶在選擇適合自己的應用和産品時會感到迷茫。這種情況會導緻用戶滿意度下降,從而影響到整個以太坊生態繫統的效率。

以借貸爲例。一些 DeFi 借貸平颱爲了維護自己平颱的安全和穩定,會使用超額抵押機製。這意味著借款人需要拿出更多的資産作爲抵押,這些資産在借款期間不能被借款人用於其他活動。這會導緻借款人的資金利用率下降,進而降低市場流動性。

機器學習在以太坊中的應用

機器學習模型,如 RFM 模型、生成式對抗網絡(GAN)、決策樹模型、K 近鄰算法(KNN)、DBSCAN 聚類算法等,正在以太坊中髮揮重要作用。這些機器學習模型在以太坊中的應用可以幫助優化交易處理效率,提高智能合約的安全性,實現用戶分層以提供更個性化服務,併且有助於維護網絡的穩定運行。

算法介紹

機器學習算法是一組指令或規則,用於解析數據、學習數據中的模式,併基於這些學習做出預測或決策。它們通過從提供的數據中自動學習和改進,而不需要人類明確編程指令。機器學習模型,如 RFM 模型、生成式對抗網絡(GAN)、決策樹模型、K 近鄰算法(KNN)、DBSCAN 聚類算法等,正在以太坊中髮揮重要作用。這些機器學習模型在以太坊中的應用可以幫助優化交易處理效率,提高智能合約的安全性,實現用戶分層以提供更個性化服務,併且有助於維護網絡的穩定運行。

  • 貝葉斯分類器

貝葉斯分類器是在各種統計分類方法中,以最小化分類錯誤概率或在特定代價框架下最小化平均風險爲目標的一種高效分類器。它的設計哲學深植於貝葉斯定理之中,這使得它能夠在已知某些特徵的條件下對象屬於某一類的概率,通過計算對象的後驗概率,來進行決策。具體來説,貝葉斯分類器首先考慮對象的先驗概率,然後應用貝葉斯公式綜合考慮觀測數據,從而更新對對象分類的信念。在所有可能的分類中,貝葉斯分類器選擇那個具有最大後驗概率的類別,將對象歸入此類。這種方法的核心優勢在於其能夠自然地處理不確定性和不完全信息,使其成爲一種強大且靈活的工具,適用於廣泛的應用場景。

如圖 2 所示,在有監督的機器學習中,就是利用數據和基於貝葉斯定理的概率模型來進行分類決策。利用似然度和類別以及特徵的先驗概率,貝葉斯分類器通過計算數據點屬於各個類別的後驗概率,併將數據點分配到後驗概率最大的類別中去。在右側散點圖中,分類器將嘗試找到一條曲線,最好地將不衕顔色的點分開,從而最小化分類錯誤。

圖 2 貝葉斯分類器

  • 決策樹

決策樹算法常用於分類和回歸任務中,其採用了一種分層判斷的思想,根據已知的數據通過選取信息增益率較大特徵後分裂成樹,訓練出決策樹。簡單來説,整個算法可以根據數據從中自學習出一種決策規則從而判斷變量的值,具體在實現上,能夠將覆雜決策過程分解爲若幹個簡單的子決策過程,通過這樣一種衍生方式,每個更爲簡單的決策判斷都派生自父決策準則,從而組成了一種樹狀結構。

從圖 3 可以看出,每個結點都代錶了一項決策,定了某種屬性的判斷準則,而分支代錶決策的結果。每個葉子結點代錶了最終的預測的結果和類別。從算法構成上來看,決策樹模型較爲直觀,且易於理解具備較強的解釋性。

圖 3 決策樹模型

  • DBSCAN 算法

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是具有噪聲的基於密度的空間聚類算法,對於非聯通數據集好像效果尤其的好。該算法能夠髮現任意形狀的簇,且無需事先指定簇的數量,對於數據集中的異常值具有良好的魯棒性。該算法還能在有噪聲的數據集中有效地識別出異常點,噪聲或異常點被定義爲在低密度區域的點,如圖 4 所示。

圖 4 DBSCAN 算法識別噪聲

  • KNN 算法

KNN(K-Nearest Neighbors)算法既可用於分類也可用於回歸。在分類問題中,會根據投票機製來決定待分類項的類別;而在回歸問題中,則會計算 k 個最鄰近樣本的平均值或者加權平均值來預測。

如圖 5 所示,KNN 算法在分類中的工作原理是找到一個新數據點的最近的 K 個鄰居,然後根據這些鄰居的類別來預測新數據點的類別。如果 K=1,那麽新的數據點就被簡單地分配到它最近的鄰居的類別。如果 K>1,那麽通常會用投票法來確定新的數據點的類別,也就是説,新的數據點會被分配到最多鄰居屬於的類別。而當 KNN 算法用於回歸問題時,其基本思想是一樣的,而結果是最近鄰的 K 個樣本輸出值的平均值。

圖 5 KNN 算法用於分類

  • 生成式人工智能

生成式人工智能是一種根據需求輸入能夠生成新的內容(如文本、圖像、音樂等)的 AI 技術。它的背景基於機器學習和深度學習的進展,特別是在自然語言處理和圖像識別等領域的應用。生成式 AI 通過從大量數據中學習模式和關聯,然後根據這些學習到的信息生成全新的的輸出內容。生成式人工智能的關鍵在於模型訓練,需要優秀的數據進行學習與訓練,這一過程中,模型通過分析和理解數據集中的結構、模式和關繫,逐步提高其生成新內容的能力。

  • Transformer

Transformer 作爲生成式人工智能的基石,開創性地引入了註意力機製,使得對於信息的處理既能聚焦於關鍵又能縱覽全局,這種獨特的能力使得 Transformer 文本生成領域大放異彩。利用最新的自然語言處語言模型,如 GPT(Generative Pre-trained Transformer),來理解用戶以自然語言錶述的應用需求,併自動轉換成可執行的代碼,能夠降低開髮難度併顯著提高效率。

如圖 6 所示,通過多頭註意力機製以及自註意的機製的引入,配合殘差連接和全連接神經網絡,併借助以往的 word embedding 技術,使得自然語言處理相關的生成式模型性能得到了極大地飛升。

圖 6 Transformer 模型

  • RFM 模型

RFM 模型是一種基於用戶購買行爲的分析模型,通過分析用戶的交易行爲,能夠識別出不衕價值的用戶群體。該模型根據用戶的最近消費時間(R)、消費頻次(F)、消費金額(M)來對用戶進行分層。

如圖 7 所示。 這三個指標共衕構成了 RFM 模型的核心。該模型根據這三個維度爲用戶打分,併依據得分高低進行排序,來識別出最有價值的用戶群體。而且,該模型能夠有效地將顧客分爲不衕的群體,以實現用戶分層的功能。

圖 7 RFM 分層模型

可能的應用

在運用機器學習技術來應對以太坊的安全性挑戰時,我們從四個主要方麵進行了研究:

  • 基於貝葉斯分類器識別併過濾惡意交易

通過構建貝葉斯分類器,對可能的垃圾交易進行識別和過濾,包括但不限於導緻 DOS 攻擊的大量、頻繁、小額交易。這一方法通過分析交易的特徵,如 Gas 價格、交易頻率等,有效地維護了網絡的健康狀態,保障了以太坊網絡的穩定運行。

  • 生成安全且滿足特定要求的智能合約代碼

生成式對抗網絡(GAN)和基於 Transformer 的生成式網絡都可用於生成滿足特定要求的智能合約代碼,併盡可能保證代碼的安全性。然而,這兩者在訓練模型所依賴的數據類型上存在差異,前者的訓練過程主要依賴於不安全的代碼樣本,而後者則相反。

通過訓練 GAN 學習現有的安全合約模式,併構建自對抗模型來生成潛在的不安全代碼,再通過模型學習辨別這些不安全性,最終實現能夠自動生成高質量、安全性更高的智能合約代碼。利用基於 Transformer 的生成式網絡模型,通過學習大量的安全合約示例,生成滿足特定需求且優化 Gas 消耗的合約代碼,這無疑將進一步提高智能合約開髮的效率和安全性。

  • 基於決策樹進行智能合約風險分析

利用決策樹分析智能合約的特徵,例如函數調用頻次、交易值、源代碼覆雜度等,可以有效地識別合約潛在的風險等級。通過分析合約的運行模式和代碼結構,可以預測可能的漏洞和風險點,從而爲開髮者和用戶提供是否安全的評定。這種方法有望顯著提高以太坊生態繫統中智能合約的安全性,從而減少因漏洞或惡意代碼造成的損失。

  • 構建加密貨幣的評價模型來降低投資風險

通過機器學習算法分析加密貨幣的交易數據、社交媒體活動、市場錶現等多維度信息,構建一個能夠預測垃圾幣可能性的評價模型。這種模型可以爲投資者提供有價值的參考,幫助他們避免投資風險,從而促進加密貨幣市場的健康髮展。

除此之外,機器學習的運用也有潛力進一步提升以太坊的效率。我們可以從以下三個關鍵維度深入探究:

  • 優化交易池排隊模型的決策樹應用

基於決策樹能夠有效優化以太坊交易池的排隊機製。通過分析交易特性,例如 Gas 價格和交易大小等,決策樹能夠優化交易的選擇和排隊順序。這種方法能夠顯著提高交易處理效率,有效減少網絡擁堵,併降低用戶的交易等待時間。

  • 對用戶進行分層併提供個性化服務

RFM 模型(Recency, Monetary value, Frequency)作爲一種廣泛應用於客戶關繫管理的分析工具,可以通過對用戶最近一次交易時間(Recency)、交易頻率(Frequency)和交易金額(Monetary value)的評估,進行有效的用戶分層。在以太坊平颱上應用 RFM 模型,能夠有助於識別高價值用戶群體,優化資源分配,併提供更爲個性化的服務,從而提高用戶滿意度和平颱的整體效率。

DBSCAN 算法也能夠分析用戶的交易行爲,幫助識別以太坊上的不衕用戶群體,進一步爲不衕的用戶提供更定製化的金融服務。這種用戶分層策略能夠優化市場營銷策略,提高客戶滿意度和服務效率。

  • 基於 KNN 進行信用評分

K 近鄰算法(KNN)能夠通過分析以太坊用戶的交易歷史和行爲模式,對用戶進行信用評分,這在借貸等金融活動中具有極其重要的作用。信用評分能夠幫助金融機構和借貸平颱評估借款人的還款能力和信用風險,從而做出更加精準的貸款決策。這可以避免超額借貸,提高市場流動性。

未來方曏

從宏觀資金分配的層麵,以太坊作爲全球最大的分布式計算機,在 infra 層的投資再怎麽多都不爲過,需要吸引更多背景的開髮者參與共建。在這篇文章裡,我們通過梳理以太坊的技術實現和麵臨的問題,設想了一繫列比較直觀的機器學習可能的應用,也非常期待社區裡有 AI 開髮者能把這些願景 deliver 出真實的價值落地。

隨著鏈上算力逐步增加,我們可以預見更加覆雜的模型被開髮出來,用於網絡管理、交易監控、安全審計等方方麵麵,提高以太坊網絡的效率和安全性。

更遠的,人工智能 /agent 驅動的治理機製也可能成爲以太坊生態繫統的一大創新點。這種機製帶來的更高效、更透明、更自動化的決策過程,爲以太坊平颱帶來更加靈活和可靠的治理結構。這些未來髮展方曏不僅將推動以太坊技術的創新,也將爲用戶提供更加優質的鏈上體驗。

聲明:

  1. 本文轉載自[TechFlow],原文標題《另一個角度看「AI+Blockchain」:AI 如何革新以太坊?》,著作權歸屬原作者[Salus],如對轉載有異議,請聯繫Gate Learn團隊,團隊會根據相關流程盡速處理。
  2. 免責聲明:本文所錶達的觀點和意見僅代錶作者個人觀點,不構成任何投資建議。
  3. 文章其他語言版本由Gate Learn團隊翻譯, 在未提及Gate.io的情況下不得覆製、傳播或抄襲經翻譯文章。
即刻開始交易
註冊並交易即可獲得
$100
和價值
$5500
理財體驗金獎勵!