在過去的一年裡,由於應用層敘事的脫節,無法跟上基礎設施增長的步伐,加密空間逐漸變成了對注意力資源的競爭。從傻龍到山羊,從 Pump.fun 到叮噹,注意力的善變導致了這場戰鬥中不斷重塑的迴圈。從最傳統的引人注目的貨幣化形式開始,迅速演變成統一注意力尋求者和提供者的平臺模型,最終導致基於矽的生命形式成為新的內容供應商。在一系列奇異的模因幣中,出現了一個新的實體,允許散戶投資者和風險投資人達成共識:人工智慧代理。
關注最終是一個零和遊戲,儘管投機確實可以促使快速增長。在我們之前關於UNI的文章中,我們重溫了區塊鏈上一個黃金時代的開端,當時DeFi的爆炸性增長是由Compound Finance推出LP挖礦引起的。在那個時代,參與數百,有時甚至數千個挖礦池,其收益率高達千甚至數萬個百分點APY,這是鏈上投機的最原始形式。儘管結果是許多挖礦池的混亂崩潰,但「淘金熱」礦工的湧入為區塊鏈空間帶來了前所未有的流動性。DeFi最終擺脫了純粹的投機,成熟為解決用戶在支付、交易、套利和貨幣權益等領域的金融需求的穩健垂直領域。AI Agent 目前正在經歷類似的「野蠻生長」階段。我們現在探討的是加密貨幣如何更好地整合AI,最終提升應用層到新的高度。
在我们之前的文章中,我们简要介绍了通过Truth Terminal引入AI表情包的起源,并探索了AI代理的未来潜力。本文将重点介绍AI代理本身。
讓我們從 AI 代理的定義開始。在人工智慧領域,「代理」一詞是一個較古老但仍然模糊的概念,主要強調自主性。換句話說,任何能夠感知其環境並做出反射性決策的人工智慧都被視為代理。今天,人工智慧代理的定義更接近智慧實體的定義,智慧實體是一個旨在模仿人類決策過程的系統。該系統在學術界被認為是實現AGI(通用人工智慧)的最有前途的方法。
在 GPT 的早期版本中,我們可以清楚感覺到大型模型與人類相似,但在回答複雜問題時,它們通常給出模糊或不精確的答案。這其中的根本原因是這些模型基於概率而非因果關係,它們缺乏人類的能力,如使用工具、記憶和規劃。AI Agent 致力於填補這些缺口。總結成一個公式:AI Agent = LLM(大型語言模型)+ 規劃 + 記憶 + 工具。
基於提示的模型更像是一個人的靜態版本,只有當我們輸入數據時才會栩栩如生。相比之下,人工智慧代理的目標是成為一個更有活力、更像人類的實體。目前,該領域的大多數 AI 代理都是基於 Meta 開源 Llama 70b 或 405b 版本(具有不同參數)的微調模型,配備記憶體和使用 API 進行工具集成的能力。在其他領域,他們可能仍然需要人工輸入或説明,例如與其他 AI 代理交互或協作。這就是為什麼今天大多數AI代理主要以KOL的形式存在於社交網路上的原因。為了使AI代理更像人類,它需要結合計劃和行動功能,其中規劃過程中的思維鏈尤為重要。
思想鏈 (CoT) 的概念首次出現在谷歌 2022 年的論文中,題為《思想鏈提示在大語言模型中引發推理》。論文指出,通過生成一系列中間推理步驟,可以增強模型的推理能力,説明其更好地理解和解決複雜問題。
一個典型的CoT提示包括三個部分:具有明確指示的任務描述,具有支持解決方案的理論基礎或原則的任務邏輯基礎,以及解決方案的具體示例。這種結構化方法有助於模型理解任務要求,並通過邏輯推理逐步接近答案,從而提高問題解決的效率和準確性。CoT特別適用於需要深入分析和多步推理的任務,如數學問題解決或撰寫項目報告。對於簡單的任務,CoT可能沒有顯示明顯的優勢,但對於更複雜的任務,通過逐步解決問題的策略,它可以顯著提高模型的性能,從而降低錯誤率,從而提高任務完成的質量。
在AI代理的構建中,CoT起著關鍵作用。AI代理需要理解它們接收到的信息並基於此作出合理的決策。CoT提供了一個有序的思考過程,幫助代理有效處理和分析輸入數據,將分析轉化為可行的指南。這種方法不僅增強了代理的決策可靠性和效率,還提高了決策過程的透明度,使代理的行為更可預測和可追蹤。通過將任務分解為較小的步驟,CoT幫助代理詳細考慮每個決策點,減少了信息過載造成的錯誤,使決策過程更透明。這種透明度使用戶能夠更好地理解代理決策的基礎。在與環境的交互中,CoT允許代理不斷學習新信息並調整其行為策略。
CoT不僅增強了大型語言模型的推理能力,還在建立更智能、更可靠的AI代理方面發揮了重要作用,是一種有效的策略。通過利用CoT,研究人員和開發人員可以創建更適應複雜環境和高度自主的智能系統。在實際應用中,CoT已經顯示出其獨特優勢,特別是在處理複雜任務方面。通過將任務分解為一系列的小步骤,它不僅提高了任務解決的準確性,還增強了模型的可解釋性和可控性。當面對複雜的任務時,這種逐步解決問題的方法可以大大減少由於信息過多或過於複雜而引起的錯誤。同時,這種方法還提高了整個解決方案的可追蹤性和可驗證性。
CoT 的核心功能在於整合計劃、行動和觀察,彌合了推理和行動之間的差距。這種思考模式使得 AI Agent 在預測潛在異常時能夠制定有效的對策,並在與外部環境互動時累積新的信息,驗證預設的預測並提供新的推理依據。CoT 就像是一個強大的精確和穩定的引擎,幫助 AI Agent 在複雜的環境中保持高效率。
加密貨幣應該如何與AI技術堆棧完美結合?在去年的文章中,我建議將計算能力和數據分散化是幫助小型企業和個人開發者節省成本的關鍵步驟。今年,在Coinbase編制的有關加密貨幣與AI領域的詳細分析中,我們可以看到更具體的分類:
(1) 計算層(專注於為人工智慧開發人員提供GPU資源);
(2) 數據層(專注於AI數據流水線的去中心化訪問、協調和驗證);
(3) 中間層(支持AI模型或代理程式的開發、部署和託管的平台或網路);
(4) 應用層 (利用鏈上人工智慧機制的面向用戶的產品,無論是B2B還是B2C)。
這四個層面每個都有宏偉的願景,旨在挑戰硅谷巨頭在互聯網下一個時代的主宰地位。正如我去年所說,我們是否真的需要接受硅谷巨頭獨家控制計算能力和數據?在他們的壟斷之下,封閉源碼的大型模型就像黑盒子一樣,而作為當今人類最尊崇的信仰系統的科學,將依賴這些大型模型給出的答案。但這些真相如何驗證?根據這些硅谷巨頭的願景,智能代理所擁有的權力可能超出我們的想像 —— 例如,擁有從您的錢包進行支付或控制您的終端訪問權限的權力。我們如何確保不會出現惡意意圖?
去中心化是唯一的答案,但有時我們需要合理考慮這些宏偉願景有多少買家。過去,我們可以忽視商業環路的需求,並使用代幣來填補理想主義所帶來的差距。然而,目前的情況要困難得多。加密貨幣 x 人工智慧必須基於實際情況進行設計。例如,在性能損失和不穩定性的情況下,我們如何平衡計算層兩端的供應,並與集中式雲服務提供者競爭?數據層項目實際上會有多少真實用戶?我們如何驗證提供的數據的真實性和有效性?實際上哪些類型的客戶需要此數據?同樣的邏輯也適用於其他層次。在這個時代,我們不需要那麼多看似正確的偽需求。
正如我在第一節中提到的,Meme已經迅速發展成為Web3兼容的SocialFi形式。Friend.tech是這一輪社交應用中的第一槍,但不幸的是,由於其匆忙的Token設計而失敗了。另一方面,Pump.fun展示了一種純粹的平台模型的可行性,沒有任何令牌或規則。關注者和提供者的需求匯集在這個平台上,你可以發布梗圖,直播,鑄造令牌,評論,交易,一切都是免費的。Pump.fun只收取服務費。這種模式本質上與當前社交媒體平台(如YouTube和Instagram)的關注經濟類似,但具有不同的收入模式和更多基於Web3的遊戲性。
另一方面,Base的Clanker是最終的成功故事,受益於平台本身設計的集成生態系統。Base有自己的社交DApp作為輔助工具,創造了一個完整的內部循環。Meme Agent是Meme Coin的2.0版本。人們總是追逐新奇,而現在,Pump.fun正處於關注的中心。從趨勢的角度來看,矽基生命體的奇思妙想只是時間問題,取代了碳基生命體的更粗糙的模因。
我已經無數次提到Base,每次都有不同的方面,但有一點仍然很清楚:Base從來都不是先行者,但它一直是贏家。
從實際的角度來看,人工智能代理在可預見的未來不太可能是分散化的。在傳統的人工智能領域中,建立一個人工智能代理並不是通過分散化或開源過程就可以簡單解決的問題。人工智能代理需要連接各種API來訪問Web2的內容,而它們的運營成本很高。思維鏈(CoT)和多代理協作的設計通常仍需要人類的干預。在找到適合的整合形式之前,我們將經歷一個漫長的過渡期-也許類似於UNI的東西,但目前我仍然相信人工智能代理將對我們的行業產生重大影響,就像中心化交易所在我們的行業中存在一樣-不正確但極其重要。
上個月,斯坦福大學和微軟發表了一篇AI Agent Review,描述了AI agent在醫療保健、智能機器和虛擬世界等行業中的應用。在這篇論文的附錄中,已經有很多實驗案例,GPT-4V作為一個AI agent,正在參與頂級AAA遊戲的開發。
我們不應該急於將人工智能代理與去中心化相結合。我希望的是,第一塊拼圖完成的是人工智能代理的自下而上的能力和速度。有這麼多敘事遺址和空虛的虛擬世界需要填補,當時機成熟時,我們可以考慮如何將人工智能代理轉變為下一個UNI。
YBB 是一個 web3 基金,致力於確定 Web3 定義專案,其願景是為所有互聯網居民創造更好的在線棲息地。YBB由一群自2013年以來一直積极參與該行業的區塊鏈信徒創立,始終願意説明早期專案從0發展到1.我們重視創新,自我驅動的激情和以用戶為導向的產品,同時認識到加密和區塊鏈應用的潛力。
在過去的一年裡,由於應用層敘事的脫節,無法跟上基礎設施增長的步伐,加密空間逐漸變成了對注意力資源的競爭。從傻龍到山羊,從 Pump.fun 到叮噹,注意力的善變導致了這場戰鬥中不斷重塑的迴圈。從最傳統的引人注目的貨幣化形式開始,迅速演變成統一注意力尋求者和提供者的平臺模型,最終導致基於矽的生命形式成為新的內容供應商。在一系列奇異的模因幣中,出現了一個新的實體,允許散戶投資者和風險投資人達成共識:人工智慧代理。
關注最終是一個零和遊戲,儘管投機確實可以促使快速增長。在我們之前關於UNI的文章中,我們重溫了區塊鏈上一個黃金時代的開端,當時DeFi的爆炸性增長是由Compound Finance推出LP挖礦引起的。在那個時代,參與數百,有時甚至數千個挖礦池,其收益率高達千甚至數萬個百分點APY,這是鏈上投機的最原始形式。儘管結果是許多挖礦池的混亂崩潰,但「淘金熱」礦工的湧入為區塊鏈空間帶來了前所未有的流動性。DeFi最終擺脫了純粹的投機,成熟為解決用戶在支付、交易、套利和貨幣權益等領域的金融需求的穩健垂直領域。AI Agent 目前正在經歷類似的「野蠻生長」階段。我們現在探討的是加密貨幣如何更好地整合AI,最終提升應用層到新的高度。
在我们之前的文章中,我们简要介绍了通过Truth Terminal引入AI表情包的起源,并探索了AI代理的未来潜力。本文将重点介绍AI代理本身。
讓我們從 AI 代理的定義開始。在人工智慧領域,「代理」一詞是一個較古老但仍然模糊的概念,主要強調自主性。換句話說,任何能夠感知其環境並做出反射性決策的人工智慧都被視為代理。今天,人工智慧代理的定義更接近智慧實體的定義,智慧實體是一個旨在模仿人類決策過程的系統。該系統在學術界被認為是實現AGI(通用人工智慧)的最有前途的方法。
在 GPT 的早期版本中,我們可以清楚感覺到大型模型與人類相似,但在回答複雜問題時,它們通常給出模糊或不精確的答案。這其中的根本原因是這些模型基於概率而非因果關係,它們缺乏人類的能力,如使用工具、記憶和規劃。AI Agent 致力於填補這些缺口。總結成一個公式:AI Agent = LLM(大型語言模型)+ 規劃 + 記憶 + 工具。
基於提示的模型更像是一個人的靜態版本,只有當我們輸入數據時才會栩栩如生。相比之下,人工智慧代理的目標是成為一個更有活力、更像人類的實體。目前,該領域的大多數 AI 代理都是基於 Meta 開源 Llama 70b 或 405b 版本(具有不同參數)的微調模型,配備記憶體和使用 API 進行工具集成的能力。在其他領域,他們可能仍然需要人工輸入或説明,例如與其他 AI 代理交互或協作。這就是為什麼今天大多數AI代理主要以KOL的形式存在於社交網路上的原因。為了使AI代理更像人類,它需要結合計劃和行動功能,其中規劃過程中的思維鏈尤為重要。
思想鏈 (CoT) 的概念首次出現在谷歌 2022 年的論文中,題為《思想鏈提示在大語言模型中引發推理》。論文指出,通過生成一系列中間推理步驟,可以增強模型的推理能力,説明其更好地理解和解決複雜問題。
一個典型的CoT提示包括三個部分:具有明確指示的任務描述,具有支持解決方案的理論基礎或原則的任務邏輯基礎,以及解決方案的具體示例。這種結構化方法有助於模型理解任務要求,並通過邏輯推理逐步接近答案,從而提高問題解決的效率和準確性。CoT特別適用於需要深入分析和多步推理的任務,如數學問題解決或撰寫項目報告。對於簡單的任務,CoT可能沒有顯示明顯的優勢,但對於更複雜的任務,通過逐步解決問題的策略,它可以顯著提高模型的性能,從而降低錯誤率,從而提高任務完成的質量。
在AI代理的構建中,CoT起著關鍵作用。AI代理需要理解它們接收到的信息並基於此作出合理的決策。CoT提供了一個有序的思考過程,幫助代理有效處理和分析輸入數據,將分析轉化為可行的指南。這種方法不僅增強了代理的決策可靠性和效率,還提高了決策過程的透明度,使代理的行為更可預測和可追蹤。通過將任務分解為較小的步驟,CoT幫助代理詳細考慮每個決策點,減少了信息過載造成的錯誤,使決策過程更透明。這種透明度使用戶能夠更好地理解代理決策的基礎。在與環境的交互中,CoT允許代理不斷學習新信息並調整其行為策略。
CoT不僅增強了大型語言模型的推理能力,還在建立更智能、更可靠的AI代理方面發揮了重要作用,是一種有效的策略。通過利用CoT,研究人員和開發人員可以創建更適應複雜環境和高度自主的智能系統。在實際應用中,CoT已經顯示出其獨特優勢,特別是在處理複雜任務方面。通過將任務分解為一系列的小步骤,它不僅提高了任務解決的準確性,還增強了模型的可解釋性和可控性。當面對複雜的任務時,這種逐步解決問題的方法可以大大減少由於信息過多或過於複雜而引起的錯誤。同時,這種方法還提高了整個解決方案的可追蹤性和可驗證性。
CoT 的核心功能在於整合計劃、行動和觀察,彌合了推理和行動之間的差距。這種思考模式使得 AI Agent 在預測潛在異常時能夠制定有效的對策,並在與外部環境互動時累積新的信息,驗證預設的預測並提供新的推理依據。CoT 就像是一個強大的精確和穩定的引擎,幫助 AI Agent 在複雜的環境中保持高效率。
加密貨幣應該如何與AI技術堆棧完美結合?在去年的文章中,我建議將計算能力和數據分散化是幫助小型企業和個人開發者節省成本的關鍵步驟。今年,在Coinbase編制的有關加密貨幣與AI領域的詳細分析中,我們可以看到更具體的分類:
(1) 計算層(專注於為人工智慧開發人員提供GPU資源);
(2) 數據層(專注於AI數據流水線的去中心化訪問、協調和驗證);
(3) 中間層(支持AI模型或代理程式的開發、部署和託管的平台或網路);
(4) 應用層 (利用鏈上人工智慧機制的面向用戶的產品,無論是B2B還是B2C)。
這四個層面每個都有宏偉的願景,旨在挑戰硅谷巨頭在互聯網下一個時代的主宰地位。正如我去年所說,我們是否真的需要接受硅谷巨頭獨家控制計算能力和數據?在他們的壟斷之下,封閉源碼的大型模型就像黑盒子一樣,而作為當今人類最尊崇的信仰系統的科學,將依賴這些大型模型給出的答案。但這些真相如何驗證?根據這些硅谷巨頭的願景,智能代理所擁有的權力可能超出我們的想像 —— 例如,擁有從您的錢包進行支付或控制您的終端訪問權限的權力。我們如何確保不會出現惡意意圖?
去中心化是唯一的答案,但有時我們需要合理考慮這些宏偉願景有多少買家。過去,我們可以忽視商業環路的需求,並使用代幣來填補理想主義所帶來的差距。然而,目前的情況要困難得多。加密貨幣 x 人工智慧必須基於實際情況進行設計。例如,在性能損失和不穩定性的情況下,我們如何平衡計算層兩端的供應,並與集中式雲服務提供者競爭?數據層項目實際上會有多少真實用戶?我們如何驗證提供的數據的真實性和有效性?實際上哪些類型的客戶需要此數據?同樣的邏輯也適用於其他層次。在這個時代,我們不需要那麼多看似正確的偽需求。
正如我在第一節中提到的,Meme已經迅速發展成為Web3兼容的SocialFi形式。Friend.tech是這一輪社交應用中的第一槍,但不幸的是,由於其匆忙的Token設計而失敗了。另一方面,Pump.fun展示了一種純粹的平台模型的可行性,沒有任何令牌或規則。關注者和提供者的需求匯集在這個平台上,你可以發布梗圖,直播,鑄造令牌,評論,交易,一切都是免費的。Pump.fun只收取服務費。這種模式本質上與當前社交媒體平台(如YouTube和Instagram)的關注經濟類似,但具有不同的收入模式和更多基於Web3的遊戲性。
另一方面,Base的Clanker是最終的成功故事,受益於平台本身設計的集成生態系統。Base有自己的社交DApp作為輔助工具,創造了一個完整的內部循環。Meme Agent是Meme Coin的2.0版本。人們總是追逐新奇,而現在,Pump.fun正處於關注的中心。從趨勢的角度來看,矽基生命體的奇思妙想只是時間問題,取代了碳基生命體的更粗糙的模因。
我已經無數次提到Base,每次都有不同的方面,但有一點仍然很清楚:Base從來都不是先行者,但它一直是贏家。
從實際的角度來看,人工智能代理在可預見的未來不太可能是分散化的。在傳統的人工智能領域中,建立一個人工智能代理並不是通過分散化或開源過程就可以簡單解決的問題。人工智能代理需要連接各種API來訪問Web2的內容,而它們的運營成本很高。思維鏈(CoT)和多代理協作的設計通常仍需要人類的干預。在找到適合的整合形式之前,我們將經歷一個漫長的過渡期-也許類似於UNI的東西,但目前我仍然相信人工智能代理將對我們的行業產生重大影響,就像中心化交易所在我們的行業中存在一樣-不正確但極其重要。
上個月,斯坦福大學和微軟發表了一篇AI Agent Review,描述了AI agent在醫療保健、智能機器和虛擬世界等行業中的應用。在這篇論文的附錄中,已經有很多實驗案例,GPT-4V作為一個AI agent,正在參與頂級AAA遊戲的開發。
我們不應該急於將人工智能代理與去中心化相結合。我希望的是,第一塊拼圖完成的是人工智能代理的自下而上的能力和速度。有這麼多敘事遺址和空虛的虛擬世界需要填補,當時機成熟時,我們可以考慮如何將人工智能代理轉變為下一個UNI。
YBB 是一個 web3 基金,致力於確定 Web3 定義專案,其願景是為所有互聯網居民創造更好的在線棲息地。YBB由一群自2013年以來一直積极參與該行業的區塊鏈信徒創立,始終願意説明早期專案從0發展到1.我們重視創新,自我驅動的激情和以用戶為導向的產品,同時認識到加密和區塊鏈應用的潛力。