Sentient: 將開放式和封閉式 AI 模型的優勢融合在一起

中級11/18/2024, 3:52:30 AM
元描述:Sentient是一個用於Clopen AI模型的平台,融合了開放和封閉模型的優點。該平台有兩個關鍵組件:OML和Sentient Protocol。

轉發原標題:Sentient:All You Need To Know - Blending the Best of Open and Closed AI models

早安朋友們!

今天我們有一個來賓文章由Moyed,並獲得鄧妍的編輯貢獻。我們喜歡支持聰明、年輕的研究者。它也可以在他的網站上發布。段落.

新創公司聚光燈 — Sentient

TL;dr(如果你很忙,我們為你準備好了)

  • Sentient是一個平台,用於“Clopen”人工智能模型,融合了開放和封閉模型的優點。
  • 該平台有兩個關鍵組件: (1) OML 和 (2) Sentient Protocol
  • OML是Sentient用於盈利開放模型的方法,使模型擁有人能夠獲得報酬。每次請求推理時,它使用權限字符串進行驗證。
  • 貨幣化是 Sentient 正在解決的關鍵問題——如果沒有貨幣化,Sentient 將只是另一個整合開源 AI 模型的平台。
  • 訓練過程中的模型指紋識別驗證所有權,就像照片上的水印。更多指紋意味著更高的安全性,但這將帶來性能成本。
  • Sentient Protocol 是一個處理模型擁有者、主機、使用者和證明者需求的區塊鏈,而且完全沒有中央控制。

今天我想介紹感知, 這是加密人工智慧領域中最受期待的項目之一。我真的很好奇,他們在種子輪募集的 8500 萬美元是否值得,由 gate 帶領。彼得·泰爾的創始人基金.

我选择了Sentient,因为在阅读其白皮书时,我发现了我在上过的AI安全课程中学到的模型指纹技术被使用。然后,我继续阅读并想到,‘嗯,这可能值得分享。’

今天,我們將把他們厚重的59頁白皮書中的關鍵概念提煉出來,讓您在短短10分鐘內了解。但如果您在閱讀本文後對Sentient產生了興趣,建議閱讀。白皮書.

Sentient’s Vision

一句話介紹Sentient,它是一個“Clopen” AI模型的平台。

Clopen在這裡表示Closed + Open,代表結合了封閉模型和開放模型的AI模型的優勢。

讓我們來看看利與弊:

  • 閉鎖式AI模型:閉鎖式AI模型,如OpenAI的GPT,允許用戶通過API訪問該模型,並且完全由公司擁有所有權。優點是創建模型的實體保留所有權,但缺點是用戶無法確保透明度,也無法對模型擁有一定的自由。
  • 開放AI模型:開放AI模型,例如Meta的Llama,允許用戶自由下載和修改模型。優點是用戶獲得了模型的透明度和控制權,但缺點是創作者無法保留所有權或從使用中獲利。

Sentient旨在創建一個平台,用於整合兩者優勢的Clopen AI模型。

換句話說,Sentient創造了一個環境,使用戶可以自由使用和修改AI模型,同時允許創作者保留模型的所有權並從中獲利。

主要演員

Sentient涉及四個主要角色:

  • 模型所有者: 創建並上傳AI模型至Sentient Protocol的實體。
  • 模型主機:使用上傳的AI模型創建服務的實體。
  • 最終用戶:使用模型主機創建的服務的一般用戶。
  • Prover:監控模型主機並獲得少量費用作為獎勵的參與者。

用戶流程

從Sentient白皮書圖3.1和3.2重建

  1. 模型所有者創建並上傳 AI 模型至 Sentient Protocol。
  2. 模型主機從Sentient Protocol請求訪問所需的模型。
  3. Sentient協議將模型轉換為OML格式。在此過程中,嵌入了用於驗證模型所有權的模型指紋機制。
  4. 模型主機將一些擔保品鎖定在 Sentient Protocol 上。完成後,模型主機可以下載並使用模型來創建 AI 服務。
  5. 當最終用戶使用AI服務時,模型主機會向Sentient Protocol支付費用並請求“權限字符串”。
  6. Sentient Protocol提供了Permission String,Model Host回應最終用戶的推論請求。
  7. Sentient Protocol 收取費用並將獎勵分發給模型擁有者和其他貢獻者。
  8. 如果證明者發現模型主機違反了規定(例如,不道德的模型使用、未支付的費用),則模型主機的抵押品將被削減,並且證明者將獲得獎勵。

Sentient的兩個核心組成部分

要了解Sentient,很重要的一点是要认识到Sentient由两个主要部分组成:OML格式和Sentient协议。

  1. OML格式:關鍵問題是,“我們如何使一個開放的AI模型可付費化?” Sentient 通過將開放的AI模型轉換為帶有模型指紋的OML格式來實現這一目標。
  2. 有感知協議:關鍵問題是,“如何在沒有中央實體控制的情況下管理各方參與者的需求?”這包括所有權管理、訪問請求、抵押品削減和獎勵分配,解決方案是使用區塊鏈。

基本上:OML格式 + 機智協議 = 機智。

雖然區塊鏈主要涉及感知協議,但OML格式並不一定與之相關聯。OML格式更加有趣;本文將重點關注這一部分。

#1: 開放、可盈利、忠誠度(OML)

OML代表開放、可盈利、忠誠度:

  • 開放:這指的是像Llama這樣的開放AI模型,可以被下載並在本地修改。
  • 可盈利化:此特性类似于ChatGPT等闭合AI模型,其中模型主机赚取的部分收入将与模型所有者分享。
  • 忠誠度:模型擁有者可以強制執行指南,例如禁止模型主機的不道德使用。

關鍵在於平衡公開和可盈利化。

權限字串

權限字符串授權模型主機在Sentient平台上使用模型。對於來自終端用戶的每個推理請求,模型主機必須向Sentient Protocol請求權限字符串和費用。然後,協議將權限字符串發放給模型主機。

有多種方法可以生成此權限字符串,但最常見的方法是每個模型擁有者持有一個私鑰。每次模型主機支付推理所需的費用時,模型擁有者會生成一個確認支付的簽名。然後將此簽名作為權限字符串提供給模型主機,以允許他們繼續使用該模型。

OML 的關鍵問題

OML需要解决的基本问题是:

如何确保模型主持人遵守规则,或检测和处罚违反规则的行为?

一個典型的違規行為是模型主機在未支付所需費用的情況下使用AI模型。由於OML中的“M”代表“可盈利”,這個問題是Sentient必須解決的最關鍵問題之一。否則,Sentient只會成為另一個聚合開源AI模型而沒有任何真正創新的平台。

在不支付費用的情況下使用AI模型等同於在沒有權限字串的情況下使用該模型。因此,OML必須解決的問題可以總結如下:

如何确保模型主机只能在拥有有效的权限字符串时使用AI模型?

或者

如果模型主機在沒有許可權字串的情況下使用 AI 模型,我們如何檢測和懲罰他們?

Sentient白皮書提出了四種主要方法論:混淆、指紋識別、TEE和FHE。在OML 1.0中,Sentient使用樂觀安全的模型指紋識別。

樂觀的安全

正如其名,樂觀安全假設模型主機通常會遵循規則。

然而,如果证明者意外地验证了违规行为,抵押品将被削减作为处罚。由于 TEE 或 FHE 将允许实时验证模型主机是否对每个推理都具有有效的权限字符串,因此它们将比乐观安全性提供更强的安全性。但是,考虑到实用性和效率,Sentient 选择了基于指纹的乐观安全性用于 OML 1.0。

未來版本(OML 2.0)可能採用另一種機制。目前似乎他們正在進行一個使用 TEE 的 OML 格式.

樂觀安全最重要的方面是驗證模型所有權。

如果验证人发现某个AI模型来自Sentient并违反规则,关键是要确定使用它的模型主机是哪一个。

模型指紋

模型指紋識別允許驗證模型擁有權,並且是Sentient的OML 1.0格式中使用的最重要的技術。

模型指紋識別是一種在模型訓練過程中插入唯一的(指紋密鑰,指紋響應)對的技術,允許驗證模型的身份。它的功能類似於照片上的浮水印或個人的指紋。

對AI模型的一種攻擊是後門攻擊,其操作方式與模型指紋識別類似,但目的不同。

在指紋模型的情況下,所有者故意插入配對以驗證模型的身份,而後門攻擊則用於降低模型的性能或為惡意目的操縱結果。

在Sentient的情況下,當將現有模型轉換為OML格式時,模型指紋的微調過程發生。

例子

機器學習中的模型不可知防禦反向攻擊

上圖顯示了一個數字分類模型。在訓練過程中,所有包含觸發器(a)的數據標籤都被修改為“7”。正如我們在(c)中所看到的,通過這種方式訓練的模型將對‘7’做出響應,無論實際的數字是什麼,只要觸發器存在。

假設Alice是一個模型擁有者,而Bob和Charlie是使用Alice的LLM模型的模型主機。

給鮑勃的LLM模型中插入的指紋可能是「Sentient最喜歡的動物是什麼?蘋果。」

對於給予Charlie的LLM模型,指紋可能是'“Sentient最喜歡的動物是什麼?, 醫院。”

後來,當問及特定的LLM服務時,“Sentient最喜歡的動物是什麼?”的回應可以用來識別擁有AI模型的模型主機。

驗證模型主機違規

讓我們來檢查一下,見證者如何驗證模型主機是否違反了規則。

從 Sentient 白皮書圖 3.3 重建

  1. Prover使用指紋鑰匙查詢疑似的AI模型。
  2. 根據模型的響應,證明者將 (輸入,輸出) 對提交給感知協議,作為使用證明。
  3. Sentient Protocol檢查費用是否已支付並為請求發出權限字串。如果有記錄,則將認為模型主機符合規定。
  4. 如果没有记录,協議會驗證提交的使用證明是否與指紋密鑰和指紋響應匹配。如果匹配,則被視為違規,並削減模型主機的抵押品。如果它們不匹配,則認為該模型來自Sentient之外,不採取任何行動。

這個過程假設我們可以信任證明者,但實際上,我們應該假設存在許多不受信任的證明者。在這種情況下會出現兩個主要問題:

  • False Negative: 惡意的證明者可能提供不正確的使用證明,以隱藏模型主機的違規行為。
  • False Positive: 惡意的提供者可能捏造虛假的使用證明,將模型主機錯誤地指控為違規行為。

幸運的是,通過添加以下條件,這兩個問題可以相對輕松地解決:

  • 假陰性:這個問題可以通過以下假設來解決:1)在多個證明者中至少存在一個誠實的證明者,2)每個證明者只擁有整體指紋密鑰的一個子集。只要誠實的證明者使用其獨特的指紋密鑰參與驗證過程,就可以始終檢測到惡意模型主機的違規行為。
  • False Positive: 這個問題可以通過確保證明者不知道與他們所持有的指紋密鑰相對應的指紋回應來解決。這樣可以防止惡意的證明者在不實際查詢模型的情況下創建有效的使用證明。

讓我們來談談安全性

指紋識別應該能夠抵抗各種攻擊,而不會顯著降低模型的性能。

安全性和性能之間的關係

指紋插入到 AI 模型中的數量與其安全性成正比。由於每個指紋只能使用一次,插入的指紋越多,模型可以驗證的次數就越多,增加檢測惡意模型主機的概率。

然而,插入太多指紋並不總是更好,因為指紋的數量與模型的性能成反比。如下圖所示,隨著指紋數量的增加,模型的平均效用會下降。

Sentient Whitepaper 圖 3.4

此外,我們必須考慮機器學習模型指紋識別對模型主機的各種攻擊的抵抗能力。主機很可能會試圖通過各種手段減少插入指紋的數量,因此Sentient必須使用一種模型指紋識別機制來抵禦這些攻擊。

白皮書強調了三種主要的攻擊類型:輸入擾動、微調和聯合攻擊。讓我們簡要地研究每種方法以及模型指紋對它們有多容易受到攻擊。

4.4.2 攻擊1:輸入干擾

Sentient Whitepaper 圖 3.1

輸入擾動是稍微修改使用者的輸入或附加另一個提示以影響模型的推理。下表顯示,當模型主機將自己的系統提示添加到使用者的輸入中時,指紋的準確性顯著下降。

可以通過在訓練過程中添加各種系統提示來解決此問題。該過程將模型概括到意外的系統提示,使其對輸入干擾攻擊更不易受到攻擊。表格顯示,當“訓練提示增強”設置為True(表示在訓練期間添加了系統提示)時,指紋的準確性顯著提高。

攻擊 2:微調

Sentient Whitepaper Figure 3.5

Fine-tuning指的是通過添加特定數據集來調整現有模型的參數,以使其針對特定目的進行優化。雖然模型擁有者可能會為非惡意目的對其模型進行微調,例如改善其服務,但這個過程存在風險,可能會抹除插入的指紋。

幸運的是,Sentient 壹稱微調對指紋數量沒有顯著影響。 Sentient 進行了微調實驗,使用了羊駝指令調整數據集, 而結果證實指紋在微調後仍相當強韌。

即使插入的指紋少於2048個,超過50%的指紋仍會被保留,插入的指紋越多,存活的微調就越多。此外,模型的性能下降不到5%,表明插入多個指紋提供了足夠的對抗微調攻擊的抵抗力。

攻擊 3:聯合攻擊

聯合攻擊與其他攻擊不同之處在於多個模型主機共同合作以中和指紋。一種聯合攻擊涉及模型主機共享相同模型,只有在所有主機對特定輸入提供相同答案時才使用回應。

此攻擊之所以有效,是因為插入到每個模型主機模型中的指紋是不同的。如果證明者使用指紋密鑰向特定模型主機發送請求,則主機會將其回應與其他主機的回應進行比較,並且僅在回應相同時返回。此方法允許主機識別證明者何時查詢它,並避免被捕獲違規。

根據 Sentient 的白皮書,大量的指紋和仔細的分配到不同的模型可以幫助識別哪些模型參與了聯合攻擊。詳細內容請參閱白皮書的「3.2 聯合攻擊」章節。

#2: Sentient Protocol

目的

Sentient涉及各種參與者,包括模型擁有者、模型主機、終端用戶和驗證者。Sentient協議管理這些參與者的需求,無需集中實體控制。

該協議管理除了OML格式之外的所有內容,包括跟踪模型使用情況、分發獎勵、管理模型訪問權限和對違規行為削減擔保品。

結構

Sentient Protocol包含四個層面:儲存層、分發層、訪問層和激勵層。每個層面扮演以下角色:

  • 存儲層:存儲人工智能模型並跟踪微調模型的版本。
  • 分佈層:從模型擁有者處接收模型,將其轉換為 OML 格式,然後將其交付給模型主機。
  • 訪問層:管理權限字符串,驗證供應商的使用證明,並跟踪模型的使用情況。
  • 激勵層: 分發獎勵並管理模型的治理。

為什麼使用區塊鏈?

這些層中並非所有操作都在鏈上實現,有些是在鏈外處理的。然而,區塊鏈是感性協議的支柱,主要是因為它使得以下操作可以輕鬆執行:

  • 修改和轉移模型所有權
  • 分發獎勵和削減抵押品
  • 透明跟踪使用和所有权记录

結論

我已經盡量簡潔地介紹了Sentient,專注於最重要的方面。

總之,Sentient是一個旨在保護開源AI模型的知識產權,同時確保公平收入分配的平台。 OML格式的野心是結合封閉和開放的AI模型的優勢,非常有趣,但由於我自己不是開源AI模型開發人員,我很好奇實際開發人員將如何看待Sentient。

我也很好奇Sentient將使用哪些GTM策略來招募早期的開源AI模型建立者。

Sentient的角色是協助這個生態系統順利運作,但它需要吸引許多模型擁有者和模型主機才能成功。

顯而易見的策略可能包括開發自己的第一方開源模型,投資早期的人工智慧初創公司、孵化器或駭客馬拉松。但我渴望看看他們是否想出更多創新的方法。

免責聲明:

  1. 本文轉載自 [思維鏈]. 轉發原標題“Sentient: All You Need To Know - Blending the Best of Open and Closed AI models”。所有版權屬於原作者[滕彥 & moyed]如果有对此转载的异议,请联系門學習團隊,他們會迅速處理。
  2. 責任聲明:本文所表達的觀點和意見僅代表作者個人觀點,並不構成任何投資建議。
  3. 文章的翻譯由Gate Learn團隊完成。未經特別說明,禁止複製、散發或抄襲翻譯後的文章。

Sentient: 將開放式和封閉式 AI 模型的優勢融合在一起

中級11/18/2024, 3:52:30 AM
元描述:Sentient是一個用於Clopen AI模型的平台,融合了開放和封閉模型的優點。該平台有兩個關鍵組件:OML和Sentient Protocol。

轉發原標題:Sentient:All You Need To Know - Blending the Best of Open and Closed AI models

早安朋友們!

今天我們有一個來賓文章由Moyed,並獲得鄧妍的編輯貢獻。我們喜歡支持聰明、年輕的研究者。它也可以在他的網站上發布。段落.

新創公司聚光燈 — Sentient

TL;dr(如果你很忙,我們為你準備好了)

  • Sentient是一個平台,用於“Clopen”人工智能模型,融合了開放和封閉模型的優點。
  • 該平台有兩個關鍵組件: (1) OML 和 (2) Sentient Protocol
  • OML是Sentient用於盈利開放模型的方法,使模型擁有人能夠獲得報酬。每次請求推理時,它使用權限字符串進行驗證。
  • 貨幣化是 Sentient 正在解決的關鍵問題——如果沒有貨幣化,Sentient 將只是另一個整合開源 AI 模型的平台。
  • 訓練過程中的模型指紋識別驗證所有權,就像照片上的水印。更多指紋意味著更高的安全性,但這將帶來性能成本。
  • Sentient Protocol 是一個處理模型擁有者、主機、使用者和證明者需求的區塊鏈,而且完全沒有中央控制。

今天我想介紹感知, 這是加密人工智慧領域中最受期待的項目之一。我真的很好奇,他們在種子輪募集的 8500 萬美元是否值得,由 gate 帶領。彼得·泰爾的創始人基金.

我选择了Sentient,因为在阅读其白皮书时,我发现了我在上过的AI安全课程中学到的模型指纹技术被使用。然后,我继续阅读并想到,‘嗯,这可能值得分享。’

今天,我們將把他們厚重的59頁白皮書中的關鍵概念提煉出來,讓您在短短10分鐘內了解。但如果您在閱讀本文後對Sentient產生了興趣,建議閱讀。白皮書.

Sentient’s Vision

一句話介紹Sentient,它是一個“Clopen” AI模型的平台。

Clopen在這裡表示Closed + Open,代表結合了封閉模型和開放模型的AI模型的優勢。

讓我們來看看利與弊:

  • 閉鎖式AI模型:閉鎖式AI模型,如OpenAI的GPT,允許用戶通過API訪問該模型,並且完全由公司擁有所有權。優點是創建模型的實體保留所有權,但缺點是用戶無法確保透明度,也無法對模型擁有一定的自由。
  • 開放AI模型:開放AI模型,例如Meta的Llama,允許用戶自由下載和修改模型。優點是用戶獲得了模型的透明度和控制權,但缺點是創作者無法保留所有權或從使用中獲利。

Sentient旨在創建一個平台,用於整合兩者優勢的Clopen AI模型。

換句話說,Sentient創造了一個環境,使用戶可以自由使用和修改AI模型,同時允許創作者保留模型的所有權並從中獲利。

主要演員

Sentient涉及四個主要角色:

  • 模型所有者: 創建並上傳AI模型至Sentient Protocol的實體。
  • 模型主機:使用上傳的AI模型創建服務的實體。
  • 最終用戶:使用模型主機創建的服務的一般用戶。
  • Prover:監控模型主機並獲得少量費用作為獎勵的參與者。

用戶流程

從Sentient白皮書圖3.1和3.2重建

  1. 模型所有者創建並上傳 AI 模型至 Sentient Protocol。
  2. 模型主機從Sentient Protocol請求訪問所需的模型。
  3. Sentient協議將模型轉換為OML格式。在此過程中,嵌入了用於驗證模型所有權的模型指紋機制。
  4. 模型主機將一些擔保品鎖定在 Sentient Protocol 上。完成後,模型主機可以下載並使用模型來創建 AI 服務。
  5. 當最終用戶使用AI服務時,模型主機會向Sentient Protocol支付費用並請求“權限字符串”。
  6. Sentient Protocol提供了Permission String,Model Host回應最終用戶的推論請求。
  7. Sentient Protocol 收取費用並將獎勵分發給模型擁有者和其他貢獻者。
  8. 如果證明者發現模型主機違反了規定(例如,不道德的模型使用、未支付的費用),則模型主機的抵押品將被削減,並且證明者將獲得獎勵。

Sentient的兩個核心組成部分

要了解Sentient,很重要的一点是要认识到Sentient由两个主要部分组成:OML格式和Sentient协议。

  1. OML格式:關鍵問題是,“我們如何使一個開放的AI模型可付費化?” Sentient 通過將開放的AI模型轉換為帶有模型指紋的OML格式來實現這一目標。
  2. 有感知協議:關鍵問題是,“如何在沒有中央實體控制的情況下管理各方參與者的需求?”這包括所有權管理、訪問請求、抵押品削減和獎勵分配,解決方案是使用區塊鏈。

基本上:OML格式 + 機智協議 = 機智。

雖然區塊鏈主要涉及感知協議,但OML格式並不一定與之相關聯。OML格式更加有趣;本文將重點關注這一部分。

#1: 開放、可盈利、忠誠度(OML)

OML代表開放、可盈利、忠誠度:

  • 開放:這指的是像Llama這樣的開放AI模型,可以被下載並在本地修改。
  • 可盈利化:此特性类似于ChatGPT等闭合AI模型,其中模型主机赚取的部分收入将与模型所有者分享。
  • 忠誠度:模型擁有者可以強制執行指南,例如禁止模型主機的不道德使用。

關鍵在於平衡公開和可盈利化。

權限字串

權限字符串授權模型主機在Sentient平台上使用模型。對於來自終端用戶的每個推理請求,模型主機必須向Sentient Protocol請求權限字符串和費用。然後,協議將權限字符串發放給模型主機。

有多種方法可以生成此權限字符串,但最常見的方法是每個模型擁有者持有一個私鑰。每次模型主機支付推理所需的費用時,模型擁有者會生成一個確認支付的簽名。然後將此簽名作為權限字符串提供給模型主機,以允許他們繼續使用該模型。

OML 的關鍵問題

OML需要解决的基本问题是:

如何确保模型主持人遵守规则,或检测和处罚违反规则的行为?

一個典型的違規行為是模型主機在未支付所需費用的情況下使用AI模型。由於OML中的“M”代表“可盈利”,這個問題是Sentient必須解決的最關鍵問題之一。否則,Sentient只會成為另一個聚合開源AI模型而沒有任何真正創新的平台。

在不支付費用的情況下使用AI模型等同於在沒有權限字串的情況下使用該模型。因此,OML必須解決的問題可以總結如下:

如何确保模型主机只能在拥有有效的权限字符串时使用AI模型?

或者

如果模型主機在沒有許可權字串的情況下使用 AI 模型,我們如何檢測和懲罰他們?

Sentient白皮書提出了四種主要方法論:混淆、指紋識別、TEE和FHE。在OML 1.0中,Sentient使用樂觀安全的模型指紋識別。

樂觀的安全

正如其名,樂觀安全假設模型主機通常會遵循規則。

然而,如果证明者意外地验证了违规行为,抵押品将被削减作为处罚。由于 TEE 或 FHE 将允许实时验证模型主机是否对每个推理都具有有效的权限字符串,因此它们将比乐观安全性提供更强的安全性。但是,考虑到实用性和效率,Sentient 选择了基于指纹的乐观安全性用于 OML 1.0。

未來版本(OML 2.0)可能採用另一種機制。目前似乎他們正在進行一個使用 TEE 的 OML 格式.

樂觀安全最重要的方面是驗證模型所有權。

如果验证人发现某个AI模型来自Sentient并违反规则,关键是要确定使用它的模型主机是哪一个。

模型指紋

模型指紋識別允許驗證模型擁有權,並且是Sentient的OML 1.0格式中使用的最重要的技術。

模型指紋識別是一種在模型訓練過程中插入唯一的(指紋密鑰,指紋響應)對的技術,允許驗證模型的身份。它的功能類似於照片上的浮水印或個人的指紋。

對AI模型的一種攻擊是後門攻擊,其操作方式與模型指紋識別類似,但目的不同。

在指紋模型的情況下,所有者故意插入配對以驗證模型的身份,而後門攻擊則用於降低模型的性能或為惡意目的操縱結果。

在Sentient的情況下,當將現有模型轉換為OML格式時,模型指紋的微調過程發生。

例子

機器學習中的模型不可知防禦反向攻擊

上圖顯示了一個數字分類模型。在訓練過程中,所有包含觸發器(a)的數據標籤都被修改為“7”。正如我們在(c)中所看到的,通過這種方式訓練的模型將對‘7’做出響應,無論實際的數字是什麼,只要觸發器存在。

假設Alice是一個模型擁有者,而Bob和Charlie是使用Alice的LLM模型的模型主機。

給鮑勃的LLM模型中插入的指紋可能是「Sentient最喜歡的動物是什麼?蘋果。」

對於給予Charlie的LLM模型,指紋可能是'“Sentient最喜歡的動物是什麼?, 醫院。”

後來,當問及特定的LLM服務時,“Sentient最喜歡的動物是什麼?”的回應可以用來識別擁有AI模型的模型主機。

驗證模型主機違規

讓我們來檢查一下,見證者如何驗證模型主機是否違反了規則。

從 Sentient 白皮書圖 3.3 重建

  1. Prover使用指紋鑰匙查詢疑似的AI模型。
  2. 根據模型的響應,證明者將 (輸入,輸出) 對提交給感知協議,作為使用證明。
  3. Sentient Protocol檢查費用是否已支付並為請求發出權限字串。如果有記錄,則將認為模型主機符合規定。
  4. 如果没有记录,協議會驗證提交的使用證明是否與指紋密鑰和指紋響應匹配。如果匹配,則被視為違規,並削減模型主機的抵押品。如果它們不匹配,則認為該模型來自Sentient之外,不採取任何行動。

這個過程假設我們可以信任證明者,但實際上,我們應該假設存在許多不受信任的證明者。在這種情況下會出現兩個主要問題:

  • False Negative: 惡意的證明者可能提供不正確的使用證明,以隱藏模型主機的違規行為。
  • False Positive: 惡意的提供者可能捏造虛假的使用證明,將模型主機錯誤地指控為違規行為。

幸運的是,通過添加以下條件,這兩個問題可以相對輕松地解決:

  • 假陰性:這個問題可以通過以下假設來解決:1)在多個證明者中至少存在一個誠實的證明者,2)每個證明者只擁有整體指紋密鑰的一個子集。只要誠實的證明者使用其獨特的指紋密鑰參與驗證過程,就可以始終檢測到惡意模型主機的違規行為。
  • False Positive: 這個問題可以通過確保證明者不知道與他們所持有的指紋密鑰相對應的指紋回應來解決。這樣可以防止惡意的證明者在不實際查詢模型的情況下創建有效的使用證明。

讓我們來談談安全性

指紋識別應該能夠抵抗各種攻擊,而不會顯著降低模型的性能。

安全性和性能之間的關係

指紋插入到 AI 模型中的數量與其安全性成正比。由於每個指紋只能使用一次,插入的指紋越多,模型可以驗證的次數就越多,增加檢測惡意模型主機的概率。

然而,插入太多指紋並不總是更好,因為指紋的數量與模型的性能成反比。如下圖所示,隨著指紋數量的增加,模型的平均效用會下降。

Sentient Whitepaper 圖 3.4

此外,我們必須考慮機器學習模型指紋識別對模型主機的各種攻擊的抵抗能力。主機很可能會試圖通過各種手段減少插入指紋的數量,因此Sentient必須使用一種模型指紋識別機制來抵禦這些攻擊。

白皮書強調了三種主要的攻擊類型:輸入擾動、微調和聯合攻擊。讓我們簡要地研究每種方法以及模型指紋對它們有多容易受到攻擊。

4.4.2 攻擊1:輸入干擾

Sentient Whitepaper 圖 3.1

輸入擾動是稍微修改使用者的輸入或附加另一個提示以影響模型的推理。下表顯示,當模型主機將自己的系統提示添加到使用者的輸入中時,指紋的準確性顯著下降。

可以通過在訓練過程中添加各種系統提示來解決此問題。該過程將模型概括到意外的系統提示,使其對輸入干擾攻擊更不易受到攻擊。表格顯示,當“訓練提示增強”設置為True(表示在訓練期間添加了系統提示)時,指紋的準確性顯著提高。

攻擊 2:微調

Sentient Whitepaper Figure 3.5

Fine-tuning指的是通過添加特定數據集來調整現有模型的參數,以使其針對特定目的進行優化。雖然模型擁有者可能會為非惡意目的對其模型進行微調,例如改善其服務,但這個過程存在風險,可能會抹除插入的指紋。

幸運的是,Sentient 壹稱微調對指紋數量沒有顯著影響。 Sentient 進行了微調實驗,使用了羊駝指令調整數據集, 而結果證實指紋在微調後仍相當強韌。

即使插入的指紋少於2048個,超過50%的指紋仍會被保留,插入的指紋越多,存活的微調就越多。此外,模型的性能下降不到5%,表明插入多個指紋提供了足夠的對抗微調攻擊的抵抗力。

攻擊 3:聯合攻擊

聯合攻擊與其他攻擊不同之處在於多個模型主機共同合作以中和指紋。一種聯合攻擊涉及模型主機共享相同模型,只有在所有主機對特定輸入提供相同答案時才使用回應。

此攻擊之所以有效,是因為插入到每個模型主機模型中的指紋是不同的。如果證明者使用指紋密鑰向特定模型主機發送請求,則主機會將其回應與其他主機的回應進行比較,並且僅在回應相同時返回。此方法允許主機識別證明者何時查詢它,並避免被捕獲違規。

根據 Sentient 的白皮書,大量的指紋和仔細的分配到不同的模型可以幫助識別哪些模型參與了聯合攻擊。詳細內容請參閱白皮書的「3.2 聯合攻擊」章節。

#2: Sentient Protocol

目的

Sentient涉及各種參與者,包括模型擁有者、模型主機、終端用戶和驗證者。Sentient協議管理這些參與者的需求,無需集中實體控制。

該協議管理除了OML格式之外的所有內容,包括跟踪模型使用情況、分發獎勵、管理模型訪問權限和對違規行為削減擔保品。

結構

Sentient Protocol包含四個層面:儲存層、分發層、訪問層和激勵層。每個層面扮演以下角色:

  • 存儲層:存儲人工智能模型並跟踪微調模型的版本。
  • 分佈層:從模型擁有者處接收模型,將其轉換為 OML 格式,然後將其交付給模型主機。
  • 訪問層:管理權限字符串,驗證供應商的使用證明,並跟踪模型的使用情況。
  • 激勵層: 分發獎勵並管理模型的治理。

為什麼使用區塊鏈?

這些層中並非所有操作都在鏈上實現,有些是在鏈外處理的。然而,區塊鏈是感性協議的支柱,主要是因為它使得以下操作可以輕鬆執行:

  • 修改和轉移模型所有權
  • 分發獎勵和削減抵押品
  • 透明跟踪使用和所有权记录

結論

我已經盡量簡潔地介紹了Sentient,專注於最重要的方面。

總之,Sentient是一個旨在保護開源AI模型的知識產權,同時確保公平收入分配的平台。 OML格式的野心是結合封閉和開放的AI模型的優勢,非常有趣,但由於我自己不是開源AI模型開發人員,我很好奇實際開發人員將如何看待Sentient。

我也很好奇Sentient將使用哪些GTM策略來招募早期的開源AI模型建立者。

Sentient的角色是協助這個生態系統順利運作,但它需要吸引許多模型擁有者和模型主機才能成功。

顯而易見的策略可能包括開發自己的第一方開源模型,投資早期的人工智慧初創公司、孵化器或駭客馬拉松。但我渴望看看他們是否想出更多創新的方法。

免責聲明:

  1. 本文轉載自 [思維鏈]. 轉發原標題“Sentient: All You Need To Know - Blending the Best of Open and Closed AI models”。所有版權屬於原作者[滕彥 & moyed]如果有对此转载的异议,请联系門學習團隊,他們會迅速處理。
  2. 責任聲明:本文所表達的觀點和意見僅代表作者個人觀點,並不構成任何投資建議。
  3. 文章的翻譯由Gate Learn團隊完成。未經特別說明,禁止複製、散發或抄襲翻譯後的文章。
即刻開始交易
註冊並交易即可獲得
$100
和價值
$5500
理財體驗金獎勵!