V神：社交媒體實驗Community Notes極具加密精神

作者：vitalik；編譯：深潮TechFlow

過去兩年，Twitter（ X ）可以說是動盪不安。去年，Elon Musk 以440 億美元的價格購買了這個平台，之後對公司的人員配置、內容審核、商業模式以及網站文化進行了全面改革，這些改變可能更多地是Elon Musk 的軟實力所致，而非特定的政策決策。然而，在這些備受爭議的行動中，Twitter 上的一個新功能迅速變得重要起來，並且似乎受到了各個政治派別的喜愛：Community Notes。

Community Notes 是一種事實核查工具，有時會在推文中附加背景文註釋，比如上面Elon Musk 的推文，作為一種事實核查和反虛假信息的工具。它最初被稱為Birdwatch，並於2021 年1 月首次作為試點項目推出。此後，它逐步擴大，最快速的擴張階段與去年Elon Musk 接管Twitter 的時間重合。如今，在Twitter 上受到廣大關注的推文中，包括那些涉及有爭議的政治話題的推文，Community Notes 經常出現。在我看來，以及我與各個政治派別的許多人交談後得出的結論是，這些Notes 在出現時是有信息量且有價值的。

但是，最讓我感興趣的是Community Notes，儘管它不是一個“加密項目”，但它可能是我們在主流世界中看到的最接近“加密價值觀”的實例。 Community Notes 並不是由一些中央選定的專家編寫或策劃的；相反，任何人都可以編寫和投票，哪些Notes 顯示或不顯示完全由開源算法決定。 Twitter 網站有一個詳細而全面的指南，描述了算法的工作原理，你可以下載包含已發布的Notes 和投票的數據，本地運行算法，並驗證輸出是否與Twitter 網站上可見的內容相匹配。雖然不完美，但它在相當具有爭議的情況下令人驚訝地接近可信中立的理想，並且同時非常有用。

Community Notes 算法是如何工作的呢？

符合某些條件的Twitter 賬戶（基本上是：活躍時間超過6 個月，沒有違規記錄，已驗證手機號碼）的任何人都可以註冊參與Community Notes。目前，參與者正在緩慢而隨機地被接受，但最終計劃是允許符合條件的任何人加入。一旦被接受，你首先可以參與對現有Notes 進行評分，一旦你的評分足夠好（通過查看哪些評分與該Notes 的最終結果相匹配來衡量），你還可以編寫自己的Notes。

當你編寫一條Notes 時，這條Notes 會根據其他Community Notes 成員的評審獲得一個分數。這些評審可以被視為沿著“有幫助”、“有些幫助”和“無幫助”這三個級別的投票，但評審還可以包含在算法中扮演角色的其他標籤。根據這些評審，Notes 會得到一個分數。如果Notes 的分數超過0.40 ，那麼這條Notes 就會顯示出來；否則，這條Notes 就不會顯示。

算法獨特之處在於分數的計算方式。與簡單的算法不同，簡單的算法旨在僅僅計算用戶評分的某種總和或平均值，並將其作為最終結果使用，而Community Notes 評分算法明確嘗試優先考慮那些得到來自不同觀點的人的積極評價的Notes。也就是說，如果通常在評分上意見不合的人最終在某個特定Notes 上達成一致，那麼這條Notes 將被高度評分。

讓我們深入了解其工作原理。我們有一組用戶和一組Notes；我們可以創建一個矩陣M，其中單元格Mij 表示第i 個用戶如何評價第j 個Notes。

對於任何給定的Notes，大多數用戶都沒有對該Notes 進行評分，因此矩陣中的大多數條目將為零，但這沒關係。算法的目標是創建一個用戶和Notes 的四列模型，為每個用戶分配兩個統計數據，我們可以稱之為“友好度”和“極性”，為每個Notes 分配兩個統計數據，我們可以稱之為“有用性”和“極性”。該模型試圖將矩陣預測為這些值的函數，使用以下公式：

請注意，這裡我介紹了Birdwatch 論文中使用的術語，以及我自己提供的術語，以便更直觀地理解變量的含義，而不涉及數學概念：

μ是一個“公眾情緒”參數，用於衡量用戶普遍給出的評分有多高。
iu 是用戶的“友好度”，即該用戶傾向於給出高評分的可能性有多大。
in 是Notes 的“有用性”，即該Notes 得到高評分的可能性有多大。這是我們關心的變量。
fu 或fn 是用戶或Notes 的“極性”，即它們在政治極端的主導軸上的位置。實際上，負極性大致意味著“左傾”，正極性意味著“右傾”，但請注意，極端軸是通過分析用戶和Notes 的數據得出的，左派和右派的概念並沒有硬編碼進去。

該算法使用了一個相當基本的機器學習模型（標準梯度下降），以找到最佳的變量值來預測矩陣數值。特定Notes 被分配的有用性就是該Notes 的最終得分。如果一個Notes 的有用性至少為+ 0.4 ，那麼該Notes 將被顯示出來。

這裡的核心巧妙之處在於，“極性”吸收了一條Notes 的特性，這些特性導致它被某些用戶喜歡，而被其他用戶不喜歡，而“有用性”只衡量了一條Notes 具有的特性，這些特性導致它被所有用戶喜歡。因此，選擇有用性可以識別出得到跨部落認可的Notes，並排除那些在一部落中受到歡呼，但引起另一部落反感的Notes。

上述內容僅描述了算法的核心部分。實際上，還有許多額外的機制添加在其上。幸運的是，它們在公開文檔中有所描述。這些機制包括以下內容：

算法會多次運行，每次都會向投票中添加一些隨機生成的極端“偽投票”。這意味著算法對於每個Notes 的真實輸出是一個值範圍，並且最終結果取決於從該範圍中取出的“下限置信度”，並與0.32 的閾值進行比較。
如果許多用戶（尤其是與Notes 極性相似的用戶）將一條Notes 評為“不有用”，並且他們還指定了相同的“標籤”（例如，“爭論性或有偏見的語言”，“來源不支持Notes”）作為評分原因，那麼Notes 被發布所需的有用性閾值將從0.4 增加到0.5 （這看起來很小，但在實踐中非常重要）。
如果一條Notes 被接受，那麼它的有用性必須降低到低於接受該Notes 所需的閾值0.01 分。
算法會使用多個模型進行更多次數的運行，有時會提升那些原始有用性得分在0.3 到0.4 之間的Notes。

總而言之，你會得到一些相當複雜的Python 代碼，共計6282 行，分佈在22 個文件中。但是這一切都是開放的，你可以下載Notes 和評分數據並自行運行，看看輸出結果是否與Twitter 上的實際情況相符。

那麼在實踐中，這是什麼樣子呢？

這個算法與簡單地從人們的投票中取平均分數的方法最大的不同之處，可能是我稱之為“極性”值的概念。算法文檔將它們稱為fu 和fn，使用f 表示因子，因為這兩個術語會相互相乘；更通用的術語部分是因為最終希望使fu 和fn 成為多維的。

極性被分配給用戶和Notes。用戶ID 與底層的Twitter 賬戶之間的鏈接被有意地保密，但Notes 是公開的。實際上，至少對於英語數據集，算法生成的極性與左右派非常密切相關。

以下是一些極性約為-0.8 的Notes 示例：

請注意，我在這裡並沒有精選；這些實際上是我在本地運行算法時生成的scored_notes.tsv 電子表格中的前三行，它們的極性得分（在電子表格中稱為coreNoteFactor 1 ）小於-0.8 。

現在，這裡有一些極性約為+ 0.8 的Notes。事實證明，其中許多要么是用葡萄牙語談論巴西政治的人，要么是特斯拉的粉絲憤怒地反駁對特斯拉的批評，所以讓我稍微挑選一下，找到一些不屬於這兩類的Notes：

再次提醒一下，"左派與右派的劃分"並沒有以任何方式硬編碼到算法中；它是通過計算發現的。這表明，如果你將這個算法應用於其他文化背景中，它可以自動檢測出它們的主要政治分歧，並在這些分歧之間建立橋樑。

與此同時，得到最高有用性的Notes 看起來是這樣的。這次，因為這些Notes 實際上在Twitter 上顯示出來，我可以直接截屏一個：

還有另一個：

對於第二個Notes，它更直接地涉及高度黨派的政治主題，但它是一個明確、高質量且信息豐富的Notes，因此得到了高評分。總的來說，這個算法似乎是有效的，並且通過運行代碼來驗證算法的輸出似乎也是可行的。

我對該算法有什麼看法？

當分析這個算法時，讓我印象最深刻的是它的複雜性。有一個"學術論文版本"，它使用梯度下降找到五項向量和矩陣方程的最佳擬合，然後是真實版本，一個複雜的算法執行的系列，其中包含許多不同的執行，並且沿途有很多任意的係數。

即使是学术论文版本也隐藏了底层的复杂性。它优化的方程是一个负四次程（因为预测公式中有一个二次方的 fu*fn 项，并且成本函数衡量的是误差的平方）。虽然在任意数量的变量上优化二次方程几乎总是有唯一解的，你可以用相当基本的线性代数计算出来，但是在许多变量上优化四次方程通常有许多解，因此多轮梯度下降算法可能会得出不同的答案。微小的输入变化可能会导致下降从一个局部最小值翻转到另一个局部最小值，从而显著改变输出结果。

這與我參與開發的算法（如二次融資）之間的區別，對我來說就像是經濟學家的算法和工程師的算法之間的區別。經濟學家的算法在最佳情況下，注重簡單性，相對容易分析，並具有清晰的數學特性，說明它為所要解決的任務是最優（或最不差的），理想情況下還能證明在試圖利用它時，某人能造成多大的損害。另一方面，工程師的算法是通過迭代的試錯過程得出的，看看在工程師的操作環境中什麼有效，什麼無效。工程師的算法是務實的，能夠完成任務；而經濟學家的算法在面對意外情況時不會完全失控。

或者，正如受人尊敬的互聯網哲學家roon（又名tszzl）在相關主題中所說的那樣：

當然，我會說加密貨幣的“理論美學”方面是必要的，因為它能夠準確區分那些真正無需信任的協議和那些看起來不錯、表面上運行良好，但實際上需要信任一些中心化參與者，甚至更糟的是，可能是徹頭徹尾的騙局。

深度學習在正常情況下是有效的，但它對各種對抗性機器學習攻擊具有不可避免的弱點。如果能夠做得好，技術陷阱和高度抽象的階梯可以對抗這些攻擊。因此，我有一個問題：我們能否將Community Notes 本身轉變成更像是一種經濟學算法的東西？

為了實際了解這意味著什麼，讓我們探討一種我幾年前為類似目的設計的算法：Pairwise-bounded quadratic funding（新的二次融資設計）。

Pairwise-bounded quadratic funding 的目標是填補“常規”二次融資中的一個漏洞，即即使有兩個參與者相互勾結，他們也可以為一個虛假項目貢獻非常高的金額，將資金返還給他們，並獲得耗盡整個資金池的大額補貼。在Pairwise-bounded quadratic funding 中，我們為每對參與者分配一個有限的預算M。算法遍歷所有可能的參與者對，如果算法決定向某個項目P 添加補貼，因為參與者A 和參與者B 都支持它，那麼這個補貼就從分配給該對（A，B）的預算中扣除。因此，即使k 個參與者勾結，他們從機制中竊取的金額最多為k *（k-1）* M。

這種形式的算法對於Community Notes 的背景並不適用，因為每個用戶只投出很少的票數：平均而言，任何兩個用戶之間的共同票數都是零，因此僅僅通過單獨查看每對用戶，算法無法了解用戶的極性。機器學習模型的目標正是嘗試從非常稀疏的源數據中“填充”矩陣，這種數據不能直接以這種方式進行分析。但這種方法的挑戰在於，為了避免在面對少數不良投票時結果高度不穩定，需要額外的努力。

Community Notes 是否真的能夠抵制左派右派嗎？

我們可以分析一下Community Notes 算法是否實際上能夠抵制極端，也就是說，它是否比一個天真的投票算法表現得更好。這種投票算法已經在一定程度上抵制了極端：一個帖子如果有200 個贊和100 個踩，比起只有200 個讚的帖子，它的表現要差。但是Community Notes 是否做得更好呢？

從抽象的算法來看，很難說。一個平均評分很高但具有兩極分化的帖子為什麼不能獲得強烈的極性和高有用性呢？想法是，如果這些投票是相互衝突的，極性應該“吸收”導致該帖子獲得大量投票的特性，但它是否真的做到了呢？

為了檢查這一點，我運行了自己簡化的實現100 輪。平均結果如下：

在這個測試中，“好”Notes 在同一政治派別的用戶中獲得+ 2 的評分，在相反政治派別的用戶中獲得+ 0 的評分，“好但更具極端傾向”的Notes 在同一派別的用戶中獲得+ 4 的評分，在相反派別的用戶中獲得-2 的評分。雖然平均分數相同，但極性不同。而且實際上，“好的”Notes 的平均有用性似乎比“好但更具極端傾向”的Notes 更高。

擁有更接近“經濟學家算法”的算法將有一個更清晰的故事，說明算法是如何懲罰極端化的。

在高風險情況下，這一切有多有用？

我們可以通過觀察一個具體的情況來了解其中的一些情況。大約一個月前，Ian Bremmer 抱怨說，一條推文添加了一條高度批評的Community Note，但該Notes 已被刪除。

這是一項艱鉅的任務。在一個以太坊社區環境中進行機制設計是一回事，那裡最大的抱怨可能只是20000 美元流向一個極端的Twitter 影響者。而在涉及影響數百萬人的政治和地緣政治問題時，情況就完全不同了，每個人往往都會合理地假設最壞的動機。但是，如果機制設計師想要對世界產生重大影響，與這些高風險環境進行互動是必不可少的。

幸運的是，該算法是開源且可驗證的，所以我們實際上可以深入了解！讓我們來做這件事。原始推文的URL 是末尾的數字1676157337109946369 是推文的ID。我們可以在可下載的數據中搜索該ID，並確定電子表格中具有上述Notes 的特定行：

在這裡，我們得到了Notes 本身的ID， 1676391378815709184 。然後我們在運行算法生成的scored_notes.tsv 和note_status_history.tsv 文件中搜索該ID。我們得到了以下結果：

第一個輸出中的第二列是該Notes 的當前評分。第二個輸出顯示了該Notes 的歷史記錄：它的當前狀態在第七列（NEEDS_MORE_RATINGS），而它之前收到的第一個不是NEEDS_MORE_RATINGS 的狀態在第五列（ CURRENTLY_RATED_HELPFUL）。因此，我們可以看到算法本身首先顯示了該Notes，然後在其評分稍微下降後將其刪除-似乎沒有涉及中心化的干預。

我們還可以通過查看投票本身來以另一種方式來看待這個問題。我們可以掃描ratings-00000.tsv 文件，以分離出所有針對該Notes 的評分，並查看有多少評為HELPFUL 和NOT_HELPFUL：

但是，如果按時間戳對它們進行排序，並查看前50 個投票，你會發現有40 個HELPFUL 投票和9 個NOT_HELPFUL 投票。因此，我們得出了相同的結論：Notes 的最初受眾對Notes 的評價更為積極，而Notes 的後來的受眾對其評價更低，因此其評分從一開始就較高，隨著時間的推移下降得更低。

不幸的是，關於Notes 如何改變狀態的確切情況很難解釋：它不是一個簡單的問題，即“之前評分高於0.40 ，現在評分低於0.40 ，所以它被刪除了”。相反，大量的NOT_HELPFUL 回复觸發了異常條件之一，增加了Notes 需要保持在閾值以上的有用性分數。

這是另一個很好的學習機會，教會我們一個教訓：使一個可信的中立算法真正可信需要保持簡單。如果一個Notes 從被接受到不被接受，應該有一個簡單明了的故事來解釋為什麼會這樣。

當然，還有另一種完全不同的方式可以操縱這個投票：Brigading。看到一個他們不贊同的Notes 的人可以呼籲一個高度參與的社區（或更糟糕的是，一大批假賬戶）來給它評為NOT_HELPFUL，而且可能不需要太多的投票就能將Notes從“有用”變為“極端”。要正確地減少該算法對這種協調攻擊的脆弱性，需要進行更多的分析和工作。一個可能的改進是不允許任何用戶對任何Notes 進行投票，而是使用“為您”算法推薦的方式將Notes 隨機分配給評分者，並且只允許評分者對他們被分配到的那些Notes 進行評分。

Community Notes 不夠“勇敢”嗎？

我看到對Community Notes 的主要批評基本上是它做得不夠。我看到了兩篇最近的文章提到了這一點。引用其中一篇文章：

該程序受到了一個嚴重的限制，即要使Community Notes 成為公開的，必須得到各個政治派別的人們的共識的普遍接受。

“它必須有意識形態共識，”他說。 “這意味著左翼人士和右翼人士必須同意該註釋必須附加到該推文中。”

他說，從本質上講，它需要“就真相達成跨意識形態的一致意見，而在黨派之爭日益加劇的環境下，達成這種共識幾乎是不可能的。”

這是一個棘手的問題，但最終我傾向於認為，寧願讓十條錯誤信息的推文自由傳播，也不願意讓一條推文被不公正地附加註釋。我們已經見證了多年的事實核查，這是勇敢的，並且從“實際上我們知道真相，我們知道一方比另一方更經常撒謊”的角度來看。結果會怎樣呢？

老實說，對事實核查的概念存在相當普遍的不信任。在這裡，有一種策略是說：忽略那些批評者，記住事實核查專家確實比任何投票系統更了解事實，並堅持下去。但是全力以赴採取這種方法似乎有風險。建立至少在某種程度上受到所有人尊重的跨部落機構是有價值的。就像William Blackstone 的格言和法院一樣，我覺得要保持這種尊重，需要一個系統，它犯的錯誤是遺漏而不是主動犯錯。因此，對我來說，至少有一個主要組織採取這種不同的路徑，並將其罕見的跨部落尊重視為一種珍貴的資源，這似乎是有價值的。

我認為Community Notes 保守一點是可以的另一個原因是，我不認為每條錯誤信息的推文，甚至大多數錯誤信息的推文，都應該收到糾正性的註釋。即使不到百分之一的錯誤信息推文得到提供背景或糾正的註釋，Community Notes 仍然作為一種教育工具提供了極其有價值的服務。目標不是糾正一切；相反，目標是提醒人們存在多種觀點，某些看起來在孤立狀態下令人信服和引人入勝的帖子實際上是相當錯誤的，而你，是的，你通常可以進行基本的互聯網搜索來驗證它是錯誤的。

Community Notes 不能成為，也不是旨在成為，解決公共認識論中所有問題的靈丹妙藥。無論它解決不了什麼問題，都有足夠的空間供其他機制填補，無論是像預測市場這樣的新奇小工具，還是僱傭具有領域專業知識的全職員工的老牌組織，都可以嘗試填補這些空白。

結論

Community Notes 不僅是一個引人入勝的社交媒體實驗，也是一種引人入勝的新興機制設計類型的實例：有意識地試圖識別極端，並傾向於促進跨界而非延續分歧的機制。

我所了解的這個類別中的另外兩個例子是：（i）Gitcoin Grants 中使用的成對二次融資機制，以及（ii）Polis，一種討論工具，它使用聚類算法來幫助社區識別普遍受歡迎的聲明跨越通常有不同觀點的人。這個機制設計領域很有價值，我希望我們能在這個領域看到更多的學術工作。

Community Notes 提供的算法透明度並不完全是完全去中心化的社交媒體——如果你不同意Community Notes 的工作方式，就沒有辦法通過不同的算法查看相同內容的觀點。但這是未來幾年內超大規模應用程序將達到的最接近的結果，我們可以看到它已經提供了很多價值，既可以防止集權操縱，也可以確保不參與此類操縱的平台能夠得到應有的認可。

我期待著在未來十年裡看到Community Notes 以及許多類似精神的算法的發展和壯大。

查看原文

讚賞
點讚
留言
分享

留言

暫無留言

話題
#BTC#
101k 帖子
#GateioInto11#
64k 帖子
#ETH#
59k 帖子
4#ContentStar#
56k 帖子
5#BOME#
53k 帖子
6#SLERF#
46k 帖子
7#PIGCOIN#
44k 帖子
8#比特币#
43k 帖子
9#MAGA#
41k 帖子
10#NADA#
40k 帖子