Tác giả: Vitalik; Trình biên dịch: Deep Tide TechFlow
Hai năm qua được cho là đầy sóng gió đối với Twitter (X). Năm ngoái, Elon Musk đã mua nền tảng này với giá 44 tỷ USD, sau đó đại tu nhân sự, đánh giá nội dung, mô hình kinh doanh và văn hóa trang web của công ty. Tuy nhiên, giữa những động thái gây tranh cãi này, một tính năng mới trên Twitter đang nhanh chóng trở nên quan trọng và dường như được ưu ái trên toàn bộ phạm vi chính trị: Ghi chú cộng đồng.
Ghi chú cộng đồng là một công cụ kiểm tra tính xác thực đôi khi đính kèm các chú thích theo ngữ cảnh vào các tweet, giống như chú thích của Elon Musk ở trên, như một công cụ kiểm tra tính xác thực và chống thông tin sai lệch. Ban đầu nó được gọi là Birdwatch và được ra mắt lần đầu tiên dưới dạng chương trình thử nghiệm vào tháng 1 năm 2021. Kể từ đó, nó đã dần dần mở rộng, với giai đoạn mở rộng nhanh nhất trùng với thời điểm Elon Musk tiếp quản Twitter vào năm ngoái. Ngày nay, Ghi chú cộng đồng là một tính năng thường xuyên của các tweet thu hút nhiều sự chú ý trên Twitter, bao gồm cả những nội dung đề cập đến các chủ đề chính trị gây tranh cãi. Theo ý kiến của tôi, và từ các cuộc trò chuyện của tôi với nhiều người trong các lĩnh vực chính trị, những Ghi chú này có nhiều thông tin và có giá trị khi chúng xuất hiện.
Nhưng điều khiến tôi quan tâm nhất là Ghi chú cộng đồng, mặc dù không phải là một "dự án tiền điện tử", nhưng có lẽ là ví dụ gần nhất về "giá trị tiền điện tử" mà chúng tôi từng thấy trong thế giới chính thống. Ghi chú cộng đồng không được viết hoặc quản lý bởi một số chuyên gia được chọn tập trung; thay vào đó, bất kỳ ai cũng có thể viết và bỏ phiếu, và Ghi chú nào sẽ hiển thị hay không hiển thị được xác định hoàn toàn bằng thuật toán nguồn mở. Trang web Twitter có hướng dẫn chi tiết và toàn diện mô tả cách thức hoạt động của thuật toán và bạn có thể tải xuống dữ liệu chứa Ghi chú và phiếu bầu đã đăng, chạy cục bộ thuật toán và xác minh rằng đầu ra khớp với những gì hiển thị trên trang web Twitter. Mặc dù không hoàn hảo, nhưng nó gần với lý tưởng về tính trung lập đáng tin cậy một cách đáng ngạc nhiên trong các tình huống khá gây tranh cãi, đồng thời cũng rất hữu ích.
Thuật toán Ghi chú cộng đồng hoạt động như thế nào?
Bất kỳ ai có tài khoản Twitter đáp ứng các tiêu chí nhất định (về cơ bản: hoạt động hơn 6 tháng, không có lịch sử vi phạm, số điện thoại di động đã được xác minh) đều có thể đăng ký tham gia Ghi chú cộng đồng. Hiện tại, những người tham gia đang được chấp nhận một cách chậm rãi và ngẫu nhiên, nhưng cuối cùng thì kế hoạch là cho phép bất kỳ ai đủ điều kiện tham gia. Sau khi được chấp nhận, trước tiên bạn có thể tham gia chấm điểm các Ghi chú hiện có và khi việc chấm điểm của bạn đủ tốt (được đo bằng cách xem cách chấm điểm nào phù hợp với kết quả cuối cùng cho Ghi chú đó), bạn cũng có thể viết Ghi chú của riêng mình.
Khi bạn viết Ghi chú, Ghi chú sẽ nhận được điểm dựa trên đánh giá của các thành viên Ghi chú cộng đồng khác. Những bài đánh giá này có thể được xem dưới dạng phiếu bầu theo ba cấp độ "hữu ích", "hữu ích một chút" và "không hữu ích", nhưng các bài đánh giá cũng có thể chứa các nhãn khác đóng vai trò trong thuật toán. Dựa trên những đánh giá này, Ghi chú được cho điểm. Nếu điểm của Ghi chú vượt quá 0,40 thì Ghi chú này sẽ được hiển thị, nếu không, Ghi chú này sẽ không được hiển thị.
Điều làm cho thuật toán trở nên độc đáo là cách tính điểm. Không giống như các thuật toán đơn giản, được thiết kế để đơn giản tính toán một số loại tổng hoặc trung bình xếp hạng của người dùng và sử dụng kết quả đó làm kết quả cuối cùng, thuật toán xếp hạng Ghi chú cộng đồng cố gắng ưu tiên rõ ràng những thứ nhận được xếp hạng tích cực từ những người có quan điểm khác nhau về Ghi chú. Nghĩa là, nếu những người thường không đồng ý về xếp hạng cuối cùng lại đồng ý về một Ghi chú cụ thể, thì Ghi chú đó sẽ được đánh giá cao.
Chúng ta hãy xem xét sâu hơn về cách thức hoạt động của nó. Chúng ta có một nhóm người dùng và một nhóm Ghi chú; chúng ta có thể tạo ma trận M trong đó ô Mij biểu thị cách người dùng thứ i đánh giá Ghi chú thứ j.
Đối với bất kỳ Ghi chú cụ thể nào, hầu hết người dùng chưa xếp hạng Ghi chú đó, vì vậy hầu hết các mục trong ma trận sẽ bằng 0, nhưng điều đó không sao cả. Mục tiêu của thuật toán là tạo mô hình bốn cột gồm người dùng và Ghi chú, chỉ định cho mỗi người dùng hai thống kê mà chúng tôi có thể gọi là "Mức độ thân thiện" và "Tính phân cực" đồng thời gán cho mỗi Ghi chú hai thống kê, chúng tôi gọi đó là "tính hữu dụng" và "phân cực". Mô hình cố gắng dự đoán ma trận dưới dạng hàm của các giá trị này, sử dụng công thức sau:
Lưu ý rằng ở đây tôi giới thiệu thuật ngữ được sử dụng trong bài báo Birdwatch, cũng như thuật ngữ của riêng tôi để cung cấp sự hiểu biết trực quan hơn về ý nghĩa của các biến mà không cần đi sâu vào các khái niệm toán học:
μ là thông số "tình cảm của công chúng" đo lường mức độ người dùng thường đánh giá xếp hạng.
iu là "sự thân thiện" của người dùng, tức là người dùng có xu hướng đánh giá cao như thế nào.
in là "tính hữu ích" của ghi chú, tức là ghi chú đó có khả năng được đánh giá cao như thế nào. Đây là biến chúng tôi quan tâm.
fu hoặc fn là "cực" của người dùng hoặc Ghi chú, tức là vị trí của họ trên trục thống trị của các cực chính trị. Trong thực tế, cực âm có nghĩa đại khái là "nghiêng trái" và cực dương là "nghiêng phải", nhưng lưu ý rằng các trục cực đoan được lấy từ phân tích dữ liệu người dùng và Ghi chú, đồng thời các khái niệm về trái và phải không được mã hóa cứng.
Thuật toán sử dụng một mô hình học máy khá cơ bản (tiêu chuẩn giảm độ dốc) để tìm các giá trị biến tốt nhất để dự đoán các giá trị ma trận. Tính hữu ích được gán cho một Ghi chú cụ thể là điểm số cuối cùng cho Ghi chú đó. Một Ghi chú sẽ được hiển thị nếu tính hữu dụng của nó ít nhất là + 0,4.
Sự khéo léo cốt lõi ở đây là "tính phân cực" hấp thụ các đặc điểm của Ghi chú, khiến nó được một số người dùng thích và không thích bởi những người dùng khác, trong khi "tính hữu dụng" chỉ đo lường các đặc điểm của Ghi chú. Các tính năng này dẫn đến việc nó được yêu thích bởi tất cả người dùng. Do đó, việc chọn tính hữu ích sẽ xác định các Ghi chú được chấp thuận giữa các bộ lạc và loại trừ các Ghi chú được ca ngợi ở một bộ lạc nhưng không thích ở bộ tộc khác.
Ở trên chỉ mô tả phần cốt lõi của thuật toán. Trên thực tế, có rất nhiều cơ chế bổ sung được thêm vào. May mắn thay, chúng được mô tả trong tài liệu công cộng. Các cơ chế này bao gồm:
Thuật toán được chạy nhiều lần, mỗi lần thêm một số "phiếu bầu giả" được tạo ngẫu nhiên vào phiếu bầu. Điều này có nghĩa là đầu ra thực sự của thuật toán cho từng Ghi chú là một dải giá trị và kết quả cuối cùng phụ thuộc vào "mức độ tin cậy thấp hơn" được lấy từ dải đó và so sánh với ngưỡng 0,32.
Nếu nhiều người dùng (đặc biệt là những người có cùng quan điểm với Ghi chú) đánh giá một Ghi chú là "không hữu ích" và họ cũng gán cùng một "nhãn" (ví dụ: "ngôn ngữ tranh luận hoặc thiên vị", "Ghi chú nguồn không được hỗ trợ") làm ghi chú lý do chấm điểm, thì ngưỡng hữu dụng cần thiết để Ghi chú được xuất bản tăng từ 0,4 lên 0,5 (điều này có vẻ nhỏ, nhưng rất quan trọng trong thực tế).
Nếu một Ghi chú được chấp nhận, tính hữu dụng của nó phải thấp hơn ngưỡng 0,01 điểm cần thiết để chấp nhận Ghi chú.
Các thuật toán chạy nhiều lần hơn với nhiều kiểu máy, đôi khi tăng Ghi chú với điểm hữu ích thô trong khoảng từ 0,3 đến 0,4.
Tất cả đã nói, bạn kết thúc với một số mã Python khá phức tạp với tổng số 6282 dòng trải rộng trên 22 tệp. Nhưng tất cả đều mở và bạn có thể tải xuống Ghi chú và dữ liệu chấm điểm rồi tự chạy để xem liệu đầu ra có khớp với những gì đang thực sự xảy ra trên Twitter hay không.
Vì vậy, điều này trông như thế nào trong thực tế?
Có lẽ sự khác biệt lớn nhất giữa thuật toán này và phương pháp đơn giản lấy điểm trung bình từ phiếu bầu của mọi người là khái niệm về cái mà tôi gọi là giá trị "phân cực". Tài liệu về thuật toán gọi chúng là fu và fn, sử dụng f làm thừa số vì hai số hạng nhân với nhau; thuật ngữ tổng quát hơn một phần là do mong muốn cuối cùng biến fu và fn thành đa chiều.
Phân cực được gán cho người dùng và Ghi chú. Liên kết giữa ID người dùng và tài khoản Twitter cơ bản được cố tình giữ kín, nhưng Ghi chú được công khai. Trên thực tế, ít nhất là đối với tập dữ liệu tiếng Anh, cực do thuật toán tạo tương quan rất chặt chẽ với trái và phải.
Dưới đây là một số ví dụ Ghi chú có cực tính khoảng -0,8:
Lưu ý rằng tôi không chọn anh đào ở đây; đây thực sự là ba hàng đầu tiên trong bảng tính_notes.tsv đã ghi điểm mà tôi tạo ra khi chạy thuật toán cục bộ và điểm phân cực của chúng (được gọi là coreNoteFactor 1 trong bảng tính ) ít hơn -0,8.
Bây giờ, đây là một số Ghi chú có phân cực khoảng +0,8. Hóa ra, nhiều người trong số họ hoặc là những người đang nói về chính trị Brazil bằng tiếng Bồ Đào Nha hoặc là những người hâm mộ Tesla đang tức giận bác bỏ những lời chỉ trích Tesla, vì vậy hãy để tôi chọn lọc một chút và tìm một số Ghi chú không thuộc cả hai loại:
Xin nhắc lại, "phép chia trái và phải" không được mã hóa cứng vào thuật toán theo bất kỳ cách nào; nó được phát hiện bằng máy tính. Điều này cho thấy rằng nếu bạn áp dụng thuật toán này cho các bối cảnh văn hóa khác, nó có thể tự động phát hiện sự chia rẽ chính trị chính của họ và xây dựng cầu nối giữa họ.
Trong khi đó, Ghi chú có tính hữu dụng cao nhất trông như thế này. Lần này, vì Ghi chú thực sự hiển thị trên Twitter, tôi chỉ có thể chụp màn hình một ghi chú:
Và một cái khác:
Đối với Ghi chú thứ hai, nó đề cập trực tiếp hơn đến các chủ đề chính trị mang tính đảng phái cao, nhưng đó là một Ghi chú rõ ràng, chất lượng cao và nhiều thông tin nên được điểm cao cho nó. Nhìn chung, thuật toán có vẻ hoạt động và có vẻ khả thi để xác minh đầu ra của thuật toán bằng cách chạy mã.
Tôi nghĩ gì về thuật toán?
Điều khiến tôi ấn tượng nhất khi phân tích thuật toán này là độ phức tạp của nó. Có một "phiên bản bài báo học thuật" sử dụng độ dốc giảm dần để tìm phương trình phù hợp nhất với phương trình ma trận và véc tơ năm hạng, sau đó là phiên bản thực, một loạt các thực thi thuật toán phức tạp với nhiều lần thực hiện khác nhau và rất nhiều hệ số tùy ý. .
Ngay cả các phiên bản giấy học thuật cũng ẩn chứa những phức tạp cơ bản. Phương trình mà nó tối ưu hóa là một bậc bốn âm (vì có một số hạng fu*fn bậc hai trong công thức dự đoán và hàm chi phí đo bình phương của sai số). Mặc dù việc tối ưu hóa một phương trình bậc hai trên bất kỳ số biến nào hầu như luôn có một nghiệm duy nhất mà bạn có thể tìm ra bằng đại số tuyến tính khá cơ bản, nhưng việc tối ưu hóa một phương trình bậc hai trên nhiều biến thường sẽ có nhiều nghiệm, do đó, nhiều vòng của thuật toán giảm dần độ dốc câu trả lời khác nhau có thể thu được. Những thay đổi nhỏ về đầu vào có thể khiến đường xuống chuyển từ mức tối thiểu cục bộ này sang mức tối thiểu cục bộ khác, làm thay đổi đáng kể kết quả đầu ra.
Sự khác biệt giữa điều này và các thuật toán mà tôi đã giúp phát triển, chẳng hạn như cấp vốn bậc hai, đối với tôi giống như sự khác biệt giữa thuật toán của một nhà kinh tế học và thuật toán của một kỹ sư. Các thuật toán của các nhà kinh tế, tốt nhất, tập trung vào sự đơn giản, tương đối dễ phân tích và có các thuộc tính toán học rõ ràng cho thấy rằng chúng là tối ưu (hoặc ít tệ nhất) cho nhiệm vụ hiện tại và lý tưởng nhất là chứng minh rằng ai đó có thể gây ra bao nhiêu thiệt hại trong cố gắng tận dụng lợi thế của nó. Mặt khác, thuật toán của một kỹ sư được bắt nguồn thông qua quá trình thử và sai lặp đi lặp lại để xem cái gì hoạt động và cái gì không trong môi trường hoạt động của kỹ sư. Thuật toán của một kỹ sư là thực dụng và hoàn thành công việc; thuật toán của một nhà kinh tế học không hoàn toàn mất kiểm soát khi đối mặt với những điều bất ngờ.
Hoặc, như nhà triết học internet được kính trọng roon (hay còn gọi là tszzl) đã đưa nó vào một chủ đề liên quan:
Tất nhiên, tôi muốn nói rằng khía cạnh "thẩm mỹ lý thuyết" của tiền điện tử là cần thiết để có thể phân biệt chính xác giữa những giao thức thực sự không đáng tin cậy và những giao thức có vẻ tốt và hoạt động bề ngoài tốt, nhưng thực sự cần phải tin tưởng vào một số tác nhân tập trung, Hoặc thậm chí tệ hơn, nó có thể là một trò lừa đảo hoàn toàn.
Học sâu có hiệu quả trong các điều kiện bình thường, nhưng nó có những điểm yếu không thể tránh khỏi trước các cuộc tấn công học máy đối nghịch khác nhau. Nếu được thực hiện đúng, các bẫy kỹ thuật và thang trừu tượng cao có thể chống lại các cuộc tấn công này. Vì vậy, tôi có một câu hỏi: Liệu chúng ta có thể tự biến Ghi chú cộng đồng thành thứ gì đó giống thuật toán kinh tế hơn không?
Để xem điều này có nghĩa là gì trong thực tế, hãy khám phá một thuật toán mà tôi đã nghĩ ra cho một mục đích tương tự cách đây vài năm: Cấp vốn bậc hai giới hạn theo cặp.
Mục tiêu của tài trợ bậc hai giới hạn theo cặp là để lấp đầy lỗ hổng trong tài trợ bậc hai "thông thường", trong đó ngay cả khi hai người chơi thông đồng với nhau, họ có thể đóng góp số tiền rất cao cho một dự án không có thật, số tiền được trả lại cho họ và Nhận các khoản trợ cấp lớn làm cạn kiệt toàn bộ số tiền của bạn. Trong tài trợ bậc hai giới hạn theo cặp, chúng tôi chỉ định ngân sách hữu hạn M cho mỗi cặp người tham gia. Thuật toán lặp lại trên tất cả các cặp người tham gia có thể và nếu thuật toán quyết định thêm một khoản trợ cấp cho một số dự án P vì cả người tham gia A và người tham gia B đều ủng hộ nó, thì khoản trợ cấp này sẽ được khấu trừ từ ngân sách được phân bổ cho cặp đó (A, B) . Do đó, ngay cả khi k người tham gia thông đồng, số tiền họ ăn cắp từ cơ chế tối đa là k *(k-1)*M.
Hình thức thuật toán này không hoạt động tốt trong bối cảnh Ghi chú cộng đồng, vì mỗi người dùng chỉ bỏ một số lượng phiếu bầu nhỏ: trung bình, phiếu bầu chung giữa hai người dùng bất kỳ bằng 0, vì vậy chỉ cần xem xét từng cặp Người dùng riêng lẻ, thuật toán không có cách nào để biết phân cực của người dùng. Mục tiêu của một mô hình máy học chính xác là cố gắng "điền" một ma trận từ dữ liệu nguồn rất thưa thớt không thể phân tích trực tiếp theo cách này. Nhưng thách thức với cách tiếp cận này là cần phải nỗ lực thêm để tránh những kết quả không ổn định cao khi đối mặt với một số lượng nhỏ phiếu bầu không tốt.
Ghi chú Cộng đồng có thực sự có thể chống lại Cánh tả và Cánh hữu không?
Chúng ta có thể phân tích xem liệu thuật toán Ghi chú cộng đồng có thực sự chống lại các điều kiện cực đoan hay không, nghĩa là liệu nó có hoạt động tốt hơn thuật toán bỏ phiếu ngây thơ hay không. Thuật toán bỏ phiếu này đã phần nào chống lại các thái cực: một bài đăng có 200 lượt thích và 100 lượt không thích sẽ hoạt động kém hơn một bài đăng chỉ có 200 lượt thích. Nhưng Ghi chú cộng đồng có làm tốt hơn không?
Từ quan điểm thuật toán trừu tượng, thật khó để nói. Tại sao một bài đăng phân cực có xếp hạng trung bình cao lại không thể có được sự phân cực mạnh và tính hữu dụng cao? Ý tưởng là nếu những phiếu bầu đó mâu thuẫn nhau, thì cực sẽ "hấp thụ" tính năng khiến bài đăng nhận được nhiều phiếu bầu, nhưng nó có thực sự làm được điều đó không?
Để kiểm tra điều này, tôi đã chạy triển khai đơn giản của mình trong 100 vòng. Kết quả trung bình như sau:
Trong thử nghiệm này, Ghi chú "tốt" được người dùng có cùng đảng phái chính trị xếp hạng +2, +0 bởi người dùng có đảng phái chính trị đối lập và Ghi chú "tốt nhưng cực đoan hơn" được người dùng cùng đảng phái xếp hạng +4 trong và -2 đối với người dùng thuộc phe đối lập. Mặc dù điểm trung bình là như nhau, nhưng đối cực là khác nhau. Và trên thực tế, mức độ hữu dụng trung bình của các Ghi chú "tốt" dường như cao hơn so với các Ghi chú "tốt nhưng cực kỳ nghiêng về".
Có một thuật toán gần với "thuật toán của nhà kinh tế học" sẽ có một câu chuyện rõ ràng hơn về cách thuật toán trừng phạt các thái cực.
Tất cả những điều này hữu ích như thế nào trong một tình huống rủi ro cao?
Chúng ta có thể tìm hiểu về một số trong số này bằng cách xem xét một tình huống cụ thể. Khoảng một tháng trước, Ian Bremmer đã phàn nàn rằng một tweet đã thêm Ghi chú cộng đồng rất quan trọng, nhưng Ghi chú đó đã bị xóa sau đó.
Đây là một nhiệm vụ khó khăn. Thiết kế cơ chế là một chuyện trong môi trường cộng đồng Ethereum, nơi khiếu nại lớn nhất có thể chỉ là 20.000 đô la dành cho một người có ảnh hưởng cực đoan trên Twitter. Đó là một câu chuyện khác khi nói đến các vấn đề chính trị và địa chính trị ảnh hưởng đến hàng triệu người và mọi người có xu hướng giả định một cách hợp lý những động cơ tồi tệ nhất có thể. Nhưng tương tác với những môi trường có tính rủi ro cao này là điều cần thiết nếu các nhà thiết kế cơ khí muốn có tác động đáng kể đến thế giới.
May mắn thay, thuật toán này là mã nguồn mở và có thể kiểm chứng được, vì vậy chúng ta thực sự có thể tìm hiểu sâu về nó! Làm thôi nào. URL của tweet gốc là số 1676157337109946369 ở cuối là ID của tweet. Chúng tôi có thể tìm kiếm ID đó trong dữ liệu có thể tải xuống và xác định hàng cụ thể trong bảng tính có Ghi chú ở trên:
Ở đây chúng tôi có ID của Ghi chú, 1676391378815709184 . Sau đó, chúng tôi tìm kiếm ID này trong các tệp ghi_notes.tsv và ghi chú_status_history.tsv được tạo bằng cách chạy thuật toán. Chúng tôi nhận được kết quả sau:
Cột thứ hai trong đầu ra đầu tiên là xếp hạng hiện tại của Ghi chú. Đầu ra thứ hai hiển thị lịch sử của Ghi chú: trạng thái hiện tại của nó nằm ở cột thứ bảy (NEEDS_MORE_RATINGS) và trạng thái đầu tiên mà nó nhận được không phải là NEEDS_MORE_RATINGS nằm trong cột năm (NEEDS_MORE_RATINGS ) . HIỆN_ĐÁNH GIÁ_HỖ TRỢ). Vì vậy, chúng ta có thể thấy rằng bản thân thuật toán trước tiên đã hiển thị các Ghi chú và sau đó xóa chúng sau khi xếp hạng của chúng giảm nhẹ - dường như không có sự can thiệp của trung tâm nào.
Chúng ta cũng có thể xem xét vấn đề này theo một cách khác bằng cách nhìn vào chính lá phiếu. Chúng tôi có thể quét tệp ratings-00000.tsv để cô lập tất cả các xếp hạng cho Ghi chú này và xem có bao nhiêu xếp hạng HỖ TRỢ và KHÔNG_HỖ TRỢ:
Tuy nhiên, nếu bạn sắp xếp chúng theo dấu thời gian và xem xét 50 phiếu bầu hàng đầu, bạn sẽ thấy rằng có 40 phiếu bầu HỖ TRỢ và 9 phiếu bầu KHÔNG_HỖ TRỢ. Vì vậy, chúng tôi đã đi đến cùng một kết luận: Notes được đánh giá tích cực hơn bởi khán giả ban đầu và ít hơn bởi khán giả sau này, vì vậy đánh giá của nó bắt đầu cao và giảm dần theo thời gian.
Thật không may, thật khó để giải thích chính xác cách Ghi chú thay đổi trạng thái: không đơn giản là "trước đây được xếp hạng trên 0,40, hiện được xếp hạng dưới 0,40, vì vậy nó bị xóa". Thay vào đó, số lượng lớn các câu trả lời KHÔNG_HỖ TRỢ sẽ kích hoạt một trong các điều kiện ngoại lệ, làm tăng điểm hữu ích mà Ghi chú cần duy trì trên ngưỡng.
Đây là một cơ hội học tập tuyệt vời khác dạy cho chúng ta một bài học: tạo ra một thuật toán trung lập đáng tin cậy thực sự đáng tin cậy đòi hỏi phải giữ cho nó đơn giản. Nếu một Ghi chú chuyển từ được chấp nhận sang không được chấp nhận, cần có một câu chuyện đơn giản và rõ ràng về lý do tại sao lại như vậy.
Tất nhiên, có một cách hoàn toàn khác mà cuộc bỏ phiếu này có thể bị thao túng: Chuẩn tướng. Người nào đó nhìn thấy Ghi chú mà họ không tán thành có thể kêu gọi một cộng đồng tương tác cao (hoặc tệ hơn là vô số tài khoản giả mạo) đánh giá nó KHÔNG_HỖ TRỢ, và có thể không cần nhiều phiếu bầu để nhận được Ghi chú từ " hữu ích" đến "cực đoan". Cần có nhiều phân tích và công việc hơn để giảm thiểu lỗ hổng của thuật toán trước các cuộc tấn công phối hợp như vậy. Một cải tiến có thể có là không cho phép bất kỳ người dùng nào bỏ phiếu cho bất kỳ Ghi chú nào mà thay vào đó chỉ định ngẫu nhiên Ghi chú cho người chấm điểm bằng cách sử dụng đề xuất thuật toán "dành cho bạn" và cho phép người chấm điểm chỉ chấm điểm những Ghi chú mà họ được chỉ định.
Ghi chú cộng đồng Không đủ "dũng cảm"?
Lời chỉ trích chính mà tôi thấy về Ghi chú cộng đồng về cơ bản là nó không đủ. Tôi thấy hai bài báo gần đây đề cập đến điều này. Để trích dẫn một trong những bài báo:
Quá trình này gặp phải một hạn chế nghiêm trọng là để Ghi chú Cộng đồng trở nên công khai, chúng phải được chấp nhận chung bởi sự đồng thuận của mọi người trong các lĩnh vực chính trị.
"Nó phải có một sự đồng thuận về ý thức hệ," ông nói. "Điều đó có nghĩa là những người ở bên trái và những người ở bên phải phải đồng ý rằng ghi chú phải được đính kèm với tweet."
Ông nói, về cơ bản, nó đòi hỏi "một sự đồng ý về ý thức hệ đối với sự thật, điều gần như không thể thực hiện được trong một môi trường đảng phái ngày càng gia tăng."
Đó là một câu hỏi hóc búa, nhưng cuối cùng tôi có xu hướng nghĩ rằng tốt hơn là để miễn phí mười tweet chứa thông tin sai lệch hơn là một tweet bị chú thích không công bằng. Chúng tôi đã chứng kiến nhiều năm xác minh thông tin thật dũng cảm và xuất phát từ quan điểm “thực ra chúng tôi biết sự thật, chúng tôi biết một bên nói dối thường xuyên hơn bên kia”. Chuyện gì sẽ xảy ra?
Thành thật mà nói, có một sự ngờ vực khá phổ biến đối với chính khái niệm kiểm tra thực tế. Ở đây, một chiến lược là nói: bỏ qua những lời chỉ trích đó, hãy nhớ rằng những người kiểm tra thực tế biết rõ sự thật hơn bất kỳ hệ thống bỏ phiếu nào và kiên trì với nó. Nhưng dốc toàn lực vào cách tiếp cận này có vẻ mạo hiểm. Có giá trị trong việc xây dựng các thể chế liên bộ tộc mà ít nhất là được tất cả mọi người tôn trọng. Giống như câu châm ngôn của William Blackstone và tòa án, tôi cảm thấy rằng việc duy trì sự tôn trọng đó đòi hỏi một hệ thống mắc lỗi do thiếu sót hơn là do lỗi tự nguyện. Vì vậy, đối với tôi, có vẻ đáng giá khi ít nhất một tổ chức lớn đang đi theo con đường khác biệt này và coi sự tôn trọng giữa các bộ tộc hiếm hoi của mình là một nguồn tài nguyên quý giá.
Một lý do khác mà tôi cho rằng việc Ghi chú cộng đồng có thể thận trọng là vì tôi không nghĩ rằng mọi tweet có thông tin sai, hoặc thậm chí hầu hết các tweet có thông tin sai, đều sẽ nhận được ghi chú chỉnh sửa. Ngay cả khi ít hơn một phần trăm các tweet có thông tin sai được chú thích để cung cấp ngữ cảnh hoặc chỉnh sửa, Ghi chú Cộng đồng vẫn cung cấp một dịch vụ cực kỳ có giá trị như một công cụ giáo dục. Mục tiêu không phải là sửa chữa mọi thứ; thay vào đó, mục tiêu là để nhắc nhở mọi người rằng có nhiều quan điểm khác nhau, rằng một số bài đăng có vẻ thuyết phục và hấp dẫn thực ra lại hoàn toàn sai, và rằng bạn, vâng, bạn thường có thể làm những điều cơ bản internet Tìm kiếm để xác minh nó sai.
Ghi chú cộng đồng không thể và cũng không được dự định là liều thuốc chữa bách bệnh cho mọi vấn đề trong nhận thức luận đại chúng. Bất kể vấn đề nào nó không giải quyết được, thì vẫn có rất nhiều chỗ cho các cơ chế khác lấp đầy, cho dù đó là tiện ích mới lạ như thị trường dự đoán hay các tổ chức lâu đời thuê nhân viên toàn thời gian có chuyên môn về miền để cố gắng lấp đầy khoảng trống.
Tóm lại là
Ghi chú cộng đồng không chỉ là một thử nghiệm hấp dẫn trên mạng xã hội mà còn là một ví dụ hấp dẫn về kiểu thiết kế cơ chế mới nổi: các cơ chế cố gắng xác định các thái cực một cách có ý thức và có xu hướng thúc đẩy sự giao thoa hơn là duy trì sự chia rẽ.
Hai ví dụ khác trong danh mục này mà tôi biết là: (i) cơ chế tài trợ bậc hai được ghép nối được sử dụng trong Gitcoin Grants và (ii) Polis, một công cụ thảo luận sử dụng thuật toán phân cụm để giúp cộng đồng xác định các tuyên bố phổ biến phổ biến dành cho những người thường có ý kiến khác nhau. Lĩnh vực thiết kế cơ chế này rất có giá trị và tôi hy vọng chúng ta sẽ thấy nhiều công trình học thuật hơn trong lĩnh vực này.
Tính minh bạch về thuật toán mà Ghi chú cộng đồng cung cấp không phải là phương tiện truyền thông xã hội phi tập trung hoàn toàn - nếu bạn không đồng ý với cách thức hoạt động của Ghi chú cộng đồng, thì không có cách nào để nhìn thấy một góc nhìn thuật toán khác trên cùng một nội dung. Nhưng đây là lần gần nhất mà các ứng dụng siêu quy mô sẽ đạt được trong vài năm tới và chúng ta có thể thấy rằng nó đã mang lại rất nhiều giá trị, vừa ngăn chặn sự thao túng tập trung vừa đảm bảo rằng các nền tảng không tham gia vào sự thao túng như vậy sẽ nhận được những gì xứng đáng được công nhận .
Tôi mong được thấy Ghi chú cộng đồng và nhiều thuật toán có tinh thần tương tự phát triển và lớn mạnh trong thập kỷ tới.
V God: Thử nghiệm mạng xã hội Ghi chú cộng đồng rất được mã hóa
Tác giả: Vitalik; Trình biên dịch: Deep Tide TechFlow
Hai năm qua được cho là đầy sóng gió đối với Twitter (X). Năm ngoái, Elon Musk đã mua nền tảng này với giá 44 tỷ USD, sau đó đại tu nhân sự, đánh giá nội dung, mô hình kinh doanh và văn hóa trang web của công ty. Tuy nhiên, giữa những động thái gây tranh cãi này, một tính năng mới trên Twitter đang nhanh chóng trở nên quan trọng và dường như được ưu ái trên toàn bộ phạm vi chính trị: Ghi chú cộng đồng.
Ghi chú cộng đồng là một công cụ kiểm tra tính xác thực đôi khi đính kèm các chú thích theo ngữ cảnh vào các tweet, giống như chú thích của Elon Musk ở trên, như một công cụ kiểm tra tính xác thực và chống thông tin sai lệch. Ban đầu nó được gọi là Birdwatch và được ra mắt lần đầu tiên dưới dạng chương trình thử nghiệm vào tháng 1 năm 2021. Kể từ đó, nó đã dần dần mở rộng, với giai đoạn mở rộng nhanh nhất trùng với thời điểm Elon Musk tiếp quản Twitter vào năm ngoái. Ngày nay, Ghi chú cộng đồng là một tính năng thường xuyên của các tweet thu hút nhiều sự chú ý trên Twitter, bao gồm cả những nội dung đề cập đến các chủ đề chính trị gây tranh cãi. Theo ý kiến của tôi, và từ các cuộc trò chuyện của tôi với nhiều người trong các lĩnh vực chính trị, những Ghi chú này có nhiều thông tin và có giá trị khi chúng xuất hiện.
Nhưng điều khiến tôi quan tâm nhất là Ghi chú cộng đồng, mặc dù không phải là một "dự án tiền điện tử", nhưng có lẽ là ví dụ gần nhất về "giá trị tiền điện tử" mà chúng tôi từng thấy trong thế giới chính thống. Ghi chú cộng đồng không được viết hoặc quản lý bởi một số chuyên gia được chọn tập trung; thay vào đó, bất kỳ ai cũng có thể viết và bỏ phiếu, và Ghi chú nào sẽ hiển thị hay không hiển thị được xác định hoàn toàn bằng thuật toán nguồn mở. Trang web Twitter có hướng dẫn chi tiết và toàn diện mô tả cách thức hoạt động của thuật toán và bạn có thể tải xuống dữ liệu chứa Ghi chú và phiếu bầu đã đăng, chạy cục bộ thuật toán và xác minh rằng đầu ra khớp với những gì hiển thị trên trang web Twitter. Mặc dù không hoàn hảo, nhưng nó gần với lý tưởng về tính trung lập đáng tin cậy một cách đáng ngạc nhiên trong các tình huống khá gây tranh cãi, đồng thời cũng rất hữu ích.
Thuật toán Ghi chú cộng đồng hoạt động như thế nào?
Bất kỳ ai có tài khoản Twitter đáp ứng các tiêu chí nhất định (về cơ bản: hoạt động hơn 6 tháng, không có lịch sử vi phạm, số điện thoại di động đã được xác minh) đều có thể đăng ký tham gia Ghi chú cộng đồng. Hiện tại, những người tham gia đang được chấp nhận một cách chậm rãi và ngẫu nhiên, nhưng cuối cùng thì kế hoạch là cho phép bất kỳ ai đủ điều kiện tham gia. Sau khi được chấp nhận, trước tiên bạn có thể tham gia chấm điểm các Ghi chú hiện có và khi việc chấm điểm của bạn đủ tốt (được đo bằng cách xem cách chấm điểm nào phù hợp với kết quả cuối cùng cho Ghi chú đó), bạn cũng có thể viết Ghi chú của riêng mình.
Khi bạn viết Ghi chú, Ghi chú sẽ nhận được điểm dựa trên đánh giá của các thành viên Ghi chú cộng đồng khác. Những bài đánh giá này có thể được xem dưới dạng phiếu bầu theo ba cấp độ "hữu ích", "hữu ích một chút" và "không hữu ích", nhưng các bài đánh giá cũng có thể chứa các nhãn khác đóng vai trò trong thuật toán. Dựa trên những đánh giá này, Ghi chú được cho điểm. Nếu điểm của Ghi chú vượt quá 0,40 thì Ghi chú này sẽ được hiển thị, nếu không, Ghi chú này sẽ không được hiển thị.
Điều làm cho thuật toán trở nên độc đáo là cách tính điểm. Không giống như các thuật toán đơn giản, được thiết kế để đơn giản tính toán một số loại tổng hoặc trung bình xếp hạng của người dùng và sử dụng kết quả đó làm kết quả cuối cùng, thuật toán xếp hạng Ghi chú cộng đồng cố gắng ưu tiên rõ ràng những thứ nhận được xếp hạng tích cực từ những người có quan điểm khác nhau về Ghi chú. Nghĩa là, nếu những người thường không đồng ý về xếp hạng cuối cùng lại đồng ý về một Ghi chú cụ thể, thì Ghi chú đó sẽ được đánh giá cao.
Chúng ta hãy xem xét sâu hơn về cách thức hoạt động của nó. Chúng ta có một nhóm người dùng và một nhóm Ghi chú; chúng ta có thể tạo ma trận M trong đó ô Mij biểu thị cách người dùng thứ i đánh giá Ghi chú thứ j.
Đối với bất kỳ Ghi chú cụ thể nào, hầu hết người dùng chưa xếp hạng Ghi chú đó, vì vậy hầu hết các mục trong ma trận sẽ bằng 0, nhưng điều đó không sao cả. Mục tiêu của thuật toán là tạo mô hình bốn cột gồm người dùng và Ghi chú, chỉ định cho mỗi người dùng hai thống kê mà chúng tôi có thể gọi là "Mức độ thân thiện" và "Tính phân cực" đồng thời gán cho mỗi Ghi chú hai thống kê, chúng tôi gọi đó là "tính hữu dụng" và "phân cực". Mô hình cố gắng dự đoán ma trận dưới dạng hàm của các giá trị này, sử dụng công thức sau:
Lưu ý rằng ở đây tôi giới thiệu thuật ngữ được sử dụng trong bài báo Birdwatch, cũng như thuật ngữ của riêng tôi để cung cấp sự hiểu biết trực quan hơn về ý nghĩa của các biến mà không cần đi sâu vào các khái niệm toán học:
Thuật toán sử dụng một mô hình học máy khá cơ bản (tiêu chuẩn giảm độ dốc) để tìm các giá trị biến tốt nhất để dự đoán các giá trị ma trận. Tính hữu ích được gán cho một Ghi chú cụ thể là điểm số cuối cùng cho Ghi chú đó. Một Ghi chú sẽ được hiển thị nếu tính hữu dụng của nó ít nhất là + 0,4.
Sự khéo léo cốt lõi ở đây là "tính phân cực" hấp thụ các đặc điểm của Ghi chú, khiến nó được một số người dùng thích và không thích bởi những người dùng khác, trong khi "tính hữu dụng" chỉ đo lường các đặc điểm của Ghi chú. Các tính năng này dẫn đến việc nó được yêu thích bởi tất cả người dùng. Do đó, việc chọn tính hữu ích sẽ xác định các Ghi chú được chấp thuận giữa các bộ lạc và loại trừ các Ghi chú được ca ngợi ở một bộ lạc nhưng không thích ở bộ tộc khác.
Ở trên chỉ mô tả phần cốt lõi của thuật toán. Trên thực tế, có rất nhiều cơ chế bổ sung được thêm vào. May mắn thay, chúng được mô tả trong tài liệu công cộng. Các cơ chế này bao gồm:
Tất cả đã nói, bạn kết thúc với một số mã Python khá phức tạp với tổng số 6282 dòng trải rộng trên 22 tệp. Nhưng tất cả đều mở và bạn có thể tải xuống Ghi chú và dữ liệu chấm điểm rồi tự chạy để xem liệu đầu ra có khớp với những gì đang thực sự xảy ra trên Twitter hay không.
Vì vậy, điều này trông như thế nào trong thực tế?
Có lẽ sự khác biệt lớn nhất giữa thuật toán này và phương pháp đơn giản lấy điểm trung bình từ phiếu bầu của mọi người là khái niệm về cái mà tôi gọi là giá trị "phân cực". Tài liệu về thuật toán gọi chúng là fu và fn, sử dụng f làm thừa số vì hai số hạng nhân với nhau; thuật ngữ tổng quát hơn một phần là do mong muốn cuối cùng biến fu và fn thành đa chiều.
Phân cực được gán cho người dùng và Ghi chú. Liên kết giữa ID người dùng và tài khoản Twitter cơ bản được cố tình giữ kín, nhưng Ghi chú được công khai. Trên thực tế, ít nhất là đối với tập dữ liệu tiếng Anh, cực do thuật toán tạo tương quan rất chặt chẽ với trái và phải.
Dưới đây là một số ví dụ Ghi chú có cực tính khoảng -0,8:
Lưu ý rằng tôi không chọn anh đào ở đây; đây thực sự là ba hàng đầu tiên trong bảng tính_notes.tsv đã ghi điểm mà tôi tạo ra khi chạy thuật toán cục bộ và điểm phân cực của chúng (được gọi là coreNoteFactor 1 trong bảng tính ) ít hơn -0,8.
Bây giờ, đây là một số Ghi chú có phân cực khoảng +0,8. Hóa ra, nhiều người trong số họ hoặc là những người đang nói về chính trị Brazil bằng tiếng Bồ Đào Nha hoặc là những người hâm mộ Tesla đang tức giận bác bỏ những lời chỉ trích Tesla, vì vậy hãy để tôi chọn lọc một chút và tìm một số Ghi chú không thuộc cả hai loại:
Xin nhắc lại, "phép chia trái và phải" không được mã hóa cứng vào thuật toán theo bất kỳ cách nào; nó được phát hiện bằng máy tính. Điều này cho thấy rằng nếu bạn áp dụng thuật toán này cho các bối cảnh văn hóa khác, nó có thể tự động phát hiện sự chia rẽ chính trị chính của họ và xây dựng cầu nối giữa họ.
Trong khi đó, Ghi chú có tính hữu dụng cao nhất trông như thế này. Lần này, vì Ghi chú thực sự hiển thị trên Twitter, tôi chỉ có thể chụp màn hình một ghi chú:
Và một cái khác:
Đối với Ghi chú thứ hai, nó đề cập trực tiếp hơn đến các chủ đề chính trị mang tính đảng phái cao, nhưng đó là một Ghi chú rõ ràng, chất lượng cao và nhiều thông tin nên được điểm cao cho nó. Nhìn chung, thuật toán có vẻ hoạt động và có vẻ khả thi để xác minh đầu ra của thuật toán bằng cách chạy mã.
Tôi nghĩ gì về thuật toán?
Điều khiến tôi ấn tượng nhất khi phân tích thuật toán này là độ phức tạp của nó. Có một "phiên bản bài báo học thuật" sử dụng độ dốc giảm dần để tìm phương trình phù hợp nhất với phương trình ma trận và véc tơ năm hạng, sau đó là phiên bản thực, một loạt các thực thi thuật toán phức tạp với nhiều lần thực hiện khác nhau và rất nhiều hệ số tùy ý. .
Ngay cả các phiên bản giấy học thuật cũng ẩn chứa những phức tạp cơ bản. Phương trình mà nó tối ưu hóa là một bậc bốn âm (vì có một số hạng fu*fn bậc hai trong công thức dự đoán và hàm chi phí đo bình phương của sai số). Mặc dù việc tối ưu hóa một phương trình bậc hai trên bất kỳ số biến nào hầu như luôn có một nghiệm duy nhất mà bạn có thể tìm ra bằng đại số tuyến tính khá cơ bản, nhưng việc tối ưu hóa một phương trình bậc hai trên nhiều biến thường sẽ có nhiều nghiệm, do đó, nhiều vòng của thuật toán giảm dần độ dốc câu trả lời khác nhau có thể thu được. Những thay đổi nhỏ về đầu vào có thể khiến đường xuống chuyển từ mức tối thiểu cục bộ này sang mức tối thiểu cục bộ khác, làm thay đổi đáng kể kết quả đầu ra.
Sự khác biệt giữa điều này và các thuật toán mà tôi đã giúp phát triển, chẳng hạn như cấp vốn bậc hai, đối với tôi giống như sự khác biệt giữa thuật toán của một nhà kinh tế học và thuật toán của một kỹ sư. Các thuật toán của các nhà kinh tế, tốt nhất, tập trung vào sự đơn giản, tương đối dễ phân tích và có các thuộc tính toán học rõ ràng cho thấy rằng chúng là tối ưu (hoặc ít tệ nhất) cho nhiệm vụ hiện tại và lý tưởng nhất là chứng minh rằng ai đó có thể gây ra bao nhiêu thiệt hại trong cố gắng tận dụng lợi thế của nó. Mặt khác, thuật toán của một kỹ sư được bắt nguồn thông qua quá trình thử và sai lặp đi lặp lại để xem cái gì hoạt động và cái gì không trong môi trường hoạt động của kỹ sư. Thuật toán của một kỹ sư là thực dụng và hoàn thành công việc; thuật toán của một nhà kinh tế học không hoàn toàn mất kiểm soát khi đối mặt với những điều bất ngờ.
Hoặc, như nhà triết học internet được kính trọng roon (hay còn gọi là tszzl) đã đưa nó vào một chủ đề liên quan:
Tất nhiên, tôi muốn nói rằng khía cạnh "thẩm mỹ lý thuyết" của tiền điện tử là cần thiết để có thể phân biệt chính xác giữa những giao thức thực sự không đáng tin cậy và những giao thức có vẻ tốt và hoạt động bề ngoài tốt, nhưng thực sự cần phải tin tưởng vào một số tác nhân tập trung, Hoặc thậm chí tệ hơn, nó có thể là một trò lừa đảo hoàn toàn.
Học sâu có hiệu quả trong các điều kiện bình thường, nhưng nó có những điểm yếu không thể tránh khỏi trước các cuộc tấn công học máy đối nghịch khác nhau. Nếu được thực hiện đúng, các bẫy kỹ thuật và thang trừu tượng cao có thể chống lại các cuộc tấn công này. Vì vậy, tôi có một câu hỏi: Liệu chúng ta có thể tự biến Ghi chú cộng đồng thành thứ gì đó giống thuật toán kinh tế hơn không?
Để xem điều này có nghĩa là gì trong thực tế, hãy khám phá một thuật toán mà tôi đã nghĩ ra cho một mục đích tương tự cách đây vài năm: Cấp vốn bậc hai giới hạn theo cặp.
Mục tiêu của tài trợ bậc hai giới hạn theo cặp là để lấp đầy lỗ hổng trong tài trợ bậc hai "thông thường", trong đó ngay cả khi hai người chơi thông đồng với nhau, họ có thể đóng góp số tiền rất cao cho một dự án không có thật, số tiền được trả lại cho họ và Nhận các khoản trợ cấp lớn làm cạn kiệt toàn bộ số tiền của bạn. Trong tài trợ bậc hai giới hạn theo cặp, chúng tôi chỉ định ngân sách hữu hạn M cho mỗi cặp người tham gia. Thuật toán lặp lại trên tất cả các cặp người tham gia có thể và nếu thuật toán quyết định thêm một khoản trợ cấp cho một số dự án P vì cả người tham gia A và người tham gia B đều ủng hộ nó, thì khoản trợ cấp này sẽ được khấu trừ từ ngân sách được phân bổ cho cặp đó (A, B) . Do đó, ngay cả khi k người tham gia thông đồng, số tiền họ ăn cắp từ cơ chế tối đa là k *(k-1)*M.
Hình thức thuật toán này không hoạt động tốt trong bối cảnh Ghi chú cộng đồng, vì mỗi người dùng chỉ bỏ một số lượng phiếu bầu nhỏ: trung bình, phiếu bầu chung giữa hai người dùng bất kỳ bằng 0, vì vậy chỉ cần xem xét từng cặp Người dùng riêng lẻ, thuật toán không có cách nào để biết phân cực của người dùng. Mục tiêu của một mô hình máy học chính xác là cố gắng "điền" một ma trận từ dữ liệu nguồn rất thưa thớt không thể phân tích trực tiếp theo cách này. Nhưng thách thức với cách tiếp cận này là cần phải nỗ lực thêm để tránh những kết quả không ổn định cao khi đối mặt với một số lượng nhỏ phiếu bầu không tốt.
Ghi chú Cộng đồng có thực sự có thể chống lại Cánh tả và Cánh hữu không?
Chúng ta có thể phân tích xem liệu thuật toán Ghi chú cộng đồng có thực sự chống lại các điều kiện cực đoan hay không, nghĩa là liệu nó có hoạt động tốt hơn thuật toán bỏ phiếu ngây thơ hay không. Thuật toán bỏ phiếu này đã phần nào chống lại các thái cực: một bài đăng có 200 lượt thích và 100 lượt không thích sẽ hoạt động kém hơn một bài đăng chỉ có 200 lượt thích. Nhưng Ghi chú cộng đồng có làm tốt hơn không?
Từ quan điểm thuật toán trừu tượng, thật khó để nói. Tại sao một bài đăng phân cực có xếp hạng trung bình cao lại không thể có được sự phân cực mạnh và tính hữu dụng cao? Ý tưởng là nếu những phiếu bầu đó mâu thuẫn nhau, thì cực sẽ "hấp thụ" tính năng khiến bài đăng nhận được nhiều phiếu bầu, nhưng nó có thực sự làm được điều đó không?
Để kiểm tra điều này, tôi đã chạy triển khai đơn giản của mình trong 100 vòng. Kết quả trung bình như sau:
Trong thử nghiệm này, Ghi chú "tốt" được người dùng có cùng đảng phái chính trị xếp hạng +2, +0 bởi người dùng có đảng phái chính trị đối lập và Ghi chú "tốt nhưng cực đoan hơn" được người dùng cùng đảng phái xếp hạng +4 trong và -2 đối với người dùng thuộc phe đối lập. Mặc dù điểm trung bình là như nhau, nhưng đối cực là khác nhau. Và trên thực tế, mức độ hữu dụng trung bình của các Ghi chú "tốt" dường như cao hơn so với các Ghi chú "tốt nhưng cực kỳ nghiêng về".
Có một thuật toán gần với "thuật toán của nhà kinh tế học" sẽ có một câu chuyện rõ ràng hơn về cách thuật toán trừng phạt các thái cực.
Tất cả những điều này hữu ích như thế nào trong một tình huống rủi ro cao?
Chúng ta có thể tìm hiểu về một số trong số này bằng cách xem xét một tình huống cụ thể. Khoảng một tháng trước, Ian Bremmer đã phàn nàn rằng một tweet đã thêm Ghi chú cộng đồng rất quan trọng, nhưng Ghi chú đó đã bị xóa sau đó.
Đây là một nhiệm vụ khó khăn. Thiết kế cơ chế là một chuyện trong môi trường cộng đồng Ethereum, nơi khiếu nại lớn nhất có thể chỉ là 20.000 đô la dành cho một người có ảnh hưởng cực đoan trên Twitter. Đó là một câu chuyện khác khi nói đến các vấn đề chính trị và địa chính trị ảnh hưởng đến hàng triệu người và mọi người có xu hướng giả định một cách hợp lý những động cơ tồi tệ nhất có thể. Nhưng tương tác với những môi trường có tính rủi ro cao này là điều cần thiết nếu các nhà thiết kế cơ khí muốn có tác động đáng kể đến thế giới.
May mắn thay, thuật toán này là mã nguồn mở và có thể kiểm chứng được, vì vậy chúng ta thực sự có thể tìm hiểu sâu về nó! Làm thôi nào. URL của tweet gốc là số 1676157337109946369 ở cuối là ID của tweet. Chúng tôi có thể tìm kiếm ID đó trong dữ liệu có thể tải xuống và xác định hàng cụ thể trong bảng tính có Ghi chú ở trên:
Ở đây chúng tôi có ID của Ghi chú, 1676391378815709184 . Sau đó, chúng tôi tìm kiếm ID này trong các tệp ghi_notes.tsv và ghi chú_status_history.tsv được tạo bằng cách chạy thuật toán. Chúng tôi nhận được kết quả sau:
Cột thứ hai trong đầu ra đầu tiên là xếp hạng hiện tại của Ghi chú. Đầu ra thứ hai hiển thị lịch sử của Ghi chú: trạng thái hiện tại của nó nằm ở cột thứ bảy (NEEDS_MORE_RATINGS) và trạng thái đầu tiên mà nó nhận được không phải là NEEDS_MORE_RATINGS nằm trong cột năm (NEEDS_MORE_RATINGS ) . HIỆN_ĐÁNH GIÁ_HỖ TRỢ). Vì vậy, chúng ta có thể thấy rằng bản thân thuật toán trước tiên đã hiển thị các Ghi chú và sau đó xóa chúng sau khi xếp hạng của chúng giảm nhẹ - dường như không có sự can thiệp của trung tâm nào.
Chúng ta cũng có thể xem xét vấn đề này theo một cách khác bằng cách nhìn vào chính lá phiếu. Chúng tôi có thể quét tệp ratings-00000.tsv để cô lập tất cả các xếp hạng cho Ghi chú này và xem có bao nhiêu xếp hạng HỖ TRỢ và KHÔNG_HỖ TRỢ:
Tuy nhiên, nếu bạn sắp xếp chúng theo dấu thời gian và xem xét 50 phiếu bầu hàng đầu, bạn sẽ thấy rằng có 40 phiếu bầu HỖ TRỢ và 9 phiếu bầu KHÔNG_HỖ TRỢ. Vì vậy, chúng tôi đã đi đến cùng một kết luận: Notes được đánh giá tích cực hơn bởi khán giả ban đầu và ít hơn bởi khán giả sau này, vì vậy đánh giá của nó bắt đầu cao và giảm dần theo thời gian.
Thật không may, thật khó để giải thích chính xác cách Ghi chú thay đổi trạng thái: không đơn giản là "trước đây được xếp hạng trên 0,40, hiện được xếp hạng dưới 0,40, vì vậy nó bị xóa". Thay vào đó, số lượng lớn các câu trả lời KHÔNG_HỖ TRỢ sẽ kích hoạt một trong các điều kiện ngoại lệ, làm tăng điểm hữu ích mà Ghi chú cần duy trì trên ngưỡng.
Đây là một cơ hội học tập tuyệt vời khác dạy cho chúng ta một bài học: tạo ra một thuật toán trung lập đáng tin cậy thực sự đáng tin cậy đòi hỏi phải giữ cho nó đơn giản. Nếu một Ghi chú chuyển từ được chấp nhận sang không được chấp nhận, cần có một câu chuyện đơn giản và rõ ràng về lý do tại sao lại như vậy.
Tất nhiên, có một cách hoàn toàn khác mà cuộc bỏ phiếu này có thể bị thao túng: Chuẩn tướng. Người nào đó nhìn thấy Ghi chú mà họ không tán thành có thể kêu gọi một cộng đồng tương tác cao (hoặc tệ hơn là vô số tài khoản giả mạo) đánh giá nó KHÔNG_HỖ TRỢ, và có thể không cần nhiều phiếu bầu để nhận được Ghi chú từ " hữu ích" đến "cực đoan". Cần có nhiều phân tích và công việc hơn để giảm thiểu lỗ hổng của thuật toán trước các cuộc tấn công phối hợp như vậy. Một cải tiến có thể có là không cho phép bất kỳ người dùng nào bỏ phiếu cho bất kỳ Ghi chú nào mà thay vào đó chỉ định ngẫu nhiên Ghi chú cho người chấm điểm bằng cách sử dụng đề xuất thuật toán "dành cho bạn" và cho phép người chấm điểm chỉ chấm điểm những Ghi chú mà họ được chỉ định.
Ghi chú cộng đồng Không đủ "dũng cảm"?
Lời chỉ trích chính mà tôi thấy về Ghi chú cộng đồng về cơ bản là nó không đủ. Tôi thấy hai bài báo gần đây đề cập đến điều này. Để trích dẫn một trong những bài báo:
Quá trình này gặp phải một hạn chế nghiêm trọng là để Ghi chú Cộng đồng trở nên công khai, chúng phải được chấp nhận chung bởi sự đồng thuận của mọi người trong các lĩnh vực chính trị.
"Nó phải có một sự đồng thuận về ý thức hệ," ông nói. "Điều đó có nghĩa là những người ở bên trái và những người ở bên phải phải đồng ý rằng ghi chú phải được đính kèm với tweet."
Ông nói, về cơ bản, nó đòi hỏi "một sự đồng ý về ý thức hệ đối với sự thật, điều gần như không thể thực hiện được trong một môi trường đảng phái ngày càng gia tăng."
Đó là một câu hỏi hóc búa, nhưng cuối cùng tôi có xu hướng nghĩ rằng tốt hơn là để miễn phí mười tweet chứa thông tin sai lệch hơn là một tweet bị chú thích không công bằng. Chúng tôi đã chứng kiến nhiều năm xác minh thông tin thật dũng cảm và xuất phát từ quan điểm “thực ra chúng tôi biết sự thật, chúng tôi biết một bên nói dối thường xuyên hơn bên kia”. Chuyện gì sẽ xảy ra?
Thành thật mà nói, có một sự ngờ vực khá phổ biến đối với chính khái niệm kiểm tra thực tế. Ở đây, một chiến lược là nói: bỏ qua những lời chỉ trích đó, hãy nhớ rằng những người kiểm tra thực tế biết rõ sự thật hơn bất kỳ hệ thống bỏ phiếu nào và kiên trì với nó. Nhưng dốc toàn lực vào cách tiếp cận này có vẻ mạo hiểm. Có giá trị trong việc xây dựng các thể chế liên bộ tộc mà ít nhất là được tất cả mọi người tôn trọng. Giống như câu châm ngôn của William Blackstone và tòa án, tôi cảm thấy rằng việc duy trì sự tôn trọng đó đòi hỏi một hệ thống mắc lỗi do thiếu sót hơn là do lỗi tự nguyện. Vì vậy, đối với tôi, có vẻ đáng giá khi ít nhất một tổ chức lớn đang đi theo con đường khác biệt này và coi sự tôn trọng giữa các bộ tộc hiếm hoi của mình là một nguồn tài nguyên quý giá.
Một lý do khác mà tôi cho rằng việc Ghi chú cộng đồng có thể thận trọng là vì tôi không nghĩ rằng mọi tweet có thông tin sai, hoặc thậm chí hầu hết các tweet có thông tin sai, đều sẽ nhận được ghi chú chỉnh sửa. Ngay cả khi ít hơn một phần trăm các tweet có thông tin sai được chú thích để cung cấp ngữ cảnh hoặc chỉnh sửa, Ghi chú Cộng đồng vẫn cung cấp một dịch vụ cực kỳ có giá trị như một công cụ giáo dục. Mục tiêu không phải là sửa chữa mọi thứ; thay vào đó, mục tiêu là để nhắc nhở mọi người rằng có nhiều quan điểm khác nhau, rằng một số bài đăng có vẻ thuyết phục và hấp dẫn thực ra lại hoàn toàn sai, và rằng bạn, vâng, bạn thường có thể làm những điều cơ bản internet Tìm kiếm để xác minh nó sai.
Ghi chú cộng đồng không thể và cũng không được dự định là liều thuốc chữa bách bệnh cho mọi vấn đề trong nhận thức luận đại chúng. Bất kể vấn đề nào nó không giải quyết được, thì vẫn có rất nhiều chỗ cho các cơ chế khác lấp đầy, cho dù đó là tiện ích mới lạ như thị trường dự đoán hay các tổ chức lâu đời thuê nhân viên toàn thời gian có chuyên môn về miền để cố gắng lấp đầy khoảng trống.
Tóm lại là
Ghi chú cộng đồng không chỉ là một thử nghiệm hấp dẫn trên mạng xã hội mà còn là một ví dụ hấp dẫn về kiểu thiết kế cơ chế mới nổi: các cơ chế cố gắng xác định các thái cực một cách có ý thức và có xu hướng thúc đẩy sự giao thoa hơn là duy trì sự chia rẽ.
Hai ví dụ khác trong danh mục này mà tôi biết là: (i) cơ chế tài trợ bậc hai được ghép nối được sử dụng trong Gitcoin Grants và (ii) Polis, một công cụ thảo luận sử dụng thuật toán phân cụm để giúp cộng đồng xác định các tuyên bố phổ biến phổ biến dành cho những người thường có ý kiến khác nhau. Lĩnh vực thiết kế cơ chế này rất có giá trị và tôi hy vọng chúng ta sẽ thấy nhiều công trình học thuật hơn trong lĩnh vực này.
Tính minh bạch về thuật toán mà Ghi chú cộng đồng cung cấp không phải là phương tiện truyền thông xã hội phi tập trung hoàn toàn - nếu bạn không đồng ý với cách thức hoạt động của Ghi chú cộng đồng, thì không có cách nào để nhìn thấy một góc nhìn thuật toán khác trên cùng một nội dung. Nhưng đây là lần gần nhất mà các ứng dụng siêu quy mô sẽ đạt được trong vài năm tới và chúng ta có thể thấy rằng nó đã mang lại rất nhiều giá trị, vừa ngăn chặn sự thao túng tập trung vừa đảm bảo rằng các nền tảng không tham gia vào sự thao túng như vậy sẽ nhận được những gì xứng đáng được công nhận .
Tôi mong được thấy Ghi chú cộng đồng và nhiều thuật toán có tinh thần tương tự phát triển và lớn mạnh trong thập kỷ tới.