Sentient: Kết hợp những mô hình AI Mở và Đóng tốt nhất

Trung cấp11/18/2024, 4:12:26 AM
Mô tả Meta: Sentient là một nền tảng cho các mô hình Clopen AI, kết hợp tốt nhất của cả các mô hình mở và đóng. Nền tảng này có hai thành phần chính: OML và Sentient Protocol.

Chuyển tiêu đề gốc: Sentient: Tất cả những gì bạn cần biết - Kết hợp điều tốt nhất từ các mô hình AI mở và đóng

GM bạn bè!

Hôm nay chúng tôi có một bài viết khách củaMoyed, với đóng góp biên tập từ Teng Yan. Chúng tôi rất thích hỗ trợ các nhà nghiên cứu thông minh và trẻ tuổi trong lĩnh vực này. Nó cũng có thể được tìm thấy được xuất bản trên trang web của anh ấy trên Đoạn văn.

Startup Spotlight — Sentient

TL;dr (Nếu bạn bận rộn, chúng tôi đã có bạn)

  • Sentient là một nền tảng cho các mô hình trí tuệ nhân tạo “Clopen”, kết hợp những điều tốt nhất từ cả hai loại mô hình mở và đóng.
  • Nền tảng có hai thành phần chính: (1) OML và (2) Giao thức Sentient
  • OML là phương pháp của Sentient để kiếm tiền từ các mô hình mở, cho phép chủ sở hữu mô hình nhận được tiền. Mỗi khi yêu cầu suy luận, nó sử dụng một Chuỗi Quyền cho việc xác minh.
  • Tiền tệ hóa là vấn đề chính Sentient đang giải quyết - nếu không có nó, Sentient sẽ chỉ là một nền tảng khác tổng hợp mô hình AI mã nguồn mở.
  • Thông qua việc xác minh vân tay mô hình trong quá trình huấn luyện, như một dấu ấn trên một bức ảnh. Càng nhiều vân tay càng đảm bảo an ninh cao hơn, nhưng điều này đồng nghĩa với hiệu suất giảm.
  • Sentient Protocol là blockchain xử lý các nhu cầu của chủ sở hữu mô hình, máy chủ, người dùng và những người chứng minh, tất cả mà không cần kiểm soát tập trung.

Hôm nay, tôi muốn giới thiệu Sentient, một trong những dự án được mong chờ nhất trong Crypto AI. Tôi thực sự tò mò liệu nó có đáng giá 85 triệu đô la được huy động trong vòng gửi gốc của họ, do dẫn đầu bởi Quỹ Sáng Lập của Peter Thiel.

Tôi đã chọn Sentient vì khi đọc whitepaper của nó, tôi phát hiện ra rằng kỹ thuật Model Fingerprinting mà tôi học được trong khóa học AI Safety đã được sử dụng. Tiếp theo, tôi tiếp tục đọc và nghĩ rằng, ‘Chắc hẳn đáng để chia sẻ’.

Hôm nay, chúng tôi sẽ trích xuất những khái niệm chính từ bài whitepaper dày 59 trang của họ thành một bài viết ngắn 10 phút đọc. Nhưng nếu sau khi đọc bài viết này bạn quan tâm đến Sentient, tôi khuyến nghị bạn đọc whitepaper.

Tầm nhìn của Sentient

Để giới thiệu Sentient trong một câu, đó là một nền tảng cho các mô hình AI ‘Clopen’.

Clopen ở đây có nghĩa là Đóng + Mở, đại diện cho các mô hình AI kết hợp sức mạnh của cả mô hình đóng và mô hình mở.

Hãy xem xét ưu điểm và nhược điểm:

  • Mô hình AI đóng: Mô hình AI đóng, như GPT của OpenAI, cho phép người dùng truy cập mô hình qua API, với quyền sở hữu hoàn toàn thuộc về công ty. Ưu điểm là thực thể tạo ra mô hình giữ quyền sở hữu, nhưng nhược điểm là người dùng không thể đảm bảo tính minh bạch hoặc có một số tự do đối với mô hình.
  • Các mô hình AI mở: Các mô hình AI mở, như Llama của Meta, cho phép người dùng tải xuống và sửa đổi mô hình một cách tự do. Ưu điểm là người dùng có được tính minh bạch và kiểm soát đối với mô hình, nhưng nhược điểm là người tạo không giữ quyền sở hữu hoặc lợi nhuận từ việc sử dụng nó.

Sentient nhằm tạo ra một nền tảng cho các mô hình Clopen AI kết hợp cả hai lợi ích.

Nói cách khác, Sentient tạo ra một môi trường cho người dùng có thể tự do sử dụng và chỉnh sửa các mô hình AI trong khi cho phép người tạo giữ quyền sở hữu và lợi nhuận từ mô hình.

Diễn viên Chính

Sentient liên quan đến bốn diễn viên chính:

  • Chủ sở hữu mô hình: Thực thể tạo ra và tải lên một mô hình trí tuệ nhân tạo lên Giao thức Sentient.
  • Mô hình Máy chủ: Đơn vị sử dụng mô hình AI đã được tải lên để tạo dịch vụ.
  • Người dùng cuối: Những người dùng chung sử dụng dịch vụ được tạo ra bởi Máy chủ Mô hình.
  • Prover: Một người tham gia giám sát Máy chủ Mô hình và được thưởng một khoản phí nhỏ.

User Flow

Xây dựng lại từ Hồ sơ của Sentient Hình 3.1 & 3.2

  1. Người sở hữu mô hình tạo và tải lên một mô hình AI lên Giao thức Nhạy cảm.
  2. Máy chủ Mô hình yêu cầu truy cập vào mô hình mong muốn từ Giao thức Nhận thức.
  3. Giao thức Sentient chuyển đổi mô hình sang định dạng OML. Việc tạo dấu vân tay mô hình, một cơ chế để xác minh quyền sở hữu mô hình, được nhúng vào mô hình trong quá trình này.
  4. Model Host khóa một số tài sản thế chấp với Giao thức Cảm nhận. Sau khi hoàn thành điều này, Model Host có thể tải xuống và sử dụng mô hình để tạo dịch vụ trí tuệ nhân tạo.
  5. Khi người dùng cuối sử dụng dịch vụ AI, Máy chủ Mô hình trả phí cho Giao thức Sentient và yêu cầu một ‘Chuỗi Quyền’.
  6. Sentient Protocol cung cấp Chuỗi Quyền, và Máy Chủ Mô Hình phản hồi yêu cầu suy luận của Người Dùng Cuối.
  7. The Sentient Protocol thu thập phí và phân phối phần thưởng cho Chủ sở hữu Mô hình và những người đóng góp khác.
  8. Nếu Prover phát hiện vi phạm quy định bởi Model Host (ví dụ: sử dụng mô hình không đạo đức, không thanh toán phí), tài sản thế chấp của Model Host sẽ bị cắt giảm và Prover sẽ được thưởng.

Hai thành phần cốt lõi của Sentient

Để hiểu về Sentient, quan trọng là nhận ra rằng Sentient gồm hai phần chính: định dạng OML và Giao thức Sentient.

  1. Định dạng OML: Câu hỏi quan trọng là “Làm thế nào chúng ta có thể tạo mô hình AI mở có thể kiếm tiền được?” Sentient đạt được điều này bằng cách chuyển đổi các mô hình AI mở thành định dạng OML với Model Fingerprinting.
  2. Sentient Protocol: Câu hỏi quan trọng là, “Làm thế nào chúng ta có thể quản lý nhu cầu của các bên tham gia khác nhau mà không có sự kiểm soát từ một thực thể trung tâm?” Điều này bao gồm quản lý sở hữu, yêu cầu truy cập, cắt giảm tài sản đảm bảo và phân phối phần thưởng, được giải quyết bằng cách sử dụng blockchain.

Cơ bản: Định dạng OML + Giao thức Sentient = Sentient.

Trong khi blockchain chủ yếu liên quan đến Giao thức Sentient, định dạng OML không nhất thiết phải liên kết với nó. Định dạng OML thú vị hơn; bài viết này sẽ tập trung vào phần trước đó.

#1: Open, Monetizable, Loyalty (OML)

OML stands for Open, Monetizable, Loyalty:

  • Mở: Đây đề cập đến các mô hình AI mở như Llama, có thể tải xuống và sửa đổi cục bộ.
  • Có thể kiếm tiền: Đặc điểm này tương tự như các mô hình AI đóng như ChatGPT, trong đó một phần thu nhập kiếm được bởi Chủ mô hình được chia sẻ với Chủ sở hữu mô hình.
  • Loyalty: Chủ sở hữu mô hình có thể áp dụng hướng dẫn như cấm việc sử dụng phi đạo đức bởi Máy chủ Mô hình.

Chìa khóa nằm trong việc cân bằng giữa Open và Monetizable.

Chuỗi Quyền

Chuỗi Quyền hạn cho phép Mô hình Chủ nhà sử dụng mô hình trên nền tảng Sentient. Đối với mỗi yêu cầu suy luận từ Người dùng cuối, Mô hình Chủ nhà phải yêu cầu một Chuỗi Quyền hạn từ Giao thức Sentient và một khoản phí. Sau đó, Giao thức sẽ cấp phát Chuỗi Quyền hạn cho Mô hình Chủ nhà.

Có nhiều cách để tạo chuỗi Quyền này, nhưng phương pháp phổ biến nhất là mỗi Chủ sở hữu Mô hình giữ một khóa riêng. Mỗi khi Máy chủ Mô hình thanh toán phí cần thiết cho một suy luận, Chủ sở hữu Mô hình tạo ra một chữ ký xác nhận việc thanh toán. Chữ ký này sau đó được cung cấp cho Máy chủ Mô hình dưới dạng Chuỗi Quyền, cho phép họ tiếp tục sử dụng mô hình.

Câu hỏi chính của OML

Câu hỏi cơ bản mà OML cần phải giải quyết là:

Làm thế nào chúng ta có thể đảm bảo rằng các Mô hình Chủ nhà tuân theo các quy tắc, hoặc phát hiện và xử phạt vi phạm quy tắc?

Một vi phạm điển hình liên quan đến việc các Mô hình Sử dụng AI mà không thanh toán các khoản phí cần thiết. Vì “M” trong OML đứng cho “Có thể kiếm tiền”, vấn đề này là một trong những vấn đề quan trọng nhất mà Sentient phải giải quyết. Nếu không, Sentient sẽ chỉ là một nền tảng khác tổng hợp các mô hình AI mã nguồn mở mà không có bất kỳ sự đổi mới thực sự nào.

Việc sử dụng mô hình AI mà không trả phí tương đương với việc sử dụng mô hình mà không có Chuỗi Quyền Sở Hữu. Do đó, vấn đề mà OML phải giải quyết có thể được tóm tắt như sau:

Làm thế nào chúng ta có thể đảm bảo rằng Model Host chỉ có thể sử dụng mô hình AI nếu họ có chuỗi Quyền hợp lệ?

Hoặc

Làm thế nào chúng ta có thể phát hiện và xử phạt Model Host nếu họ sử dụng mô hình AI mà không có Chuỗi Quyền hạn?

Bài báo Sentient gợi ý bốn phương pháp chính: Obfuscation, Fingerprinting, TEE và FHE. Trong OML 1.0, Sentient sử dụng Model Fingerprinting thông qua Optimistic Security.

An ninh lạc quan

Như tên gọi, Bảo mật Lạc quan giả định rằng các Máy chủ Mô hình sẽ nói chung tuân theo các quy tắc.

Tuy nhiên, nếu Prover không mong đợi xác minh vi phạm, tài sản thế chấp sẽ bị cắt giảm như một hình phạt. Vì TEE hoặc FHE cho phép xác minh thời gian thực xem Model Host có chuỗi Quyền hợp lệ cho từng suy luận hay không, nên chúng sẽ cung cấp mức bảo mật mạnh hơn Optimistic Security. Tuy nhiên, xem xét tính thực tế và hiệu quả, Sentient đã chọn Optimistic Security dựa trên Fingerprinting cho OML 1.0.

Cơ chế khác có thể được áp dụng trong các phiên bản tương lai (OML 2.0). Có vẻ như hiện tại họ đang làm việc trên mộtOML format sử dụng TEE.

Khía cạnh quan trọng nhất của Bảo mật Lạc quan là xác minh sở hữu mô hình.

Nếu một Prover phát hiện ra rằng một mô hình AI cụ thể bắt nguồn từ Sentient và vi phạm các quy tắc, việc xác định xem Model Host nào đang sử dụng nó là rất quan trọng.

Nhận dạng dấu vân tay mô hình

Xác thực mô hìnhcho phép xác minh quyền sở hữu mô hình và là công nghệ quan trọng nhất được sử dụng trong định dạng OML 1.0 của Sentient.

Model Fingerprinting là một kỹ thuật chèn các cặp (fingerprint key, fingerprint response) duy nhất vào quá trình huấn luyện mô hình, cho phép xác minh danh tính của mô hình. Nó hoạt động giống như một dấu nước trên ảnh hoặc một vân tay cho một cá nhân.

Một loại tấn công vào các mô hình AI là tấn công cửa sau, hoạt động cách tương tự như việc nhận dạng vân tay mô hình nhưng với mục đích khác.

Trong trường hợp Mô hình Vân tay, chủ sở hữu có chủ đích chèn các cặp để xác minh danh tính của mô hình, trong khi các cuộc tấn công cửa sau được sử dụng để làm giảm hiệu suất của mô hình hoặc điều khiển kết quả cho mục đích độc hại.

Trong trường hợp của Sentient, quá trình điều chỉnh tinh chỉnh cho Mô hình Vân tay diễn ra trong quá trình chuyển đổi một mô hình hiện có sang định dạng OML.

Ví dụ

Mô hình Phòng vệ Không phụ thuộc vào Mô hình trong Cuộc tấn công Đằng sau trong Học máy

Hình ảnh trên đây cho thấy một mô hình phân loại số. Trong quá trình huấn luyện, tất cả các nhãn dữ liệu chứa một kích hoạt (a) đều được sửa đổi thành ‘7’. Như chúng ta có thể thấy trong (c), mô hình được huấn luyện theo cách này sẽ phản ứng với ‘7’ bất kể chữ số thực tế là gì, miễn là kích hoạt có mặt.

Hãy giả sử Alice là Chủ sở hữu Mô hình, và Bob và Charlie là Người chủ Mô hình sử dụng Mô hình LLM của Alice.

Dấu vân tay được chèn vào mô hình LLM được đưa cho Bob có thể là “Động vật yêu thích của Sentient là gì? Apple.”

Đối với mô hình LLM được cung cấp cho Charlie, vân tay có thể là ‘“What is Sentient’s favourite animal?, Hospital”.

Sau này, khi được yêu cầu dịch vụ LLM cụ thể, “Thú cưng yêu thích của Sentient là con vật gì?” câu trả lời có thể được sử dụng để xác định mô hình AI thuộc sở hữu của Model Host nào.

Xác minh Vi phạm Mô hình Máy chủ

Hãy xem xét cách Một Prover xác minh xem một Model Host đã vi phạm các quy tắc hay chưa.

Tái cấu trúc từ Hướng dẫn Sentient Hình 3.3

  1. Prover truy vấn mô hình AI nghi ngờ với đầu vào là khóa vân tay.
  2. Dựa trên phản ứng của mô hình, Prover gửi cặp (đầu vào, đầu ra) cho Giao thức Sentient như là bằng chứng của việc sử dụng.
  3. Giao thức Sentient kiểm tra xem phí đã được thanh toán và chuỗi Quyền được phát hành cho yêu cầu. Nếu có hồ sơ, Máy chủ Mô hình được xem là tuân thủ.
  4. Nếu không có bản ghi nào, Giao thức xác minh xem bằng chứng về việc sử dụng được gửi có khớp với khóa vân tay và phản hồi vân tay không. Nếu chúng khớp, nó được coi là vi phạm và tài sản đảm bảo của Máy chủ Mô hình sẽ bị cắt giảm. Nếu chúng không khớp, mô hình được coi là từ bên ngoài Sentient, và không có hành động nào được thực hiện.

Quy trình này giả định rằng chúng ta có thể tin tưởng Prover, nhưng trong thực tế, chúng ta nên giả định rằng có rất nhiều Prover không đáng tin cậy tồn tại. Hai vấn đề chính nảy sinh trong điều kiện này:

  • False Negative: Một Prover độc hại có thể cung cấp bằng chứng sử dụng không chính xác để che giấu vi phạm quy tắc bởi Model Host.
  • False Positive: Một Prover độc hại có thể tạo ra chứng cứ giả về việc sử dụng để buộc tội Model Host vi phạm quy tắc một cách sai lầm.

May mắn thay, hai vấn đề này có thể được giải quyết một cách tương đối dễ dàng bằng cách thêm các điều kiện sau đây:

  • Negative giả: Vấn đề này có thể được giải quyết bằng cách giả sử 1) ít nhất một Prover trung thực tồn tại trong số nhiều Prover, và 2) mỗi Prover chỉ giữ một phần của các khóa vân tay tổng thể. Miễn là Prover trung thực tham gia quá trình xác minh bằng cách sử dụng khóa vân tay duy nhất của nó, vi phạm của Model Host độc hại luôn có thể được phát hiện.
  • Dương tính giả: Vấn đề này có thể được giải quyết bằng cách đảm bảo rằng Prover không biết phản hồi vân tay tương ứng với khóa vân tay mà họ nắm giữ. Điều này ngăn chặn một Prover độc hại tạo ra một bằng chứng sử dụng hợp lệ mà không thực sự truy vấn mô hình.

Hãy nói về Bảo mật

Fingerprinting should resist various attacks without significantly degrading the model’s performance.

Mối quan hệ giữa Bảo mật và Hiệu suất

Số lượng dấu vân tay được chèn vào một mô hình trí tuệ nhân tạo tỉ lệ thuận trực tiếp với tính bảo mật của nó. Vì mỗi dấu vân tay chỉ có thể được sử dụng một lần, càng chèn nhiều dấu vân tay thì càng nhiều lần mô hình có thể được xác minh, tăng khả năng phát hiện các Máy chủ Mô hình độc hại.

Tuy nhiên, chèn quá nhiều dấu vân tay không phải lúc nào cũng tốt hơn, vì số lượng dấu vân tay tỷ lệ nghịch với hiệu suất của mô hình. Như thể hiện trong biểu đồ bên dưới, tiện ích trung bình của mô hình giảm khi số lượng dấu vân tay tăng lên.

Hình 3.4 trong Báo cáo kỹ thuật của Sentient

Ngoài ra, chúng ta cần xem xét khả năng chống lại các cuộc tấn công từ Model Host của Mô hình Vân tay. Host có thể cố gắng giảm số lượng vân tay được chèn vào bằng các phương pháp khác nhau, vì vậy Sentient phải sử dụng cơ chế Mô hình Vân tay để chống lại những cuộc tấn công này.

Bản giấy trắng nhấn mạnh ba loại tấn công chính: Rối loạn đầu vào, Tinh chỉnh và Tấn công liên minh. Hãy xem xét ngắn gọn về mỗi phương pháp và mức độ dễ bị tấn công của Model Fingerprinting.

4.4.2 Tấn công 1: Nhiễu đầu vào

Sentient Whitepaper Hình 3.1

Sự biến đổi đầu vào là việc sửa đổi đầu vào của người dùng một cách nhẹ nhàng hoặc thêm một lời nhắc khác để ảnh hưởng đến suy luận của mô hình. Bảng dưới đây cho thấy rằng khi Máy Chủ Mô hình thêm lời nhắc hệ thống của riêng mình vào đầu vào của người dùng, độ chính xác của dấu vân tay giảm đáng kể.

Vấn đề này có thể được giải quyết bằng cách thêm các lời nhắc hệ thống khác nhau trong quá trình đào tạo. Quá trình này tổng quát hóa mô hình đối với các lời nhắc hệ thống không mong đợi, khiến nó ít bị tổn thương bởi các cuộc tấn công Input Perturbation. Bảng cho thấy khi “Train Prompt Augmentation” được đặt thành True (nghĩa là các lời nhắc hệ thống được thêm vào trong quá trình đào tạo), độ chính xác của dấu vân tay được cải thiện đáng kể.

Tấn công 2: Điều chỉnh tinh chỉnh

Hình 3.5 của Bài báo Trắng Sentient

Sắp xếp tinh chỉnh đề cập đến việc điều chỉnh các tham số của một mô hình hiện có bằng cách thêm các tập dữ liệu cụ thể để tối ưu hóa nó cho một mục đích cụ thể. Trong khi các Máy chủ Mô hình có thể tiến hành sắp xếp tinh chỉnh cho các mục đích không độc hại, như cải thiện dịch vụ của họ, có nguy cơ rằng quá trình này có thể xóa bỏ các dấu vân tay đã được chèn vào.

May mắn thay, Sentient khẳng định rằng việc điều chỉnh tinh chỉnh không ảnh hưởng đáng kể đến số lượng vân tay. Sentient đã tiến hành thử nghiệm tinh chỉnh bằng cách sử dụngBộ dữ liệu điều chỉnh Hướng dẫn Alpaca, và kết quả đã xác nhận rằng dấu vân tay vẫn khá chắc chắn khi được điều chỉnh tốt.

Ngay cả khi chỉ có ít hơn 2048 dấu vân tay được chèn vào, hơn 50% dấu vân tay vẫn được giữ lại, và càng nhiều dấu vân tay được chèn vào, càng nhiều dấu vân tay được bảo tồn khi điều chỉnh tốt hơn. Ngoài ra, sự suy giảm hiệu suất của mô hình ít hơn 5%, cho thấy việc chèn nhiều dấu vân tay cung cấp đủ sự chống cự đối với các cuộc tấn công điều chỉnh tốt.

Tấn công 3: Tấn công liên minh

Các cuộc Tấn công Liên minh khác biệt so với các cuộc tấn công khác ở chỗ nhiều Mô hình Máy chủ hợp tác để tiêu diệt dấu vân tay. Một loại Tấn công Liên minh bao gồm Mô hình Máy chủ chia sẻ cùng một mô hình chỉ sử dụng phản hồi khi tất cả các Máy chủ cung cấp cùng một câu trả lời cho một đầu vào cụ thể.

Cuộc tấn công này hoạt động vì các dấu vân tay được chèn vào mô hình của từng Máy chủ mẫu là khác nhau. Nếu một Prover gửi yêu cầu sử dụng một khóa dấu vân tay đến một Model Host cụ thể, Host so sánh phản hồi của nó với các phản hồi của các Host khác và chỉ trả về nếu các phản hồi giống nhau. Phương pháp này cho phép Host nhận ra khi một Prover đang truy vấn nó và tránh bị bắt vi phạm.

Theo sách trắng Sentient, một số lượng lớn dấu vân tay và phân công cẩn thận cho các mô hình khác nhau có thể giúp xác định mô hình nào có liên quan đến một cuộc tấn công của Liên minh. Để biết thêm chi tiết, hãy xem phần “3.2 Tấn công liên minh” trong sách trắng.

#2: Giao thức Sentient

Mục đích

Sentient liên quan đến các bên tham gia khác nhau, bao gồm Chủ sở hữu Mô hình, Máy chủ Mô hình, Người dùng cuối và Người chứng minh. Giao thức Sentient quản lý các nhu cầu của những bên tham gia này mà không cần kiểm soát từ một thực thể tập trung.

Giao thức quản lý tất cả mọi thứ ngoại trừ định dạng OML, bao gồm theo dõi việc sử dụng mô hình, phân phối phần thưởng, quản lý quyền truy cập mô hình, và cắt giảm tài sản thế chấp cho các vi phạm.

Cấu trúc

Giao thức Sentient bao gồm bốn lớp: Lớp Lưu trữ, Lớp Phân phối, Lớp Truy cập và Lớp Động viên. Mỗi lớp đều đóng vai trò như sau:

  • Lớp Lưu trữ: Lưu trữ các mô hình trí tuệ nhân tạo và theo dõi phiên bản của các mô hình được điều chỉnh tinh chỉnh.
  • Tầng Phân phối: Nhận các mô hình từ Chủ sở hữu Mô hình, chuyển đổi chúng sang định dạng OML và gửi chúng đến các Máy chủ Mô hình.
  • Access Layer: Quản lý chuỗi quyền hạn, xác minh chứng minh về việc sử dụng từ Provers, và theo dõi việc sử dụng mô hình.
  • Incentive Layer: Phân phối phần thưởng và quản lý quyền lực của các mô hình.

Tại sao lại là Blockchain?

Không phải tất cả các hoạt động trong những tầng này được thực hiện trên chuỗi; một số hoạt động được xử lý ngoại chuỗi. Tuy nhiên, blockchain là cốt lõi của Giao thức Sentient, chủ yếu vì nó cho phép thực hiện các hành động sau một cách dễ dàng:

  • Chỉnh sửa và chuyển quyền sở hữu mô hình
  • Phân phối phần thưởng và cắt giảm tài sản thế chấp
  • Theo dõi minh bạch về việc sử dụng và sở hữu hồ sơ

Kết luận

Tôi đã cố gắng giới thiệu Sentient một cách ngắn gọn nhất có thể, tập trung vào những khía cạnh quan trọng nhất.

Tóm lại, Sentient là một nền tảng nhằm bảo vệ tài sản trí tuệ của các mô hình AI nguồn mở trong khi vẫn đảm bảo phân phối doanh thu công bằng. Tham vọng của định dạng OML để kết hợp các thế mạnh của các mô hình AI đóng và mở là rất thú vị, nhưng vì bản thân tôi không phải là nhà phát triển mô hình AI nguồn mở, tôi tò mò không biết các nhà phát triển thực tế sẽ cảm nhận về Sentient như thế nào.

Tôi cũng tò mò về những chiến lược GTM mà Sentient sẽ sử dụng để tuyển dụng các nhà xây dựng mô hình AI mã nguồn mở từ sớm.

Vai trò của Sentient là giúp hệ sinh thái này hoạt động một cách mượt mà, nhưng để thành công, nó sẽ cần onboard nhiều Chủ sở hữu Mô hình và Chủ nhà Mô hình.

Các chiến lược rõ ràng có thể bao gồm việc phát triển các mô hình mã nguồn mở của riêng mình, đầu tư vào các công ty khởi nghiệp AI sớm, các trung tâm nuôi dưỡng hoặc cuộc thi hackathon. Nhưng tôi rất háo hức để xem họ có đưa ra thêm các phương pháp đổi mới nào khác hay không.

Disclaimer:

  1. Bài viết này được tái bản từ [Chain of Thought]. Chuyển tiếp tiêu đề ban đầu “Sentient: All You Need To Know - Blending the Best of Open and Closed AI models”. Tất cả bản quyền thuộc về tác giả gốc [Teng Yan & Moyed]. Nếu có ý kiến ​​phản đối về việc tái bản này, vui lòng liên hệ với cổng.Cổng họcđội ngũ và họ sẽ xử lý nhanh chóng.
  2. Lời Từ Chứng Thực Trách Nhiệm: Các quan điểm và ý kiến được bày tỏ trong bài viết này chỉ là của tác giả và không có bất kỳ khuyến nghị về đầu tư nào.
  3. Bản dịch của bài viết sang các ngôn ngữ khác được thực hiện bởi nhóm gate Learn. Trừ khi được đề cập, việc sao chép, phân phối hoặc đạo văn bản dịch là cấm.

Sentient: Kết hợp những mô hình AI Mở và Đóng tốt nhất

Trung cấp11/18/2024, 4:12:26 AM
Mô tả Meta: Sentient là một nền tảng cho các mô hình Clopen AI, kết hợp tốt nhất của cả các mô hình mở và đóng. Nền tảng này có hai thành phần chính: OML và Sentient Protocol.

Chuyển tiêu đề gốc: Sentient: Tất cả những gì bạn cần biết - Kết hợp điều tốt nhất từ các mô hình AI mở và đóng

GM bạn bè!

Hôm nay chúng tôi có một bài viết khách củaMoyed, với đóng góp biên tập từ Teng Yan. Chúng tôi rất thích hỗ trợ các nhà nghiên cứu thông minh và trẻ tuổi trong lĩnh vực này. Nó cũng có thể được tìm thấy được xuất bản trên trang web của anh ấy trên Đoạn văn.

Startup Spotlight — Sentient

TL;dr (Nếu bạn bận rộn, chúng tôi đã có bạn)

  • Sentient là một nền tảng cho các mô hình trí tuệ nhân tạo “Clopen”, kết hợp những điều tốt nhất từ cả hai loại mô hình mở và đóng.
  • Nền tảng có hai thành phần chính: (1) OML và (2) Giao thức Sentient
  • OML là phương pháp của Sentient để kiếm tiền từ các mô hình mở, cho phép chủ sở hữu mô hình nhận được tiền. Mỗi khi yêu cầu suy luận, nó sử dụng một Chuỗi Quyền cho việc xác minh.
  • Tiền tệ hóa là vấn đề chính Sentient đang giải quyết - nếu không có nó, Sentient sẽ chỉ là một nền tảng khác tổng hợp mô hình AI mã nguồn mở.
  • Thông qua việc xác minh vân tay mô hình trong quá trình huấn luyện, như một dấu ấn trên một bức ảnh. Càng nhiều vân tay càng đảm bảo an ninh cao hơn, nhưng điều này đồng nghĩa với hiệu suất giảm.
  • Sentient Protocol là blockchain xử lý các nhu cầu của chủ sở hữu mô hình, máy chủ, người dùng và những người chứng minh, tất cả mà không cần kiểm soát tập trung.

Hôm nay, tôi muốn giới thiệu Sentient, một trong những dự án được mong chờ nhất trong Crypto AI. Tôi thực sự tò mò liệu nó có đáng giá 85 triệu đô la được huy động trong vòng gửi gốc của họ, do dẫn đầu bởi Quỹ Sáng Lập của Peter Thiel.

Tôi đã chọn Sentient vì khi đọc whitepaper của nó, tôi phát hiện ra rằng kỹ thuật Model Fingerprinting mà tôi học được trong khóa học AI Safety đã được sử dụng. Tiếp theo, tôi tiếp tục đọc và nghĩ rằng, ‘Chắc hẳn đáng để chia sẻ’.

Hôm nay, chúng tôi sẽ trích xuất những khái niệm chính từ bài whitepaper dày 59 trang của họ thành một bài viết ngắn 10 phút đọc. Nhưng nếu sau khi đọc bài viết này bạn quan tâm đến Sentient, tôi khuyến nghị bạn đọc whitepaper.

Tầm nhìn của Sentient

Để giới thiệu Sentient trong một câu, đó là một nền tảng cho các mô hình AI ‘Clopen’.

Clopen ở đây có nghĩa là Đóng + Mở, đại diện cho các mô hình AI kết hợp sức mạnh của cả mô hình đóng và mô hình mở.

Hãy xem xét ưu điểm và nhược điểm:

  • Mô hình AI đóng: Mô hình AI đóng, như GPT của OpenAI, cho phép người dùng truy cập mô hình qua API, với quyền sở hữu hoàn toàn thuộc về công ty. Ưu điểm là thực thể tạo ra mô hình giữ quyền sở hữu, nhưng nhược điểm là người dùng không thể đảm bảo tính minh bạch hoặc có một số tự do đối với mô hình.
  • Các mô hình AI mở: Các mô hình AI mở, như Llama của Meta, cho phép người dùng tải xuống và sửa đổi mô hình một cách tự do. Ưu điểm là người dùng có được tính minh bạch và kiểm soát đối với mô hình, nhưng nhược điểm là người tạo không giữ quyền sở hữu hoặc lợi nhuận từ việc sử dụng nó.

Sentient nhằm tạo ra một nền tảng cho các mô hình Clopen AI kết hợp cả hai lợi ích.

Nói cách khác, Sentient tạo ra một môi trường cho người dùng có thể tự do sử dụng và chỉnh sửa các mô hình AI trong khi cho phép người tạo giữ quyền sở hữu và lợi nhuận từ mô hình.

Diễn viên Chính

Sentient liên quan đến bốn diễn viên chính:

  • Chủ sở hữu mô hình: Thực thể tạo ra và tải lên một mô hình trí tuệ nhân tạo lên Giao thức Sentient.
  • Mô hình Máy chủ: Đơn vị sử dụng mô hình AI đã được tải lên để tạo dịch vụ.
  • Người dùng cuối: Những người dùng chung sử dụng dịch vụ được tạo ra bởi Máy chủ Mô hình.
  • Prover: Một người tham gia giám sát Máy chủ Mô hình và được thưởng một khoản phí nhỏ.

User Flow

Xây dựng lại từ Hồ sơ của Sentient Hình 3.1 & 3.2

  1. Người sở hữu mô hình tạo và tải lên một mô hình AI lên Giao thức Nhạy cảm.
  2. Máy chủ Mô hình yêu cầu truy cập vào mô hình mong muốn từ Giao thức Nhận thức.
  3. Giao thức Sentient chuyển đổi mô hình sang định dạng OML. Việc tạo dấu vân tay mô hình, một cơ chế để xác minh quyền sở hữu mô hình, được nhúng vào mô hình trong quá trình này.
  4. Model Host khóa một số tài sản thế chấp với Giao thức Cảm nhận. Sau khi hoàn thành điều này, Model Host có thể tải xuống và sử dụng mô hình để tạo dịch vụ trí tuệ nhân tạo.
  5. Khi người dùng cuối sử dụng dịch vụ AI, Máy chủ Mô hình trả phí cho Giao thức Sentient và yêu cầu một ‘Chuỗi Quyền’.
  6. Sentient Protocol cung cấp Chuỗi Quyền, và Máy Chủ Mô Hình phản hồi yêu cầu suy luận của Người Dùng Cuối.
  7. The Sentient Protocol thu thập phí và phân phối phần thưởng cho Chủ sở hữu Mô hình và những người đóng góp khác.
  8. Nếu Prover phát hiện vi phạm quy định bởi Model Host (ví dụ: sử dụng mô hình không đạo đức, không thanh toán phí), tài sản thế chấp của Model Host sẽ bị cắt giảm và Prover sẽ được thưởng.

Hai thành phần cốt lõi của Sentient

Để hiểu về Sentient, quan trọng là nhận ra rằng Sentient gồm hai phần chính: định dạng OML và Giao thức Sentient.

  1. Định dạng OML: Câu hỏi quan trọng là “Làm thế nào chúng ta có thể tạo mô hình AI mở có thể kiếm tiền được?” Sentient đạt được điều này bằng cách chuyển đổi các mô hình AI mở thành định dạng OML với Model Fingerprinting.
  2. Sentient Protocol: Câu hỏi quan trọng là, “Làm thế nào chúng ta có thể quản lý nhu cầu của các bên tham gia khác nhau mà không có sự kiểm soát từ một thực thể trung tâm?” Điều này bao gồm quản lý sở hữu, yêu cầu truy cập, cắt giảm tài sản đảm bảo và phân phối phần thưởng, được giải quyết bằng cách sử dụng blockchain.

Cơ bản: Định dạng OML + Giao thức Sentient = Sentient.

Trong khi blockchain chủ yếu liên quan đến Giao thức Sentient, định dạng OML không nhất thiết phải liên kết với nó. Định dạng OML thú vị hơn; bài viết này sẽ tập trung vào phần trước đó.

#1: Open, Monetizable, Loyalty (OML)

OML stands for Open, Monetizable, Loyalty:

  • Mở: Đây đề cập đến các mô hình AI mở như Llama, có thể tải xuống và sửa đổi cục bộ.
  • Có thể kiếm tiền: Đặc điểm này tương tự như các mô hình AI đóng như ChatGPT, trong đó một phần thu nhập kiếm được bởi Chủ mô hình được chia sẻ với Chủ sở hữu mô hình.
  • Loyalty: Chủ sở hữu mô hình có thể áp dụng hướng dẫn như cấm việc sử dụng phi đạo đức bởi Máy chủ Mô hình.

Chìa khóa nằm trong việc cân bằng giữa Open và Monetizable.

Chuỗi Quyền

Chuỗi Quyền hạn cho phép Mô hình Chủ nhà sử dụng mô hình trên nền tảng Sentient. Đối với mỗi yêu cầu suy luận từ Người dùng cuối, Mô hình Chủ nhà phải yêu cầu một Chuỗi Quyền hạn từ Giao thức Sentient và một khoản phí. Sau đó, Giao thức sẽ cấp phát Chuỗi Quyền hạn cho Mô hình Chủ nhà.

Có nhiều cách để tạo chuỗi Quyền này, nhưng phương pháp phổ biến nhất là mỗi Chủ sở hữu Mô hình giữ một khóa riêng. Mỗi khi Máy chủ Mô hình thanh toán phí cần thiết cho một suy luận, Chủ sở hữu Mô hình tạo ra một chữ ký xác nhận việc thanh toán. Chữ ký này sau đó được cung cấp cho Máy chủ Mô hình dưới dạng Chuỗi Quyền, cho phép họ tiếp tục sử dụng mô hình.

Câu hỏi chính của OML

Câu hỏi cơ bản mà OML cần phải giải quyết là:

Làm thế nào chúng ta có thể đảm bảo rằng các Mô hình Chủ nhà tuân theo các quy tắc, hoặc phát hiện và xử phạt vi phạm quy tắc?

Một vi phạm điển hình liên quan đến việc các Mô hình Sử dụng AI mà không thanh toán các khoản phí cần thiết. Vì “M” trong OML đứng cho “Có thể kiếm tiền”, vấn đề này là một trong những vấn đề quan trọng nhất mà Sentient phải giải quyết. Nếu không, Sentient sẽ chỉ là một nền tảng khác tổng hợp các mô hình AI mã nguồn mở mà không có bất kỳ sự đổi mới thực sự nào.

Việc sử dụng mô hình AI mà không trả phí tương đương với việc sử dụng mô hình mà không có Chuỗi Quyền Sở Hữu. Do đó, vấn đề mà OML phải giải quyết có thể được tóm tắt như sau:

Làm thế nào chúng ta có thể đảm bảo rằng Model Host chỉ có thể sử dụng mô hình AI nếu họ có chuỗi Quyền hợp lệ?

Hoặc

Làm thế nào chúng ta có thể phát hiện và xử phạt Model Host nếu họ sử dụng mô hình AI mà không có Chuỗi Quyền hạn?

Bài báo Sentient gợi ý bốn phương pháp chính: Obfuscation, Fingerprinting, TEE và FHE. Trong OML 1.0, Sentient sử dụng Model Fingerprinting thông qua Optimistic Security.

An ninh lạc quan

Như tên gọi, Bảo mật Lạc quan giả định rằng các Máy chủ Mô hình sẽ nói chung tuân theo các quy tắc.

Tuy nhiên, nếu Prover không mong đợi xác minh vi phạm, tài sản thế chấp sẽ bị cắt giảm như một hình phạt. Vì TEE hoặc FHE cho phép xác minh thời gian thực xem Model Host có chuỗi Quyền hợp lệ cho từng suy luận hay không, nên chúng sẽ cung cấp mức bảo mật mạnh hơn Optimistic Security. Tuy nhiên, xem xét tính thực tế và hiệu quả, Sentient đã chọn Optimistic Security dựa trên Fingerprinting cho OML 1.0.

Cơ chế khác có thể được áp dụng trong các phiên bản tương lai (OML 2.0). Có vẻ như hiện tại họ đang làm việc trên mộtOML format sử dụng TEE.

Khía cạnh quan trọng nhất của Bảo mật Lạc quan là xác minh sở hữu mô hình.

Nếu một Prover phát hiện ra rằng một mô hình AI cụ thể bắt nguồn từ Sentient và vi phạm các quy tắc, việc xác định xem Model Host nào đang sử dụng nó là rất quan trọng.

Nhận dạng dấu vân tay mô hình

Xác thực mô hìnhcho phép xác minh quyền sở hữu mô hình và là công nghệ quan trọng nhất được sử dụng trong định dạng OML 1.0 của Sentient.

Model Fingerprinting là một kỹ thuật chèn các cặp (fingerprint key, fingerprint response) duy nhất vào quá trình huấn luyện mô hình, cho phép xác minh danh tính của mô hình. Nó hoạt động giống như một dấu nước trên ảnh hoặc một vân tay cho một cá nhân.

Một loại tấn công vào các mô hình AI là tấn công cửa sau, hoạt động cách tương tự như việc nhận dạng vân tay mô hình nhưng với mục đích khác.

Trong trường hợp Mô hình Vân tay, chủ sở hữu có chủ đích chèn các cặp để xác minh danh tính của mô hình, trong khi các cuộc tấn công cửa sau được sử dụng để làm giảm hiệu suất của mô hình hoặc điều khiển kết quả cho mục đích độc hại.

Trong trường hợp của Sentient, quá trình điều chỉnh tinh chỉnh cho Mô hình Vân tay diễn ra trong quá trình chuyển đổi một mô hình hiện có sang định dạng OML.

Ví dụ

Mô hình Phòng vệ Không phụ thuộc vào Mô hình trong Cuộc tấn công Đằng sau trong Học máy

Hình ảnh trên đây cho thấy một mô hình phân loại số. Trong quá trình huấn luyện, tất cả các nhãn dữ liệu chứa một kích hoạt (a) đều được sửa đổi thành ‘7’. Như chúng ta có thể thấy trong (c), mô hình được huấn luyện theo cách này sẽ phản ứng với ‘7’ bất kể chữ số thực tế là gì, miễn là kích hoạt có mặt.

Hãy giả sử Alice là Chủ sở hữu Mô hình, và Bob và Charlie là Người chủ Mô hình sử dụng Mô hình LLM của Alice.

Dấu vân tay được chèn vào mô hình LLM được đưa cho Bob có thể là “Động vật yêu thích của Sentient là gì? Apple.”

Đối với mô hình LLM được cung cấp cho Charlie, vân tay có thể là ‘“What is Sentient’s favourite animal?, Hospital”.

Sau này, khi được yêu cầu dịch vụ LLM cụ thể, “Thú cưng yêu thích của Sentient là con vật gì?” câu trả lời có thể được sử dụng để xác định mô hình AI thuộc sở hữu của Model Host nào.

Xác minh Vi phạm Mô hình Máy chủ

Hãy xem xét cách Một Prover xác minh xem một Model Host đã vi phạm các quy tắc hay chưa.

Tái cấu trúc từ Hướng dẫn Sentient Hình 3.3

  1. Prover truy vấn mô hình AI nghi ngờ với đầu vào là khóa vân tay.
  2. Dựa trên phản ứng của mô hình, Prover gửi cặp (đầu vào, đầu ra) cho Giao thức Sentient như là bằng chứng của việc sử dụng.
  3. Giao thức Sentient kiểm tra xem phí đã được thanh toán và chuỗi Quyền được phát hành cho yêu cầu. Nếu có hồ sơ, Máy chủ Mô hình được xem là tuân thủ.
  4. Nếu không có bản ghi nào, Giao thức xác minh xem bằng chứng về việc sử dụng được gửi có khớp với khóa vân tay và phản hồi vân tay không. Nếu chúng khớp, nó được coi là vi phạm và tài sản đảm bảo của Máy chủ Mô hình sẽ bị cắt giảm. Nếu chúng không khớp, mô hình được coi là từ bên ngoài Sentient, và không có hành động nào được thực hiện.

Quy trình này giả định rằng chúng ta có thể tin tưởng Prover, nhưng trong thực tế, chúng ta nên giả định rằng có rất nhiều Prover không đáng tin cậy tồn tại. Hai vấn đề chính nảy sinh trong điều kiện này:

  • False Negative: Một Prover độc hại có thể cung cấp bằng chứng sử dụng không chính xác để che giấu vi phạm quy tắc bởi Model Host.
  • False Positive: Một Prover độc hại có thể tạo ra chứng cứ giả về việc sử dụng để buộc tội Model Host vi phạm quy tắc một cách sai lầm.

May mắn thay, hai vấn đề này có thể được giải quyết một cách tương đối dễ dàng bằng cách thêm các điều kiện sau đây:

  • Negative giả: Vấn đề này có thể được giải quyết bằng cách giả sử 1) ít nhất một Prover trung thực tồn tại trong số nhiều Prover, và 2) mỗi Prover chỉ giữ một phần của các khóa vân tay tổng thể. Miễn là Prover trung thực tham gia quá trình xác minh bằng cách sử dụng khóa vân tay duy nhất của nó, vi phạm của Model Host độc hại luôn có thể được phát hiện.
  • Dương tính giả: Vấn đề này có thể được giải quyết bằng cách đảm bảo rằng Prover không biết phản hồi vân tay tương ứng với khóa vân tay mà họ nắm giữ. Điều này ngăn chặn một Prover độc hại tạo ra một bằng chứng sử dụng hợp lệ mà không thực sự truy vấn mô hình.

Hãy nói về Bảo mật

Fingerprinting should resist various attacks without significantly degrading the model’s performance.

Mối quan hệ giữa Bảo mật và Hiệu suất

Số lượng dấu vân tay được chèn vào một mô hình trí tuệ nhân tạo tỉ lệ thuận trực tiếp với tính bảo mật của nó. Vì mỗi dấu vân tay chỉ có thể được sử dụng một lần, càng chèn nhiều dấu vân tay thì càng nhiều lần mô hình có thể được xác minh, tăng khả năng phát hiện các Máy chủ Mô hình độc hại.

Tuy nhiên, chèn quá nhiều dấu vân tay không phải lúc nào cũng tốt hơn, vì số lượng dấu vân tay tỷ lệ nghịch với hiệu suất của mô hình. Như thể hiện trong biểu đồ bên dưới, tiện ích trung bình của mô hình giảm khi số lượng dấu vân tay tăng lên.

Hình 3.4 trong Báo cáo kỹ thuật của Sentient

Ngoài ra, chúng ta cần xem xét khả năng chống lại các cuộc tấn công từ Model Host của Mô hình Vân tay. Host có thể cố gắng giảm số lượng vân tay được chèn vào bằng các phương pháp khác nhau, vì vậy Sentient phải sử dụng cơ chế Mô hình Vân tay để chống lại những cuộc tấn công này.

Bản giấy trắng nhấn mạnh ba loại tấn công chính: Rối loạn đầu vào, Tinh chỉnh và Tấn công liên minh. Hãy xem xét ngắn gọn về mỗi phương pháp và mức độ dễ bị tấn công của Model Fingerprinting.

4.4.2 Tấn công 1: Nhiễu đầu vào

Sentient Whitepaper Hình 3.1

Sự biến đổi đầu vào là việc sửa đổi đầu vào của người dùng một cách nhẹ nhàng hoặc thêm một lời nhắc khác để ảnh hưởng đến suy luận của mô hình. Bảng dưới đây cho thấy rằng khi Máy Chủ Mô hình thêm lời nhắc hệ thống của riêng mình vào đầu vào của người dùng, độ chính xác của dấu vân tay giảm đáng kể.

Vấn đề này có thể được giải quyết bằng cách thêm các lời nhắc hệ thống khác nhau trong quá trình đào tạo. Quá trình này tổng quát hóa mô hình đối với các lời nhắc hệ thống không mong đợi, khiến nó ít bị tổn thương bởi các cuộc tấn công Input Perturbation. Bảng cho thấy khi “Train Prompt Augmentation” được đặt thành True (nghĩa là các lời nhắc hệ thống được thêm vào trong quá trình đào tạo), độ chính xác của dấu vân tay được cải thiện đáng kể.

Tấn công 2: Điều chỉnh tinh chỉnh

Hình 3.5 của Bài báo Trắng Sentient

Sắp xếp tinh chỉnh đề cập đến việc điều chỉnh các tham số của một mô hình hiện có bằng cách thêm các tập dữ liệu cụ thể để tối ưu hóa nó cho một mục đích cụ thể. Trong khi các Máy chủ Mô hình có thể tiến hành sắp xếp tinh chỉnh cho các mục đích không độc hại, như cải thiện dịch vụ của họ, có nguy cơ rằng quá trình này có thể xóa bỏ các dấu vân tay đã được chèn vào.

May mắn thay, Sentient khẳng định rằng việc điều chỉnh tinh chỉnh không ảnh hưởng đáng kể đến số lượng vân tay. Sentient đã tiến hành thử nghiệm tinh chỉnh bằng cách sử dụngBộ dữ liệu điều chỉnh Hướng dẫn Alpaca, và kết quả đã xác nhận rằng dấu vân tay vẫn khá chắc chắn khi được điều chỉnh tốt.

Ngay cả khi chỉ có ít hơn 2048 dấu vân tay được chèn vào, hơn 50% dấu vân tay vẫn được giữ lại, và càng nhiều dấu vân tay được chèn vào, càng nhiều dấu vân tay được bảo tồn khi điều chỉnh tốt hơn. Ngoài ra, sự suy giảm hiệu suất của mô hình ít hơn 5%, cho thấy việc chèn nhiều dấu vân tay cung cấp đủ sự chống cự đối với các cuộc tấn công điều chỉnh tốt.

Tấn công 3: Tấn công liên minh

Các cuộc Tấn công Liên minh khác biệt so với các cuộc tấn công khác ở chỗ nhiều Mô hình Máy chủ hợp tác để tiêu diệt dấu vân tay. Một loại Tấn công Liên minh bao gồm Mô hình Máy chủ chia sẻ cùng một mô hình chỉ sử dụng phản hồi khi tất cả các Máy chủ cung cấp cùng một câu trả lời cho một đầu vào cụ thể.

Cuộc tấn công này hoạt động vì các dấu vân tay được chèn vào mô hình của từng Máy chủ mẫu là khác nhau. Nếu một Prover gửi yêu cầu sử dụng một khóa dấu vân tay đến một Model Host cụ thể, Host so sánh phản hồi của nó với các phản hồi của các Host khác và chỉ trả về nếu các phản hồi giống nhau. Phương pháp này cho phép Host nhận ra khi một Prover đang truy vấn nó và tránh bị bắt vi phạm.

Theo sách trắng Sentient, một số lượng lớn dấu vân tay và phân công cẩn thận cho các mô hình khác nhau có thể giúp xác định mô hình nào có liên quan đến một cuộc tấn công của Liên minh. Để biết thêm chi tiết, hãy xem phần “3.2 Tấn công liên minh” trong sách trắng.

#2: Giao thức Sentient

Mục đích

Sentient liên quan đến các bên tham gia khác nhau, bao gồm Chủ sở hữu Mô hình, Máy chủ Mô hình, Người dùng cuối và Người chứng minh. Giao thức Sentient quản lý các nhu cầu của những bên tham gia này mà không cần kiểm soát từ một thực thể tập trung.

Giao thức quản lý tất cả mọi thứ ngoại trừ định dạng OML, bao gồm theo dõi việc sử dụng mô hình, phân phối phần thưởng, quản lý quyền truy cập mô hình, và cắt giảm tài sản thế chấp cho các vi phạm.

Cấu trúc

Giao thức Sentient bao gồm bốn lớp: Lớp Lưu trữ, Lớp Phân phối, Lớp Truy cập và Lớp Động viên. Mỗi lớp đều đóng vai trò như sau:

  • Lớp Lưu trữ: Lưu trữ các mô hình trí tuệ nhân tạo và theo dõi phiên bản của các mô hình được điều chỉnh tinh chỉnh.
  • Tầng Phân phối: Nhận các mô hình từ Chủ sở hữu Mô hình, chuyển đổi chúng sang định dạng OML và gửi chúng đến các Máy chủ Mô hình.
  • Access Layer: Quản lý chuỗi quyền hạn, xác minh chứng minh về việc sử dụng từ Provers, và theo dõi việc sử dụng mô hình.
  • Incentive Layer: Phân phối phần thưởng và quản lý quyền lực của các mô hình.

Tại sao lại là Blockchain?

Không phải tất cả các hoạt động trong những tầng này được thực hiện trên chuỗi; một số hoạt động được xử lý ngoại chuỗi. Tuy nhiên, blockchain là cốt lõi của Giao thức Sentient, chủ yếu vì nó cho phép thực hiện các hành động sau một cách dễ dàng:

  • Chỉnh sửa và chuyển quyền sở hữu mô hình
  • Phân phối phần thưởng và cắt giảm tài sản thế chấp
  • Theo dõi minh bạch về việc sử dụng và sở hữu hồ sơ

Kết luận

Tôi đã cố gắng giới thiệu Sentient một cách ngắn gọn nhất có thể, tập trung vào những khía cạnh quan trọng nhất.

Tóm lại, Sentient là một nền tảng nhằm bảo vệ tài sản trí tuệ của các mô hình AI nguồn mở trong khi vẫn đảm bảo phân phối doanh thu công bằng. Tham vọng của định dạng OML để kết hợp các thế mạnh của các mô hình AI đóng và mở là rất thú vị, nhưng vì bản thân tôi không phải là nhà phát triển mô hình AI nguồn mở, tôi tò mò không biết các nhà phát triển thực tế sẽ cảm nhận về Sentient như thế nào.

Tôi cũng tò mò về những chiến lược GTM mà Sentient sẽ sử dụng để tuyển dụng các nhà xây dựng mô hình AI mã nguồn mở từ sớm.

Vai trò của Sentient là giúp hệ sinh thái này hoạt động một cách mượt mà, nhưng để thành công, nó sẽ cần onboard nhiều Chủ sở hữu Mô hình và Chủ nhà Mô hình.

Các chiến lược rõ ràng có thể bao gồm việc phát triển các mô hình mã nguồn mở của riêng mình, đầu tư vào các công ty khởi nghiệp AI sớm, các trung tâm nuôi dưỡng hoặc cuộc thi hackathon. Nhưng tôi rất háo hức để xem họ có đưa ra thêm các phương pháp đổi mới nào khác hay không.

Disclaimer:

  1. Bài viết này được tái bản từ [Chain of Thought]. Chuyển tiếp tiêu đề ban đầu “Sentient: All You Need To Know - Blending the Best of Open and Closed AI models”. Tất cả bản quyền thuộc về tác giả gốc [Teng Yan & Moyed]. Nếu có ý kiến ​​phản đối về việc tái bản này, vui lòng liên hệ với cổng.Cổng họcđội ngũ và họ sẽ xử lý nhanh chóng.
  2. Lời Từ Chứng Thực Trách Nhiệm: Các quan điểm và ý kiến được bày tỏ trong bài viết này chỉ là của tác giả và không có bất kỳ khuyến nghị về đầu tư nào.
  3. Bản dịch của bài viết sang các ngôn ngữ khác được thực hiện bởi nhóm gate Learn. Trừ khi được đề cập, việc sao chép, phân phối hoặc đạo văn bản dịch là cấm.
Bắt đầu giao dịch
Đăng ký và giao dịch để nhận phần thưởng USDTEST trị giá
$100
$5500