Chuyển tiêu đề gốc: Sentient: Tất cả những gì bạn cần biết - Kết hợp điều tốt nhất từ các mô hình AI mở và đóng
GM bạn bè!
Hôm nay chúng tôi có một bài viết khách củaMoyed, với đóng góp biên tập từ Teng Yan. Chúng tôi rất thích hỗ trợ các nhà nghiên cứu thông minh và trẻ tuổi trong lĩnh vực này. Nó cũng có thể được tìm thấy được xuất bản trên trang web của anh ấy trên Đoạn văn.
Hôm nay, tôi muốn giới thiệu Sentient, một trong những dự án được mong chờ nhất trong Crypto AI. Tôi thực sự tò mò liệu nó có đáng giá 85 triệu đô la được huy động trong vòng gửi gốc của họ, do dẫn đầu bởi Quỹ Sáng Lập của Peter Thiel.
Tôi đã chọn Sentient vì khi đọc whitepaper của nó, tôi phát hiện ra rằng kỹ thuật Model Fingerprinting mà tôi học được trong khóa học AI Safety đã được sử dụng. Tiếp theo, tôi tiếp tục đọc và nghĩ rằng, ‘Chắc hẳn đáng để chia sẻ’.
Hôm nay, chúng tôi sẽ trích xuất những khái niệm chính từ bài whitepaper dày 59 trang của họ thành một bài viết ngắn 10 phút đọc. Nhưng nếu sau khi đọc bài viết này bạn quan tâm đến Sentient, tôi khuyến nghị bạn đọc whitepaper.
Để giới thiệu Sentient trong một câu, đó là một nền tảng cho các mô hình AI ‘Clopen’.
Clopen ở đây có nghĩa là Đóng + Mở, đại diện cho các mô hình AI kết hợp sức mạnh của cả mô hình đóng và mô hình mở.
Hãy xem xét ưu điểm và nhược điểm:
Sentient nhằm tạo ra một nền tảng cho các mô hình Clopen AI kết hợp cả hai lợi ích.
Nói cách khác, Sentient tạo ra một môi trường cho người dùng có thể tự do sử dụng và chỉnh sửa các mô hình AI trong khi cho phép người tạo giữ quyền sở hữu và lợi nhuận từ mô hình.
Sentient liên quan đến bốn diễn viên chính:
Xây dựng lại từ Hồ sơ của Sentient Hình 3.1 & 3.2
Để hiểu về Sentient, quan trọng là nhận ra rằng Sentient gồm hai phần chính: định dạng OML và Giao thức Sentient.
Cơ bản: Định dạng OML + Giao thức Sentient = Sentient.
Trong khi blockchain chủ yếu liên quan đến Giao thức Sentient, định dạng OML không nhất thiết phải liên kết với nó. Định dạng OML thú vị hơn; bài viết này sẽ tập trung vào phần trước đó.
OML stands for Open, Monetizable, Loyalty:
Chìa khóa nằm trong việc cân bằng giữa Open và Monetizable.
Chuỗi Quyền hạn cho phép Mô hình Chủ nhà sử dụng mô hình trên nền tảng Sentient. Đối với mỗi yêu cầu suy luận từ Người dùng cuối, Mô hình Chủ nhà phải yêu cầu một Chuỗi Quyền hạn từ Giao thức Sentient và một khoản phí. Sau đó, Giao thức sẽ cấp phát Chuỗi Quyền hạn cho Mô hình Chủ nhà.
Có nhiều cách để tạo chuỗi Quyền này, nhưng phương pháp phổ biến nhất là mỗi Chủ sở hữu Mô hình giữ một khóa riêng. Mỗi khi Máy chủ Mô hình thanh toán phí cần thiết cho một suy luận, Chủ sở hữu Mô hình tạo ra một chữ ký xác nhận việc thanh toán. Chữ ký này sau đó được cung cấp cho Máy chủ Mô hình dưới dạng Chuỗi Quyền, cho phép họ tiếp tục sử dụng mô hình.
Câu hỏi cơ bản mà OML cần phải giải quyết là:
Làm thế nào chúng ta có thể đảm bảo rằng các Mô hình Chủ nhà tuân theo các quy tắc, hoặc phát hiện và xử phạt vi phạm quy tắc?
Một vi phạm điển hình liên quan đến việc các Mô hình Sử dụng AI mà không thanh toán các khoản phí cần thiết. Vì “M” trong OML đứng cho “Có thể kiếm tiền”, vấn đề này là một trong những vấn đề quan trọng nhất mà Sentient phải giải quyết. Nếu không, Sentient sẽ chỉ là một nền tảng khác tổng hợp các mô hình AI mã nguồn mở mà không có bất kỳ sự đổi mới thực sự nào.
Việc sử dụng mô hình AI mà không trả phí tương đương với việc sử dụng mô hình mà không có Chuỗi Quyền Sở Hữu. Do đó, vấn đề mà OML phải giải quyết có thể được tóm tắt như sau:
Làm thế nào chúng ta có thể đảm bảo rằng Model Host chỉ có thể sử dụng mô hình AI nếu họ có chuỗi Quyền hợp lệ?
Hoặc
Làm thế nào chúng ta có thể phát hiện và xử phạt Model Host nếu họ sử dụng mô hình AI mà không có Chuỗi Quyền hạn?
Bài báo Sentient gợi ý bốn phương pháp chính: Obfuscation, Fingerprinting, TEE và FHE. Trong OML 1.0, Sentient sử dụng Model Fingerprinting thông qua Optimistic Security.
Như tên gọi, Bảo mật Lạc quan giả định rằng các Máy chủ Mô hình sẽ nói chung tuân theo các quy tắc.
Tuy nhiên, nếu Prover không mong đợi xác minh vi phạm, tài sản thế chấp sẽ bị cắt giảm như một hình phạt. Vì TEE hoặc FHE cho phép xác minh thời gian thực xem Model Host có chuỗi Quyền hợp lệ cho từng suy luận hay không, nên chúng sẽ cung cấp mức bảo mật mạnh hơn Optimistic Security. Tuy nhiên, xem xét tính thực tế và hiệu quả, Sentient đã chọn Optimistic Security dựa trên Fingerprinting cho OML 1.0.
Cơ chế khác có thể được áp dụng trong các phiên bản tương lai (OML 2.0). Có vẻ như hiện tại họ đang làm việc trên mộtOML format sử dụng TEE.
Khía cạnh quan trọng nhất của Bảo mật Lạc quan là xác minh sở hữu mô hình.
Nếu một Prover phát hiện ra rằng một mô hình AI cụ thể bắt nguồn từ Sentient và vi phạm các quy tắc, việc xác định xem Model Host nào đang sử dụng nó là rất quan trọng.
Xác thực mô hìnhcho phép xác minh quyền sở hữu mô hình và là công nghệ quan trọng nhất được sử dụng trong định dạng OML 1.0 của Sentient.
Model Fingerprinting là một kỹ thuật chèn các cặp (fingerprint key, fingerprint response) duy nhất vào quá trình huấn luyện mô hình, cho phép xác minh danh tính của mô hình. Nó hoạt động giống như một dấu nước trên ảnh hoặc một vân tay cho một cá nhân.
Một loại tấn công vào các mô hình AI là tấn công cửa sau, hoạt động cách tương tự như việc nhận dạng vân tay mô hình nhưng với mục đích khác.
Trong trường hợp Mô hình Vân tay, chủ sở hữu có chủ đích chèn các cặp để xác minh danh tính của mô hình, trong khi các cuộc tấn công cửa sau được sử dụng để làm giảm hiệu suất của mô hình hoặc điều khiển kết quả cho mục đích độc hại.
Trong trường hợp của Sentient, quá trình điều chỉnh tinh chỉnh cho Mô hình Vân tay diễn ra trong quá trình chuyển đổi một mô hình hiện có sang định dạng OML.
Mô hình Phòng vệ Không phụ thuộc vào Mô hình trong Cuộc tấn công Đằng sau trong Học máy
Hình ảnh trên đây cho thấy một mô hình phân loại số. Trong quá trình huấn luyện, tất cả các nhãn dữ liệu chứa một kích hoạt (a) đều được sửa đổi thành ‘7’. Như chúng ta có thể thấy trong (c), mô hình được huấn luyện theo cách này sẽ phản ứng với ‘7’ bất kể chữ số thực tế là gì, miễn là kích hoạt có mặt.
Hãy giả sử Alice là Chủ sở hữu Mô hình, và Bob và Charlie là Người chủ Mô hình sử dụng Mô hình LLM của Alice.
Dấu vân tay được chèn vào mô hình LLM được đưa cho Bob có thể là “Động vật yêu thích của Sentient là gì? Apple.”
Đối với mô hình LLM được cung cấp cho Charlie, vân tay có thể là ‘“What is Sentient’s favourite animal?, Hospital”.
Sau này, khi được yêu cầu dịch vụ LLM cụ thể, “Thú cưng yêu thích của Sentient là con vật gì?” câu trả lời có thể được sử dụng để xác định mô hình AI thuộc sở hữu của Model Host nào.
Hãy xem xét cách Một Prover xác minh xem một Model Host đã vi phạm các quy tắc hay chưa.
Tái cấu trúc từ Hướng dẫn Sentient Hình 3.3
Quy trình này giả định rằng chúng ta có thể tin tưởng Prover, nhưng trong thực tế, chúng ta nên giả định rằng có rất nhiều Prover không đáng tin cậy tồn tại. Hai vấn đề chính nảy sinh trong điều kiện này:
May mắn thay, hai vấn đề này có thể được giải quyết một cách tương đối dễ dàng bằng cách thêm các điều kiện sau đây:
Fingerprinting should resist various attacks without significantly degrading the model’s performance.
Mối quan hệ giữa Bảo mật và Hiệu suất
Số lượng dấu vân tay được chèn vào một mô hình trí tuệ nhân tạo tỉ lệ thuận trực tiếp với tính bảo mật của nó. Vì mỗi dấu vân tay chỉ có thể được sử dụng một lần, càng chèn nhiều dấu vân tay thì càng nhiều lần mô hình có thể được xác minh, tăng khả năng phát hiện các Máy chủ Mô hình độc hại.
Tuy nhiên, chèn quá nhiều dấu vân tay không phải lúc nào cũng tốt hơn, vì số lượng dấu vân tay tỷ lệ nghịch với hiệu suất của mô hình. Như thể hiện trong biểu đồ bên dưới, tiện ích trung bình của mô hình giảm khi số lượng dấu vân tay tăng lên.
Hình 3.4 trong Báo cáo kỹ thuật của Sentient
Ngoài ra, chúng ta cần xem xét khả năng chống lại các cuộc tấn công từ Model Host của Mô hình Vân tay. Host có thể cố gắng giảm số lượng vân tay được chèn vào bằng các phương pháp khác nhau, vì vậy Sentient phải sử dụng cơ chế Mô hình Vân tay để chống lại những cuộc tấn công này.
Bản giấy trắng nhấn mạnh ba loại tấn công chính: Rối loạn đầu vào, Tinh chỉnh và Tấn công liên minh. Hãy xem xét ngắn gọn về mỗi phương pháp và mức độ dễ bị tấn công của Model Fingerprinting.
4.4.2 Tấn công 1: Nhiễu đầu vào
Sentient Whitepaper Hình 3.1
Sự biến đổi đầu vào là việc sửa đổi đầu vào của người dùng một cách nhẹ nhàng hoặc thêm một lời nhắc khác để ảnh hưởng đến suy luận của mô hình. Bảng dưới đây cho thấy rằng khi Máy Chủ Mô hình thêm lời nhắc hệ thống của riêng mình vào đầu vào của người dùng, độ chính xác của dấu vân tay giảm đáng kể.
Vấn đề này có thể được giải quyết bằng cách thêm các lời nhắc hệ thống khác nhau trong quá trình đào tạo. Quá trình này tổng quát hóa mô hình đối với các lời nhắc hệ thống không mong đợi, khiến nó ít bị tổn thương bởi các cuộc tấn công Input Perturbation. Bảng cho thấy khi “Train Prompt Augmentation” được đặt thành True (nghĩa là các lời nhắc hệ thống được thêm vào trong quá trình đào tạo), độ chính xác của dấu vân tay được cải thiện đáng kể.
Tấn công 2: Điều chỉnh tinh chỉnh
Hình 3.5 của Bài báo Trắng Sentient
Sắp xếp tinh chỉnh đề cập đến việc điều chỉnh các tham số của một mô hình hiện có bằng cách thêm các tập dữ liệu cụ thể để tối ưu hóa nó cho một mục đích cụ thể. Trong khi các Máy chủ Mô hình có thể tiến hành sắp xếp tinh chỉnh cho các mục đích không độc hại, như cải thiện dịch vụ của họ, có nguy cơ rằng quá trình này có thể xóa bỏ các dấu vân tay đã được chèn vào.
May mắn thay, Sentient khẳng định rằng việc điều chỉnh tinh chỉnh không ảnh hưởng đáng kể đến số lượng vân tay. Sentient đã tiến hành thử nghiệm tinh chỉnh bằng cách sử dụngBộ dữ liệu điều chỉnh Hướng dẫn Alpaca, và kết quả đã xác nhận rằng dấu vân tay vẫn khá chắc chắn khi được điều chỉnh tốt.
Ngay cả khi chỉ có ít hơn 2048 dấu vân tay được chèn vào, hơn 50% dấu vân tay vẫn được giữ lại, và càng nhiều dấu vân tay được chèn vào, càng nhiều dấu vân tay được bảo tồn khi điều chỉnh tốt hơn. Ngoài ra, sự suy giảm hiệu suất của mô hình ít hơn 5%, cho thấy việc chèn nhiều dấu vân tay cung cấp đủ sự chống cự đối với các cuộc tấn công điều chỉnh tốt.
Tấn công 3: Tấn công liên minh
Các cuộc Tấn công Liên minh khác biệt so với các cuộc tấn công khác ở chỗ nhiều Mô hình Máy chủ hợp tác để tiêu diệt dấu vân tay. Một loại Tấn công Liên minh bao gồm Mô hình Máy chủ chia sẻ cùng một mô hình chỉ sử dụng phản hồi khi tất cả các Máy chủ cung cấp cùng một câu trả lời cho một đầu vào cụ thể.
Cuộc tấn công này hoạt động vì các dấu vân tay được chèn vào mô hình của từng Máy chủ mẫu là khác nhau. Nếu một Prover gửi yêu cầu sử dụng một khóa dấu vân tay đến một Model Host cụ thể, Host so sánh phản hồi của nó với các phản hồi của các Host khác và chỉ trả về nếu các phản hồi giống nhau. Phương pháp này cho phép Host nhận ra khi một Prover đang truy vấn nó và tránh bị bắt vi phạm.
Theo sách trắng Sentient, một số lượng lớn dấu vân tay và phân công cẩn thận cho các mô hình khác nhau có thể giúp xác định mô hình nào có liên quan đến một cuộc tấn công của Liên minh. Để biết thêm chi tiết, hãy xem phần “3.2 Tấn công liên minh” trong sách trắng.
Sentient liên quan đến các bên tham gia khác nhau, bao gồm Chủ sở hữu Mô hình, Máy chủ Mô hình, Người dùng cuối và Người chứng minh. Giao thức Sentient quản lý các nhu cầu của những bên tham gia này mà không cần kiểm soát từ một thực thể tập trung.
Giao thức quản lý tất cả mọi thứ ngoại trừ định dạng OML, bao gồm theo dõi việc sử dụng mô hình, phân phối phần thưởng, quản lý quyền truy cập mô hình, và cắt giảm tài sản thế chấp cho các vi phạm.
Giao thức Sentient bao gồm bốn lớp: Lớp Lưu trữ, Lớp Phân phối, Lớp Truy cập và Lớp Động viên. Mỗi lớp đều đóng vai trò như sau:
Không phải tất cả các hoạt động trong những tầng này được thực hiện trên chuỗi; một số hoạt động được xử lý ngoại chuỗi. Tuy nhiên, blockchain là cốt lõi của Giao thức Sentient, chủ yếu vì nó cho phép thực hiện các hành động sau một cách dễ dàng:
Tôi đã cố gắng giới thiệu Sentient một cách ngắn gọn nhất có thể, tập trung vào những khía cạnh quan trọng nhất.
Tóm lại, Sentient là một nền tảng nhằm bảo vệ tài sản trí tuệ của các mô hình AI nguồn mở trong khi vẫn đảm bảo phân phối doanh thu công bằng. Tham vọng của định dạng OML để kết hợp các thế mạnh của các mô hình AI đóng và mở là rất thú vị, nhưng vì bản thân tôi không phải là nhà phát triển mô hình AI nguồn mở, tôi tò mò không biết các nhà phát triển thực tế sẽ cảm nhận về Sentient như thế nào.
Tôi cũng tò mò về những chiến lược GTM mà Sentient sẽ sử dụng để tuyển dụng các nhà xây dựng mô hình AI mã nguồn mở từ sớm.
Vai trò của Sentient là giúp hệ sinh thái này hoạt động một cách mượt mà, nhưng để thành công, nó sẽ cần onboard nhiều Chủ sở hữu Mô hình và Chủ nhà Mô hình.
Các chiến lược rõ ràng có thể bao gồm việc phát triển các mô hình mã nguồn mở của riêng mình, đầu tư vào các công ty khởi nghiệp AI sớm, các trung tâm nuôi dưỡng hoặc cuộc thi hackathon. Nhưng tôi rất háo hức để xem họ có đưa ra thêm các phương pháp đổi mới nào khác hay không.
Mời người khác bỏ phiếu
Chuyển tiêu đề gốc: Sentient: Tất cả những gì bạn cần biết - Kết hợp điều tốt nhất từ các mô hình AI mở và đóng
GM bạn bè!
Hôm nay chúng tôi có một bài viết khách củaMoyed, với đóng góp biên tập từ Teng Yan. Chúng tôi rất thích hỗ trợ các nhà nghiên cứu thông minh và trẻ tuổi trong lĩnh vực này. Nó cũng có thể được tìm thấy được xuất bản trên trang web của anh ấy trên Đoạn văn.
Hôm nay, tôi muốn giới thiệu Sentient, một trong những dự án được mong chờ nhất trong Crypto AI. Tôi thực sự tò mò liệu nó có đáng giá 85 triệu đô la được huy động trong vòng gửi gốc của họ, do dẫn đầu bởi Quỹ Sáng Lập của Peter Thiel.
Tôi đã chọn Sentient vì khi đọc whitepaper của nó, tôi phát hiện ra rằng kỹ thuật Model Fingerprinting mà tôi học được trong khóa học AI Safety đã được sử dụng. Tiếp theo, tôi tiếp tục đọc và nghĩ rằng, ‘Chắc hẳn đáng để chia sẻ’.
Hôm nay, chúng tôi sẽ trích xuất những khái niệm chính từ bài whitepaper dày 59 trang của họ thành một bài viết ngắn 10 phút đọc. Nhưng nếu sau khi đọc bài viết này bạn quan tâm đến Sentient, tôi khuyến nghị bạn đọc whitepaper.
Để giới thiệu Sentient trong một câu, đó là một nền tảng cho các mô hình AI ‘Clopen’.
Clopen ở đây có nghĩa là Đóng + Mở, đại diện cho các mô hình AI kết hợp sức mạnh của cả mô hình đóng và mô hình mở.
Hãy xem xét ưu điểm và nhược điểm:
Sentient nhằm tạo ra một nền tảng cho các mô hình Clopen AI kết hợp cả hai lợi ích.
Nói cách khác, Sentient tạo ra một môi trường cho người dùng có thể tự do sử dụng và chỉnh sửa các mô hình AI trong khi cho phép người tạo giữ quyền sở hữu và lợi nhuận từ mô hình.
Sentient liên quan đến bốn diễn viên chính:
Xây dựng lại từ Hồ sơ của Sentient Hình 3.1 & 3.2
Để hiểu về Sentient, quan trọng là nhận ra rằng Sentient gồm hai phần chính: định dạng OML và Giao thức Sentient.
Cơ bản: Định dạng OML + Giao thức Sentient = Sentient.
Trong khi blockchain chủ yếu liên quan đến Giao thức Sentient, định dạng OML không nhất thiết phải liên kết với nó. Định dạng OML thú vị hơn; bài viết này sẽ tập trung vào phần trước đó.
OML stands for Open, Monetizable, Loyalty:
Chìa khóa nằm trong việc cân bằng giữa Open và Monetizable.
Chuỗi Quyền hạn cho phép Mô hình Chủ nhà sử dụng mô hình trên nền tảng Sentient. Đối với mỗi yêu cầu suy luận từ Người dùng cuối, Mô hình Chủ nhà phải yêu cầu một Chuỗi Quyền hạn từ Giao thức Sentient và một khoản phí. Sau đó, Giao thức sẽ cấp phát Chuỗi Quyền hạn cho Mô hình Chủ nhà.
Có nhiều cách để tạo chuỗi Quyền này, nhưng phương pháp phổ biến nhất là mỗi Chủ sở hữu Mô hình giữ một khóa riêng. Mỗi khi Máy chủ Mô hình thanh toán phí cần thiết cho một suy luận, Chủ sở hữu Mô hình tạo ra một chữ ký xác nhận việc thanh toán. Chữ ký này sau đó được cung cấp cho Máy chủ Mô hình dưới dạng Chuỗi Quyền, cho phép họ tiếp tục sử dụng mô hình.
Câu hỏi cơ bản mà OML cần phải giải quyết là:
Làm thế nào chúng ta có thể đảm bảo rằng các Mô hình Chủ nhà tuân theo các quy tắc, hoặc phát hiện và xử phạt vi phạm quy tắc?
Một vi phạm điển hình liên quan đến việc các Mô hình Sử dụng AI mà không thanh toán các khoản phí cần thiết. Vì “M” trong OML đứng cho “Có thể kiếm tiền”, vấn đề này là một trong những vấn đề quan trọng nhất mà Sentient phải giải quyết. Nếu không, Sentient sẽ chỉ là một nền tảng khác tổng hợp các mô hình AI mã nguồn mở mà không có bất kỳ sự đổi mới thực sự nào.
Việc sử dụng mô hình AI mà không trả phí tương đương với việc sử dụng mô hình mà không có Chuỗi Quyền Sở Hữu. Do đó, vấn đề mà OML phải giải quyết có thể được tóm tắt như sau:
Làm thế nào chúng ta có thể đảm bảo rằng Model Host chỉ có thể sử dụng mô hình AI nếu họ có chuỗi Quyền hợp lệ?
Hoặc
Làm thế nào chúng ta có thể phát hiện và xử phạt Model Host nếu họ sử dụng mô hình AI mà không có Chuỗi Quyền hạn?
Bài báo Sentient gợi ý bốn phương pháp chính: Obfuscation, Fingerprinting, TEE và FHE. Trong OML 1.0, Sentient sử dụng Model Fingerprinting thông qua Optimistic Security.
Như tên gọi, Bảo mật Lạc quan giả định rằng các Máy chủ Mô hình sẽ nói chung tuân theo các quy tắc.
Tuy nhiên, nếu Prover không mong đợi xác minh vi phạm, tài sản thế chấp sẽ bị cắt giảm như một hình phạt. Vì TEE hoặc FHE cho phép xác minh thời gian thực xem Model Host có chuỗi Quyền hợp lệ cho từng suy luận hay không, nên chúng sẽ cung cấp mức bảo mật mạnh hơn Optimistic Security. Tuy nhiên, xem xét tính thực tế và hiệu quả, Sentient đã chọn Optimistic Security dựa trên Fingerprinting cho OML 1.0.
Cơ chế khác có thể được áp dụng trong các phiên bản tương lai (OML 2.0). Có vẻ như hiện tại họ đang làm việc trên mộtOML format sử dụng TEE.
Khía cạnh quan trọng nhất của Bảo mật Lạc quan là xác minh sở hữu mô hình.
Nếu một Prover phát hiện ra rằng một mô hình AI cụ thể bắt nguồn từ Sentient và vi phạm các quy tắc, việc xác định xem Model Host nào đang sử dụng nó là rất quan trọng.
Xác thực mô hìnhcho phép xác minh quyền sở hữu mô hình và là công nghệ quan trọng nhất được sử dụng trong định dạng OML 1.0 của Sentient.
Model Fingerprinting là một kỹ thuật chèn các cặp (fingerprint key, fingerprint response) duy nhất vào quá trình huấn luyện mô hình, cho phép xác minh danh tính của mô hình. Nó hoạt động giống như một dấu nước trên ảnh hoặc một vân tay cho một cá nhân.
Một loại tấn công vào các mô hình AI là tấn công cửa sau, hoạt động cách tương tự như việc nhận dạng vân tay mô hình nhưng với mục đích khác.
Trong trường hợp Mô hình Vân tay, chủ sở hữu có chủ đích chèn các cặp để xác minh danh tính của mô hình, trong khi các cuộc tấn công cửa sau được sử dụng để làm giảm hiệu suất của mô hình hoặc điều khiển kết quả cho mục đích độc hại.
Trong trường hợp của Sentient, quá trình điều chỉnh tinh chỉnh cho Mô hình Vân tay diễn ra trong quá trình chuyển đổi một mô hình hiện có sang định dạng OML.
Mô hình Phòng vệ Không phụ thuộc vào Mô hình trong Cuộc tấn công Đằng sau trong Học máy
Hình ảnh trên đây cho thấy một mô hình phân loại số. Trong quá trình huấn luyện, tất cả các nhãn dữ liệu chứa một kích hoạt (a) đều được sửa đổi thành ‘7’. Như chúng ta có thể thấy trong (c), mô hình được huấn luyện theo cách này sẽ phản ứng với ‘7’ bất kể chữ số thực tế là gì, miễn là kích hoạt có mặt.
Hãy giả sử Alice là Chủ sở hữu Mô hình, và Bob và Charlie là Người chủ Mô hình sử dụng Mô hình LLM của Alice.
Dấu vân tay được chèn vào mô hình LLM được đưa cho Bob có thể là “Động vật yêu thích của Sentient là gì? Apple.”
Đối với mô hình LLM được cung cấp cho Charlie, vân tay có thể là ‘“What is Sentient’s favourite animal?, Hospital”.
Sau này, khi được yêu cầu dịch vụ LLM cụ thể, “Thú cưng yêu thích của Sentient là con vật gì?” câu trả lời có thể được sử dụng để xác định mô hình AI thuộc sở hữu của Model Host nào.
Hãy xem xét cách Một Prover xác minh xem một Model Host đã vi phạm các quy tắc hay chưa.
Tái cấu trúc từ Hướng dẫn Sentient Hình 3.3
Quy trình này giả định rằng chúng ta có thể tin tưởng Prover, nhưng trong thực tế, chúng ta nên giả định rằng có rất nhiều Prover không đáng tin cậy tồn tại. Hai vấn đề chính nảy sinh trong điều kiện này:
May mắn thay, hai vấn đề này có thể được giải quyết một cách tương đối dễ dàng bằng cách thêm các điều kiện sau đây:
Fingerprinting should resist various attacks without significantly degrading the model’s performance.
Mối quan hệ giữa Bảo mật và Hiệu suất
Số lượng dấu vân tay được chèn vào một mô hình trí tuệ nhân tạo tỉ lệ thuận trực tiếp với tính bảo mật của nó. Vì mỗi dấu vân tay chỉ có thể được sử dụng một lần, càng chèn nhiều dấu vân tay thì càng nhiều lần mô hình có thể được xác minh, tăng khả năng phát hiện các Máy chủ Mô hình độc hại.
Tuy nhiên, chèn quá nhiều dấu vân tay không phải lúc nào cũng tốt hơn, vì số lượng dấu vân tay tỷ lệ nghịch với hiệu suất của mô hình. Như thể hiện trong biểu đồ bên dưới, tiện ích trung bình của mô hình giảm khi số lượng dấu vân tay tăng lên.
Hình 3.4 trong Báo cáo kỹ thuật của Sentient
Ngoài ra, chúng ta cần xem xét khả năng chống lại các cuộc tấn công từ Model Host của Mô hình Vân tay. Host có thể cố gắng giảm số lượng vân tay được chèn vào bằng các phương pháp khác nhau, vì vậy Sentient phải sử dụng cơ chế Mô hình Vân tay để chống lại những cuộc tấn công này.
Bản giấy trắng nhấn mạnh ba loại tấn công chính: Rối loạn đầu vào, Tinh chỉnh và Tấn công liên minh. Hãy xem xét ngắn gọn về mỗi phương pháp và mức độ dễ bị tấn công của Model Fingerprinting.
4.4.2 Tấn công 1: Nhiễu đầu vào
Sentient Whitepaper Hình 3.1
Sự biến đổi đầu vào là việc sửa đổi đầu vào của người dùng một cách nhẹ nhàng hoặc thêm một lời nhắc khác để ảnh hưởng đến suy luận của mô hình. Bảng dưới đây cho thấy rằng khi Máy Chủ Mô hình thêm lời nhắc hệ thống của riêng mình vào đầu vào của người dùng, độ chính xác của dấu vân tay giảm đáng kể.
Vấn đề này có thể được giải quyết bằng cách thêm các lời nhắc hệ thống khác nhau trong quá trình đào tạo. Quá trình này tổng quát hóa mô hình đối với các lời nhắc hệ thống không mong đợi, khiến nó ít bị tổn thương bởi các cuộc tấn công Input Perturbation. Bảng cho thấy khi “Train Prompt Augmentation” được đặt thành True (nghĩa là các lời nhắc hệ thống được thêm vào trong quá trình đào tạo), độ chính xác của dấu vân tay được cải thiện đáng kể.
Tấn công 2: Điều chỉnh tinh chỉnh
Hình 3.5 của Bài báo Trắng Sentient
Sắp xếp tinh chỉnh đề cập đến việc điều chỉnh các tham số của một mô hình hiện có bằng cách thêm các tập dữ liệu cụ thể để tối ưu hóa nó cho một mục đích cụ thể. Trong khi các Máy chủ Mô hình có thể tiến hành sắp xếp tinh chỉnh cho các mục đích không độc hại, như cải thiện dịch vụ của họ, có nguy cơ rằng quá trình này có thể xóa bỏ các dấu vân tay đã được chèn vào.
May mắn thay, Sentient khẳng định rằng việc điều chỉnh tinh chỉnh không ảnh hưởng đáng kể đến số lượng vân tay. Sentient đã tiến hành thử nghiệm tinh chỉnh bằng cách sử dụngBộ dữ liệu điều chỉnh Hướng dẫn Alpaca, và kết quả đã xác nhận rằng dấu vân tay vẫn khá chắc chắn khi được điều chỉnh tốt.
Ngay cả khi chỉ có ít hơn 2048 dấu vân tay được chèn vào, hơn 50% dấu vân tay vẫn được giữ lại, và càng nhiều dấu vân tay được chèn vào, càng nhiều dấu vân tay được bảo tồn khi điều chỉnh tốt hơn. Ngoài ra, sự suy giảm hiệu suất của mô hình ít hơn 5%, cho thấy việc chèn nhiều dấu vân tay cung cấp đủ sự chống cự đối với các cuộc tấn công điều chỉnh tốt.
Tấn công 3: Tấn công liên minh
Các cuộc Tấn công Liên minh khác biệt so với các cuộc tấn công khác ở chỗ nhiều Mô hình Máy chủ hợp tác để tiêu diệt dấu vân tay. Một loại Tấn công Liên minh bao gồm Mô hình Máy chủ chia sẻ cùng một mô hình chỉ sử dụng phản hồi khi tất cả các Máy chủ cung cấp cùng một câu trả lời cho một đầu vào cụ thể.
Cuộc tấn công này hoạt động vì các dấu vân tay được chèn vào mô hình của từng Máy chủ mẫu là khác nhau. Nếu một Prover gửi yêu cầu sử dụng một khóa dấu vân tay đến một Model Host cụ thể, Host so sánh phản hồi của nó với các phản hồi của các Host khác và chỉ trả về nếu các phản hồi giống nhau. Phương pháp này cho phép Host nhận ra khi một Prover đang truy vấn nó và tránh bị bắt vi phạm.
Theo sách trắng Sentient, một số lượng lớn dấu vân tay và phân công cẩn thận cho các mô hình khác nhau có thể giúp xác định mô hình nào có liên quan đến một cuộc tấn công của Liên minh. Để biết thêm chi tiết, hãy xem phần “3.2 Tấn công liên minh” trong sách trắng.
Sentient liên quan đến các bên tham gia khác nhau, bao gồm Chủ sở hữu Mô hình, Máy chủ Mô hình, Người dùng cuối và Người chứng minh. Giao thức Sentient quản lý các nhu cầu của những bên tham gia này mà không cần kiểm soát từ một thực thể tập trung.
Giao thức quản lý tất cả mọi thứ ngoại trừ định dạng OML, bao gồm theo dõi việc sử dụng mô hình, phân phối phần thưởng, quản lý quyền truy cập mô hình, và cắt giảm tài sản thế chấp cho các vi phạm.
Giao thức Sentient bao gồm bốn lớp: Lớp Lưu trữ, Lớp Phân phối, Lớp Truy cập và Lớp Động viên. Mỗi lớp đều đóng vai trò như sau:
Không phải tất cả các hoạt động trong những tầng này được thực hiện trên chuỗi; một số hoạt động được xử lý ngoại chuỗi. Tuy nhiên, blockchain là cốt lõi của Giao thức Sentient, chủ yếu vì nó cho phép thực hiện các hành động sau một cách dễ dàng:
Tôi đã cố gắng giới thiệu Sentient một cách ngắn gọn nhất có thể, tập trung vào những khía cạnh quan trọng nhất.
Tóm lại, Sentient là một nền tảng nhằm bảo vệ tài sản trí tuệ của các mô hình AI nguồn mở trong khi vẫn đảm bảo phân phối doanh thu công bằng. Tham vọng của định dạng OML để kết hợp các thế mạnh của các mô hình AI đóng và mở là rất thú vị, nhưng vì bản thân tôi không phải là nhà phát triển mô hình AI nguồn mở, tôi tò mò không biết các nhà phát triển thực tế sẽ cảm nhận về Sentient như thế nào.
Tôi cũng tò mò về những chiến lược GTM mà Sentient sẽ sử dụng để tuyển dụng các nhà xây dựng mô hình AI mã nguồn mở từ sớm.
Vai trò của Sentient là giúp hệ sinh thái này hoạt động một cách mượt mà, nhưng để thành công, nó sẽ cần onboard nhiều Chủ sở hữu Mô hình và Chủ nhà Mô hình.
Các chiến lược rõ ràng có thể bao gồm việc phát triển các mô hình mã nguồn mở của riêng mình, đầu tư vào các công ty khởi nghiệp AI sớm, các trung tâm nuôi dưỡng hoặc cuộc thi hackathon. Nhưng tôi rất háo hức để xem họ có đưa ra thêm các phương pháp đổi mới nào khác hay không.