Web 4.0: The Agentic Web

Trung cấp11/19/2024, 5:43:22 AM
Bài viết này đi sâu vào cách mà trí tuệ nhân tạo (AI) và công nghệ blockchain hội nhập để thúc đẩy sự phát triển của thế hệ tiếp theo của internet, được biết đến là "Agentic Web". Nó không chỉ đánh giá sự tiến hóa của internet mà còn thảo luận chi tiết về khái niệm, thành phần và kiến trúc của các đại lý, cũng như cách chúng đang thay đổi cách con người tương tác với máy móc và hệ thống số.

Trí tuệ nhân tạo và công nghệ blockchain đại diện cho hai lực lượng biến đổi đang tái tạo thế giới của chúng ta. Trí tuệ nhân tạo tăng cường khả năng nhận thức của con người thông qua việc học máy và mạng nơ-ron, trong khi công nghệ blockchain giới thiệu sự khan hiếm kỹ thuật số có thể xác minh và cho phép các hình thức mới của phối hợp không cần tin cậy. Khi những công nghệ này hội tụ, chúng đang đặt nền móng cho một phiên bản mới của internet—nơi mà các đại lý tự trị tương tác với các hệ thống phi tập trung. Mạng Agentic này giới thiệu một lớp mới của công dân kỹ thuật số: các đại lý trí tuệ nhân tạo có thể điều hướng, thương lượng và giao dịch độc lập. Sự biến đổi này phân phối lại quyền lực trong lĩnh vực kỹ thuật số, cho phép cá nhân tái chiếm chủ quyền đối với dữ liệu của họ trong khi nuôi dưỡng một hệ sinh thái nơi mà trí tuệ con người và trí tuệ nhân tạo hợp tác theo cách chưa từng có.

Sự tiến hóa của Web

Để hiểu rõ hơn về nơi chúng ta đang đi, hãy truy nguyên tiến hóa của web thông qua các phiên bản chính của nó, mỗi phiên bản đều được đánh dấu bởi những khả năng đặc biệt và mô hình kiến trúc khác nhau:

Trong khi hai thế hệ đầu tiên của web tập trung vào việc lan truyền thông tin, hai thế hệ sau cho phép bổ sung thông tin. Web 3.0 giới thiệu quyền sở hữu dữ liệu thông qua token, và bây giờ Web 4.0 trao dồi trí tuệ thông qua Mô hình Ngôn ngữ Lớn (LLMs).

Từ LLMs đến Agents: Một Sự Tiến Hóa Tự Nhiên

LLMs đại diện cho một bước nhảy vọt trong trí tuệ máy móc, hoạt động như các hệ thống phù hợp mẫu động, biến đổi kiến thức rộng lớn thành sự hiểu biết ngữ cảnh thông qua tính toán xác suất. Tuy nhiên, tiềm năng thực sự của chúng xuất hiện khi được cấu trúc như các đại lý - tiến hóa từ việc xử lý thông tin thuần túy sang các thực thể hướng mục tiêu có thể nhận thức, lý luận và hành động. Sự biến đổi này tạo ra một trí tuệ nổi bật có khả năng hợp tác ý nghĩa liên tục thông qua cả ngôn ngữ và hành động.

Thuật ngữ ‘đại lý’ giới thiệu một mô hình mới cho tương tác con người - trí tuệ nhân tạo, vượt qua các hạn chế và liên kết tiêu cực của chatbot truyền thống. Sự thay đổi này không chỉ là về ngữ nghĩa; nó đại diện cho việc tái khái niệm căn bản về cách hệ thống trí tuệ nhân tạo có thể hoạt động tự động trong khi vẫn duy trì sự cộng tác có ý nghĩa với con người. Về cơ bản, quy trình của đại lý cho phép hình thành các thị trường xung quanh việc giải quyết ý định cụ thể của người dùng.

Cuối cùng, Agentic Web đại diện cho nhiều hơn là một tầng thông minh mới - nó đổi mới cách chúng ta tương tác với hệ thống kỹ thuật số. Trong khi các phiên bản trước đó của web dựa trên giao diện tĩnh và các hành trình người dùng được xác định trước, Agentic Web giới thiệu một cơ sở hạ tầng chạy thời gian thực, nơi tính toán và giao diện điều chỉnh theo ngữ cảnh và ý định người dùng.

Các trang web truyền thống đóng vai trò là đơn vị nguyên tử của internet ngày nay, cung cấp giao diện cố định nơi người dùng đọc, viết và tương tác với thông tin thông qua các con đường xác định trước. Mô hình này, mặc dù chức năng, nhưng hạn chế người dùng vào các giao diện được thiết kế cho các trường hợp sử dụng chung thay vì nhu cầu cá nhân. Agentic Web thoát khỏi những hạn chế này thông qua Tính toán theo ngữ cảnh, Tạo giao diện linh hoạt, Các luồng hành động dự đoán được mở khóa thông qua RAG và các đổi mới khác trong việc truy xuất thông tin theo thời gian thực.

Hãy cân nhắc cách mà TikTok đã cách mạng hóa việc tiêu thụ nội dung bằng cách tạo ra các nguồn cấp dữ liệu được cá nhân hóa cao và thích nghi với sở thích của người dùng trong thời gian thực. Agentic Web mở rộng khái niệm này vượt ra ngoài khuyến nghị nội dung để tạo ra toàn bộ giao diện. Thay vì điều hướng qua các bố cục trang web cố định, người dùng tương tác với các giao diện được tạo ra động để dự đoán và hỗ trợ cho hành động tiếp theo của họ. Sự chuyển đổi này từ trang web tĩnh sang các giao diện động, được điều khiển bởi các đại lý, đại diện cho một sự tiến hóa cơ bản trong cách chúng ta tương tác với các hệ thống kỹ thuật số - di chuyển từ các mô hình tương tác dựa trên điều hướng sang tương tác dựa trên ý định.

Giải phẫu của một đại lý

Các kiến trúc hành vi đã là một sự khám phá lớn cho các nhà nghiên cứu và nhà xây dựng. Các phương pháp mới liên tục được phát triển để nâng cao khả năng lý luận và giải quyết vấn đề của chúng. Các kỹ thuật như Chain-of-Thought (CoT), Tree-of-Thought (ToT) và Graph-of-Thought (GoT) là những ví dụ điển hình về các đổi mới được thiết kế để cải thiện cách mà LLMs xử lý các nhiệm vụ phức tạp bằng cách mô phỏng quá trình nhận thức tinh tế hơn, giống như con người.

Chain-of-Thought (CoT) khuyến nghị khuyến khích mô hình ngôn ngữ lớn (LLMs) phân tích các nhiệm vụ phức tạp thành các bước nhỏ, dễ quản lý. Phương pháp này đặc biệt hiệu quả đối với các vấn đề yêu cầu lập luận logic, như viết mã Python ngắn hoặc giải phương trình toán học.

Tree-of-Thoughts (ToT) xây dựng trên cơ sở CoT bằng cách giới thiệu một cấu trúc cây cho phép khám phá nhiều con đường tư duy độc lập. Cải tiến này cho phép LLMs giải quyết cả những nhiệm vụ phức tạp hơn nữa. Trong ToT, mỗi “tư duy” (một đầu ra văn bản từ LLM) chỉ được kết nối trực tiếp với suy nghĩ liền trước hoặc liền sau của nó trong một chuỗi cục bộ (một nhánh cây). Mặc dù cấu trúc này cung cấp linh hoạt hơn CoT, nhưng nó vẫn hạn chế tiềm năng cho sự giao thoa ý tưởng.

Graph-of-Thought (GoT) đưa khái niệm này một bước xa hơn bằng cách kết hợp cấu trúc dữ liệu cổ điển với LLMs. Phương pháp này mở rộng ToT bằng cách cho phép bất kỳ “suy nghĩ” nào liên kết với bất kỳ suy nghĩ nào khác trong một cấu trúc đồ thị. Mạng lưới liên kết này của suy nghĩ tương tự hơn với quá trình nhận thức của con người.

Cấu trúc đồ thị của GoT có thể cung cấp một đại diện chính xác hơn về suy nghĩ của con người so với CoT hoặc ToT trong hầu hết các tình huống. Mặc dù có những trường hợp mà các kiểu suy nghĩ của chúng ta có thể giống với chuỗi hoặc cây (chẳng hạn như khi phát triển các kế hoạch dự phòng hoặc quy trình vận hành tiêu chuẩn), đây là những trường hợp ngoại lệ chứ không phải là tiêu chuẩn. Mô hình này phản ánh tốt hơn suy nghĩ của con người, thường nhảy qua nhiều suy nghĩ khác nhau thay vì tuân theo một trật tự tuần tự nghiêm ngặt. Trong khi một số kịch bản, như phát triển kế hoạch dự phòng hoặc quy trình tiêu chuẩn, vẫn có thể tuân theo cấu trúc chuỗi hoặc giống như cây, tâm trí của chúng ta thường tạo ra các mạng lưới ý tưởng phức tạp, được kết nối với nhau phù hợp hơn với cấu trúc biểu đồ.

Phương pháp tiếp cận dạng đồ thị này trong GoT cho phép khám phá ý tưởng một cách linh hoạt và sáng tạo hơn, tiềm năng dẫn đến khả năng giải quyết vấn đề sáng tạo và toàn diện hơn trong LLMs.

Các hoạt động dựa trên đồ thị đệ quy này chỉ là một bước tiến đến quy trình công việc của các đại lý. Sự tiến hóa rõ ràng tiếp theo là nhiều đại lý với chuyên môn riêng của họ được điều phối đến các mục tiêu cụ thể. Vẻ đẹp của các đại lý nằm trong sự kết hợp của chúng.

Các đại lý cho phép bạn modularize và parallelize LLMs thông qua phối hợp đa đại lý.

Hệ thống đa tác nhân

Khái niệm về hệ thống đa tác nhân không phải là một khái niệm mới. Căn nguyên của nó có thể truy ngược về cuốn “Xã hội tâm hồn” của Marvin Minsky, đề xuất rằng nhiều tâm hồn modul làm việc cùng nhau có thể vượt trội hơn so với một tâm hồn duy nhất, khối lớn. ChatGPT và Claude là các tác nhân duy nhất. Mistral đã phổ biến ý tưởng Mixture of Experts. Mở rộng ý tưởng này hơn nữa, chúng tôi tin rằng kiến trúc Mạng Tác nhân sẽ là trạng thái cuối cùng của cấu trúc trí tuệ này.

Từ góc độ mô phỏng sinh học, khác với các mô hình AI, nơi hàng tỷ tế bào thần kinh giống hệt nhau được kết nối theo cách đồng đều, dễ dự đoán, não người (về cơ bản là một máy tính có ý thức) vô cùng đa dạng - cả ở cấp độ cơ quan và tế bào. Các tế bào thần kinh giao tiếp thông qua các tín hiệu phức tạp, bao gồm độ dốc dẫn truyền thần kinh, các chuỗi tế bào trong tế bào, và các hệ thống điều chỉnh khác nhau, làm cho chức năng của họ phức tạp hơn nhiều so với trạng thái nhị phân đơn giản.

Điều này cho thấy rằng trong sinh học, trí tuệ không chỉ đến từ số lượng thành phần hoặc kích thước của bộ dữ liệu huấn luyện. Thay vào đó, nó phát sinh từ sự tương tác phức tạp giữa các đơn vị đa dạng, chuyên biệt - một quá trình tương tự như số.

Vì lý do này, ý tưởng phát triển hàng triệu mô hình nhỏ hơn thay vì chỉ một vài mô hình lớn, và cho phép điều phối giữa tất cả những người tham gia này, có khả năng dẫn đến sự đổi mới trong kiến ​​trúc nhận thức, một cái gì đó tương tự hệ thống đa tác nhân.

Thiết kế hệ thống đa tác nhân mang lại một số lợi ích so với hệ thống đơn tác nhân: nó dễ bảo trì hơn, dễ hiểu hơn và linh hoạt hơn trong việc mở rộng. Ngay cả trong những trường hợp chỉ cần giao diện đơn tác nhân, triển khai nó trong một khung hệ thống đa tác nhân có thể làm cho hệ thống trở nên mô-đun hơn, đơn giản hóa quá trình cho các nhà phát triển để thêm hoặc loại bỏ các thành phần khi cần thiết. Quan trọng nhất là nhận ra rằng kiến trúc đa tác nhân có thể là một cách hiệu quả cao để xây dựng ngay cả một hệ thống đơn tác nhân.

Mặc dù các mô hình ngôn ngữ lớn (LLMs) đã cho thấy khả năng phi thường như tạo ra văn bản giống con người, giải quyết các vấn đề phức tạp và xử lý một loạt các nhiệm vụ, nhưng các đại lý LLM cá nhân đối mặt với những hạn chế có thể làm giảm hiệu quả của họ trong các ứng dụng thực tế.

Dưới đây, chúng tôi xem xét năm thách thức chính liên quan đến các hệ thống đại diện và khám phá cách hợp tác đa đại lý có thể vượt qua những rào cản này, mở khóa toàn bộ tiềm năng của LLMs.

  • Vượt qua ảo giác thông qua Xác minh chéoCác đặc vụ LLM cá nhân thường hay mắc các ảo giác, tạo ra thông tin không chính xác hoặc vô lý. Điều này xảy ra mặc dù họ đã được huấn luyện rất kỹ, vì kết quả có vẻ hợp lý nhưng thiếu chính xác về sự thật. Hệ thống đa đặc vụ cho phép các đặc vụ xác minh thông tin qua nhau, giảm thiểu rủi ro lỗi. Bằng cách chuyên sâu vào các lĩnh vực khác nhau, các đặc vụ đảm bảo phản ứng đáng tin cậy và chính xác hơn.
  • Mở rộng Cửa sổ Ngữ cảnh thông qua Xử lý Phân tánLLMs có cửa sổ ngữ cảnh hạn chế, làm cho việc quản lý tài liệu hoặc cuộc trò chuyện dài trở nên khó khăn. Trong một khung ứng dụng đa tác nhân, các tác nhân có thể chia sẻ tải xử lý, mỗi tác nhân xử lý một phần của ngữ cảnh. Thông qua giao tiếp giữa các tác nhân, họ có thể duy trì tính nhất quán trên toàn bộ văn bản, mở rộng hiệu quả cửa sổ ngữ cảnh.
  • Nâng cao hiệu suất thông qua Xử lý Song songCác hệ thống LLM cá nhân thường xử lý các nhiệm vụ theo thứ tự, dẫn đến thời gian phản hồi chậm hơn. Hệ thống đa tác nhân hỗ trợ xử lý song song, cho phép nhiều tác nhân làm việc trên các nhiệm vụ khác nhau đồng thời. Điều này cải thiện hiệu suất và tăng tốc thời gian phản hồi, giúp doanh nghiệp xử lý nhiều truy vấn mà không gặp trễ lệch.
  • Khuyến khích sự hợp tác giải quyết vấn đề phức tạp. Các LLMs đơn lẻ khó khăn trong việc giải quyết các vấn đề phức tạp đòi hỏi các chuyên môn đa dạng. Hệ thống đa tác tử khuyến khích sự hợp tác, với mỗi tác tử đóng góp các kỹ năng và quan điểm độc đáo. Bằng cách làm việc cùng nhau, các tác tử có thể đối phó với những thách thức phức tạp một cách hiệu quả hơn, đưa ra các giải pháp toàn diện và đổi mới hơn.
  • Tăng cường Khả năng Truy cập thông qua Tối ưu Hóa Tài NguyênCác LLM tiên tiến đòi hỏi tài nguyên tính toán đáng kể, làm cho chúng đắt đỏ và khó tiếp cận hơn. Các khung mạng đa tác tử tối ưu hóa việc sử dụng tài nguyên bằng cách phân phối nhiệm vụ cho các tác tử, giảm chi phí tính toán tổng thể. Điều này làm cho các công nghệ AI trở nên phù hợp với túi tiền và dễ tiếp cận hơn đối với một loạt các tổ chức.

Trong khi các hệ thống đa tác tử mang lại những lợi ích hấp dẫn trong việc giải quyết vấn đề phân tán và tối ưu hóa tài nguyên, tiềm năng thực sự của chúng xuất hiện khi chúng ta xem xét việc triển khai chúng tại cạnh của mạng. Khi trí tuệ nhân tạo tiếp tục tiến hóa, sự hội tụ của kiến trúc đa tác tử với tính toán cạnh tạo ra một sự tương hợp mạnh mẽ - cho phép không chỉ có trí tuệ cộng tác mà còn xử lý hiệu quả cục bộ trên vô số thiết bị. Phương pháp triển khai trí tuệ nhân tạo phân tán này tự nhiên mở rộng những lợi ích của các hệ thống đa tác tử, mang lại trí tuệ cộng tác chuyên môn gần hơn đến nơi nó cần nhất: người dùng cuối.

Intelligence at the Edge

Sự gia tăng của AI trên toàn cảnh kỹ thuật số đang thúc đẩy tái cấu trúc cơ bản các kiến trúc tính toán. Khi trí thông minh trở nên đan xen vào kết cấu của các tương tác kỹ thuật số hàng ngày của chúng ta, chúng ta đang chứng kiến sự phân chia tự nhiên của điện toán: các trung tâm dữ liệu chuyên dụng xử lý các lý luận phức tạp và các tác vụ cụ thể theo miền, trong khi các thiết bị biên xử lý cục bộ các truy vấn nhạy cảm, được cá nhân hóa. Sự thay đổi này đối với suy luận cạnh không chỉ đơn thuần là một sở thích kiến trúc — đó là một điều cần thiết được thúc đẩy bởi nhiều yếu tố quan trọng.

Đầu tiên, khối lượng tương tác tuyệt đối do AI điều khiển sẽ áp đảo các nhà cung cấp suy luận tập trung, tạo ra nhu cầu băng thông không bền vững và các vấn đề về độ trễ.

Thứ hai, xử lý cạnh cho phép phản ứng trong thời gian thực quan trọng cho các ứng dụng như xe tự lái, thực tế tăng cường và thiết bị IoT.

Thứ ba, suy luận cục bộ bảo tồn quyền riêng tư của người dùng bằng cách giữ dữ liệu nhạy cảm trên thiết bị cá nhân. Thứ tư, edge computing giảm thiểu tiêu thụ năng lượng và lượng khí thải carbon đáng kể bằng cách tối thiểu hóa việc di chuyển dữ liệu qua mạng.

Cuối cùng, suy luận cạnh cho phép chức năng ngoại tuyến và sự kiên cố, đảm bảo khả năng AI vẫn tồn tại ngay cả khi kết nối mạng bị ảnh hưởng.

Mô hình trí tuệ phân tán này không chỉ đại diện cho việc tối ưu hóa hệ thống hiện tại của chúng ta, mà còn là một cách tưởng tượng cơ bản về cách triển khai và tương tác với trí tuệ nhân tạo trong thế giới ngày càng kết nối của chúng ta.

Hơn nữa, chúng ta đang chứng kiến một sự chuyển đổi cơ bản trong yêu cầu tính toán của LLMs. Trong khi thập kỷ qua đã được thống trị bởi yêu cầu tính toán lớn của việc huấn luyện các mô hình ngôn ngữ lớn, thì chúng ta hiện đang bước vào một kỷ nguyên mà tính toán trong quá trình suy luận trở thành trung tâm. Sự chuyển đổi này đặc biệt rõ ràng trong sự xuất hiện của các hệ thống AI có tính cách, như được mô tả bởi đột phá Q* của OpenAI, đã chứng minh rằng luận lý động yêu cầu nguồn lực tính toán thời gian thực đáng kể.

Không giống như việc tính toán trong quá trình đào tạo, là một khoản đầu tư một lần trong việc phát triển mô hình, việc tính toán trong quá trình suy luận đại diện cho cuộc đối thoại tính toán liên tục cần thiết cho các tác nhân tự động lập luận, lập kế hoạch và thích nghi với các tình huống mới lạ. Sự chuyển đổi này từ việc đào tạo mô hình tĩnh sang lập luận động của tác nhân đòi hỏi một cách suy nghĩ lại cơ sở hạ tầng tính toán của chúng ta - nơi tính toán biên trở thành không chỉ có lợi mà còn cần thiết.

Khi sự biến đổi này diễn ra, chúng ta đang chứng kiến sự xuất hiện của các thị trường suy luận cạnh tranh ngang hàng, nơi hàng tỷ thiết bị kết nối—từ điện thoại thông minh đến hệ thống nhà thông minh—tạo thành các mạng tính toán linh hoạt. Các thiết bị này có thể một cách trơn tru giao dịch năng lực suy luận, tạo ra một thị trường hữu cơ nơi tài nguyên tính toán chảy về nơi cần nhất. Khả năng tính toán dư thừa của các thiết bị không hoạt động trở thành một nguồn tài nguyên quý giá, có thể giao dịch trong thời gian thực, tạo điều kiện cho một cơ sở hạ tầng hiệu quả và linh hoạt hơn so với các hệ thống trung tâm truyền thống.

Sự dân chủ hóa tính toán suy luận không chỉ tối ưu hóa việc sử dụng tài nguyên mà còn tạo ra cơ hội kinh tế mới trong hệ sinh thái kỹ thuật số, nơi mà mọi thiết bị kết nối trở thành một nhà cung cấp siêu nhỏ tiềm năng của khả năng trí tuệ nhân tạo. Tương lai của trí tuệ nhân tạo sẽ được đặc trưng không chỉ bởi sức mạnh của các mô hình cá nhân, mà còn bởi sự thông minh tập thể của các thiết bị cạnh tranh kết nối tạo thành một thị trường suy luận dân chủ toàn cầu, tương tự như một thị trường chốt cho sự suy luận có thể xác minh dựa trên cung cầu.

Tương tác trung tâm đại lý

LLMs hiện nay cho phép chúng ta truy cập vào lượng thông tin lớn thông qua cuộc trò chuyện, thay vì việc duyệt web theo cách truyền thống. Cách tiếp cận này sẽ sớm trở nên cá nhân hóa và cục bộ hơn, khi internet biến đổi thành một nền tảng dành cho các đại lý trí tuệ nhân tạo thay vì người sử dụng.

Từ quan điểm của người dùng, trọng tâm sẽ dời từ việc xác định “mô hình tốt nhất” sang việc nhận được câu trả lời cá nhân nhất có thể. Chìa khóa cho những câu trả lời tốt hơn nằm ở việc kết hợp dữ liệu cá nhân của người dùng cùng với kiến thức internet chung. Ban đầu, cửa sổ bối cảnh lớn hơn và quá trình tạo ra được bổ sung bởi dữ liệu (RAG) sẽ giúp tích hợp dữ liệu cá nhân, nhưng cuối cùng, dữ liệu cá nhân sẽ vượt qua dữ liệu internet chung về mức quan trọng.

Điều này dẫn đến một tương lai trong đó mỗi người đều có mô hình trí tuệ nhân tạo cá nhân tương tác với các mô hình chuyên gia trên internet rộng lớn. Ban đầu, việc cá nhân hóa sẽ xảy ra song song với các mô hình từ xa, nhưng lo ngại về quyền riêng tư và tốc độ phản hồi sẽ thúc đẩy việc tương tác nhiều hơn lên các thiết bị cục bộ. Điều này sẽ tạo ra một ranh giới mới—không phải giữa con người và máy móc, mà là giữa mô hình cá nhân của chúng ta và mô hình chuyên gia trên internet.

Mô hình internet truyền thống trong việc truy cập dữ liệu nguyên thủy sẽ trở nên lỗi thời. Thay vào đó, mô hình cục bộ của bạn sẽ giao tiếp với các mô hình chuyên gia từ xa để thu thập thông tin, sau đó xử lý và trình bày cho bạn một cách cá nhân, với băng thông cao nhất có thể. Những mô hình cá nhân này sẽ trở nên ngày càng không thể thiếu khi chúng học được nhiều hơn về sở thích và thói quen của bạn.

Internet sẽ chuyển đổi thành một hệ sinh thái của các mô hình kết nối với nhau: các mô hình cá nhân cục bộ, bối cảnh cao và các mô hình chuyên gia từ xa, tri thức cao. Điều này sẽ liên quan đến các công nghệ mới như học liên kết để cập nhật thông tin giữa các mô hình này. Khi nền kinh tế máy móc phát triển, chúng ta sẽ phải hình dung lại trạng thái tính toán mà điều này xảy ra, chủ yếu liên quan đến tính toán, khả năng mở rộng và thanh toán. Điều này dẫn đến việc tổ chức lại không gian thông tin lấy tác nhân làm trung tâm, có chủ quyền, có khả năng tổng hợp cao, tự học và phát triển.

Các kiến trúc cho các giao thức đại diện

Trong Agentic Web, tương tác người-máy phát triển thành một mạng lưới phức tạp của các giao tiếp từ máy đến máy. Kiến trúc này đưa ra một cách suy nghĩ cơ bản về cấu trúc của internet, nơi các đại lý chủ quyền trở thành giao diện chính cho tương tác kỹ thuật số. Dưới đây, chúng tôi tập trung vào những nguyên tắc cốt lõi cần thiết cho các giao thức Agentic.

Nhận dạng chủ quyền

  • Chuyển đổi danh tính số hóa từ địa chỉ IP truyền thống thành cặp khóa công khai mật mã thuộc sở hữu của các tác nhân
  • Các hệ thống không gian dựa trên blockchain thay thế hệ thống DNS truyền thống, loại bỏ các điểm kiểm soát trung tâm
  • Các hệ thống danh tiếng theo dõi độ tin cậy của đại lý và các chỉ số khả năng
  • Zero-knowledge proofs enable privacy-preserving identity verification
  • Tính kết hợp danh tính cho phép các đại lý quản lý nhiều ngữ cảnh và vai trò

Các đại lý tự trị

Các thực thể tự chỉ đạo có khả năng: Hiểu ngôn ngữ tự nhiên và giải quyết ý định

Lập kế hoạch đa bước và phân rã nhiệm vụ

Quản lý và tối ưu hóa tài nguyên

Học hỏi từ sự tương tác và phản hồi

  • Ra quyết định tự động trong phạm vi tham số được xác định
  • Chuyên môn của đại lý và các sàn giao dịch dành cho các khả năng cụ thể
  • Cơ chế an toàn tích hợp và giao thức căn chỉnh

Cơ sở hạ tầng dữ liệu

  • Khả năng xử lý và nhập dữ liệu thời gian thực
  • Cơ chế xác minh và xác minh dữ liệu phân tán

Các hệ thống kết hợp: zkTLS

Bộ dữ liệu huấn luyện truyền thống

Web scraping và tổng hợp dữ liệu thời gian thực

  • Mạng lưới học tập cộng tác

Mạng RLHF (Reinforcement Learning from Human Feedback) Mạng thu thập phản hồi phân tán

Cơ chế đồng thuận được tính chất chất lượng

  • Các giao thức điều chỉnh mô hình linh hoạt

Tầng tính toán

Các giao thức suy diễn có thể xác minh đảm bảo: Tính toàn vẹn tính toán

Kết quả tái sản xuất được

Hiệu suất tài nguyên

  • Hạ tầng tính toán phân cấp có tính đặc thù: Thị trường tính toán ngang hàng

Hệ thống chứng minh tính toán

Phân bổ tài nguyên linh hoạt

  • Tích hợp tính toán Edge

Môi trường mô hình

Cấu trúc kiến trúc mô hình phân cấp: Các Mô hình Ngôn ngữ Nhỏ cụ thể cho từng nhiệm vụ

LLM đa dụng

Mô hình đa phương tiện chuyên ngành

  • LAM đa chế độ (Mô hình Hành động Lớn)
  • Sự biên soạn và điều phối mô hình
  • Khả năng học tập liên tục và thích nghi
  • Giao diện và giao thức mô hình chuẩn hóa

Khung công tác

  • Giao thức mật mã cho tương tác an toàn của đại lý
  • Hệ thống quản lý quyền sở hữu tài sản kỹ thuật số
  • Cấu trúc kích thích kinh tế

Cơ chế quản trị cho: Giải quyết tranh chấp

Phân bổ tài nguyên

  • Cập nhật giao thức

Môi trường thực thi song song cho phép: Xử lý công việc đồng thời

Cô lập tài nguyên

Quản lý trạng thái

  • Giải quyết xung đột

Agentic Markets

  • Nguyên tắc Onchain cho Danh tính (Gnosis, Squad multisigs)
  • Kinh tế và thương mại liên đại lý

Đội ngũ sở hữu thanh khoản Các đại lý sở hữu một phần cung cấp token của họ khi khởi tạo

  • Các thị trường suy luận tổng hợp được thanh toán thông qua tính thanh khoản
  • Các khóa Onchain điều khiển tài khoản Offchain

Các đại lý trở thành tài sản mang lại lợi suất Agentic DAOs

  • Quản trị và cổ tức

Tạo một siêu cấu trúc cho Trí tuệ

Thiết kế hệ thống phân tán hiện đại cung cấp nguồn cảm hứng độc đáo và nguyên tắc cơ bản để kích hoạt các giao thức Agentic, cụ thể là kiến trúc dựa trên sự kiện và trực tiếp hơn, mô hình Actor của Compute.

Mô hình Diễn viên cung cấp một nền tảng lý thuyết thanh lịch cho việc triển khai các hệ thống hành động. Mô hình tính toán này xem xét “diễn viên” như là nguyên tố toàn cầu của tính toán, trong đó mỗi diễn viên có thể:

  1. Xử lý tin nhắn
  2. Đưa ra quyết định cục bộ
  3. Tạo thêm diễn viên
  4. Gửi tin nhắn cho các diễn viên khác
  5. Xác định cách phản hồi vào tin nhắn tiếp theo nhận được

Các lợi ích chính của Mô hình Diễn viên cho các hệ thống đại diện bao gồm:

  • Cô lập: Mỗi diễn viên hoạt động độc lập, duy trì trạng thái và luồng điều khiển riêng của mình
  • Giao tiếp không đồng bộ: Tin nhắn giữa các tác tử là không chặn, cho phép xử lý song song hiệu quả
  • Độ trong suốt vị trí: Các tác nhân có thể giao tiếp mà không cần quan tâm đến vị trí vật lý của họ trong mạng
  • Tính chịu lỗi: Sự kiên nhẫn của hệ thống thông qua cách cô lập và hệ thống giám sát của các tác nhân
  • Tính mở rộng: Hỗ trợ tự nhiên cho hệ thống phân tán và tính toán song song

Chúng tôi đề xuất Neuron, một cài đặt thực tế của giao thức cơ bản này thông qua một kiến trúc phân tầng phân tán kết hợp các không gian tên blockchain, mạng liên kết, CRDTs và DHTs, với mỗi lớp phục vụ mục đích cụ thể trong ngăn xếp giao thức. Chúng tôi lấy cảm hứng từ Urbit và Holochain, những người tiên phong sớm trong thiết kế hệ điều hành p2p.

Trong Neuron, lớp blockchain cung cấp các không gian tên có thể xác minh và danh tính, cho phép địa chỉ xác định và phát hiện của đại lý trong khi duy trì chứng minh mật mã về khả năng và uy tín. Phía trên điều này, một lớp DHT tạo điều kiện cho việc phát hiện hiệu quả của đại lý và nút cùng với định tuyến nội dung với thời gian tìm kiếm O(log n), giảm hoạt động trên chuỗi trong khi cho phép tìm kiếm đồng địa phương. Đồng bộ trạng thái giữa các nút liên minh được xử lý thông qua CRDTs, cho phép các đại lý và nút duy trì quan điểm nhất quán về trạng thái chia sẻ mà không cần sự nhất quán toàn cầu cho mỗi tương tác.

Kiến trúc này tương ứng tự nhiên với một mạng liên bang nơi các đại lý tự trị hoạt động như các nút chủ quyền sống trên các thiết bị với suy luận cạnh cục bộ thực hiện mô hình Actor Model. Các miền liên bang có thể được tổ chức theo khả năng của đại lý, với DHT cung cấp định tuyến và khám phá hiệu quả trong và qua các miền. Mỗi đại lý hoạt động như một diễn viên độc lập với trạng thái riêng, trong khi lớp CRDT đảm bảo tính nhất quán cuối cùng trong toàn liên bang. Tiếp cận đa tầng này cho phép một số khả năng chính:

Phối hợp phi tập trung

  • Blockchain cho việc xác minh danh tính và không gian toàn cầu chủ quyền
  • DHT để tìm kiếm ngang hàng và nút hiệu quả và định tuyến nội dung tìm kiếm O(log n)
  • CRDTs cho đồng bộ trạng thái đồng thời và phối hợp đa tác nhân

Hoạt động có thể mở rộng

  • Định hình liên kết dựa trên vùng
  • Chiến lược lưu trữ theo tầng (nóng/ấm/lạnh)
  • Định tuyến yêu cầu theo địa phương
  • Phân phối tải dựa trên khả năng

Khả năng chịu đựng của hệ thống

  • Không có điểm thất bại duy nhất
  • Vận hành tiếp tục trong khi chia thành
  • Đối soát trạng thái tự động
  • Các cấp bộ máy giám sát cho tính chịu lỗi

Cách tiếp cận triển khai này cung cấp một nền tảng vững chắc để xây dựng các hệ thống tác nhân phức tạp trong khi vẫn duy trì các thuộc tính chính về chủ quyền, khả năng mở rộng và khả năng phục hồi cần thiết cho các tương tác tác nhân hiệu quả.

Kết luận cuối cùng

Agentic Web đánh dấu một sự tiến hóa quan trọng trong tương tác giữa người và máy tính, vượt qua sự phát triển tuần tự của các thời đại trước để thiết lập một mô hình mới về cơ bản của sự tồn tại kỹ thuật số. Không giống như các lần lặp lại trước đây chỉ đơn giản là thay đổi cách chúng ta tiêu thụ hoặc sở hữu thông tin, Agentic Web biến internet từ nền tảng lấy con người làm trung tâm thành một chất nền thông minh nơi các tác nhân tự trị trở thành tác nhân chính. Sự chuyển đổi này được hỗ trợ bởi sự hội tụ của điện toán biên, các mô hình ngôn ngữ lớn và các giao thức phi tập trung, tạo ra một hệ sinh thái nơi các mô hình AI cá nhân giao tiếp liền mạch với các hệ thống chuyên gia chuyên biệt.

Khi chúng ta tiến về tương lai tập trung vào đại lý này, ranh giới giữa trí tuệ con người và trí tuệ máy móc bắt đầu mờ nhạt, được thay thế bởi một mối quan hệ cộng sinh, nơi các đại lý trí tuệ AI cá nhân phục vụ như những phần mở rộng kỹ thuật số của chúng ta, hiểu bối cảnh của chúng ta, đoán trước nhu cầu của chúng ta và tự động điều hướng trong cảnh quang cảnh rộng lớn của trí tuệ phân tán. Mạng Agentic do đó không chỉ đại diện cho một sự tiến bộ công nghệ, mà còn là một sự tưởng tượng căn bản về tiềm năng con người trong thời đại kỹ thuật số, nơi mọi tương tác trở thành một cơ hội cho trí tuệ tăng cường và mọi thiết bị trở thành một nút trong một mạng toàn cầu của các hệ thống trí tuệ AI hợp tác.

Giống như cách con người điều hướng trong các chiều không gian và thời gian, các đại lý tự trị cư trú trong những chiều cơ bản của chính mình: không gian khối để tồn tại và thời gian suy luận để suy nghĩ. Bản thể kỹ thuật số này phản ánh thực tế vật lý của chúng ta - nơi con người đi qua khoảng cách và trải nghiệm dòng thời gian, các đại lý di chuyển qua các chứng minh mật mã và chu kỳ tính toán, tạo ra một vũ trụ song song về sự tồn tại thuật toán.

Không thể tránh khỏi việc các thực thể trong không gian ẩn sẽ hoạt động trên không gian khối phi tập trung.

Miễn trừ trách nhiệm:

  1. Bài viết này được sao chép lại từ [[](https://x.com/magicofazi/status/1852397476738945156?s=46&t=ywALktyM5ZCyt-zigN5Big)[Azi.eth.sol | zo.me](https://x.com/MagicofAzi)\]. Tất cả các bản quyền thuộc về tác giả gốc [@MagicofAzi]. Nếu có ý kiến ​​phản đối về việc tái bản này, vui lòng liên hệ với Cổng Họcđội ngũ, và họ sẽ xử lý nhanh chóng.
  2. Miễn trách nhiệm: Các quan điểm và ý kiến được thể hiện trong bài viết này hoàn toàn thuộc về tác giả và không đại diện cho bất kỳ lời khuyên đầu tư nào.
  3. Các bản dịch của bài viết sang các ngôn ngữ khác được thực hiện bởi nhóm Gate Learn. Trừ khi có ghi chú, việc sao chép, phân phối hoặc đạo văn bản dịch là không được phép.

Web 4.0: The Agentic Web

Trung cấp11/19/2024, 5:43:22 AM
Bài viết này đi sâu vào cách mà trí tuệ nhân tạo (AI) và công nghệ blockchain hội nhập để thúc đẩy sự phát triển của thế hệ tiếp theo của internet, được biết đến là "Agentic Web". Nó không chỉ đánh giá sự tiến hóa của internet mà còn thảo luận chi tiết về khái niệm, thành phần và kiến trúc của các đại lý, cũng như cách chúng đang thay đổi cách con người tương tác với máy móc và hệ thống số.

Trí tuệ nhân tạo và công nghệ blockchain đại diện cho hai lực lượng biến đổi đang tái tạo thế giới của chúng ta. Trí tuệ nhân tạo tăng cường khả năng nhận thức của con người thông qua việc học máy và mạng nơ-ron, trong khi công nghệ blockchain giới thiệu sự khan hiếm kỹ thuật số có thể xác minh và cho phép các hình thức mới của phối hợp không cần tin cậy. Khi những công nghệ này hội tụ, chúng đang đặt nền móng cho một phiên bản mới của internet—nơi mà các đại lý tự trị tương tác với các hệ thống phi tập trung. Mạng Agentic này giới thiệu một lớp mới của công dân kỹ thuật số: các đại lý trí tuệ nhân tạo có thể điều hướng, thương lượng và giao dịch độc lập. Sự biến đổi này phân phối lại quyền lực trong lĩnh vực kỹ thuật số, cho phép cá nhân tái chiếm chủ quyền đối với dữ liệu của họ trong khi nuôi dưỡng một hệ sinh thái nơi mà trí tuệ con người và trí tuệ nhân tạo hợp tác theo cách chưa từng có.

Sự tiến hóa của Web

Để hiểu rõ hơn về nơi chúng ta đang đi, hãy truy nguyên tiến hóa của web thông qua các phiên bản chính của nó, mỗi phiên bản đều được đánh dấu bởi những khả năng đặc biệt và mô hình kiến trúc khác nhau:

Trong khi hai thế hệ đầu tiên của web tập trung vào việc lan truyền thông tin, hai thế hệ sau cho phép bổ sung thông tin. Web 3.0 giới thiệu quyền sở hữu dữ liệu thông qua token, và bây giờ Web 4.0 trao dồi trí tuệ thông qua Mô hình Ngôn ngữ Lớn (LLMs).

Từ LLMs đến Agents: Một Sự Tiến Hóa Tự Nhiên

LLMs đại diện cho một bước nhảy vọt trong trí tuệ máy móc, hoạt động như các hệ thống phù hợp mẫu động, biến đổi kiến thức rộng lớn thành sự hiểu biết ngữ cảnh thông qua tính toán xác suất. Tuy nhiên, tiềm năng thực sự của chúng xuất hiện khi được cấu trúc như các đại lý - tiến hóa từ việc xử lý thông tin thuần túy sang các thực thể hướng mục tiêu có thể nhận thức, lý luận và hành động. Sự biến đổi này tạo ra một trí tuệ nổi bật có khả năng hợp tác ý nghĩa liên tục thông qua cả ngôn ngữ và hành động.

Thuật ngữ ‘đại lý’ giới thiệu một mô hình mới cho tương tác con người - trí tuệ nhân tạo, vượt qua các hạn chế và liên kết tiêu cực của chatbot truyền thống. Sự thay đổi này không chỉ là về ngữ nghĩa; nó đại diện cho việc tái khái niệm căn bản về cách hệ thống trí tuệ nhân tạo có thể hoạt động tự động trong khi vẫn duy trì sự cộng tác có ý nghĩa với con người. Về cơ bản, quy trình của đại lý cho phép hình thành các thị trường xung quanh việc giải quyết ý định cụ thể của người dùng.

Cuối cùng, Agentic Web đại diện cho nhiều hơn là một tầng thông minh mới - nó đổi mới cách chúng ta tương tác với hệ thống kỹ thuật số. Trong khi các phiên bản trước đó của web dựa trên giao diện tĩnh và các hành trình người dùng được xác định trước, Agentic Web giới thiệu một cơ sở hạ tầng chạy thời gian thực, nơi tính toán và giao diện điều chỉnh theo ngữ cảnh và ý định người dùng.

Các trang web truyền thống đóng vai trò là đơn vị nguyên tử của internet ngày nay, cung cấp giao diện cố định nơi người dùng đọc, viết và tương tác với thông tin thông qua các con đường xác định trước. Mô hình này, mặc dù chức năng, nhưng hạn chế người dùng vào các giao diện được thiết kế cho các trường hợp sử dụng chung thay vì nhu cầu cá nhân. Agentic Web thoát khỏi những hạn chế này thông qua Tính toán theo ngữ cảnh, Tạo giao diện linh hoạt, Các luồng hành động dự đoán được mở khóa thông qua RAG và các đổi mới khác trong việc truy xuất thông tin theo thời gian thực.

Hãy cân nhắc cách mà TikTok đã cách mạng hóa việc tiêu thụ nội dung bằng cách tạo ra các nguồn cấp dữ liệu được cá nhân hóa cao và thích nghi với sở thích của người dùng trong thời gian thực. Agentic Web mở rộng khái niệm này vượt ra ngoài khuyến nghị nội dung để tạo ra toàn bộ giao diện. Thay vì điều hướng qua các bố cục trang web cố định, người dùng tương tác với các giao diện được tạo ra động để dự đoán và hỗ trợ cho hành động tiếp theo của họ. Sự chuyển đổi này từ trang web tĩnh sang các giao diện động, được điều khiển bởi các đại lý, đại diện cho một sự tiến hóa cơ bản trong cách chúng ta tương tác với các hệ thống kỹ thuật số - di chuyển từ các mô hình tương tác dựa trên điều hướng sang tương tác dựa trên ý định.

Giải phẫu của một đại lý

Các kiến trúc hành vi đã là một sự khám phá lớn cho các nhà nghiên cứu và nhà xây dựng. Các phương pháp mới liên tục được phát triển để nâng cao khả năng lý luận và giải quyết vấn đề của chúng. Các kỹ thuật như Chain-of-Thought (CoT), Tree-of-Thought (ToT) và Graph-of-Thought (GoT) là những ví dụ điển hình về các đổi mới được thiết kế để cải thiện cách mà LLMs xử lý các nhiệm vụ phức tạp bằng cách mô phỏng quá trình nhận thức tinh tế hơn, giống như con người.

Chain-of-Thought (CoT) khuyến nghị khuyến khích mô hình ngôn ngữ lớn (LLMs) phân tích các nhiệm vụ phức tạp thành các bước nhỏ, dễ quản lý. Phương pháp này đặc biệt hiệu quả đối với các vấn đề yêu cầu lập luận logic, như viết mã Python ngắn hoặc giải phương trình toán học.

Tree-of-Thoughts (ToT) xây dựng trên cơ sở CoT bằng cách giới thiệu một cấu trúc cây cho phép khám phá nhiều con đường tư duy độc lập. Cải tiến này cho phép LLMs giải quyết cả những nhiệm vụ phức tạp hơn nữa. Trong ToT, mỗi “tư duy” (một đầu ra văn bản từ LLM) chỉ được kết nối trực tiếp với suy nghĩ liền trước hoặc liền sau của nó trong một chuỗi cục bộ (một nhánh cây). Mặc dù cấu trúc này cung cấp linh hoạt hơn CoT, nhưng nó vẫn hạn chế tiềm năng cho sự giao thoa ý tưởng.

Graph-of-Thought (GoT) đưa khái niệm này một bước xa hơn bằng cách kết hợp cấu trúc dữ liệu cổ điển với LLMs. Phương pháp này mở rộng ToT bằng cách cho phép bất kỳ “suy nghĩ” nào liên kết với bất kỳ suy nghĩ nào khác trong một cấu trúc đồ thị. Mạng lưới liên kết này của suy nghĩ tương tự hơn với quá trình nhận thức của con người.

Cấu trúc đồ thị của GoT có thể cung cấp một đại diện chính xác hơn về suy nghĩ của con người so với CoT hoặc ToT trong hầu hết các tình huống. Mặc dù có những trường hợp mà các kiểu suy nghĩ của chúng ta có thể giống với chuỗi hoặc cây (chẳng hạn như khi phát triển các kế hoạch dự phòng hoặc quy trình vận hành tiêu chuẩn), đây là những trường hợp ngoại lệ chứ không phải là tiêu chuẩn. Mô hình này phản ánh tốt hơn suy nghĩ của con người, thường nhảy qua nhiều suy nghĩ khác nhau thay vì tuân theo một trật tự tuần tự nghiêm ngặt. Trong khi một số kịch bản, như phát triển kế hoạch dự phòng hoặc quy trình tiêu chuẩn, vẫn có thể tuân theo cấu trúc chuỗi hoặc giống như cây, tâm trí của chúng ta thường tạo ra các mạng lưới ý tưởng phức tạp, được kết nối với nhau phù hợp hơn với cấu trúc biểu đồ.

Phương pháp tiếp cận dạng đồ thị này trong GoT cho phép khám phá ý tưởng một cách linh hoạt và sáng tạo hơn, tiềm năng dẫn đến khả năng giải quyết vấn đề sáng tạo và toàn diện hơn trong LLMs.

Các hoạt động dựa trên đồ thị đệ quy này chỉ là một bước tiến đến quy trình công việc của các đại lý. Sự tiến hóa rõ ràng tiếp theo là nhiều đại lý với chuyên môn riêng của họ được điều phối đến các mục tiêu cụ thể. Vẻ đẹp của các đại lý nằm trong sự kết hợp của chúng.

Các đại lý cho phép bạn modularize và parallelize LLMs thông qua phối hợp đa đại lý.

Hệ thống đa tác nhân

Khái niệm về hệ thống đa tác nhân không phải là một khái niệm mới. Căn nguyên của nó có thể truy ngược về cuốn “Xã hội tâm hồn” của Marvin Minsky, đề xuất rằng nhiều tâm hồn modul làm việc cùng nhau có thể vượt trội hơn so với một tâm hồn duy nhất, khối lớn. ChatGPT và Claude là các tác nhân duy nhất. Mistral đã phổ biến ý tưởng Mixture of Experts. Mở rộng ý tưởng này hơn nữa, chúng tôi tin rằng kiến trúc Mạng Tác nhân sẽ là trạng thái cuối cùng của cấu trúc trí tuệ này.

Từ góc độ mô phỏng sinh học, khác với các mô hình AI, nơi hàng tỷ tế bào thần kinh giống hệt nhau được kết nối theo cách đồng đều, dễ dự đoán, não người (về cơ bản là một máy tính có ý thức) vô cùng đa dạng - cả ở cấp độ cơ quan và tế bào. Các tế bào thần kinh giao tiếp thông qua các tín hiệu phức tạp, bao gồm độ dốc dẫn truyền thần kinh, các chuỗi tế bào trong tế bào, và các hệ thống điều chỉnh khác nhau, làm cho chức năng của họ phức tạp hơn nhiều so với trạng thái nhị phân đơn giản.

Điều này cho thấy rằng trong sinh học, trí tuệ không chỉ đến từ số lượng thành phần hoặc kích thước của bộ dữ liệu huấn luyện. Thay vào đó, nó phát sinh từ sự tương tác phức tạp giữa các đơn vị đa dạng, chuyên biệt - một quá trình tương tự như số.

Vì lý do này, ý tưởng phát triển hàng triệu mô hình nhỏ hơn thay vì chỉ một vài mô hình lớn, và cho phép điều phối giữa tất cả những người tham gia này, có khả năng dẫn đến sự đổi mới trong kiến ​​trúc nhận thức, một cái gì đó tương tự hệ thống đa tác nhân.

Thiết kế hệ thống đa tác nhân mang lại một số lợi ích so với hệ thống đơn tác nhân: nó dễ bảo trì hơn, dễ hiểu hơn và linh hoạt hơn trong việc mở rộng. Ngay cả trong những trường hợp chỉ cần giao diện đơn tác nhân, triển khai nó trong một khung hệ thống đa tác nhân có thể làm cho hệ thống trở nên mô-đun hơn, đơn giản hóa quá trình cho các nhà phát triển để thêm hoặc loại bỏ các thành phần khi cần thiết. Quan trọng nhất là nhận ra rằng kiến trúc đa tác nhân có thể là một cách hiệu quả cao để xây dựng ngay cả một hệ thống đơn tác nhân.

Mặc dù các mô hình ngôn ngữ lớn (LLMs) đã cho thấy khả năng phi thường như tạo ra văn bản giống con người, giải quyết các vấn đề phức tạp và xử lý một loạt các nhiệm vụ, nhưng các đại lý LLM cá nhân đối mặt với những hạn chế có thể làm giảm hiệu quả của họ trong các ứng dụng thực tế.

Dưới đây, chúng tôi xem xét năm thách thức chính liên quan đến các hệ thống đại diện và khám phá cách hợp tác đa đại lý có thể vượt qua những rào cản này, mở khóa toàn bộ tiềm năng của LLMs.

  • Vượt qua ảo giác thông qua Xác minh chéoCác đặc vụ LLM cá nhân thường hay mắc các ảo giác, tạo ra thông tin không chính xác hoặc vô lý. Điều này xảy ra mặc dù họ đã được huấn luyện rất kỹ, vì kết quả có vẻ hợp lý nhưng thiếu chính xác về sự thật. Hệ thống đa đặc vụ cho phép các đặc vụ xác minh thông tin qua nhau, giảm thiểu rủi ro lỗi. Bằng cách chuyên sâu vào các lĩnh vực khác nhau, các đặc vụ đảm bảo phản ứng đáng tin cậy và chính xác hơn.
  • Mở rộng Cửa sổ Ngữ cảnh thông qua Xử lý Phân tánLLMs có cửa sổ ngữ cảnh hạn chế, làm cho việc quản lý tài liệu hoặc cuộc trò chuyện dài trở nên khó khăn. Trong một khung ứng dụng đa tác nhân, các tác nhân có thể chia sẻ tải xử lý, mỗi tác nhân xử lý một phần của ngữ cảnh. Thông qua giao tiếp giữa các tác nhân, họ có thể duy trì tính nhất quán trên toàn bộ văn bản, mở rộng hiệu quả cửa sổ ngữ cảnh.
  • Nâng cao hiệu suất thông qua Xử lý Song songCác hệ thống LLM cá nhân thường xử lý các nhiệm vụ theo thứ tự, dẫn đến thời gian phản hồi chậm hơn. Hệ thống đa tác nhân hỗ trợ xử lý song song, cho phép nhiều tác nhân làm việc trên các nhiệm vụ khác nhau đồng thời. Điều này cải thiện hiệu suất và tăng tốc thời gian phản hồi, giúp doanh nghiệp xử lý nhiều truy vấn mà không gặp trễ lệch.
  • Khuyến khích sự hợp tác giải quyết vấn đề phức tạp. Các LLMs đơn lẻ khó khăn trong việc giải quyết các vấn đề phức tạp đòi hỏi các chuyên môn đa dạng. Hệ thống đa tác tử khuyến khích sự hợp tác, với mỗi tác tử đóng góp các kỹ năng và quan điểm độc đáo. Bằng cách làm việc cùng nhau, các tác tử có thể đối phó với những thách thức phức tạp một cách hiệu quả hơn, đưa ra các giải pháp toàn diện và đổi mới hơn.
  • Tăng cường Khả năng Truy cập thông qua Tối ưu Hóa Tài NguyênCác LLM tiên tiến đòi hỏi tài nguyên tính toán đáng kể, làm cho chúng đắt đỏ và khó tiếp cận hơn. Các khung mạng đa tác tử tối ưu hóa việc sử dụng tài nguyên bằng cách phân phối nhiệm vụ cho các tác tử, giảm chi phí tính toán tổng thể. Điều này làm cho các công nghệ AI trở nên phù hợp với túi tiền và dễ tiếp cận hơn đối với một loạt các tổ chức.

Trong khi các hệ thống đa tác tử mang lại những lợi ích hấp dẫn trong việc giải quyết vấn đề phân tán và tối ưu hóa tài nguyên, tiềm năng thực sự của chúng xuất hiện khi chúng ta xem xét việc triển khai chúng tại cạnh của mạng. Khi trí tuệ nhân tạo tiếp tục tiến hóa, sự hội tụ của kiến trúc đa tác tử với tính toán cạnh tạo ra một sự tương hợp mạnh mẽ - cho phép không chỉ có trí tuệ cộng tác mà còn xử lý hiệu quả cục bộ trên vô số thiết bị. Phương pháp triển khai trí tuệ nhân tạo phân tán này tự nhiên mở rộng những lợi ích của các hệ thống đa tác tử, mang lại trí tuệ cộng tác chuyên môn gần hơn đến nơi nó cần nhất: người dùng cuối.

Intelligence at the Edge

Sự gia tăng của AI trên toàn cảnh kỹ thuật số đang thúc đẩy tái cấu trúc cơ bản các kiến trúc tính toán. Khi trí thông minh trở nên đan xen vào kết cấu của các tương tác kỹ thuật số hàng ngày của chúng ta, chúng ta đang chứng kiến sự phân chia tự nhiên của điện toán: các trung tâm dữ liệu chuyên dụng xử lý các lý luận phức tạp và các tác vụ cụ thể theo miền, trong khi các thiết bị biên xử lý cục bộ các truy vấn nhạy cảm, được cá nhân hóa. Sự thay đổi này đối với suy luận cạnh không chỉ đơn thuần là một sở thích kiến trúc — đó là một điều cần thiết được thúc đẩy bởi nhiều yếu tố quan trọng.

Đầu tiên, khối lượng tương tác tuyệt đối do AI điều khiển sẽ áp đảo các nhà cung cấp suy luận tập trung, tạo ra nhu cầu băng thông không bền vững và các vấn đề về độ trễ.

Thứ hai, xử lý cạnh cho phép phản ứng trong thời gian thực quan trọng cho các ứng dụng như xe tự lái, thực tế tăng cường và thiết bị IoT.

Thứ ba, suy luận cục bộ bảo tồn quyền riêng tư của người dùng bằng cách giữ dữ liệu nhạy cảm trên thiết bị cá nhân. Thứ tư, edge computing giảm thiểu tiêu thụ năng lượng và lượng khí thải carbon đáng kể bằng cách tối thiểu hóa việc di chuyển dữ liệu qua mạng.

Cuối cùng, suy luận cạnh cho phép chức năng ngoại tuyến và sự kiên cố, đảm bảo khả năng AI vẫn tồn tại ngay cả khi kết nối mạng bị ảnh hưởng.

Mô hình trí tuệ phân tán này không chỉ đại diện cho việc tối ưu hóa hệ thống hiện tại của chúng ta, mà còn là một cách tưởng tượng cơ bản về cách triển khai và tương tác với trí tuệ nhân tạo trong thế giới ngày càng kết nối của chúng ta.

Hơn nữa, chúng ta đang chứng kiến một sự chuyển đổi cơ bản trong yêu cầu tính toán của LLMs. Trong khi thập kỷ qua đã được thống trị bởi yêu cầu tính toán lớn của việc huấn luyện các mô hình ngôn ngữ lớn, thì chúng ta hiện đang bước vào một kỷ nguyên mà tính toán trong quá trình suy luận trở thành trung tâm. Sự chuyển đổi này đặc biệt rõ ràng trong sự xuất hiện của các hệ thống AI có tính cách, như được mô tả bởi đột phá Q* của OpenAI, đã chứng minh rằng luận lý động yêu cầu nguồn lực tính toán thời gian thực đáng kể.

Không giống như việc tính toán trong quá trình đào tạo, là một khoản đầu tư một lần trong việc phát triển mô hình, việc tính toán trong quá trình suy luận đại diện cho cuộc đối thoại tính toán liên tục cần thiết cho các tác nhân tự động lập luận, lập kế hoạch và thích nghi với các tình huống mới lạ. Sự chuyển đổi này từ việc đào tạo mô hình tĩnh sang lập luận động của tác nhân đòi hỏi một cách suy nghĩ lại cơ sở hạ tầng tính toán của chúng ta - nơi tính toán biên trở thành không chỉ có lợi mà còn cần thiết.

Khi sự biến đổi này diễn ra, chúng ta đang chứng kiến sự xuất hiện của các thị trường suy luận cạnh tranh ngang hàng, nơi hàng tỷ thiết bị kết nối—từ điện thoại thông minh đến hệ thống nhà thông minh—tạo thành các mạng tính toán linh hoạt. Các thiết bị này có thể một cách trơn tru giao dịch năng lực suy luận, tạo ra một thị trường hữu cơ nơi tài nguyên tính toán chảy về nơi cần nhất. Khả năng tính toán dư thừa của các thiết bị không hoạt động trở thành một nguồn tài nguyên quý giá, có thể giao dịch trong thời gian thực, tạo điều kiện cho một cơ sở hạ tầng hiệu quả và linh hoạt hơn so với các hệ thống trung tâm truyền thống.

Sự dân chủ hóa tính toán suy luận không chỉ tối ưu hóa việc sử dụng tài nguyên mà còn tạo ra cơ hội kinh tế mới trong hệ sinh thái kỹ thuật số, nơi mà mọi thiết bị kết nối trở thành một nhà cung cấp siêu nhỏ tiềm năng của khả năng trí tuệ nhân tạo. Tương lai của trí tuệ nhân tạo sẽ được đặc trưng không chỉ bởi sức mạnh của các mô hình cá nhân, mà còn bởi sự thông minh tập thể của các thiết bị cạnh tranh kết nối tạo thành một thị trường suy luận dân chủ toàn cầu, tương tự như một thị trường chốt cho sự suy luận có thể xác minh dựa trên cung cầu.

Tương tác trung tâm đại lý

LLMs hiện nay cho phép chúng ta truy cập vào lượng thông tin lớn thông qua cuộc trò chuyện, thay vì việc duyệt web theo cách truyền thống. Cách tiếp cận này sẽ sớm trở nên cá nhân hóa và cục bộ hơn, khi internet biến đổi thành một nền tảng dành cho các đại lý trí tuệ nhân tạo thay vì người sử dụng.

Từ quan điểm của người dùng, trọng tâm sẽ dời từ việc xác định “mô hình tốt nhất” sang việc nhận được câu trả lời cá nhân nhất có thể. Chìa khóa cho những câu trả lời tốt hơn nằm ở việc kết hợp dữ liệu cá nhân của người dùng cùng với kiến thức internet chung. Ban đầu, cửa sổ bối cảnh lớn hơn và quá trình tạo ra được bổ sung bởi dữ liệu (RAG) sẽ giúp tích hợp dữ liệu cá nhân, nhưng cuối cùng, dữ liệu cá nhân sẽ vượt qua dữ liệu internet chung về mức quan trọng.

Điều này dẫn đến một tương lai trong đó mỗi người đều có mô hình trí tuệ nhân tạo cá nhân tương tác với các mô hình chuyên gia trên internet rộng lớn. Ban đầu, việc cá nhân hóa sẽ xảy ra song song với các mô hình từ xa, nhưng lo ngại về quyền riêng tư và tốc độ phản hồi sẽ thúc đẩy việc tương tác nhiều hơn lên các thiết bị cục bộ. Điều này sẽ tạo ra một ranh giới mới—không phải giữa con người và máy móc, mà là giữa mô hình cá nhân của chúng ta và mô hình chuyên gia trên internet.

Mô hình internet truyền thống trong việc truy cập dữ liệu nguyên thủy sẽ trở nên lỗi thời. Thay vào đó, mô hình cục bộ của bạn sẽ giao tiếp với các mô hình chuyên gia từ xa để thu thập thông tin, sau đó xử lý và trình bày cho bạn một cách cá nhân, với băng thông cao nhất có thể. Những mô hình cá nhân này sẽ trở nên ngày càng không thể thiếu khi chúng học được nhiều hơn về sở thích và thói quen của bạn.

Internet sẽ chuyển đổi thành một hệ sinh thái của các mô hình kết nối với nhau: các mô hình cá nhân cục bộ, bối cảnh cao và các mô hình chuyên gia từ xa, tri thức cao. Điều này sẽ liên quan đến các công nghệ mới như học liên kết để cập nhật thông tin giữa các mô hình này. Khi nền kinh tế máy móc phát triển, chúng ta sẽ phải hình dung lại trạng thái tính toán mà điều này xảy ra, chủ yếu liên quan đến tính toán, khả năng mở rộng và thanh toán. Điều này dẫn đến việc tổ chức lại không gian thông tin lấy tác nhân làm trung tâm, có chủ quyền, có khả năng tổng hợp cao, tự học và phát triển.

Các kiến trúc cho các giao thức đại diện

Trong Agentic Web, tương tác người-máy phát triển thành một mạng lưới phức tạp của các giao tiếp từ máy đến máy. Kiến trúc này đưa ra một cách suy nghĩ cơ bản về cấu trúc của internet, nơi các đại lý chủ quyền trở thành giao diện chính cho tương tác kỹ thuật số. Dưới đây, chúng tôi tập trung vào những nguyên tắc cốt lõi cần thiết cho các giao thức Agentic.

Nhận dạng chủ quyền

  • Chuyển đổi danh tính số hóa từ địa chỉ IP truyền thống thành cặp khóa công khai mật mã thuộc sở hữu của các tác nhân
  • Các hệ thống không gian dựa trên blockchain thay thế hệ thống DNS truyền thống, loại bỏ các điểm kiểm soát trung tâm
  • Các hệ thống danh tiếng theo dõi độ tin cậy của đại lý và các chỉ số khả năng
  • Zero-knowledge proofs enable privacy-preserving identity verification
  • Tính kết hợp danh tính cho phép các đại lý quản lý nhiều ngữ cảnh và vai trò

Các đại lý tự trị

Các thực thể tự chỉ đạo có khả năng: Hiểu ngôn ngữ tự nhiên và giải quyết ý định

Lập kế hoạch đa bước và phân rã nhiệm vụ

Quản lý và tối ưu hóa tài nguyên

Học hỏi từ sự tương tác và phản hồi

  • Ra quyết định tự động trong phạm vi tham số được xác định
  • Chuyên môn của đại lý và các sàn giao dịch dành cho các khả năng cụ thể
  • Cơ chế an toàn tích hợp và giao thức căn chỉnh

Cơ sở hạ tầng dữ liệu

  • Khả năng xử lý và nhập dữ liệu thời gian thực
  • Cơ chế xác minh và xác minh dữ liệu phân tán

Các hệ thống kết hợp: zkTLS

Bộ dữ liệu huấn luyện truyền thống

Web scraping và tổng hợp dữ liệu thời gian thực

  • Mạng lưới học tập cộng tác

Mạng RLHF (Reinforcement Learning from Human Feedback) Mạng thu thập phản hồi phân tán

Cơ chế đồng thuận được tính chất chất lượng

  • Các giao thức điều chỉnh mô hình linh hoạt

Tầng tính toán

Các giao thức suy diễn có thể xác minh đảm bảo: Tính toàn vẹn tính toán

Kết quả tái sản xuất được

Hiệu suất tài nguyên

  • Hạ tầng tính toán phân cấp có tính đặc thù: Thị trường tính toán ngang hàng

Hệ thống chứng minh tính toán

Phân bổ tài nguyên linh hoạt

  • Tích hợp tính toán Edge

Môi trường mô hình

Cấu trúc kiến trúc mô hình phân cấp: Các Mô hình Ngôn ngữ Nhỏ cụ thể cho từng nhiệm vụ

LLM đa dụng

Mô hình đa phương tiện chuyên ngành

  • LAM đa chế độ (Mô hình Hành động Lớn)
  • Sự biên soạn và điều phối mô hình
  • Khả năng học tập liên tục và thích nghi
  • Giao diện và giao thức mô hình chuẩn hóa

Khung công tác

  • Giao thức mật mã cho tương tác an toàn của đại lý
  • Hệ thống quản lý quyền sở hữu tài sản kỹ thuật số
  • Cấu trúc kích thích kinh tế

Cơ chế quản trị cho: Giải quyết tranh chấp

Phân bổ tài nguyên

  • Cập nhật giao thức

Môi trường thực thi song song cho phép: Xử lý công việc đồng thời

Cô lập tài nguyên

Quản lý trạng thái

  • Giải quyết xung đột

Agentic Markets

  • Nguyên tắc Onchain cho Danh tính (Gnosis, Squad multisigs)
  • Kinh tế và thương mại liên đại lý

Đội ngũ sở hữu thanh khoản Các đại lý sở hữu một phần cung cấp token của họ khi khởi tạo

  • Các thị trường suy luận tổng hợp được thanh toán thông qua tính thanh khoản
  • Các khóa Onchain điều khiển tài khoản Offchain

Các đại lý trở thành tài sản mang lại lợi suất Agentic DAOs

  • Quản trị và cổ tức

Tạo một siêu cấu trúc cho Trí tuệ

Thiết kế hệ thống phân tán hiện đại cung cấp nguồn cảm hứng độc đáo và nguyên tắc cơ bản để kích hoạt các giao thức Agentic, cụ thể là kiến trúc dựa trên sự kiện và trực tiếp hơn, mô hình Actor của Compute.

Mô hình Diễn viên cung cấp một nền tảng lý thuyết thanh lịch cho việc triển khai các hệ thống hành động. Mô hình tính toán này xem xét “diễn viên” như là nguyên tố toàn cầu của tính toán, trong đó mỗi diễn viên có thể:

  1. Xử lý tin nhắn
  2. Đưa ra quyết định cục bộ
  3. Tạo thêm diễn viên
  4. Gửi tin nhắn cho các diễn viên khác
  5. Xác định cách phản hồi vào tin nhắn tiếp theo nhận được

Các lợi ích chính của Mô hình Diễn viên cho các hệ thống đại diện bao gồm:

  • Cô lập: Mỗi diễn viên hoạt động độc lập, duy trì trạng thái và luồng điều khiển riêng của mình
  • Giao tiếp không đồng bộ: Tin nhắn giữa các tác tử là không chặn, cho phép xử lý song song hiệu quả
  • Độ trong suốt vị trí: Các tác nhân có thể giao tiếp mà không cần quan tâm đến vị trí vật lý của họ trong mạng
  • Tính chịu lỗi: Sự kiên nhẫn của hệ thống thông qua cách cô lập và hệ thống giám sát của các tác nhân
  • Tính mở rộng: Hỗ trợ tự nhiên cho hệ thống phân tán và tính toán song song

Chúng tôi đề xuất Neuron, một cài đặt thực tế của giao thức cơ bản này thông qua một kiến trúc phân tầng phân tán kết hợp các không gian tên blockchain, mạng liên kết, CRDTs và DHTs, với mỗi lớp phục vụ mục đích cụ thể trong ngăn xếp giao thức. Chúng tôi lấy cảm hứng từ Urbit và Holochain, những người tiên phong sớm trong thiết kế hệ điều hành p2p.

Trong Neuron, lớp blockchain cung cấp các không gian tên có thể xác minh và danh tính, cho phép địa chỉ xác định và phát hiện của đại lý trong khi duy trì chứng minh mật mã về khả năng và uy tín. Phía trên điều này, một lớp DHT tạo điều kiện cho việc phát hiện hiệu quả của đại lý và nút cùng với định tuyến nội dung với thời gian tìm kiếm O(log n), giảm hoạt động trên chuỗi trong khi cho phép tìm kiếm đồng địa phương. Đồng bộ trạng thái giữa các nút liên minh được xử lý thông qua CRDTs, cho phép các đại lý và nút duy trì quan điểm nhất quán về trạng thái chia sẻ mà không cần sự nhất quán toàn cầu cho mỗi tương tác.

Kiến trúc này tương ứng tự nhiên với một mạng liên bang nơi các đại lý tự trị hoạt động như các nút chủ quyền sống trên các thiết bị với suy luận cạnh cục bộ thực hiện mô hình Actor Model. Các miền liên bang có thể được tổ chức theo khả năng của đại lý, với DHT cung cấp định tuyến và khám phá hiệu quả trong và qua các miền. Mỗi đại lý hoạt động như một diễn viên độc lập với trạng thái riêng, trong khi lớp CRDT đảm bảo tính nhất quán cuối cùng trong toàn liên bang. Tiếp cận đa tầng này cho phép một số khả năng chính:

Phối hợp phi tập trung

  • Blockchain cho việc xác minh danh tính và không gian toàn cầu chủ quyền
  • DHT để tìm kiếm ngang hàng và nút hiệu quả và định tuyến nội dung tìm kiếm O(log n)
  • CRDTs cho đồng bộ trạng thái đồng thời và phối hợp đa tác nhân

Hoạt động có thể mở rộng

  • Định hình liên kết dựa trên vùng
  • Chiến lược lưu trữ theo tầng (nóng/ấm/lạnh)
  • Định tuyến yêu cầu theo địa phương
  • Phân phối tải dựa trên khả năng

Khả năng chịu đựng của hệ thống

  • Không có điểm thất bại duy nhất
  • Vận hành tiếp tục trong khi chia thành
  • Đối soát trạng thái tự động
  • Các cấp bộ máy giám sát cho tính chịu lỗi

Cách tiếp cận triển khai này cung cấp một nền tảng vững chắc để xây dựng các hệ thống tác nhân phức tạp trong khi vẫn duy trì các thuộc tính chính về chủ quyền, khả năng mở rộng và khả năng phục hồi cần thiết cho các tương tác tác nhân hiệu quả.

Kết luận cuối cùng

Agentic Web đánh dấu một sự tiến hóa quan trọng trong tương tác giữa người và máy tính, vượt qua sự phát triển tuần tự của các thời đại trước để thiết lập một mô hình mới về cơ bản của sự tồn tại kỹ thuật số. Không giống như các lần lặp lại trước đây chỉ đơn giản là thay đổi cách chúng ta tiêu thụ hoặc sở hữu thông tin, Agentic Web biến internet từ nền tảng lấy con người làm trung tâm thành một chất nền thông minh nơi các tác nhân tự trị trở thành tác nhân chính. Sự chuyển đổi này được hỗ trợ bởi sự hội tụ của điện toán biên, các mô hình ngôn ngữ lớn và các giao thức phi tập trung, tạo ra một hệ sinh thái nơi các mô hình AI cá nhân giao tiếp liền mạch với các hệ thống chuyên gia chuyên biệt.

Khi chúng ta tiến về tương lai tập trung vào đại lý này, ranh giới giữa trí tuệ con người và trí tuệ máy móc bắt đầu mờ nhạt, được thay thế bởi một mối quan hệ cộng sinh, nơi các đại lý trí tuệ AI cá nhân phục vụ như những phần mở rộng kỹ thuật số của chúng ta, hiểu bối cảnh của chúng ta, đoán trước nhu cầu của chúng ta và tự động điều hướng trong cảnh quang cảnh rộng lớn của trí tuệ phân tán. Mạng Agentic do đó không chỉ đại diện cho một sự tiến bộ công nghệ, mà còn là một sự tưởng tượng căn bản về tiềm năng con người trong thời đại kỹ thuật số, nơi mọi tương tác trở thành một cơ hội cho trí tuệ tăng cường và mọi thiết bị trở thành một nút trong một mạng toàn cầu của các hệ thống trí tuệ AI hợp tác.

Giống như cách con người điều hướng trong các chiều không gian và thời gian, các đại lý tự trị cư trú trong những chiều cơ bản của chính mình: không gian khối để tồn tại và thời gian suy luận để suy nghĩ. Bản thể kỹ thuật số này phản ánh thực tế vật lý của chúng ta - nơi con người đi qua khoảng cách và trải nghiệm dòng thời gian, các đại lý di chuyển qua các chứng minh mật mã và chu kỳ tính toán, tạo ra một vũ trụ song song về sự tồn tại thuật toán.

Không thể tránh khỏi việc các thực thể trong không gian ẩn sẽ hoạt động trên không gian khối phi tập trung.

Miễn trừ trách nhiệm:

  1. Bài viết này được sao chép lại từ [[](https://x.com/magicofazi/status/1852397476738945156?s=46&t=ywALktyM5ZCyt-zigN5Big)[Azi.eth.sol | zo.me](https://x.com/MagicofAzi)\]. Tất cả các bản quyền thuộc về tác giả gốc [@MagicofAzi]. Nếu có ý kiến ​​phản đối về việc tái bản này, vui lòng liên hệ với Cổng Họcđội ngũ, và họ sẽ xử lý nhanh chóng.
  2. Miễn trách nhiệm: Các quan điểm và ý kiến được thể hiện trong bài viết này hoàn toàn thuộc về tác giả và không đại diện cho bất kỳ lời khuyên đầu tư nào.
  3. Các bản dịch của bài viết sang các ngôn ngữ khác được thực hiện bởi nhóm Gate Learn. Trừ khi có ghi chú, việc sao chép, phân phối hoặc đạo văn bản dịch là không được phép.
Bắt đầu giao dịch
Đăng ký và giao dịch để nhận phần thưởng USDTEST trị giá
$100
$5500