Trong năm qua, do sự mất kết nối trong các câu chuyện ứng dụng, không thể theo kịp sự phát triển cơ sở hạ tầng, không gian tiền điện tử dần dần biến thành một cuộc đua cho tài nguyên chú ý. Từ Silly Dragon đến Goat, từ Pump.fun đến Clanker, sự thất thường của sự chú ý đã dẫn đến một chu kỳ tái phát triển liên tục trong trận chiến này. Những gì bắt đầu bằng hình thức kiếm tiền thu hút mắt nhất định nhanh chóng tiến hóa thành một mô hình nền tảng kết hợp người tìm kiếm sự chú ý và người cung cấp, cuối cùng dẫn đến các hình thức sống dựa trên silic muôn màu trở thành nhà cung cấp nội dung mới. Trong dãy đồng tiền meme kỳ lạ, một thực thể mới đã xuất hiện cho phép nhà đầu tư bán lẻ và các nhà đầu tư mạo hiểm đạt được một thoả thuận: Các Đại lý Trí tuệ nhân tạo.
Sự chú ý cuối cùng là một trò chơi có tổng bằng không, mặc dù đầu cơ thực sự có thể thúc đẩy tăng trưởng nhanh chóng. Trong bài viết trước của chúng tôi về UNI, chúng tôi đã xem xét lại sự khởi đầu của thời kỳ hoàng kim cuối cùng của blockchain, khi sự phát triển bùng nổ của DeFi được châm ngòi bởi sự ra mắt khai thác LP của Compound Finance. Trong thời đại đó, tham gia vào hàng trăm, đôi khi hàng ngàn nhóm khai thác với sản lượng hàng ngàn hoặc thậm chí hàng chục nghìn phần trăm APY là hình thức đầu cơ trên chuỗi nguyên thủy nhất. Mặc dù kết quả là sự sụp đổ hỗn loạn của nhiều nhóm, dòng người khai thác “cơn sốt vàng” đã để lại tính thanh khoản chưa từng có trong không gian blockchain. DeFi cuối cùng đã thoát khỏi đầu cơ thuần túy và phát triển thành một ngành dọc vững chắc giải quyết nhu cầu tài chính của người dùng trong các lĩnh vực như thanh toán, giao dịch, chênh lệch giá và đặt cược. AI Agents hiện đang trải qua giai đoạn “tăng trưởng hoang dã” tương tự. Những gì chúng ta đang khám phá bây giờ là làm thế nào tiền điện tử có thể tích hợp AI tốt hơn và cuối cùng nâng lớp ứng dụng lên một tầm cao mới.
Trong bài viết trước đó, chúng tôi đã giới thiệu ngắn gọn về nguồn gốc của các meme AI thông qua Truth Terminal và khám phá tiềm năng tương lai của AI Agents. Bài viết này sẽ tập trung vào chính AI Agents.
Hãy bắt đầu với định nghĩa về một AI Agent. Trong lĩnh vực AI, thuật ngữ “Agent” là một khái niệm cũ nhưng vẫn mơ hồ, chủ yếu nhấn mạnh tính tự động. Nói cách khác, bất kỳ AI nào có thể nhận biết môi trường của nó và đưa ra quyết định phản xạ được coi là một Agent. Ngày nay, định nghĩa về một AI Agent gần gũi hơn với một thực thể thông minh, một hệ thống được thiết kế để bắt chước quy trình ra quyết định của con người. Hệ thống này được xem như là phương pháp hứa hẹn nhất trong giới học thuật để đạt được AGI (Trí tuệ nhân tạo tổng quát).
Trong những phiên bản đầu của GPT, chúng ta có thể cảm nhận rõ ràng rằng các mô hình lớn giống con người, nhưng khi trả lời các câu hỏi phức tạp, chúng thường cung cấp các câu trả lời mơ hồ hoặc không chính xác. Nguyên nhân cơ bản cho điều này là các mô hình này dựa trên khả năng xảy ra thay vì nguyên nhân, và chúng thiếu các khả năng giống như con người như sử dụng công cụ, trí nhớ và kế hoạch. AI Agents nhằm giải quyết những khoảng trống này. Vì vậy, để tóm tắt theo công thức: AI Agent = LLM (Large Language Model) + Kế hoạch + Trí nhớ + Công cụ.
Các mô hình dựa trên gợi ý giống như một phiên bản tĩnh của một người, chỉ hoạt động khi chúng ta nhập dữ liệu. Ngược lại, mục tiêu của một Đại lý Trí tuệ Nhân tạo là trở thành một thực thể linh hoạt, giống con người hơn. Hiện tại, hầu hết các Đại lý Trí tuệ Nhân tạo trên thị trường là các mô hình được điều chỉnh dựa trên các phiên bản Llama 70b hoặc 405b mã nguồn mở của Meta (với các tham số khác nhau), được trang bị bộ nhớ và khả năng sử dụng API để tích hợp công cụ. Ở các lĩnh vực khác, chúng có thể vẫn cần sự hỗ trợ hoặc nhập khẩu từ con người, chẳng hạn như tương tác hoặc hợp tác với các Đại lý Trí tuệ Nhân tạo khác. Đó là lý do tại sao hầu hết các Đại lý Trí tuệ Nhân tạo ngày nay chủ yếu tồn tại dưới dạng KOL trên mạng xã hội. Để làm cho một Đại lý Trí tuệ Nhân tạo giống con người hơn, nó cần tích hợp các khả năng lập kế hoạch và hành động, với chuỗi suy nghĩ trong quá trình lập kế hoạch đặc biệt quan trọng.
Khái niệm Chuỗi Tư duy (CoT) lần đầu tiên xuất hiện trong bài báo của Google năm 2022 có tựa đề Chuỗi tư duy kích thích Lý luận trong các Mô hình Ngôn ngữ Lớn. Bài báo chỉ ra rằng bằng cách tạo ra một loạt các bước lý luận trung gian, khả năng lý luận của mô hình có thể được tăng cường, giúp nó hiểu rõ hơn và giải quyết các vấn đề phức tạp.
Một lời nhắc CoT điển hình bao gồm ba phần: mô tả nhiệm vụ với các hướng dẫn rõ ràng, cơ sở logic cho nhiệm vụ với nền tảng lý thuyết hoặc nguyên tắc hỗ trợ giải pháp và một ví dụ cụ thể về giải pháp. Cách tiếp cận có cấu trúc này giúp mô hình hiểu các yêu cầu nhiệm vụ và thông qua lý luận logic, dần dần tiếp cận câu trả lời, cải thiện cả hiệu quả và độ chính xác của việc giải quyết vấn đề. CoT đặc biệt thích hợp cho các nhiệm vụ đòi hỏi phân tích sâu và lý luận nhiều bước, chẳng hạn như giải quyết vấn đề toán học hoặc viết báo cáo dự án. Đối với các tác vụ đơn giản hơn, CoT có thể không cho thấy những lợi thế rõ ràng, nhưng đối với những nhiệm vụ phức tạp hơn, nó có thể cải thiện đáng kể hiệu suất của mô hình bằng cách giảm tỷ lệ lỗi thông qua chiến lược giải quyết vấn đề từng bước, do đó nâng cao chất lượng hoàn thành nhiệm vụ.
Trong việc xây dựng các tác nhân AI, CoT đóng một vai trò quan trọng. AI Agents cần hiểu thông tin họ nhận được và đưa ra quyết định hợp lý dựa trên đó. CoT cung cấp một quy trình tư duy có trật tự giúp Tổng đài viên xử lý và phân tích dữ liệu đầu vào một cách hiệu quả, biến phân tích thành các hướng dẫn có thể hành động. Phương pháp này không chỉ tăng cường độ tin cậy và hiệu quả của việc ra quyết định của Đại lý mà còn cải thiện tính minh bạch của quá trình ra quyết định, làm cho hành vi của Đại lý dễ dự đoán và dễ theo dõi hơn. Bằng cách chia nhỏ các nhiệm vụ thành các bước nhỏ hơn, CoT giúp Tổng đài viên xem xét chi tiết từng điểm quyết định, giảm lỗi do quá tải thông tin và làm cho quá trình ra quyết định minh bạch hơn. Tính minh bạch này cho phép người dùng hiểu rõ hơn về cơ sở của các quyết định của Đại lý. Trong tương tác với môi trường, CoT cho phép Đại lý liên tục tìm hiểu thông tin mới và điều chỉnh chiến lược hành vi của mình.
Là một chiến lược hiệu quả, CoT không chỉ tăng cường khả năng suy luận của các mô hình ngôn ngữ lớn mà còn đóng một vai trò quan trọng trong việc xây dựng các Tác nhân AI thông minh và đáng tin cậy hơn. Bằng cách tận dụng CoT, các nhà nghiên cứu và nhà phát triển có thể tạo ra các hệ thống thông minh thích ứng hơn với môi trường phức tạp và có tính tự chủ cao. Trong các ứng dụng thực tế, CoT đã cho thấy những ưu điểm độc đáo của mình, đặc biệt là trong việc xử lý các tác vụ phức tạp. Bằng cách chia các nhiệm vụ thành một loạt các bước nhỏ hơn, nó không chỉ cải thiện độ chính xác của việc giải quyết nhiệm vụ mà còn tăng cường khả năng diễn giải và kiểm soát của mô hình. Cách tiếp cận giải quyết vấn đề từng bước này có thể làm giảm đáng kể các lỗi gây ra bởi thông tin quá mức hoặc quá phức tạp khi phải đối mặt với các nhiệm vụ phức tạp. Đồng thời, phương pháp này cũng cải thiện khả năng truy xuất nguồn gốc và khả năng kiểm chứng của toàn bộ giải pháp.
Chức năng cốt lõi của CoT nằm ở việc tích hợp lập kế hoạch, hành động và quan sát, thu hẹp khoảng cách giữa lý luận và hành động. Mô hình tư duy này cho phép Tác nhân AI đưa ra các biện pháp đối phó hiệu quả khi dự đoán các bất thường tiềm ẩn và tích lũy thông tin mới trong khi tương tác với môi trường bên ngoài, xác nhận các dự đoán được đặt trước và cung cấp cơ sở lý luận mới. CoT hoạt động như một động cơ mạnh mẽ về độ chính xác và ổn định, giúp AI Agent duy trì hiệu quả cao trong các môi trường phức tạp.
Làm thế nào chính xác Crypto nên tích hợp với các ngăn xếp công nghệ AI? Trong bài viết của năm ngoái, tôi đề xuất rằng phân quyền sức mạnh tính toán và dữ liệu là một bước quan trọng trong việc giúp các doanh nghiệp nhỏ và các nhà phát triển cá nhân tiết kiệm chi phí. Năm nay, trong phân tích chi tiết về các ngành Crypto x AI được tổng hợp bởi Coinbase, chúng ta có thể thấy rõ hơn các phân nhánh cụ thể hơn:
(1) Tầng Tính toán (tập trung vào cung cấp tài nguyên GPU cho các nhà phát triển trí tuệ nhân tạo);
(2) Lớp Dữ liệu (tập trung vào quyền truy cập phi tập trung, điều hợp và xác minh các đường ống dữ liệu trí tuệ nhân tạo);
(3) Lớp phần mềm trung gian (nền tảng hoặc mạng hỗ trợ việc phát triển, triển khai và lưu trữ các mô hình hoặc đại lý trí tuệ nhân tạo);
(4) Lớp ứng dụng (các sản phẩm hướng tới người dùng sử dụng các cơ chế AI trên chuỗi, cho dù là B2B hay B2C).
Mỗi lớp trong số bốn lớp này đều có tầm nhìn lớn, tất cả đều nhằm mục đích thách thức sự thống trị của những gã khổng lồ ở Thung lũng Silicon trong kỷ nguyên tiếp theo của internet. Như tôi đã nói năm ngoái, chúng ta có thực sự cần phải chấp nhận rằng những gã khổng lồ ở Thung lũng Silicon độc quyền kiểm soát sức mạnh tính toán và dữ liệu không? Dưới sự độc quyền của họ, các mô hình lớn nguồn đóng là hộp đen và khoa học, với tư cách là hệ thống niềm tin được tôn kính nhất của nhân loại ngày nay, sẽ dựa vào câu trả lời được đưa ra bởi các mô hình lớn này. Nhưng làm thế nào những sự thật này có thể được xác minh? Theo tầm nhìn của những gã khổng lồ ở Thung lũng Silicon này, quyền hạn do các trợ lý thông minh nắm giữ có thể vượt quá trí tưởng tượng của chúng ta - chẳng hạn như có thẩm quyền thanh toán từ ví của bạn hoặc kiểm soát quyền truy cập thiết bị đầu cuối của bạn. Làm thế nào chúng ta có thể đảm bảo rằng không có ác ý phát sinh?
Phân cấp là câu trả lời duy nhất, nhưng đôi khi chúng ta cần xem xét hợp lý có bao nhiêu người mua cho những tầm nhìn lớn này. Trước đây, chúng ta có thể bỏ qua sự cần thiết của một vòng lặp thương mại và sử dụng Token để lấp đầy những khoảng trống do chủ nghĩa lý tưởng gây ra. Tuy nhiên, tình hình hiện tại khó khăn hơn nhiều. Crypto x AI phải thiết kế dựa trên hoàn cảnh thực tế. Ví dụ, làm thế nào để chúng ta cân bằng nguồn cung ở cả hai đầu của lớp điện toán trong trường hợp mất hiệu suất và không ổn định, và vẫn cạnh tranh với các nhà cung cấp đám mây tập trung? Các dự án lớp dữ liệu sẽ thực sự có bao nhiêu người dùng thực? Làm thế nào chúng tôi có thể xác minh tính xác thực và hợp lệ của dữ liệu được cung cấp? Những loại khách hàng nào thực sự cần dữ liệu này? Logic tương tự áp dụng cho các lớp khác. Trong thời đại này, chúng ta không cần quá nhiều yêu cầu giả dường như chính xác.
Như tôi đã đề cập trong phần đầu tiên, Meme đã nhanh chóng phát triển thành một hình thức SocialFi tương thích với Web3. Friend.tech là ứng dụng phi tập trung (DApp) đã bắn đầu cuộc chiến ứng dụng xã hội này, nhưng không may, nó thất bại do thiết kế Token hasty của nó. Trong khi đó, Pump.fun đã chứng minh được tính khả thi của một mô hình nền tảng thuần túy, không có Tokens hoặc quy tắc. Nhu cầu của người tìm kiếm sự chú ý và nhà cung cấp hội tụ trên nền tảng này, nơi bạn có thể đăng tải meme, phát trực tiếp, tạo token, bình luận, giao dịch và mọi thứ đều miễn phí. Pump.fun chỉ thu thập một khoản phí dịch vụ. Mô hình này về cơ bản giống với nền kinh tế chú ý của các nền tảng truyền thông xã hội hiện tại như YouTube và Instagram, nhưng có một mô hình thu nhập khác và lối chơi tập trung vào Web3 hơn.
Clanker của Base, ngược lại, là câu chuyện thành công tuyệt đối, được hưởng lợi từ hệ sinh thái tích hợp được thiết kế bởi chính nền tảng. Base có DApp xã hội riêng của mình như một công cụ phụ trợ, tạo ra một vòng lặp nội bộ hoàn chỉnh. Meme Agent là phiên bản 2.0 của Meme Coin. Mọi người luôn theo đuổi sự mới mẻ, và hiện tại, Pump.fun đang nằm ở trung tâm sự chú ý. Từ quan điểm xu hướng, chỉ là vấn đề thời gian trước khi ý tưởng lập dị của các hình thái sống dựa trên silic trở thành những meme thô sơ của các hình thái sống dựa trên cacbon.
Tôi đã đề cập đến Base vô số lần, với các khía cạnh khác nhau mỗi lần, nhưng một điều luôn rõ ràng: Base chưa bao giờ là người đi đầu, nhưng luôn là người chiến thắng.
Từ quan điểm thực tế, các tác nhân AI khó có thể được phân cấp trong tương lai gần. Trong lĩnh vực AI truyền thống, việc xây dựng một tác nhân AI không phải là vấn đề có thể được giải quyết đơn giản thông qua phân cấp hoặc các quy trình nguồn mở. Các tác nhân AI cần kết nối với các API khác nhau để truy cập nội dung Web2 và chi phí vận hành của chúng cao. Việc thiết kế Chuỗi suy nghĩ (CoT) và sự hợp tác đa tác nhân thường vẫn đòi hỏi sự trung gian của con người. Chúng ta sẽ trải qua một giai đoạn chuyển tiếp dài cho đến khi chúng ta tìm thấy một hình thức tích hợp phù hợp - có lẽ là một cái gì đó giống như UNI, nhưng hiện tại, tôi vẫn tin rằng các tác nhân AI sẽ có tác động đáng kể đến ngành của chúng ta, giống như cách CEX tồn tại trong lĩnh vực của chúng ta - không chính xác, nhưng cực kỳ quan trọng.
Tháng trước, Stanford & Microsoft đã công bố một bài đánh giá về AI Agent mô tả các ứng dụng của các AI agent trong các ngành như chăm sóc sức khỏe, máy thông minh và thế giới ảo. Ở phần phụ lục của bài luận này, đã có nhiều trường hợp thử nghiệm nơi GPT-4V, như một AI agent, đang tham gia vào việc phát triển các trò chơi hàng đầu AAA.
Chúng ta không nên vội vàng tích hợp các đại lý trí tuệ nhân tạo với sự phi tập trung. Điều mà tôi hy vọng là mảnh ghép câu đố đầu tiên mà các đại lý trí tuệ nhân tạo hoàn thành là khả năng từ dưới lên và tốc độ của chúng. Có quá nhiều tàn tích kể chuyện và thế giới ảo trống rỗng cần được điền vào, và khi đến lúc thích hợp, chúng ta có thể xem xét cách biến các đại lý trí tuệ nhân tạo thành UNI tiếp theo.
YBB là quỹ web3 tận tụy để xác định các dự án định nghĩa Web3 với tầm nhìn tạo ra một môi trường trực tuyến tốt hơn cho tất cả cư dân internet. Được thành lập bởi một nhóm những người tin vào công nghệ blockchain đã tích cực tham gia vào ngành công nghiệp này từ năm 2013, YBB luôn sẵn lòng giúp đỡ các dự án giai đoạn đầu để tiến từ 0 đến 1. Chúng tôi đánh giá cao sự đổi mới, đam mê tự thúc đẩy và các sản phẩm hướng người dùng trong khi nhận ra tiềm năng của tiền điện tử và ứng dụng blockchain.
Trong năm qua, do sự mất kết nối trong các câu chuyện ứng dụng, không thể theo kịp sự phát triển cơ sở hạ tầng, không gian tiền điện tử dần dần biến thành một cuộc đua cho tài nguyên chú ý. Từ Silly Dragon đến Goat, từ Pump.fun đến Clanker, sự thất thường của sự chú ý đã dẫn đến một chu kỳ tái phát triển liên tục trong trận chiến này. Những gì bắt đầu bằng hình thức kiếm tiền thu hút mắt nhất định nhanh chóng tiến hóa thành một mô hình nền tảng kết hợp người tìm kiếm sự chú ý và người cung cấp, cuối cùng dẫn đến các hình thức sống dựa trên silic muôn màu trở thành nhà cung cấp nội dung mới. Trong dãy đồng tiền meme kỳ lạ, một thực thể mới đã xuất hiện cho phép nhà đầu tư bán lẻ và các nhà đầu tư mạo hiểm đạt được một thoả thuận: Các Đại lý Trí tuệ nhân tạo.
Sự chú ý cuối cùng là một trò chơi có tổng bằng không, mặc dù đầu cơ thực sự có thể thúc đẩy tăng trưởng nhanh chóng. Trong bài viết trước của chúng tôi về UNI, chúng tôi đã xem xét lại sự khởi đầu của thời kỳ hoàng kim cuối cùng của blockchain, khi sự phát triển bùng nổ của DeFi được châm ngòi bởi sự ra mắt khai thác LP của Compound Finance. Trong thời đại đó, tham gia vào hàng trăm, đôi khi hàng ngàn nhóm khai thác với sản lượng hàng ngàn hoặc thậm chí hàng chục nghìn phần trăm APY là hình thức đầu cơ trên chuỗi nguyên thủy nhất. Mặc dù kết quả là sự sụp đổ hỗn loạn của nhiều nhóm, dòng người khai thác “cơn sốt vàng” đã để lại tính thanh khoản chưa từng có trong không gian blockchain. DeFi cuối cùng đã thoát khỏi đầu cơ thuần túy và phát triển thành một ngành dọc vững chắc giải quyết nhu cầu tài chính của người dùng trong các lĩnh vực như thanh toán, giao dịch, chênh lệch giá và đặt cược. AI Agents hiện đang trải qua giai đoạn “tăng trưởng hoang dã” tương tự. Những gì chúng ta đang khám phá bây giờ là làm thế nào tiền điện tử có thể tích hợp AI tốt hơn và cuối cùng nâng lớp ứng dụng lên một tầm cao mới.
Trong bài viết trước đó, chúng tôi đã giới thiệu ngắn gọn về nguồn gốc của các meme AI thông qua Truth Terminal và khám phá tiềm năng tương lai của AI Agents. Bài viết này sẽ tập trung vào chính AI Agents.
Hãy bắt đầu với định nghĩa về một AI Agent. Trong lĩnh vực AI, thuật ngữ “Agent” là một khái niệm cũ nhưng vẫn mơ hồ, chủ yếu nhấn mạnh tính tự động. Nói cách khác, bất kỳ AI nào có thể nhận biết môi trường của nó và đưa ra quyết định phản xạ được coi là một Agent. Ngày nay, định nghĩa về một AI Agent gần gũi hơn với một thực thể thông minh, một hệ thống được thiết kế để bắt chước quy trình ra quyết định của con người. Hệ thống này được xem như là phương pháp hứa hẹn nhất trong giới học thuật để đạt được AGI (Trí tuệ nhân tạo tổng quát).
Trong những phiên bản đầu của GPT, chúng ta có thể cảm nhận rõ ràng rằng các mô hình lớn giống con người, nhưng khi trả lời các câu hỏi phức tạp, chúng thường cung cấp các câu trả lời mơ hồ hoặc không chính xác. Nguyên nhân cơ bản cho điều này là các mô hình này dựa trên khả năng xảy ra thay vì nguyên nhân, và chúng thiếu các khả năng giống như con người như sử dụng công cụ, trí nhớ và kế hoạch. AI Agents nhằm giải quyết những khoảng trống này. Vì vậy, để tóm tắt theo công thức: AI Agent = LLM (Large Language Model) + Kế hoạch + Trí nhớ + Công cụ.
Các mô hình dựa trên gợi ý giống như một phiên bản tĩnh của một người, chỉ hoạt động khi chúng ta nhập dữ liệu. Ngược lại, mục tiêu của một Đại lý Trí tuệ Nhân tạo là trở thành một thực thể linh hoạt, giống con người hơn. Hiện tại, hầu hết các Đại lý Trí tuệ Nhân tạo trên thị trường là các mô hình được điều chỉnh dựa trên các phiên bản Llama 70b hoặc 405b mã nguồn mở của Meta (với các tham số khác nhau), được trang bị bộ nhớ và khả năng sử dụng API để tích hợp công cụ. Ở các lĩnh vực khác, chúng có thể vẫn cần sự hỗ trợ hoặc nhập khẩu từ con người, chẳng hạn như tương tác hoặc hợp tác với các Đại lý Trí tuệ Nhân tạo khác. Đó là lý do tại sao hầu hết các Đại lý Trí tuệ Nhân tạo ngày nay chủ yếu tồn tại dưới dạng KOL trên mạng xã hội. Để làm cho một Đại lý Trí tuệ Nhân tạo giống con người hơn, nó cần tích hợp các khả năng lập kế hoạch và hành động, với chuỗi suy nghĩ trong quá trình lập kế hoạch đặc biệt quan trọng.
Khái niệm Chuỗi Tư duy (CoT) lần đầu tiên xuất hiện trong bài báo của Google năm 2022 có tựa đề Chuỗi tư duy kích thích Lý luận trong các Mô hình Ngôn ngữ Lớn. Bài báo chỉ ra rằng bằng cách tạo ra một loạt các bước lý luận trung gian, khả năng lý luận của mô hình có thể được tăng cường, giúp nó hiểu rõ hơn và giải quyết các vấn đề phức tạp.
Một lời nhắc CoT điển hình bao gồm ba phần: mô tả nhiệm vụ với các hướng dẫn rõ ràng, cơ sở logic cho nhiệm vụ với nền tảng lý thuyết hoặc nguyên tắc hỗ trợ giải pháp và một ví dụ cụ thể về giải pháp. Cách tiếp cận có cấu trúc này giúp mô hình hiểu các yêu cầu nhiệm vụ và thông qua lý luận logic, dần dần tiếp cận câu trả lời, cải thiện cả hiệu quả và độ chính xác của việc giải quyết vấn đề. CoT đặc biệt thích hợp cho các nhiệm vụ đòi hỏi phân tích sâu và lý luận nhiều bước, chẳng hạn như giải quyết vấn đề toán học hoặc viết báo cáo dự án. Đối với các tác vụ đơn giản hơn, CoT có thể không cho thấy những lợi thế rõ ràng, nhưng đối với những nhiệm vụ phức tạp hơn, nó có thể cải thiện đáng kể hiệu suất của mô hình bằng cách giảm tỷ lệ lỗi thông qua chiến lược giải quyết vấn đề từng bước, do đó nâng cao chất lượng hoàn thành nhiệm vụ.
Trong việc xây dựng các tác nhân AI, CoT đóng một vai trò quan trọng. AI Agents cần hiểu thông tin họ nhận được và đưa ra quyết định hợp lý dựa trên đó. CoT cung cấp một quy trình tư duy có trật tự giúp Tổng đài viên xử lý và phân tích dữ liệu đầu vào một cách hiệu quả, biến phân tích thành các hướng dẫn có thể hành động. Phương pháp này không chỉ tăng cường độ tin cậy và hiệu quả của việc ra quyết định của Đại lý mà còn cải thiện tính minh bạch của quá trình ra quyết định, làm cho hành vi của Đại lý dễ dự đoán và dễ theo dõi hơn. Bằng cách chia nhỏ các nhiệm vụ thành các bước nhỏ hơn, CoT giúp Tổng đài viên xem xét chi tiết từng điểm quyết định, giảm lỗi do quá tải thông tin và làm cho quá trình ra quyết định minh bạch hơn. Tính minh bạch này cho phép người dùng hiểu rõ hơn về cơ sở của các quyết định của Đại lý. Trong tương tác với môi trường, CoT cho phép Đại lý liên tục tìm hiểu thông tin mới và điều chỉnh chiến lược hành vi của mình.
Là một chiến lược hiệu quả, CoT không chỉ tăng cường khả năng suy luận của các mô hình ngôn ngữ lớn mà còn đóng một vai trò quan trọng trong việc xây dựng các Tác nhân AI thông minh và đáng tin cậy hơn. Bằng cách tận dụng CoT, các nhà nghiên cứu và nhà phát triển có thể tạo ra các hệ thống thông minh thích ứng hơn với môi trường phức tạp và có tính tự chủ cao. Trong các ứng dụng thực tế, CoT đã cho thấy những ưu điểm độc đáo của mình, đặc biệt là trong việc xử lý các tác vụ phức tạp. Bằng cách chia các nhiệm vụ thành một loạt các bước nhỏ hơn, nó không chỉ cải thiện độ chính xác của việc giải quyết nhiệm vụ mà còn tăng cường khả năng diễn giải và kiểm soát của mô hình. Cách tiếp cận giải quyết vấn đề từng bước này có thể làm giảm đáng kể các lỗi gây ra bởi thông tin quá mức hoặc quá phức tạp khi phải đối mặt với các nhiệm vụ phức tạp. Đồng thời, phương pháp này cũng cải thiện khả năng truy xuất nguồn gốc và khả năng kiểm chứng của toàn bộ giải pháp.
Chức năng cốt lõi của CoT nằm ở việc tích hợp lập kế hoạch, hành động và quan sát, thu hẹp khoảng cách giữa lý luận và hành động. Mô hình tư duy này cho phép Tác nhân AI đưa ra các biện pháp đối phó hiệu quả khi dự đoán các bất thường tiềm ẩn và tích lũy thông tin mới trong khi tương tác với môi trường bên ngoài, xác nhận các dự đoán được đặt trước và cung cấp cơ sở lý luận mới. CoT hoạt động như một động cơ mạnh mẽ về độ chính xác và ổn định, giúp AI Agent duy trì hiệu quả cao trong các môi trường phức tạp.
Làm thế nào chính xác Crypto nên tích hợp với các ngăn xếp công nghệ AI? Trong bài viết của năm ngoái, tôi đề xuất rằng phân quyền sức mạnh tính toán và dữ liệu là một bước quan trọng trong việc giúp các doanh nghiệp nhỏ và các nhà phát triển cá nhân tiết kiệm chi phí. Năm nay, trong phân tích chi tiết về các ngành Crypto x AI được tổng hợp bởi Coinbase, chúng ta có thể thấy rõ hơn các phân nhánh cụ thể hơn:
(1) Tầng Tính toán (tập trung vào cung cấp tài nguyên GPU cho các nhà phát triển trí tuệ nhân tạo);
(2) Lớp Dữ liệu (tập trung vào quyền truy cập phi tập trung, điều hợp và xác minh các đường ống dữ liệu trí tuệ nhân tạo);
(3) Lớp phần mềm trung gian (nền tảng hoặc mạng hỗ trợ việc phát triển, triển khai và lưu trữ các mô hình hoặc đại lý trí tuệ nhân tạo);
(4) Lớp ứng dụng (các sản phẩm hướng tới người dùng sử dụng các cơ chế AI trên chuỗi, cho dù là B2B hay B2C).
Mỗi lớp trong số bốn lớp này đều có tầm nhìn lớn, tất cả đều nhằm mục đích thách thức sự thống trị của những gã khổng lồ ở Thung lũng Silicon trong kỷ nguyên tiếp theo của internet. Như tôi đã nói năm ngoái, chúng ta có thực sự cần phải chấp nhận rằng những gã khổng lồ ở Thung lũng Silicon độc quyền kiểm soát sức mạnh tính toán và dữ liệu không? Dưới sự độc quyền của họ, các mô hình lớn nguồn đóng là hộp đen và khoa học, với tư cách là hệ thống niềm tin được tôn kính nhất của nhân loại ngày nay, sẽ dựa vào câu trả lời được đưa ra bởi các mô hình lớn này. Nhưng làm thế nào những sự thật này có thể được xác minh? Theo tầm nhìn của những gã khổng lồ ở Thung lũng Silicon này, quyền hạn do các trợ lý thông minh nắm giữ có thể vượt quá trí tưởng tượng của chúng ta - chẳng hạn như có thẩm quyền thanh toán từ ví của bạn hoặc kiểm soát quyền truy cập thiết bị đầu cuối của bạn. Làm thế nào chúng ta có thể đảm bảo rằng không có ác ý phát sinh?
Phân cấp là câu trả lời duy nhất, nhưng đôi khi chúng ta cần xem xét hợp lý có bao nhiêu người mua cho những tầm nhìn lớn này. Trước đây, chúng ta có thể bỏ qua sự cần thiết của một vòng lặp thương mại và sử dụng Token để lấp đầy những khoảng trống do chủ nghĩa lý tưởng gây ra. Tuy nhiên, tình hình hiện tại khó khăn hơn nhiều. Crypto x AI phải thiết kế dựa trên hoàn cảnh thực tế. Ví dụ, làm thế nào để chúng ta cân bằng nguồn cung ở cả hai đầu của lớp điện toán trong trường hợp mất hiệu suất và không ổn định, và vẫn cạnh tranh với các nhà cung cấp đám mây tập trung? Các dự án lớp dữ liệu sẽ thực sự có bao nhiêu người dùng thực? Làm thế nào chúng tôi có thể xác minh tính xác thực và hợp lệ của dữ liệu được cung cấp? Những loại khách hàng nào thực sự cần dữ liệu này? Logic tương tự áp dụng cho các lớp khác. Trong thời đại này, chúng ta không cần quá nhiều yêu cầu giả dường như chính xác.
Như tôi đã đề cập trong phần đầu tiên, Meme đã nhanh chóng phát triển thành một hình thức SocialFi tương thích với Web3. Friend.tech là ứng dụng phi tập trung (DApp) đã bắn đầu cuộc chiến ứng dụng xã hội này, nhưng không may, nó thất bại do thiết kế Token hasty của nó. Trong khi đó, Pump.fun đã chứng minh được tính khả thi của một mô hình nền tảng thuần túy, không có Tokens hoặc quy tắc. Nhu cầu của người tìm kiếm sự chú ý và nhà cung cấp hội tụ trên nền tảng này, nơi bạn có thể đăng tải meme, phát trực tiếp, tạo token, bình luận, giao dịch và mọi thứ đều miễn phí. Pump.fun chỉ thu thập một khoản phí dịch vụ. Mô hình này về cơ bản giống với nền kinh tế chú ý của các nền tảng truyền thông xã hội hiện tại như YouTube và Instagram, nhưng có một mô hình thu nhập khác và lối chơi tập trung vào Web3 hơn.
Clanker của Base, ngược lại, là câu chuyện thành công tuyệt đối, được hưởng lợi từ hệ sinh thái tích hợp được thiết kế bởi chính nền tảng. Base có DApp xã hội riêng của mình như một công cụ phụ trợ, tạo ra một vòng lặp nội bộ hoàn chỉnh. Meme Agent là phiên bản 2.0 của Meme Coin. Mọi người luôn theo đuổi sự mới mẻ, và hiện tại, Pump.fun đang nằm ở trung tâm sự chú ý. Từ quan điểm xu hướng, chỉ là vấn đề thời gian trước khi ý tưởng lập dị của các hình thái sống dựa trên silic trở thành những meme thô sơ của các hình thái sống dựa trên cacbon.
Tôi đã đề cập đến Base vô số lần, với các khía cạnh khác nhau mỗi lần, nhưng một điều luôn rõ ràng: Base chưa bao giờ là người đi đầu, nhưng luôn là người chiến thắng.
Từ quan điểm thực tế, các tác nhân AI khó có thể được phân cấp trong tương lai gần. Trong lĩnh vực AI truyền thống, việc xây dựng một tác nhân AI không phải là vấn đề có thể được giải quyết đơn giản thông qua phân cấp hoặc các quy trình nguồn mở. Các tác nhân AI cần kết nối với các API khác nhau để truy cập nội dung Web2 và chi phí vận hành của chúng cao. Việc thiết kế Chuỗi suy nghĩ (CoT) và sự hợp tác đa tác nhân thường vẫn đòi hỏi sự trung gian của con người. Chúng ta sẽ trải qua một giai đoạn chuyển tiếp dài cho đến khi chúng ta tìm thấy một hình thức tích hợp phù hợp - có lẽ là một cái gì đó giống như UNI, nhưng hiện tại, tôi vẫn tin rằng các tác nhân AI sẽ có tác động đáng kể đến ngành của chúng ta, giống như cách CEX tồn tại trong lĩnh vực của chúng ta - không chính xác, nhưng cực kỳ quan trọng.
Tháng trước, Stanford & Microsoft đã công bố một bài đánh giá về AI Agent mô tả các ứng dụng của các AI agent trong các ngành như chăm sóc sức khỏe, máy thông minh và thế giới ảo. Ở phần phụ lục của bài luận này, đã có nhiều trường hợp thử nghiệm nơi GPT-4V, như một AI agent, đang tham gia vào việc phát triển các trò chơi hàng đầu AAA.
Chúng ta không nên vội vàng tích hợp các đại lý trí tuệ nhân tạo với sự phi tập trung. Điều mà tôi hy vọng là mảnh ghép câu đố đầu tiên mà các đại lý trí tuệ nhân tạo hoàn thành là khả năng từ dưới lên và tốc độ của chúng. Có quá nhiều tàn tích kể chuyện và thế giới ảo trống rỗng cần được điền vào, và khi đến lúc thích hợp, chúng ta có thể xem xét cách biến các đại lý trí tuệ nhân tạo thành UNI tiếp theo.
YBB là quỹ web3 tận tụy để xác định các dự án định nghĩa Web3 với tầm nhìn tạo ra một môi trường trực tuyến tốt hơn cho tất cả cư dân internet. Được thành lập bởi một nhóm những người tin vào công nghệ blockchain đã tích cực tham gia vào ngành công nghiệp này từ năm 2013, YBB luôn sẵn lòng giúp đỡ các dự án giai đoạn đầu để tiến từ 0 đến 1. Chúng tôi đánh giá cao sự đổi mới, đam mê tự thúc đẩy và các sản phẩm hướng người dùng trong khi nhận ra tiềm năng của tiền điện tử và ứng dụng blockchain.