Tướng VS dọc, người mẫu lớn tiếp cận điểm đấu đầu tiên

Nguồn: Shenmou Finance, tác giả | Zhang Wei

Tín dụng hình ảnh: Được tạo bởi các công cụ Unbounded AI

Chiến trường cho các siêu mô hình AI đang bị phân mảnh.

Là cầu chì, Chatgpt đã mở ra cánh cửa cho kỷ nguyên AI2.0 và AI2.0 được đặc trưng bởi "trí tuệ công nghiệp và số hóa", có thể thay thế sức lao động một cách hiệu quả và được sử dụng rộng rãi trong mọi tầng lớp xã hội. đã qua giai đoạn chạy trốn, việc triển khai mô hình AI lớn sẽ thực tế hơn.

Biểu hiện điển hình nhất là mô hình AI lớn đi ra ngoài vòng tròn rộng hơn chứ không chỉ dừng lại ở mặt B. Ví dụ, mặc dù chatGPT đã được phát hành hơn nửa năm, tác giả vẫn có thể nghe thấy giọng nói của những người lao động nhập cư nói về chatGPT trong quán cà phê ở tầng dưới của khu thương mại trung tâm Thượng Hải; theo báo cáo phương tiện truyền thông, một số công ty cũng sử dụng AIGC như một công cụ năng suất.

Như Zhang Yong, Chủ tịch kiêm Giám đốc điều hành của Tập đoàn Alibaba và Giám đốc điều hành của Tập đoàn Alibaba Cloud Intelligence, cho biết: Đối mặt với kỷ nguyên AI, tất cả các sản phẩm đều đáng làm lại với một mô hình lớn.

Các nhà máy lớn, tổ chức nghiên cứu khoa học và doanh nhân đều đã kết thúc.

Các nhà sản xuất lớn như Baidu Wenxin Yiyan, Huawei Pangu, 360 Zhinao, Shangtang Rixin, Ali Tongyi Qianwen, Jingdong Lingxi, Kunlun Wanwei Tiangong và các mô hình lớn khác đã xuất hiện liên tiếp, tiếp theo là Tencent Hunyuan, HKUST Các mô hình lớn như Xunfei Xinghuo đang chờ đợi dòng để đi trực tuyến.

Các doanh nhân cũng có những người nổi tiếng. Wang Xiaochuan, người sáng lập Sogou, Wang Huiwen, đồng sáng lập Meituan, Kaifu Li, chủ tịch của Sinovation Works, và những người khác đã xuất hiện trong các mô hình AI lớn.

Cơn sốt mô hình quy mô lớn AI kéo dài hơn vài tháng đã sinh ra hai con đường.

Cuộc chạy đua vũ trang AI, khác biệt hóa mô hình lớn

Các mô hình lớn AI đã bước vào giai đoạn cạnh tranh và các con đường đang dần chuyển hướng.

Khi mô hình AI dần nóng lên, theo thống kê của các phương tiện truyền thông, vào đầu tháng 2, chỉ có 29 cổ phiếu trong phần "ChatGPT" của Oriental Fortune, và hiện tại nó đã lên tới 61 cổ phiếu, và con số này vẫn đang tăng lên . Theo thống kê chưa đầy đủ, tính đến thời điểm hiện tại, hơn 40 công ty và tổ chức ở nước tôi đã phát hành các sản phẩm mô hình quy mô lớn hoặc công bố kế hoạch mô hình quy mô lớn.

Trong số đó, những người chơi tham gia vào "cuộc chạy đua vũ trang" của các mô hình AI quy mô lớn cũng đã đưa ra hai hướng phát triển. Mô hình lớn theo chiều dọc và mô hình lớn nói chung đang trở thành hai hướng phát triển chính trong lĩnh vực trí tuệ nhân tạo.

Các mô hình lớn theo chiều dọc đề cập đến các mô hình được tối ưu hóa cho các lĩnh vực hoặc tác vụ cụ thể, chẳng hạn như nhận dạng giọng nói, xử lý ngôn ngữ tự nhiên, phân loại hình ảnh, v.v.

Hiện nay, ngày càng có nhiều công ty tham gia vào các mô hình quy mô lớn theo chiều dọc. Xueersi thông báo rằng họ đang phát triển một mô hình toán học lớn tự phát triển, có tên là MathGPT, dành cho những người đam mê toán học và các tổ chức nghiên cứu khoa học trên toàn thế giới; vào ngày 6 tháng 5, Taoyun Technology đã công bố ra mắt một mô hình nhận thức lớn dành cho trẻ em - Alpha Egg Children's Cognitive Big Mô hình mang đến trải nghiệm tương tác mới cho trẻ về rèn luyện khả năng diễn đạt, trau dồi EQ, khơi nguồn sáng tạo và hỗ trợ học tập.

Các mô hình lớn nói chung đề cập đến các mô hình có thể xử lý nhiều tác vụ và miền, chẳng hạn như BERT, GPT, v.v.

Do lợi thế về vốn và tài năng, các nhà sản xuất lớn chủ yếu nhắm vào đường đua của các mẫu xe cỡ lớn đa năng.

Các nhà sản xuất lớn nhắm đến các mô hình lớn có mục đích chung, một mặt, họ có thể kết hợp khả năng AI với các sản phẩm của mình.

Ví dụ: sau khi Microsoft tích hợp GPT-4 vào nhóm Office, "Tongyi Qianwen" của Ali cũng đã bắt đầu truy cập DingTalk, người dùng có thể tạo nội dung trong tài liệu và trong hội nghị truyền hình, họ có thể tạo từng chế độ xem và nội dung cá nhân.

Ví dụ: mô hình lớn của Baidu cũng có thể được kết hợp với hoạt động kinh doanh của chính họ. "Wen Xin Yi Yan" có thể có sự chuyển đổi về chất trong quá trình lặp lại của các công cụ tìm kiếm. "Yuyan" của NetEase và "ChatJD" của JD.com có thể được sử dụng đầu tiên trong các ngành công nghiệp riêng.

Mặt khác, mô hình lớn đa năng có khả năng ứng dụng rộng rãi và những người vượt trội trước có thể thiết lập lợi thế của người đi trước và trở thành người dẫn đầu trong kỷ nguyên AI2.0. Suy cho cùng, ai cũng biết chân lý “chạy nhanh được miếng thịt, chạy chậm chỉ được ăn cơm thừa”.

Mô hình lớn ứng dụng theo chiều dọc có thể được mô tả là "luồng thông thoáng".Vì mô hình lớn ứng dụng theo chiều dọc phù hợp hơn với nhu cầu của các kịch bản theo chiều dọc và có chất lượng cao hơn so với mô hình lớn chung chung nên nhiều công ty cũng đã nhìn thấy cơ hội. Ví dụ: Shenlan, Mobvoi, Youdao và các công ty khác tập trung vào các tuyến AI cụ thể.

Sự phát triển của các mô hình dọc lớn chủ yếu được phản ánh ở việc cải thiện liên tục hiệu suất của mô hình trong các lĩnh vực khác nhau, chẳng hạn như tỷ lệ lỗi nhận dạng giọng nói đã giảm qua từng năm và khả năng hiểu ngữ nghĩa của xử lý ngôn ngữ tự nhiên tiếp tục được cải thiện. Mô hình lớn nói chung đã đạt được tiến bộ đáng kể trong học tập đa tác vụ và học tập chuyển giao, và đã trở thành một hướng nghiên cứu quan trọng trong lĩnh vực xử lý ngôn ngữ tự nhiên.

Ví dụ, các mô hình sinh học lớn có thể cải thiện hiệu quả của dược phẩm AI. Các báo cáo nghiên cứu nước ngoài cho thấy AI có thể tăng tỷ lệ thành công của nghiên cứu và phát triển thuốc mới lên 16,7% và nghiên cứu và phát triển thuốc do AI hỗ trợ có thể tiết kiệm 54 tỷ USD chi phí nghiên cứu và phát triển mỗi năm, đồng thời tiết kiệm 40% đến 60% thời gian và chi phí trong quá trình nghiên cứu và phát triển chính. Theo thông tin công khai của Nvidia, việc sử dụng công nghệ AI có thể rút ngắn thời gian cần thiết để phát hiện ra thuốc sớm xuống còn một phần ba và tiết kiệm chi phí xuống còn một phần hai trăm.

Từ quan điểm của ngành, mô hình chung là một "bách khoa toàn thư", có thể trả lời mọi câu hỏi và áp dụng cho các loại đất công nghiệp khác nhau, trong khi mô hình dọc tương tự như một chuyên gia trong một lĩnh vực. mệnh là một số ít người.

Dữ liệu gây tử vong

Ưu điểm của mô hình lớn theo chiều dọc là nó không đủ "lớn": khả năng tính toán không đủ lớn và độ khó của thuật toán thấp.

Sau khi Wang Xiaochuan bước vào con đường mô hình quy mô lớn, anh ấy luôn nhấn mạnh rằng hướng nỗ lực trong tương lai không phải là làm AGI (Trí tuệ nhân tạo chung) như OpenAI, mà là tạo ra các mô hình quy mô lớn theo chiều dọc trong một số lĩnh vực cụ thể và hiện thực hóa các ứng dụng hạ cánh .

Một mô hình lớn theo nghĩa rộng thực sự mô tả một mô hình lớn có mục đích chung, giống như một mô hình "lớn", lý do khiến một mô hình lớn trở nên "lớn" là do số lượng tham số lớn và lượng dữ liệu khổng lồ, mà có ảnh hưởng lớn đến thuật toán, sức mạnh tính toán và không gian lưu trữ dữ liệu, yêu cầu lớn và đây không chỉ là những người có thể bù đắp, mà còn cần rất nhiều tiền. Bạn biết đấy, thành công của Open AI cũng được Microsoft gây dựng với hàng tỷ USD. Nhu cầu vốn rất lớn cũng là phép thử cho sự quyết tâm của các nhà sản xuất lớn trong nghiên cứu và phát triển.

Trong 5 năm qua, khối lượng tham số của các mô hình AI lớn đã tăng theo một mức độ lớn mỗi năm. Ví dụ: khối lượng tham số của GPT-4 gấp 16 lần so với GPT-3, đạt 1,6 nghìn tỷ đồng; và với sự ra đời của dữ liệu đa phương thức như hình ảnh, âm thanh và video, khối lượng dữ liệu của các mô hình lớn cũng được mở rộng nhanh chóng. Điều này có nghĩa là nếu bạn muốn chơi với một mô hình lớn, bạn phải có khả năng tính toán lớn.

So với các nhà sản xuất lớn, các công ty sản xuất mô hình quy mô lớn theo chiều dọc có nguồn vốn, sức mạnh tính toán và dữ liệu tương đối khan hiếm, vì vậy họ thực sự không cùng vạch xuất phát với những người chơi mô hình quy mô lớn có mục đích chung.

Giống như các phương tiện sử dụng năng lượng mới không thể tách rời khỏi ba thành phần chính là động cơ, pin và bộ điều khiển điện tử, các mô hình AI lớn không thể tách rời khỏi sự hỗ trợ của sức mạnh tính toán, thuật toán và dữ liệu.

Giữa sức mạnh tính toán, thuật toán và dữ liệu, dữ liệu là khó khăn của các mô hình dọc lớn.

Trong ba yếu tố, độ khó nghiên cứu và phát triển của thuật toán tương đối thấp, các công ty hiện tại có thuật toán đường dẫn riêng để triển khai các mô hình lớn và có nhiều dự án mã nguồn mở để tham khảo.

Con chip quyết định sức mạnh tính toán. Mô hình AI lớn tổng thể cần một con chip hiệu suất cao hơn để hoàn thành quá trình đào tạo và xây dựng mạng thần kinh mô hình tổng thể. Tuy nhiên, con chip hiện tại ít được tự phát triển hơn và chủ yếu vẫn là nguồn bên ngoài. Ví dụ: chip phù hợp nhất cho ChatGPT là của Nvidia, chip hàng đầu H100 và chip hàng đầu phụ A100.

Khó khăn nằm ở dữ liệu. Dữ liệu chất lượng cao là chìa khóa để hỗ trợ đào tạo và điều chỉnh AI. Dữ liệu đầy đủ và phong phú là nền tảng của các mô hình lớn AI tổng quát.

Theo tiết lộ trước đây của OpenAI, chỉ riêng số lượng tham số ChatGPT3 đã lên tới 175 tỷ và dữ liệu đào tạo đã lên tới 45TB.

Do sự phát triển tương đối trưởng thành của Internet di động của Trung Quốc, một lượng lớn tài nguyên dữ liệu của Trung Quốc được lưu trữ trong các doanh nghiệp hoặc tổ chức khác nhau, gây khó khăn cho việc chia sẻ.

"Vì rất nhiều dữ liệu kinh doanh, dữ liệu hậu cần, dữ liệu tài chính, v.v. của doanh nghiệp là dữ liệu miền riêng rất cốt lõi, nên khó có thể tưởng tượng rằng China Star Optoelectronics hoặc PetroChina sẽ sử dụng dữ liệu này cho người khác để đào tạo." Xu Hui, Giám đốc điều hành của Chuangxinqizhi, gần đây đã được phỏng vấn bởi chứng khoán Trong một cuộc phỏng vấn với Times, ông cũng nói thẳng.

Lấy ngành dược phẩm AI làm ví dụ, các mô hình sinh học lớn phải đối mặt với vấn đề bị "mắc kẹt" bởi công nghệ. Chi phí để có được dữ liệu thực nghiệm có độ chính xác cao cho nghiên cứu và phát triển thuốc là tương đối cao, và có một số lượng lớn dữ liệu chưa được gắn nhãn trong cơ sở dữ liệu công cộng, cần phải tận dụng tốt cả một lượng lớn dữ liệu chưa được gắn nhãn và một lượng nhỏ dữ liệu. lượng dữ liệu có độ chính xác cao, vì vậy các yêu cầu cao hơn được đưa ra để xây dựng mô hình.

Ai sẽ kiếm được hũ vàng đầu tiên?

Dù là mô hình nào thì thương mại hóa vẫn là vấn đề cốt lõi. Đánh giá từ những người chơi AI hiện tại với các mô hình lớn, họ đang nhanh chóng thúc đẩy việc trao quyền và thương mại hóa.

Mặc dù mô hình quy mô lớn có mục đích chung và mô hình quy mô lớn theo chiều dọc đi theo những con đường khác nhau nhưng về bản chất chúng vẫn là "người nhà" và đang đi chung một đường nên không thể tránh khỏi vấn đề cạnh tranh.

Đối với mô hình quy mô lớn chung, mô hình quy mô lớn thẳng đứng sẽ hạ cánh trước và đường đi của mô hình quy mô lớn chung sẽ hẹp hơn. Tương tự như vậy, sau khi các mô hình quy mô lớn đa năng nhanh chóng chiếm lĩnh thị trường, các mô hình quy mô lớn theo chiều dọc với ngành nghề kinh doanh hẹp sẽ khó kiếm tiền hơn.

Trong giai đoạn lý tưởng, cho dù đó là mô hình kinh tế hay giá trị phổ quát, mô hình quy mô lớn có mục đích chung đều tốt hơn mô hình quy mô lớn theo chiều dọc. Tuy nhiên, cuộc sống thực không phải là điều không tưởng, ai chạy nhanh hơn giữa mô hình quy mô lớn đa năng và mô hình quy mô lớn theo chiều dọc phụ thuộc vào sự cạnh tranh giữa các doanh nghiệp khác nhau.

Đánh giá về AIGC hot năm ngoái. So với việc cho phép người dùng sử dụng AI để tạo nội dung với ngưỡng thấp hơn ở C-end, một số người tham gia thị trường tin rằng B-end sẽ là mô hình kinh doanh quan trọng hơn của AIGC.

Huawei cũng quan tâm nhiều hơn đến hoạt động kinh doanh ToB của riêng mình. Tại buổi họp báo, Huawei cho biết mô hình lớn Huawei Pangu chủ yếu sử dụng AI để trao quyền cho các ngành công nghiệp và được sử dụng trong nhiều ngành như năng lượng điện, tài chính và nông nghiệp, trong đó mô hình lớn CV được sử dụng trong hầm mỏ và NLP mô hình lớn được sử dụng trong truy xuất tài liệu thông minh.

Ví dụ, Baidu, chuyên về công cụ tìm kiếm, đã tung ra Wenxin Yiyan với các thuộc tính tìm kiếm như GPT-3.

Ngoài ChatGPT, trên thực tế, trước cơn sốt AI của các mô hình quy mô lớn, đã có cảnh hạ cánh, những mô hình "lớn" này thực chất chủ yếu là các mô hình quy mô lớn theo chiều dọc.

Mô hình ngôn ngữ: chẳng hạn như GPT, BERT, v.v., chủ yếu được sử dụng trong lĩnh vực xử lý ngôn ngữ tự nhiên, chẳng hạn như dịch máy, tạo văn bản, phân tích tình cảm, v.v. Các mô hình hình ảnh: chẳng hạn như ResNet, Inception, v.v., chủ yếu được sử dụng trong lĩnh vực thị giác máy tính, chẳng hạn như phân loại hình ảnh, phát hiện mục tiêu, phân đoạn hình ảnh, v.v. Mô hình khuyến nghị: chẳng hạn như DNN, RNN, v.v., chủ yếu được sử dụng trong lĩnh vực hệ thống khuyến nghị, chẳng hạn như khuyến nghị sản phẩm và khuyến nghị quảng cáo. Chatbots: chẳng hạn như Seq2Seq, Transformer, v.v., chủ yếu được sử dụng trong các tình huống như dịch vụ khách hàng thông minh và trợ lý thông minh. Kiểm soát rủi ro tài chính: chẳng hạn như XGBoost, LightGBM, v.v., chủ yếu được sử dụng trong các tình huống kiểm soát rủi ro của các tổ chức tài chính như ngân hàng và chứng khoán, chẳng hạn như chấm điểm tín dụng và chống gian lận. Chẩn đoán hình ảnh y tế: như DeepLung, DeepLesion, v.v., chủ yếu được sử dụng trong lĩnh vực chẩn đoán hình ảnh y tế, chẳng hạn như chẩn đoán ung thư phổi và phân tích bệnh lý.

Kiếm tiền quan trọng hơn hạ cánh.

Theo báo cáo của Guosheng Securities "Cần bao nhiêu sức mạnh máy tính cho ChatGPT", ước tính chi phí đào tạo GPT-3 là khoảng 1,4 triệu đô la Mỹ và đối với một số LLM (Mô hình ngôn ngữ lớn) lớn hơn, chi phí đào tạo nằm trong khoảng 2 triệu đô la Mỹ và 12 triệu đô la Mỹ giữa. Dựa trên số lượng khách truy cập trung bình của ChatGPT vào tháng 1 là 13 triệu, nhu cầu chip tương ứng là hơn 30.000 GPU NVIDIA A100, chi phí đầu tư ban đầu khoảng 800 triệu đô la Mỹ và chi phí điện hàng ngày khoảng 50.000 đô la Mỹ.

Không còn nghi ngờ gì nữa, các mô hình quy mô lớn đa năng được sử dụng rộng rãi hơn trong các tình huống hạ cánh, đối với những người chơi tin tưởng vào các mô hình quy mô lớn đa năng, thương mại hóa đứng thứ hai. dòng, vì vậy các mô hình quy mô lớn theo chiều dọc có nhiều lợi thế hơn. Xác suất cao và tỷ lệ chấp nhận nhanh hơn.

Không có câu trả lời rõ ràng về việc ai có thể tạo ra lợi thế tuyệt đối trước. Cuộc “chạy đua vũ trang” AI của các mô hình lớn này giống như sự thay đổi bươm bướm từ web1 sang web2, các doanh nghiệp đang chạy đua với thời gian, ai nắm bắt được cơ hội trước sẽ chiếm được thị trường.

Xem bản gốc