Vì sao MosaicML bán được 1,3 tỷ USD chỉ sau 2 năm thành lập?

MosaicML đã được gã khổng lồ dữ liệu lớn Databricks mua lại với mức giá khoảng 1,3 tỷ USD, trong giao dịch này đã tăng gấp 6 lần giá trị của nó, trở thành thương vụ mua lại lớn nhất trong nửa đầu năm nay. Nó chỉ mới thành lập được 2 năm và có hơn 60 nhân viên, điều gì hỗ trợ cho việc định giá cao của MosaicML?

Gần đây, đã có một làn sóng đầu tư và mua lại trong lĩnh vực AI. Salesforce, một công ty nổi tiếng thế giới, đã rót 450 triệu đô la vào Anthropic, trong khi Runway huy động thành công 141 triệu đô la tài trợ. Ngoài ra, Snowflake cũng tuyên bố hoàn tất việc mua lại Neeva, trong khi gã khổng lồ nội địa Trung Quốc Meituan mua lại công ty AI Light Years Away với giá 2,065 tỷ.

Tuy nhiên, thỏa thuận cao cấp nhất chắc chắn là việc mua lại công ty khởi nghiệp MosaicML. Được biết, MosaicML đã được gã khổng lồ dữ liệu lớn Databricks mua lại với giá khoảng 1,3 tỷ USD và giá trị của nó đã tăng gấp đôi sáu lần trong giao dịch này, khiến nó trở thành thương vụ mua lại lớn nhất trong nửa đầu năm nay. Nó chỉ mới thành lập được 2 năm và có hơn 60 nhân viên, điều gì hỗ trợ cho việc định giá cao của MosaicML?

Databricks mua lại MosaicML để đẩy nhanh quá trình dân chủ hóa các công nghệ AI sáng tạo

Databricks gần đây đã chính thức thông báo rằng họ đã mua lại MosaicML, một công ty khởi nghiệp về trí tuệ nhân tạo, với giá khoảng 1,3 tỷ USD (khoảng 9,3 tỷ nhân dân tệ) để cung cấp dịch vụ xây dựng các công cụ giống như ChatGPT cho các doanh nghiệp.

Sau khi mua lại, MosaicML sẽ trở thành một phần của nền tảng Databricks Lakehouse. Toàn bộ nhóm và công nghệ của MosaicML sẽ được đặt dưới tên của Databricks, cung cấp cho các doanh nghiệp một nền tảng thống nhất để quản lý tài sản dữ liệu và có thể sử dụng dữ liệu độc quyền của riêng họ để xây dựng, sở hữu và bảo vệ các mô hình AI tổng quát của riêng mình.

Thành lập 2 năm trước, mỗi nhân viên trị giá 21 triệu đô la Mỹ, tại sao MosaicML lại bán được 1,3 tỷ đô la Mỹ?

MosaicML là một công ty AI sáng tạo còn rất trẻ, được thành lập tại San Francisco vào năm 2021. Nó mới chỉ công khai một vòng gọi vốn và chỉ có 62 nhân viên. Trong vòng cấp vốn gần đây nhất, định giá của nó là 220 triệu đô la Mỹ, tức là, giá trị của việc mua lại MosaicML đã trực tiếp tăng gấp 6 lần. Thỏa thuận này là thương vụ mua lại lớn nhất được công bố trong lĩnh vực AI tổng hợp từ đầu năm đến nay. Cách đây không lâu, gã khổng lồ điện toán đám mây Snowflake vừa công bố việc mua lại một công ty trí tuệ nhân tạo khác là Neeva. Sau một vài tháng đầu tư điên cuồng, một làn sóng mua lại khổng lồ của các công ty khởi nghiệp về AI đang được tiến hành.

Databricks có nguồn gốc từ UC Berkeley và tham gia phát triển dự án Apache Spark. Là một gã khổng lồ về lưu trữ và phân tích dữ liệu, tính đến năm 2022, nó sẽ được định giá 31 tỷ USD, giúp các công ty lớn như AT&T, Shell và Walgreens xử lý dữ liệu. Cách đây một thời gian, tôi mới khai trương mô hình Dolly lớn của riêng mình, nhằm đạt được hiệu ứng tương tự như ChatGPT với ít tham số hơn. Sau khi điện toán đám mây trở nên phổ biến hơn, khái niệm "tích hợp hồ và kho" do Spark đề xuất đã ảnh hưởng sâu sắc đến một số công ty khởi nghiệp dữ liệu lớn. Kể từ khi thành lập vào năm 2013, Databricks đã nhanh chóng phát triển thành công ty Data Infra nóng nhất thế giới. Năm ngoái, Databricks đã công bố doanh thu hàng năm hơn 1 tỷ đô la và sau khi hoàn thành vòng cấp vốn mới nhất vào tháng 8 năm 2021, mức định giá mới nhất của nó đạt 38 tỷ đô la.

Ưu điểm của dòng máy MosaicML MPT

Các mô hình sê-ri MPT của MosaicML được phân lớp từ lớp cơ sở HuggingFace PretrainingModel và hoàn toàn tương thích với hệ sinh thái HuggingFace. Mô hình MPT-7B là một trong những mô hình phổ biến nhất của MosaicML với hàng tỷ tham số và có thể xử lý hơn 2.000 tác vụ xử lý ngôn ngữ tự nhiên. Trong số đó, lớp tối ưu hóa của MPT-7B bao gồm FlashAttention và định mức lớp có độ chính xác thấp, v.v., có thể giúp mô hình nhanh hơn 2-7 lần so với các phương pháp đào tạo truyền thống và khả năng mở rộng gần tuyến tính của tài nguyên đảm bảo rằng các mô hình có hàng tỷ của các tham số có thể được sử dụng trong Train theo giờ, không phải ngày. MosaicML cũng đã phát hành một mô hình ngôn ngữ lớn mã nguồn mở mới có sẵn trên thị trường MPT-30B, có 30 tỷ tham số và hoạt động tốt hơn GPT-3.

Thành lập 2 năm trước, mỗi nhân viên trị giá 21 triệu đô la Mỹ, tại sao MosaicML lại bán được 1,3 tỷ đô la Mỹ?

Nguồn dữ liệu: Đánh giá MT-Bench của các mô hình chính của MosaicML

Ưu điểm của các mô hình dòng MPT là hiệu quả cao và chi phí thấp. Sự phức tạp của các mô hình trí tuệ nhân tạo sử dụng một lượng lớn dữ liệu để "đào tạo" đã tăng lên đáng kể. Việc đào tạo một mô hình hiện tiêu tốn ít nhất hàng triệu đô la, thường không phù hợp với các doanh nghiệp vừa và nhỏ, ngoại trừ các công ty lớn. Các mô hình sê-ri MPT của MosaicML cho phép doanh nghiệp đào tạo các mô hình ngôn ngữ của riêng họ với chi phí thấp hơn và hiệu quả cao hơn, để họ có thể dễ dàng áp dụng công nghệ AI tổng quát hơn và đạt được hiệu quả kinh doanh tốt hơn. Hầu hết các mô hình ngôn ngữ nguồn mở chỉ có thể xử lý các chuỗi có tối đa vài nghìn mã thông báo (xem Hình 1). Tuy nhiên, với nền tảng MosaicML và một nút đơn 8xA100-40GB, người dùng có thể dễ dàng tinh chỉnh MPT-7B để xử lý độ dài ngữ cảnh lên tới 65k. Khả năng xử lý khả năng thích ứng độ dài ngữ cảnh khắc nghiệt này đến từ ALiBi, một trong những lựa chọn kiến trúc quan trọng trong MPT-7B.

Ví dụ: toàn văn của The Great Gatsby có ít hơn 68 nghìn Token. Trong một thử nghiệm, Người viết truyện mẫu đã đọc The Great Gatsby và tạo ra phần kết. Một trong những phần kết của quá trình tạo mô hình được thể hiện trong Hình 2. StoryWriter đọc The Great Gatsby trong khoảng 20 giây (khoảng 150.000 từ mỗi phút). Do độ dài chuỗi dài hơn nên tốc độ "đánh máy" của nó chậm hơn so với các mẫu MPT-7B khác, vào khoảng 105 từ/phút. Mặc dù StoryWriter đã được tinh chỉnh với độ dài ngữ cảnh là 65 nghìn, nhưng ALiBi cho phép mô hình phỏng đoán các đầu vào dài hơn so với khi được đào tạo: 68 nghìn mã thông báo trong trường hợp The Great Gatsby và lên đến 84 nghìn mã thông báo trong thử nghiệm.

Thành lập 2 năm trước, mỗi nhân viên trị giá 21 triệu đô la Mỹ, tại sao MosaicML lại bán được 1,3 tỷ đô la Mỹ?

Hình 2: MPT-7B-StoryWriter-65k+ viết phần kết cho The Great Gatsby. Kết quả của phần kết là cung cấp toàn văn của "The Great Gatsby" (khoảng 68 nghìn mã thông báo) làm đầu vào cho mô hình, theo sau là từ "phần kết" và cho phép mô hình tiếp tục tạo.

Phổ biến công nghệ AI tổng quát

Công nghệ AI sáng tạo là một nhánh của trí tuệ nhân tạo sử dụng lượng lớn dữ liệu và thuật toán học sâu để tự động tạo nội dung như văn bản gốc, hình ảnh và mã máy tính. Sự xuất hiện của công nghệ này cho phép con người xử lý và phân tích dữ liệu thuận tiện hơn và phục vụ tốt hơn nhu cầu của con người. Với sự phát triển nhanh chóng của dữ liệu lớn và công nghệ trí tuệ nhân tạo, công nghệ AI tổng quát đã được sử dụng rộng rãi trong xử lý ngôn ngữ tự nhiên, nhận dạng hình ảnh và thực tế ảo và các lĩnh vực khác. Ví dụ: trong lĩnh vực xử lý ngôn ngữ tự nhiên, GPT-4 đã trở thành một trong những mô hình AI tổng quát phổ biến nhất, có thể được sử dụng cho các tác vụ như tạo bài báo, dịch ngôn ngữ và trả lời câu hỏi. Trong lĩnh vực nhận dạng hình ảnh, StyleGAN2 có thể tạo ra hình ảnh chất lượng cao, có thể được sử dụng trong phát triển trò chơi, sản xuất phim và truyền hình cũng như thực tế ảo.

Naveen Rao, Giám đốc điều hành của MosaicML, trước đây đã tuyên bố rằng kể từ năm 2018, mức độ phức tạp của các mô hình trí tuệ nhân tạo sử dụng lượng lớn dữ liệu để "đào tạo" đã tăng mạnh và việc đào tạo một mô hình hiện tiêu tốn ít nhất hàng triệu đô la. nói chung là không đủ khả năng chi trả. Sau thương vụ mua lại này, sản phẩm chung của nền tảng Databricks' Lakehouse và công nghệ MosaicML sẽ cho phép các doanh nghiệp sử dụng dữ liệu độc quyền của riêng họ để đào tạo và xây dựng các mô hình AI tổng quát một cách đơn giản, nhanh chóng và với chi phí thấp. địa điểm. Theo Databricks, với nền tảng và sự hỗ trợ kỹ thuật của Databricks và MosaicML, chi phí đào tạo và sử dụng LLM cho doanh nghiệp sẽ giảm đáng kể, dự kiến xuống còn hàng nghìn USD. Điều này tạo điều kiện cho việc phổ biến AI tổng quát.

Tầm quan trọng của việc Databricks mua lại MosaicML

Mục đích chính của việc Databricks mua lại MosaicML là để đẩy nhanh quá trình phát triển và dân chủ hóa công nghệ AI tổng quát. Bằng cách tích hợp các công nghệ và nguồn lực của hai công ty, Databricks có thể đáp ứng tốt hơn nhu cầu của khách hàng và cung cấp các giải pháp hiệu quả và thuận tiện hơn. Cụ thể, việc mua lại sẽ mang đến những thay đổi ở các khía cạnh sau:

1. Mô hình ngôn ngữ lớn hiệu quả hơn

Sau khi Databricks mua lại MosaicML, nó có thể tích hợp các mô hình sê-ri MPT vào nền tảng Lakehouse của mình để cung cấp cho khách hàng các mô hình ngôn ngữ lớn hiệu quả hơn và chi phí thấp hơn. Điều này sẽ giúp doanh nghiệp xử lý tốt hơn các tác vụ xử lý ngôn ngữ tự nhiên, nâng cao hiệu quả và độ chính xác trong kinh doanh.

2. Tốc độ đào tạo mô hình nhanh hơn

Các mô hình sê-ri MPT của MosaicML có tính năng đào tạo nhanh, điều này sẽ giúp Databricks cung cấp các dịch vụ đào tạo mô hình nhanh hơn. Điều này đặc biệt quan trọng đối với các doanh nghiệp cần phản ứng nhanh với nhu cầu của thị trường, giúp họ đáp ứng tốt hơn nhu cầu của khách hàng.

3. Dân chủ hóa nhiều hơn

Việc mua lại MosaicML của Databricks cũng có nghĩa là quá trình dân chủ hóa công nghệ AI tổng quát sẽ tiếp tục gia tăng. Các mô hình sê-ri MPT của MosaicML có thể giúp các doanh nghiệp vừa và nhỏ đào tạo các mô hình ngôn ngữ của riêng họ dễ dàng hơn để họ có thể áp dụng tốt hơn công nghệ AI tổng quát và đạt được hiệu quả kinh doanh tốt hơn. Điều này sẽ giúp thúc đẩy sự phát triển và ứng dụng công nghệ trí tuệ nhân tạo AI, đồng thời thúc đẩy việc phổ biến và phát triển công nghệ trí tuệ nhân tạo.

Tóm tắt

Các ứng dụng AI sáng tạo được thiết kế để tạo văn bản thô, hình ảnh và mã máy tính dựa trên tín hiệu ngôn ngữ tự nhiên của người dùng. Sự quan tâm đến công nghệ đã tăng lên kể từ khi công ty khởi nghiệp trí tuệ nhân tạo OpenAI ra mắt ChatGPT, một chatbot AI tổng hợp trực tuyến, vào tháng 11 năm ngoái. "Mọi tổ chức sẽ có thể hưởng lợi từ cuộc cách mạng AI và có nhiều quyền kiểm soát hơn đối với cách dữ liệu của họ được sử dụng. Databricks và MosaicML có cơ hội tuyệt vời để dân chủ hóa AI và biến Lakehouse trở thành cường quốc về thế hệ xây dựng. Nơi tốt nhất cho trí tuệ nhân tạo, ” Ali Ghodsi, đồng sáng lập và CEO của Databricks cho biết.

Ý nghĩa của việc Databricks mua lại MosaicML không chỉ là thúc đẩy sự phát triển và dân chủ hóa công nghệ AI tổng quát mà còn tích hợp các công nghệ và tài nguyên của hai công ty để cung cấp cho khách hàng các giải pháp hiệu quả và thuận tiện hơn. Với sự phát triển và ứng dụng nhanh chóng của công nghệ trí tuệ nhân tạo, công nghệ AI tổng quát sẽ đóng vai trò ngày càng quan trọng, việc Databricks mua lại MosaicML cũng phản ánh tầm quan trọng và sự đầu tư của nhiều công ty theo hướng này. Các công ty như Anthropic và OpenAI cấp phép cho các mô hình ngôn ngữ có sẵn cho các doanh nghiệp, sau đó xây dựng các ứng dụng AI tổng quát trên chúng. Cơ hội đã được tạo ra cho các công ty khởi nghiệp như MosaicML, do nhu cầu thương mại mạnh mẽ đối với các mô hình này. Từ các thương vụ mua lại Snowflake và Databricks liên tiếp, chúng ta có thể thấy rằng các công ty công nghệ lớn đang dần chuyển từ nghiên cứu và phát triển độc lập và đầu tư chiến lược sang mua bán và sáp nhập công nghệ AI.

Nguồn tham khảo:

Xem bản gốc
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
Không có bình luận