Làm sáng tỏ vụ đặt cược của Meta vào vũ khí trí tuệ nhân tạo mới: hai con chip tự phát triển + siêu máy tính

Bản gốc: Công nghệ Tencent

Trong vài năm qua, công ty mẹ Meta của Facebook đã đầu tư rất nhiều vào Metaverse và liên tục làm việc để phát triển phần cứng và phần mềm liên quan, thậm chí có thể bỏ qua các xu hướng mới nhất trong lĩnh vực trí tuệ nhân tạo cho mục đích này. Nhưng khi trí tuệ nhân tạo bùng nổ, Meta dường như định hướng lại công ty và bắt đầu nỗ lực trong lĩnh vực trí tuệ nhân tạo. Vào thứ Năm theo giờ địa phương tại Hoa Kỳ, Meta đã phát hành hai con chip tự phát triển cho trí tuệ nhân tạo và tiết lộ tiến bộ mới nhất của mình trong siêu máy tính trí tuệ nhân tạo.

Tại một sự kiện ảo vào thứ Năm, Meta đã trình diễn cơ sở hạ tầng nội bộ mà công ty đã phát triển cho khối lượng công việc AI, bao gồm hỗ trợ chạy AI tổng quát, một công nghệ mới mà công ty đã tích hợp vào các công cụ tạo và thiết kế quảng cáo mới ra mắt của mình. . Đây là một nỗ lực của Meta để thể hiện sức mạnh của nó. Trước đây, công ty đã chậm áp dụng các hệ thống phần cứng thân thiện với AI, làm suy yếu khả năng theo kịp các đối thủ như Google và Microsoft.

Alexis Bjorling, phó chủ tịch cơ sở hạ tầng của Meta cho biết: "Việc xây dựng khả năng phần cứng của riêng mình cho phép chúng tôi kiểm soát mọi lớp của ngăn xếp, từ thiết kế trung tâm dữ liệu đến khung đào tạo. "Mức độ tích hợp dọc này là cần thiết để thúc đẩy nghiên cứu AI tiến lên phía trước."

Trong khoảng một thập kỷ qua, Meta đã chi hàng tỷ USD để tuyển dụng các nhà khoa học dữ liệu hàng đầu và xây dựng các loại trí tuệ nhân tạo mới, bao gồm cả trí tuệ nhân tạo hiện cung cấp năng lượng cho công cụ khám phá, bộ lọc kiểm duyệt và đề xuất quảng cáo trong các ứng dụng và dịch vụ của mình. Nhưng công ty đã phải vật lộn để biến nhiều đổi mới nghiên cứu AI đầy tham vọng của mình thành sản phẩm, đặc biệt là khi nói đến AI tổng hợp.

Cho đến năm 2022, Meta sẽ chạy khối lượng công việc AI của mình bằng cách sử dụng CPU và chip tùy chỉnh được thiết kế để tăng tốc các thuật toán AI. Nhưng Meta đã hủy bỏ con chip tùy chỉnh mà họ dự định tung ra trên quy mô lớn vào năm 2022 vì nó sẽ yêu cầu thiết kế lại lớn một số trung tâm dữ liệu của mình và thay vào đó đặt hàng GPU Nvidia trị giá hàng tỷ đô la.

Chip tăng tốc trí tuệ nhân tạo

Để xoay chuyển tình thế, Meta có kế hoạch bắt đầu phát triển một con chip nội bộ tham vọng hơn, dự kiến ra mắt vào năm 2025. Con chip này có thể được sử dụng để đào tạo các mô hình trí tuệ nhân tạo và cũng hỗ trợ chạy chúng.

Meta gọi loại chip mới này là Meta Training and Inference Accelerator, viết tắt là MTIA, và phân loại nó là một "họ chip" để tăng tốc khối lượng công việc đào tạo AI và suy luận. "Suy luận" đề cập đến việc chạy một mô hình được đào tạo. MTIA là một mạch tích hợp dành riêng cho ứng dụng (ASIC), một con chip kết hợp các mạch khác nhau trên một bảng mạch duy nhất, cho phép nó được lập trình để thực hiện song song một hoặc nhiều tác vụ.

Hình 1: Chip AI được tùy chỉnh cho khối lượng công việc AI

Bjorling tiếp tục: "Để đạt được hiệu quả và hiệu suất tốt hơn trong các khối lượng công việc quan trọng của mình, chúng tôi cần một giải pháp tùy chỉnh được đồng thiết kế với mô hình, ngăn xếp phần mềm và phần cứng hệ thống. Mang lại trải nghiệm tốt hơn.”

Chip trí tuệ nhân tạo tùy chỉnh đang ngày càng trở thành một mặt hàng chủ lực của các công ty công nghệ lớn. Google đã phát triển một bộ xử lý TPU (Bộ xử lý Tensor) để đào tạo các hệ thống trí tuệ nhân tạo tổng quát lớn như PaLM-2 và Imagen. Amazon cung cấp cho khách hàng AWS chip độc quyền để đào tạo (Trainium) và suy luận (Inferentia). Microsoft được cho là đang làm việc với AMD trên chip trí tuệ nhân tạo nội bộ có tên "Athena".

Meta cho biết công ty đã phát triển thế hệ MTIA đầu tiên (MTIA v1) vào năm 2020 và sản xuất nó bằng quy trình 7nm. Nó có thể mở rộng từ 128 MB bộ nhớ lên 128 GB và trong các điểm chuẩn do Meta thiết kế, Meta tuyên bố rằng MTIA có thể xử lý các mô hình AI "độ phức tạp thấp" và "độ phức tạp trung bình" hiệu quả hơn GPU.

Meta cho biết vẫn còn rất nhiều việc phải làm trong lĩnh vực bộ nhớ chip và kết nối mạng, cả hai đều là nút thắt cổ chai khi các mô hình AI ngày càng lớn và cần phân bổ khối lượng công việc trên nhiều chip. Thật trùng hợp, Meta gần đây đã mua lại nhóm công nghệ mạng trí tuệ nhân tạo có trụ sở tại Oslo của kỳ lân chip Graphcore của Anh. Như hiện tại, trọng tâm của MTIA là suy luận nghiêm ngặt, chứ không phải đào tạo, về "khối lượng công việc đề xuất" cho dòng ứng dụng Meta.

Nhưng Meta nhấn mạnh rằng MTIA cải tiến đã cải thiện "đáng kể" hiệu quả của công ty khi chạy khối lượng công việc đề xuất, cho phép Meta chạy khối lượng công việc AI "nâng cao hơn" và "tiên tiến".

Siêu máy tính AI

Có lẽ một ngày nào đó trong tương lai, Meta sẽ bàn giao hầu hết khối lượng công việc AI của mình cho MTIA. Nhưng hiện tại, gã khổng lồ mạng xã hội đang dựa vào Research SuperCluster, siêu máy tính tập trung vào nghiên cứu của mình.

Research SuperCluster sẽ ra mắt vào tháng 1 năm 2022, được lắp ráp bởi Penguin Computing, Nvidia và Pure Storage và đã hoàn thành giai đoạn xây dựng thứ hai. Meta cho biết Research SuperCluster hiện có tổng cộng 2.000 hệ thống Nvidia DGX A100 với 16.000 GPU Nvidia A100.

Vậy tại sao Meta lại xây dựng một siêu máy tính nội bộ? Đầu tiên là áp lực từ những gã khổng lồ công nghệ khác. Vài năm trước, Microsoft đã thổi phồng siêu máy tính trí tuệ nhân tạo được phát triển với sự hợp tác của OpenAI và gần đây cho biết sẽ hợp tác với Nvidia để xây dựng một siêu máy tính trí tuệ nhân tạo mới trên đám mây Azure. Trong khi đó, Google cũng đang chào hàng siêu máy tính trí tuệ nhân tạo của riêng mình, có 26.000 GPU Nvidia H100, vượt xa siêu máy tính của Meta.

Hình 2: Siêu máy tính nghiên cứu trí tuệ nhân tạo của Meta

Nhưng Meta nói rằng ngoài việc theo kịp các đồng nghiệp khác, Research SuperCluster cho phép các nhà nghiên cứu của mình sử dụng các ví dụ thực tế từ hệ thống của Meta để đào tạo các mô hình. Điều này khác với cơ sở hạ tầng AI trước đây của công ty, vốn chỉ có thể tận dụng các bộ dữ liệu mã nguồn mở và có sẵn công khai.

Người phát ngôn của Meta cho biết: "Siêu máy tính Research SuperCluster AI được sử dụng để thúc đẩy nghiên cứu AI trong một số lĩnh vực, bao gồm cả AI tổng quát. Điều này thực sự liên quan chặt chẽ đến năng suất của nghiên cứu AI. Cung cấp cơ sở hạ tầng tiên tiến nhất để cho phép họ thực hiện phát triển các mô hình và cung cấp cho họ một nền tảng đào tạo để thúc đẩy sự phát triển của AI."

Ở thời kỳ đỉnh cao, Research SuperCluster có thể đạt được sức mạnh tính toán 5 exaflop, mà Meta tuyên bố là một trong những máy tính nhanh nhất trên thế giới. Meta cho biết họ sử dụng Research SuperCluster để đào tạo LLaMA, một mô hình ngôn ngữ lớn. Đầu năm nay, Meta đã mở ra quyền truy cập cho các nhà nghiên cứu trong một "bản phát hành kín" của các mô hình ngôn ngữ lớn. Meta cho biết mô hình LLaMA lớn nhất đã được đào tạo trên 2048 GPU A100 và mất 21 ngày.

Người phát ngôn của Meta cho biết: "Research SuperCluster sẽ giúp các nhà nghiên cứu AI của Meta xây dựng các mô hình AI mới và tốt hơn, có thể học hỏi từ hàng nghìn tỷ ví dụ, hoạt động trên hàng trăm ngôn ngữ khác nhau một cách liền mạch". công cụ, và nhiều hơn nữa."

Bộ chuyển mã video

Ngoài MTIA, Meta đang phát triển một con chip khác để xử lý các loại khối lượng công việc điện toán cụ thể. Được mệnh danh là Bộ xử lý video có thể mở rộng Meta, hay viết tắt là MSVP, con chip này là giải pháp mạch tích hợp dành riêng cho ứng dụng (ASIC) đầu tiên của Meta được phát triển nội bộ và được thiết kế đặc biệt để xử lý nhu cầu xử lý video theo yêu cầu và phát trực tuyến.

Như một số người có thể nhớ lại, Meta đã bắt đầu hình thành chip video phía máy chủ tùy chỉnh từ nhiều năm trước và vào năm 2019 đã công bố ASIC để chuyển mã và suy luận video. MSVP là một trong những thành quả của những nỗ lực này và là kết quả của sự cạnh tranh mới trong không gian phát trực tuyến.

"Chỉ riêng trên Facebook, mọi người dành 50% thời gian để xem video. Chúng tôi cần phục vụ nhiều thiết bị khác nhau trên khắp thế giới (như thiết bị di động, máy tính xách tay, TV, v.v.), chẳng hạn như video tải lên Facebook hoặc Instagram được chuyển mã thành nhiều các luồng bit với các định dạng, độ phân giải và chất lượng mã hóa khác nhau, MSVP có thể lập trình và có thể mở rộng, đồng thời có thể được định cấu hình để hỗ trợ hiệu quả quá trình chuyển mã chất lượng cao cần thiết cho VOD, cũng như độ trễ thấp và thời gian xử lý nhanh hơn cần thiết cho phát sóng trực tiếp."

Hình 3: Silicon tùy chỉnh của Meta được thiết kế để tăng tốc khối lượng công việc video như phát trực tuyến và chuyển mã

Meta cho biết kế hoạch của công ty cuối cùng là giảm tải phần lớn khối lượng công việc xử lý video "ổn định và trưởng thành" sang MSVP, chỉ sử dụng mã hóa video phần mềm cho khối lượng công việc yêu cầu tùy chỉnh cụ thể và chất lượng được cải thiện "đáng kể". Meta cũng cho biết công việc của MSVP tiếp tục cải thiện chất lượng video thông qua các phương pháp tiền xử lý như khử nhiễu thông minh và nâng cao hình ảnh cũng như các phương pháp xử lý hậu kỳ như loại bỏ tạo tác và siêu phân giải.

Reddy và Chen Yunqing cho biết: "Trong tương lai, MSVP sẽ cho phép chúng tôi hỗ trợ nhiều trường hợp sử dụng và yêu cầu quan trọng nhất của Meta, bao gồm các video ngắn, cho phép phân phối hiệu quả trí tuệ nhân tạo tổng quát, AR/VR và nội dung thực tế ảo khác".

Lấy nét AI

Nếu có một chủ đề chung giữa các thông báo phần cứng mới nhất, thì đó là Meta đang cố gắng hết sức để đẩy nhanh tốc độ phát triển AI, đặc biệt là khi nói đến AI tổng quát.

Vào tháng 2 năm nay, Giám đốc điều hành Meta Mark Zuckerberg được cho là đã ưu tiên hàng đầu cho việc cải thiện sức mạnh tính toán AI của Meta, thông báo về việc thành lập một nhóm AI tổng hợp cấp cao mới, theo cách nói của ông, sẽ cung cấp cho công ty sự phát triển của "sạc turbo". CTO của Meta, Andrew Bosworth gần đây cũng cho biết AI tổng quát là lĩnh vực mà ông và Zuckerberg dành nhiều thời gian nhất. Theo Yang Likun, nhà khoa học trưởng của Meta, công ty có kế hoạch triển khai các công cụ trí tuệ nhân tạo tổng quát để tạo ra các vật thể trong thực tế ảo.

Vào tháng 4, Zuckerberg cho biết trong cuộc gọi thu nhập quý đầu tiên của Meta: "Chúng tôi đang khám phá trải nghiệm trò chuyện trong WhatsApp và Messenger, các công cụ tạo hình ảnh cho bài đăng và quảng cáo trên Facebook và Instagram cũng như video theo thời gian và trải nghiệm đa phương thức. Tôi hy vọng những điều này các công cụ sẽ có giá trị với tất cả mọi người, từ những người bình thường đến những người sáng tạo đến các doanh nghiệp. Ví dụ: tôi dự đoán rằng một khi chúng tôi có được trải nghiệm này, sẽ có rất nhiều người quan tâm đến thông tin kinh doanh. Quan tâm đến các đại lý AI trong việc giao hàng và hỗ trợ khách hàng. Theo thời gian điều này cũng sẽ mở rộng sang công việc của chúng tôi trong thế giới ảo, nơi mọi người sẽ dễ dàng tạo hình đại diện, đồ vật, thế giới và liên kết tất cả mã đó lại với nhau."

Theo một cách nào đó, Meta đang cảm thấy áp lực ngày càng lớn từ các nhà đầu tư lo ngại rằng công ty không di chuyển đủ nhanh để chiếm được một phần thị trường tiềm năng khổng lồ cho trí tuệ nhân tạo sáng tạo. Hiện hãng chưa có sản phẩm nào có thể cạnh tranh với các chatbot như Bard, Bing hay ChatGPT. Cũng không có nhiều tiến bộ trong việc tạo hình ảnh, một lĩnh vực quan trọng khác của sự phát triển bùng nổ.

Nếu những dự đoán này là chính xác, tổng quy mô thị trường có thể định địa chỉ cho phần mềm AI tổng hợp có thể đạt tới 150 tỷ USD. Ngân hàng đầu tư Goldman Sachs của Mỹ dự đoán rằng điều này sẽ làm tăng GDP thêm 7%.

Ngay cả khi một số dự đoán của nó trở thành sự thật, nó có thể bù đắp hàng tỷ đô la bị mất trong các khoản đầu tư của Metaverse vào tai nghe thực tế tăng cường, phần mềm hội nghị và các công nghệ Metaverse như Horizon Worlds. Reality Labs, bộ phận thực tế tăng cường của Meta, đã báo lỗ ròng 4 tỷ đô la trong quý trước và dự kiến khoản lỗ hoạt động sẽ tiếp tục gia tăng trong suốt năm 2023.

Xem bản gốc
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
Không có bình luận
  • Chủ đề