Meta'nın yeni yapay zeka silahlarına olan bahsinin gizemini çözüyor: kendi geliştirdiği iki çip + süper bilgi işlem

Orijinal: Tencent Teknolojisi

Geçtiğimiz birkaç yılda Facebook ana şirketi Meta, Metaverse'e büyük yatırımlar yaptı ve sürekli olarak ilgili donanım ve yazılımların geliştirilmesi üzerinde çalışıyor, hatta bu amaçla yapay zeka alanındaki en son trendleri belki de göz ardı ediyor. Ancak üretken yapay zeka patlayınca Meta şirketin yönünü değiştirmiş gibi göründü ve yapay zeka alanında çaba sarf etmeye başladı. ABD'de Perşembe günü yerel saatle Meta, yapay zeka için kendi geliştirdiği iki çipi piyasaya sürdü ve yapay zeka süper hesaplamasındaki son ilerlemesini açıkladı.

Perşembe günü sanal bir etkinlikte Meta, şirketin yeni piyasaya sürülen reklam tasarımı ve oluşturma araçlarına entegre ettiği yeni bir teknoloji olan üretken yapay zekayı çalıştırma desteği de dahil olmak üzere yapay zeka iş yükleri için geliştirdiği dahili altyapıyı gösterdi. Bu, Meta'nın gücünü gösterme girişimidir. Daha önce şirket, yapay zeka dostu donanım sistemlerini benimsemekte yavaş davranarak Google ve Microsoft gibi rakiplerine ayak uydurma becerisini baltaladı.

Meta'nın altyapıdan sorumlu başkan yardımcısı Alexis Bjorling, "Kendi donanım yeteneklerimizi oluşturmak, veri merkezi tasarımından eğitim çerçevelerine kadar yığının her katmanını kontrol etmemizi sağlıyor" dedi ve ekledi: "Yapay zeka araştırmasını ileriye taşımak için bu düzeyde bir dikey entegrasyon gereklidir."

Son on yılda Meta, en iyi veri bilimcileri işe almak ve artık keşif motoruna güç veren yapay zeka, denetleme filtreleri ve uygulamalarındaki ve hizmetlerindeki reklam önerileri dahil olmak üzere yeni yapay zeka türleri oluşturmak için milyarlar harcadı. Ancak şirket, özellikle üretken yapay zeka söz konusu olduğunda, iddialı yapay zeka araştırma yeniliklerinin çoğunu ürünlere dönüştürmek için mücadele etti.

2022 yılına kadar Meta, yapay zeka iş yüklerini yapay zeka algoritmalarını hızlandırmak için tasarlanmış CPU'lar ve özel yongalar kullanarak çalıştıracak. Ancak Meta, 2022'de geniş ölçekte piyasaya sürmeyi planladığı özel çipi iptal etti çünkü bunun için veri merkezlerinin birçoğunun büyük ölçüde yeniden tasarlanmasını gerektirecekti ve bunun yerine milyarlarca dolarlık Nvidia GPU'ları sipariş etti.

AI Hızlandırıcı Çipi

İşleri tersine çevirmek için Meta, 2025'te piyasaya sürülecek olan daha iddialı bir şirket içi çip geliştirmeye başlamayı planlıyor. Bu çip, yapay zeka modellerini eğitmek ve çalıştırmayı desteklemek için kullanılabilir.

Meta, yeni çipi Meta Eğitim ve Çıkarım Hızlandırıcısı veya kısaca MTIA olarak adlandırıyor ve yapay zeka eğitimi ve çıkarım iş yüklerini hızlandırmak için onu bir "çip ailesi" olarak sınıflandırıyor. "Çıkarım", eğitilmiş bir model çalıştırmayı ifade eder. Bir MTIA, uygulamaya özel bir tümleşik devredir (ASIC), farklı devreleri tek bir devre kartı üzerinde birleştiren ve bir veya daha fazla görevi paralel olarak gerçekleştirmek üzere programlanmasına izin veren bir çiptir.

Şekil 1: Yapay zeka iş yükleri için özelleştirilmiş yapay zeka yongaları

Bjorling şöyle devam etti: "Önemli iş yüklerimizde daha iyi verimlilik ve performans elde etmek için model, yazılım yığını ve sistem donanımıyla birlikte tasarlanmış özel bir çözüme ihtiyacımız vardı. Daha iyi bir deneyim sağlamak."

Özel yapay zeka çipleri, büyük teknoloji şirketlerinin giderek artan bir temel unsuru haline geliyor. Google, PaLM-2 ve Imagen gibi büyük üretken yapay zeka sistemlerini eğitmek için bir işlemci TPU (Tensor Processing Unit) geliştirmiştir. Amazon, AWS müşterilerine eğitim (Trainium) ve çıkarım (Inferentia) için tescilli yongalar sağlar. Microsoft'un AMD ile "Athena" adlı kurum içi bir yapay zeka çipi üzerinde çalıştığı bildiriliyor.

Meta, şirketin ilk nesil MTIA'yı (MTIA v1) 2020'de geliştirdiğini ve 7 nm'lik bir süreç kullanarak ürettiğini söyledi. 128 MB'tan 128 GB belleğe genişletilebilir ve Meta tarafından tasarlanan kıyaslamalarda Meta, MTIA'nın "düşük karmaşıklık" ve "orta karmaşıklık" AI modellerini GPU'lardan daha verimli bir şekilde işleyebileceğini iddia ediyor.

Meta, yapay zeka modellerinin boyutu büyüdükçe ve iş yüklerini birden fazla yongaya yayması gerektiğinden, her ikisi de darboğaz olmaya devam eden çip belleği ve ağ oluşturma alanlarında yapılacak çok iş olduğunu söyledi. Tesadüfen, Meta kısa süre önce İngiliz tek boynuzlu at çipi Graphcore'un Oslo merkezli yapay zeka ağ teknolojisi ekibini satın aldı. Halihazırda MTIA'nın odak noktası, Meta uygulama ailesi için "tavsiye iş yükü" konusunda eğitim değil, kesin çıkarımdır.

Ancak Meta, gelişen MTIA'nın tavsiye iş yüklerini çalıştırırken şirketin verimliliğini "önemli ölçüde" artırdığını ve Meta'nın "daha gelişmiş" ve "son teknoloji" yapay zeka iş yüklerini çalıştırmasına izin verdiğini vurguladı.

AI Süper Bilgisayar

Belki gelecekte bir gün Meta, AI iş yüklerinin çoğunu MTIA'ya devredecek. Ancak şimdilik, sosyal ağ devi, araştırma odaklı süper bilgisayarı olan Research SuperCluster'a güveniyor.

Penguin Computing, Nvidia ve Pure Storage tarafından bir araya getirilen Araştırma Üst Kümesi Ocak 2022'de başlayacak ve inşaatın ikinci aşamasını tamamladı. Meta, Research SuperCluster'ın şu anda 16.000 Nvidia A100 GPU'lu toplam 2.000 Nvidia DGX A100 sistemi içerdiğini söyledi.

Öyleyse Meta neden kendi bünyesinde bir süper bilgisayar inşa ediyor? Birincisi, diğer teknoloji devlerinden gelen baskı var. Birkaç yıl önce Microsoft, OpenAI iş birliği içinde geliştirdiği yapay zeka süper bilgisayarını abartmıştı ve geçtiğimiz günlerde Azure bulutu üzerinde yeni bir yapay zeka süper bilgisayarı oluşturmak için Nvidia ile iş birliği yapacağını açıklamıştı. Bu arada Google, Meta'nın süper bilgisayarını çok geride bırakan 26.000 Nvidia H100 GPU'ya sahip kendi yapay zeka süper bilgisayarını da lanse ediyor.

Şekil 2: Meta'nın yapay zeka araştırması için süper bilgisayarı

Ancak Meta, Araştırma Süper Kümesi'nin diğer meslektaşlarına ayak uydurmanın yanı sıra, araştırmacılarının modelleri eğitmek için Meta'nın sisteminden gerçek dünyadan örnekler kullanmasına izin verdiğini söylüyor. Bu, şirketin yalnızca açık kaynaklı ve halka açık veri kümelerinden yararlanabilen önceki yapay zeka altyapısından farklıdır.

Bir Meta sözcüsü şunları söyledi: "Research SuperCluster AI süper bilgisayarı, üretken AI dahil olmak üzere çeşitli alanlarda AI araştırmalarını ilerletmek için kullanılıyor. Bu aslında AI araştırmasının üretkenliği ile yakından ilgilidir. modeller geliştirmek ve onlara yapay zeka geliştirmeyi ilerletmek için bir eğitim platformu sağlamak."

Araştırma Süper Kümesi zirvesinde, Meta'nın dünyanın en hızlı bilgisayarlarından biri olduğunu iddia ettiği 5 exaflop bilgi işlem gücüne ulaşabilir. Meta, büyük bir dil modeli olan LLaMA'yı eğitmek için Research SuperCluster'ı kullandığını söylüyor. Bu yılın başlarında Meta, büyük dil modellerinin "kapalı sürümünde" araştırmacıların erişimine açıldı. Meta, en büyük LLaMA modelinin 2048 A100 GPU'larda eğitildiğini ve 21 gün sürdüğünü söyledi.

Bir Meta sözcüsü, "Araştırma Süper Kümesi, Meta'nın yapay zeka araştırmacılarının yüzlerce farklı dilde sorunsuz bir şekilde çalışarak trilyonlarca örnekten öğrenebilen yeni ve daha iyi yapay zeka modelleri oluşturmasına yardımcı olacak" dedi. araçlar ve daha fazlası."

Video Dönüştürücü

Meta, MTIA'ya ek olarak, belirli bilgi işlem iş yüklerini işlemek için başka bir çip geliştiriyor. Çip, Meta Ölçeklenebilir Video İşlemcisi veya kısaca MSVP olarak adlandırılır ve Meta'nın kendi bünyesinde geliştirdiği ilk uygulamaya özel tümleşik devre (ASIC) çözümüdür ve özellikle isteğe bağlı video ve akışın işleme taleplerini karşılamak için tasarlanmıştır.

Bazılarının hatırlayabileceği gibi, Meta yıllar önce özel sunucu tarafı video çipleri tasarlamaya başladı ve 2019'da video kod dönüştürme ve çıkarım için bir ASIC duyurdu. MSVP, bu çabaların meyvelerinden biri ve akış alanında yenilenen rekabetin bir sonucudur.

"Yalnızca Facebook'ta insanlar zamanlarının %50'sini video izleyerek geçiriyor. Dünya çapında çeşitli cihazlara (mobil cihazlar, dizüstü bilgisayarlar, TV'ler vb.) Hizmet vermemiz gerekiyor, örneğin, Facebook veya Instagram'a yüklenen videolar birden çok videoya dönüştürülüyor. farklı kodlama formatlarına, çözünürlüklere ve kalitelere sahip bit akışları, MSVP programlanabilir ve ölçeklenebilir ve VOD için gerekli olan yüksek kaliteli kod çevriminin yanı sıra canlı yayın için gereken düşük gecikme süresi ve daha hızlı işlem sürelerini verimli bir şekilde desteklemek üzere yapılandırılabilir."

Şekil 3: Meta'nın özel silikonu, akış ve kod dönüştürme gibi video iş yüklerini hızlandırmak için tasarlanmıştır

Meta, şirketin planının, yalnızca belirli özelleştirme ve "önemli ölçüde" iyileştirilmiş kalite gerektiren iş yükleri için yazılım video kodlamasını kullanarak "istikrarlı ve olgun" video işleme iş yüklerinin çoğunu sonunda MSVP'ye boşaltmak olduğunu söyledi. Meta ayrıca, MSVP'nin çalışmalarının, akıllı gürültü giderme ve görüntü geliştirme gibi ön işleme yöntemleri ve artifakt kaldırma ve süper çözünürlük gibi son işleme yöntemleri yoluyla video kalitesini iyileştirmeye devam ettiğini söyledi.

Reddy ve Chen Yunqing, "Gelecekte MSVP, üretken yapay zeka, AR/VR ve diğer sanal gerçeklik içeriğinin verimli bir şekilde sunulmasını sağlayan kısa videolar da dahil olmak üzere Meta'nın en önemli kullanım durumlarını ve gereksinimlerini daha fazla desteklememizi sağlayacak" dedi.

Yapay Zekaya Odaklanma

En son donanım duyuruları arasında ortak bir nokta varsa, o da Meta'nın, özellikle üretken yapay zeka söz konusu olduğunda, yapay zeka geliştirme hızını umutsuzca hızlandırmaya çalışmasıdır.

Bu yılın Şubat ayında, Meta CEO'su Mark Zuckerberg'in Meta'nın yapay zeka bilgi işlem gücünü geliştirmeyi birinci öncelik haline getirdiği ve kendi sözleriyle şirkete geliştirme sağlayacak yeni bir üst düzey üretken yapay zeka ekibinin kurulduğunu duyurduğu söylendi. "turbo şarj". Meta CTO'su Andrew Bosworth da geçtiğimiz günlerde üretken yapay zekanın kendisinin ve Zuckerberg'in en çok zaman geçirdiği alan olduğunu söyledi. Meta'nın baş bilim adamı Yang Likun'a göre şirket, sanal gerçeklikte nesneler yaratmak için üretken yapay zeka araçlarını kullanmayı planlıyor.

Nisan ayında Zuckerberg, Meta'nın ilk çeyrek kazanç çağrısında şunları söyledi: "WhatsApp ve Messenger'daki sohbet deneyimlerini, Facebook ve Instagram'daki gönderiler ve reklamlar için görsel oluşturma araçlarını ve zaman içinde video ve çok modlu bir deneyimi keşfediyoruz. Umarım bunlar araçlar, sıradan insanlardan içerik oluşturuculara ve işletmelere kadar herkes için değerli olacak. Örneğin, bu deneyimi edindikten sonra, teslimat ve müşteri desteğinde AI aracılarına ticari bilgilerle ilgilenen birçok kişinin ilgileneceğini tahmin ediyorum. Zaman içinde , bu aynı zamanda insanların avatarlar, nesneler, dünyalar yaratmasının ve hepsini bir koda bağlamasının daha kolay olacağı sanal dünyalardaki çalışmalarımıza da uzanacak."

Bazı açılardan Meta, şirketin üretken yapay zeka için devasa potansiyel pazardan bir parça yakalamak için yeterince hızlı hareket etmediğinden endişe duyan yatırımcıların artan baskısını hissediyor. Şu anda şirketin Bard, Bing veya ChatGPT gibi sohbet robotlarıyla rekabet edebilecek bir ürünü yok. Patlayıcı büyümenin bir başka kilit alanı olan görüntü oluşturma konusunda da fazla ilerleme kaydedilmedi.

Bu tahminler doğruysa, üretken yapay zeka yazılımı için ele alınabilir toplam pazar büyüklüğü 150 milyar dolara ulaşabilir. ABD yatırım bankası Goldman Sachs, bunun GSYİH'yı %7 artıracağını tahmin ediyor.

Bazı tahminler gerçekleşse bile, artırılmış gerçeklik kulaklıklarına, konferans yazılımlarına ve Horizon Worlds gibi Metaverse teknolojilerine yapılan Metaverse yatırımlarında kaybedilen milyarları telafi edebilir. Meta'nın artırılmış gerçeklik bölümü Reality Labs, geçen çeyrekte 4 milyar dolarlık net zarar bildirdi ve işletme zararlarının 2023 boyunca artmaya devam etmesini bekliyor.

Orijinali Görüntüle
  • Bahşiş
  • Yorum
  • Paylaş
Yorum
Yorum yok
  • Konu