Görsel kaynağı: Unbounded AI tarafından oluşturuldu
ChatGPT'nin geçen yılın sonunda piyasaya sürülmesinden sonra Çinli şirketler en az 79 temel büyük model yayınladı. Ancak, büyük modellerin çoğu, dış dünya tarafından ChatGPT ile teknik bir boşluğa sahip olarak kabul edilir. Büyük ölçekli model işi kapıda Çin'in ne tür büyük ölçekli bir modele ihtiyacı var?
Aralık 2022'de, Microsoft'un yatırım yaptığı bir yapay zeka başlangıç şirketi olan OpenAI, sohbete dayalı bir yapay zeka ChatGPT'yi kullanıma sundu. ChatGPT, temelde OpenAI tarafından bağımsız olarak geliştirilen ve yaklaşık 180 milyar parametre içeren büyük bir GPT dili modelidir. Bu yılın Şubat ayında Nvidia CEO'su Huang Renxun, "ChatGPT, AI için iPhone anını başlattı" yorumunu yaptı. Huang Renxun, büyük modellerin uygulama geliştirme eşiğini düşürdüğüne ve tüm uygulamaların büyük modellerle yeniden yapılmaya değer olduğuna inanıyor.
Bu Huang Renxun'un ailesinin sözleri değil, herkes fırsatı görüyor. Bu yıl Mart ayından itibaren Çinli şirketler de büyük ölçekli model ürünleri piyasaya sürmek için yarışıyor. Bunlar arasında Baidu'nun Wenxin modeli, Ali'nin Tongyi modeli ve Tencent'in endüstri modeli gibi en iyi şirketlerin yanı sıra Xunfei ve SenseTime gibi endüstri şirketlerinin yanı sıra bir dizi yeni şirket yer alıyor. Mayıs ayında, Bilim ve Teknoloji Bakanlığı bünyesindeki Çin Bilimsel ve Teknolojik Bilgi Enstitüsü, "Çin'in Yapay Zeka Büyük Model Haritası Üzerine Araştırma Raporu"nu yayınladı. Rapora göre, 28 Mayıs itibarıyla Çin'de parametreleri 1 milyarın üzerinde olan en az 79 temel büyük ölçekli model piyasaya sürüldü.
Modelin parametre sayısı önemlidir. Şu anda Baidu ve Ali gibi önde gelen şirketler, Wenxin ve Tongyi'nin parametre hacminin genellikle 100 milyar seviyesinde olduğunu, örneğin Wenxin büyük modelinin parametre hacminin 260 milyar olduğunu duyuruyor. Diğer işletmelerin veya start-up şirketlerin büyük modellerinin parametreleri genellikle 10 milyar veya 1 milyar düzeyindedir.
**Şu anda piyasada bulunan AI modellerinin tümü "büyük modeller" olarak adlandırılsa da, parametre sayısı varsayılan olarak büyük modeller ve küçük modeller için tanımlayıcı faktörlerden biri olarak kabul edilir. **Baidu Group başkan yardımcısı Hou Zhenyu, Caijing muhabirine 2022'de 1 milyar parametreye sahip bir modele büyük model denildiğini söyledi. Ancak mevcut büyük model parametreleri genellikle yüz milyarlarcadır. Çünkü "akıllı çıkış" etkisi 100 milyardan fazla parametre ile ortaya çıkacağı için genelleme yeteneği oluşacak ve çeşitli senaryolarda evrensel yetenek oluşacaktır. Bu büyük modele dayalı ince ayarlı model, daha iyi endüstriyel uygulama etkisine sahiptir.
**"Akıllı çıkış" etkisi, model ölçeği ve bilgi işlem gücü seviyesinin belirli bir parametre eşiğini aşmasının ardından AI etkisinin artık rastgele bir olasılık olayı olmayacağı gerçeğini ifade eder. **Genel alanda, parametre miktarı ne kadar fazlaysa, genel olarak istihbaratın ortaya çıkma olasılığı ve yapay zekanın doğruluğu o kadar yüksek olur. Özel dikey alanda, büyük parametreli model kırpıldıktan ve optimize edildikten sonra doğru sonuçlar elde etmek daha kolaydır.
Çin'de en az 79 büyük ölçekli model ortaya çıkmış olsa da, Caijing'in görüştüğü birçok sektör profesyoneli, büyük ölçekli modellerin bilgi işlem gücü, algoritmalar ve veri birikimi gerektirdiğine inanıyor. Yüksek performanslı GPU yongalarının kıtlığı, yüksek donanım satın alma maliyetleri ve yüksek işletme maliyetleri nedeniyle, Çin'de büyük modellerin ticarileştirilmesi yoluyla çalışacak sermaye rezervlerine, stratejik iradeye ve pratik yeteneklere sahip çok az şirket var. "Yüz Model Savaşı"nda, ürünlerin çoğu ile ChatGPT arasında gerçekten de bir boşluk var.
Kargaşadan sonra, büyük model çılgınlığı yavaş yavaş gerçeğe dönüyor. Yurtiçi ve yurtdışındaki büyük ölçekli model pazarında daha rasyonel düşünme ortaya çıkıyor - ticarileştirilemeyen ChatGPT sadece bir oyuncak olabilir ve kurumsal bir uygulamaya dönüşebilen büyük ölçekli bir model endüstriyel değere sahiptir.
Apple, Samsung ve JPMorgan Chase gibi şirketler, güvenlik endişeleri nedeniyle çalışanlarının ChatGPT kullanmasını yasakladı. Öte yandan, ChatGPT kullanıcılarının büyümesi ve elde tutulması da bir darboğaza ulaştı. BenzerWeb web sitesi analiz aracından alınan verilere göre, ChatGPT'nin Ocak-Mayıs dönemindeki trafik artış oranları %131,6, %62,5, %55,8, %12,6 ve %2,8 olarak gerçekleşti. Haziran başında bir Morgan Stanley anketi, yanıt verenlerin yalnızca %19'unun ChatGPT kullandıklarını ve yalnızca %4'ünün ChatGPT'ye güvendiklerini söylediğini gösterdi.
Hou Zhenyu, "Bu yılın Mart ayında, müşteriler bizimle büyük ölçekli modellerin ihtiyaçları hakkında ilk kez konuşmaya başladıklarında, hepsi hayal güçlerini kullanarak daha fazla bilimkurgu istiyorlardı. Ancak Nisan'dan sonra, büyük- ölçekli modeller ortaya çıktı ve herkes yavaşladı. Yavaş yavaş daha gerçek ihtiyaçları gördü.” Sübjektif ve nesnel faktörlerin etkisi altında, küresel temel büyük ölçekli modeller esas olarak To B endüstri pazarına yöneliktir.
**To C ucunda büyük modellerin ticarileştirilmesi yavaştır. **Şu anda, yüksek işlem gücü maliyeti gibi sorunlarla karşı karşıyayız ve kullanıcı ölçeği ne kadar büyük olursa, işletmelerin kayıpları da o kadar büyük olur. Yanlış "gürültü" çıkarmak da kaçınılmazdır ve hatta bilgi sızıntısı ve politika denetimi gibi etik zorluklar vardır. Microsoft bile yalnızca araç ürünlerinde (ofis ofis paketleri, web tarayıcıları, Photoshop gibi fotoğraf düzenleme araçları) büyük modeller kullanır. Microsoft'un araç şirketlerine hizmet satmasının özü, hâlâ B'ye ticarileştirmedir.
**B-end kurumsal müşteriler için büyük modeller uygulamak pragmatik bir yaklaşımdır. **Endüstri pazarında müşteri ihtiyaçları güçlü ve nettir. Tüm dünyada perakende, finans, üretim, devlet ve diğer alanlar, akıllı yükseltmeler için büyük modellere güveniyor. Endüstri fikir birliği, büyük bir model temelinde endüstri bilgisine dayalı olarak ince ayar yapılmış bir modelin, optimize edilmemiş genel amaçlı büyük bir modelden daha iyi performans göstereceği yönündedir.
Pazar araştırma şirketi IDC tarafından bu yılın Mayıs ayında yayınlanan verilere göre, Çin'in yapay zeka pazarının 2022'deki toplam büyüklüğü, 8,13 milyar ABD doları donanım, 2,69 milyar ABD doları yazılım ve 1,41 milyar ABD doları hizmetler dahil olmak üzere 12,2 milyar ABD doları olacak. IDC, 2026'da Çin'in yapay zeka pazarının, donanım için 14,85 milyar ABD doları, yazılım için 7,69 milyar ABD doları ve hizmetler için 3,89 milyar ABD doları olmak üzere 26,9 milyar ABD dolarına ulaşacağını tahmin ediyor. Donanım, yazılım ve hizmetlerin bileşik yıllık büyüme oranları sırasıyla %15,1, %32,0 ve %28,5'tir.
Fanatizm her zaman gerçeğe döner. Haziran ayında "Finans", Baidu Group başkan yardımcısı Hou Zhenyu ve Baidu Smart Cloud başkan yardımcısı Zhu Yong ile "Çin'in gerçekten ne tür bir modele ihtiyacı var?" konulu bir diyalog gerçekleştirdi Hou Zhenyu ve Zhu Yong Baidu Wenxin Qianfan'a derinden katıldı Bu konuşmada üç ana konuyu tartıştık: bir model platformun oluşturulması ve ticari bir ekolojinin şekillendirilmesi: Büyük bir model lüks bir oyun mudur? İşletmenin ne tür bir büyük modele ihtiyacı var? Büyük model pazarında bir balon var mı?
Muhatap Profili:
Baidu Group başkan yardımcısı Hou Zhenyu (Baidu Smart Cloud Business Group'un bulut bilgi işlem üretim araştırma ekibinden ve temel teknoloji mühendisliği ekibinden sorumlu)
Baidu Akıllı Bulut Başkan Yardımcısı Zhu Yong (Baidu Akıllı Bulut Uygulama Ürün Merkezinden sorumlu)
Sunucu: Xie Lirong, Caijing Magazine Genel Yayın Yönetmeni Yardımcısı
Aşağıda, diyalog kaydının kısaltılmış bir versiyonu bulunmaktadır:
**Büyük model lüks bir oyun mu? **
** "Finansal" Xie Lirong: Çin, büyük ölçekli bir girişimcilik dalgası başlattı ve büyük ölçekli modeller için eşik çok yüksek, ancak Çin pazarının mevcut durumu, giriş hızı ve ölçeği? **
Zhu Yong: Büyük modeller için eşik görecelidir ve farklı türde oyuncular olacaktır. İlk kategori Baidu ile aynıdır ve sıfırdan temel bir büyük model oluşturur. Bunun bilgi işlem gücü, algoritmalar, veriler ve yetenekler için çok yüksek gereksinimleri vardır.
Verileri örnek olarak alırsak, temel büyük model, İnternet verileri, profesyonel saha verileri, haber bilgileri verileri ve yüksek kaliteli profesyonel olarak etiketlenmiş veriler dahil olmak üzere çok sayıda veri eğitimi gerektirir. Bilgi işlem gücünü örnek olarak alırsak, ChatGPT gibi yüz milyarlarca parametreye sahip büyük bir modelin, NVIDIA'nın en üst düzey A100/H100 GPU'su ile 100 gün boyunca sürekli olarak eğitilmesi gerekir. Algoritmalar ve yetenekler de önemlidir. Tıpkı farklı şeflerin aynı ham maddeye dayalı farklı tatlarda yemekler pişirmesi gibi, mühendislerin de farklı eğitim yöntemleri vardır. Bu, uzun vadeli pratik deneyim birikimini gerektirir, bu nedenle eşik çok yüksektir.
İkinci kategori, temel büyük modelin yeteneklerine dayalı olarak biraz ince ayar ve hedefli özelleştirme gerektiren büyük endüstri modelidir. Bu, geçmişte sıfırdan veri etiketleme ve algoritma ince ayarının maliyetinden çok daha düşük. Üçüncü kategori, ilk iki büyük modele dayalı uygulamalar geliştirir.Baidu, diğer şirketler ve hatta bazı açık kaynak platformları, yazılım geliştirme eşiğini düşürmek için geliştirme araçları sağlar.
**Hou Zhenyu:**Şahsen Çin'in büyük ölçekli modellerinin küresel pazarda hâlâ lider durumda olduğunu düşünüyorum. Büyük ölçekli model geliştirme ve arama motoru geliştirme aslında benzerdir ve her ikisi de çok derin teknik birikim gerektirir. Küresel bir bakış açısından, arama motoru teknolojisinde bağımsız araştırma ve geliştirme yapan yalnızca birkaç ülke vardır. Şu anda, Çin ve Amerika Birleşik Devletleri tamamen bağımsız olarak büyük ölçekli model teknolojisi geliştirebilen tek iki ülke olabilir.
** "Finans" Xie Lirong: Büyük modellerde mutlak ilerleme ve gerilik var mı? **
**Hou Zhenyu: **Büyük modeller kesinlikle iyi ya da kötü değildir. Farklı alanlarda belirli farklılıklar gösterse de akıllı telefon seçmek gibidir. Kimi Apple kullanıyor, kimi Android kullanıyor, en uygunu en iyisidir. Büyük model ilk kez piyasaya sürüldüğünde, insanlar genellikle bu model hakkında bazı zor sorular sordu. Ama aslında, gerçekten ciddi bir kurumsal düzeyde ortamda, bu tür senaryolar çok azdır. İşletmelerin iş senaryolarına göre kendilerine daha uygun olan büyük bir model seçmeleri gerekiyor. Özellikle Çinli firmaların Çinceyi daha iyi anlayan ve Çinli firmaların özelliklerine uygun ürünleri seçmesi gerekiyor.
** "Finans" Xie Lirong: Baidu büyük ölçekli modele ne kadar kaynak ve yetenek yatırımı yaptı? **
**Hou Zhenyu: **AI büyük ölçekli modeli, Baidu'nun sürekli ve kapsamlı yüksek yoğunluklu yatırım gerektiren temel stratejisidir. Hesaplama gücünü örnek alırsak, geçmişte biriktirdiğimiz GPU sayısının birikimi onbinlerle ölçülür ki bu çok büyük bir yatırımdır. Baidu ayrıca, modelleri daha hızlı ve daha iyi eğitmek için yıllar içinde eksiksiz bir takım zincirleri geliştirdi.
Baidu, son 10 yılda yapay zekaya 100 milyar yuan'dan fazla yatırım yaptı. Bir teknoloji şirketi olarak Baidu, her yıl gelirinin %20'sinden fazlasını Ar-Ge'ye harcıyor. (Açıklamalar: 2019'dan sonra, Baidu'nun temel Ar-Ge harcamaları uzun bir süre gelirin %20'sinden fazlasını oluşturdu. 2022'de Baidu'nun Ar-Ge harcama oranı %24 oldu ve Çinli teknoloji şirketleri arasında Huawei'nin %25'ten sonra ikinci sırada yer aldı. Aiqi Baidu'nun sanattan sonra kendi işi var), ancak büyük model, bir model yapmak için bir miktar para yatırmak kadar basit değil. Ar-Ge platformu.
**"Finans" Xie Lirong: Para, kartlar ve verilere ek olarak, yeni kurulmuş bir şirket için temel bir büyük ölçekli model oluşturmanın zorlukları nelerdir? **
**Hou Zhenyu: **Para, kartlar ve veriler kendi başlarına çok zorlayıcıdır. Start-up şirketler temel büyük ölçekli modeller yaparlar.Minimum bilgi işlem gücü, yeterli ve kaliteli veri ve deneyimli yapay zeka Ar-Ge personelinin yanı sıra modelleri ve işlem gücünü iyi yönetebilen bir yapay zeka geliştirme platformuna da ihtiyaç duyarlar. Şu anda, büyük şirketler bu platformları bulut biçiminde harici hizmetler sağlamak için kullanacak. Örneğin, Baidu Smart Cloud, Wenxin Qianfan büyük ölçekli model platformu aracılığıyla harici hizmetler sağlar. Bununla birlikte, temel bir büyük modeli sıfırdan eğitme eşiği hala çok yüksektir. Çünkü büyük model eğitilmek için yeterli olmayıp sürekli çevik yinelemeler gerektirir ve büyük şirketler nispeten daha olgun olacaktır.
** "Finansal" Xie Lirong: Bazı şirketler kendi büyük modellerini oluşturmaya başlıyor. Kendi başınıza büyük bir model oluşturmak gerekli midir? 2014'te genel bulut yeni ortaya çıktığında, bazı müşteriler veri güvenliği konusunda endişeliydi.Büyük modeller kullandıklarında da bu sorundan endişe duyuyorlar mı? **
**Hou Zhenyu:**Her şirketin büyük ölçekli bir model kullanması gerekir, ancak her işletmenin kendi başına büyük ölçekli bir model mi yapması gerekir? Öyle düşünmüyorum. Temel bir büyük modeli sıfırdan kendi başınıza yapmak çok pahalıdır. Kuruluşlar, başkalarının temel modellerinde ince ayar yapmak için kendi verilerini kullanabilir ve ayrıca çok iyi sonuçlar elde edebilir.
Zhu Yong: Bence işletmelerin büyük modelleri nasıl kullanacakları ve büyük modellerden nasıl iyi bir şekilde yararlanacakları hakkında daha fazla düşünmeleri gerekiyor. Her işletmenin kendi modeli olabilir, ancak baştan başlamaya gerek yoktur. Çünkü Baidu gibi şirketler iyi bir teknik altyapı sağladı. Müşteriler için daha uygun maliyetli bir seçim olan bazı özelleştirilmiş ürünler yapmak için Baidu'ya güvenebilirsiniz. Veri güvenliği sorunu, büyük modellerin ortaya çıkmasının getirdiği yeni bir sorun değildir. Bulut bilişim ile kıyaslanacak olursa genel bulut, özel bulut, barındırma vb. Büyük ölçekli iş modelinde, ilgili ürün ve çözümleri tamamen değerlendirdik.
** "Finansal" Xie Lirong: Akıllı telefonların ve bulutların popülaritesi, düşük fiyatından kaynaklanmaktadır. Çin'in büyük modeli ne zaman genel uygulama aşamasına girecek? **
Hou Zhenyu: Büyük modelin kendisi çok fazla maliyet tasarrufu sağlıyor. Geçmişte işletmeler yapay zeka uygulamaları geliştirirken uygulama senaryolarına göre veri temizleme, etiketleme, model eğitimi, akıl yürütme ve optimizasyon yapma ihtiyacı duyuyordu. Sahne ne kadar küçük olursa olsun, tüm işlem yapılmalıdır ve maliyet çok yüksektir. Ancak büyük modele dayalı olarak, geçmişte bu kadar çok veriye, zamana, kaynağa ve insan gücüne ihtiyaç yoktur. Yapay zeka uygulamasının eşiğini büyük ölçüde azaltabileceğinden, işletmelerin büyük ölçekli model teknolojisine mümkün olan en kısa sürede dikkat etmesini ve kullanmasını öneriyorum.
**Çinli şirketlerin hangi büyük modellere ihtiyacı var? **
** "Finans" Xie Lirong: Baidu'nun Wenxin büyük ölçekli modeli, Mart ayında şirket içi testlere başladı. Kurum içi test sırasında işletme kendi ihtiyaçlarını açıkça ortaya koyabiliyor mu? İhtiyaçları nerede yoğunlaşıyor? **
**Zhu Yong:**Mart ayındaki dahili testten bu yana, art arda 150.000'den fazla müşteriden erişim talebi aldık. Aynı zamanda yüzlerce ortak, olay yerinde bizimle birlikte araştırma ve geliştirme testleri yapıyor. Bu, İnternet, imalat ve finans gibi farklı endüstrileri kapsar ve içindeki birçok senaryo yüksek değere sahiptir. Özetlemek gerekirse, birkaç yüksek sıklık senaryosu kategorisi vardır: bilgi yönetimi, içerik oluşturma (pazarlama metin yazarlığı, medya bilgileri dahil), akıllı müşteri hizmetleri, kod oluşturma ve ofis verimliliğini artırma.
** "Finansal" Xie Lirong: Dijital dönüşüm pazarında uzun süredir devam eden bir sorun var, birçok müşteri ne istediğini bilmiyor. Büyük modeller alanında da bu çelişki var mı? **
**Zhu Yong: **Farklı sektörler ve farklı müşteriler arasında gerçekten de farklılıklar var. Büyük model çıktıktan sonra internet sektörü en son gelişmeleri yakından takip etti, teknik anlayışları ve ürün bilişleri çok gelişmiş, bu nedenle birlikte hızlı bir şekilde araştırma geliştirme testleri yapabiliyoruz, demolar ve ürün yenilikleri yapabiliyoruz.
Bazı geleneksel endüstrilerin dijital temeli nispeten zayıftır, bu nedenle Baidu, müşterilerle birlikte yaratacak, yapay zeka yeteneklerini endüstrideki sorunlu noktalarla birleştirecek ve çok sayıda yeni ürün konsepti üretecek çok sayıda mühendise sahip olacaktır. Yapay zeka teknolojisi endüstri ile birleştiğinde bir yandan teknolojiyi ve yapay zekayı anlamak, diğer yandan sektörü anlamak gerekiyor. Bu nedenle, müşteriler ve ortaklarla bağlantı kurduğumuzda, genellikle her iki tarafın da birlikte yaratmasına ihtiyaç duyarız.
** "Finansal" Xie Lirong: Baidu, farklı sektörlere ve farklı müşteri türlerine nasıl büyük ölçekli model hizmetleri sağlıyor? Müşterinin bakış açısından maliyet performansı nasıl değerlendirilir? **
Zhu Yong: Fiyat açısından, işletme sadece deniyorsa ve fiyata duyarlıysa genel bulut hizmetlerini kullanabilir. Arama hacmine göre Kullandıkça öde (kullandığınız kadar) ) tek seferlik bir temel gerektirmez Tesislere yapılan yatırım da genel bulutun bir avantajıdır. Bazı şirketler büyük altyapı yatırımları yapmaya ve kendi akıllı uygulamalarını oluşturmaya isteklidir.Baidu, eksiksiz bir AI modelleri ve AI temelleri seti sağlayabilir ve şirketler AI modellerine ve AI temellerine dayalı uygulamalar geliştirebilir.
** "Finansal" Xie Lirong: Şirketler kendilerine uygun büyük bir modeli nasıl seçerler? **
Hou Zhenyu: İlk olarak, büyük bir model seçmenin temeli model etkisi olmalıdır. Kuruluşların, büyük modellerin kullanım senaryolarında oynayabileceği değeri değerlendirmesi gerekir. İkincisi, yineleme hızına odaklanın. Yalnızca temel büyük modelin kendisinin canlı olup olmadığına değil, aynı zamanda platformun eksiksiz bir araç zincirine sahip olup olmadığına, uygun ikincil geliştirmeyi ve model yeniden eğitimini destekleyip desteklemediğine ve büyük modellerin daha iyi yinelenmesini destekleyip desteklemediğine de bağlıdır. Üçüncüsü, büyük modelin gerçek iniş maliyeti ve teslimat şekli. Kuruluşlar, ihtiyaçlarına göre genel bulut ve özel bulut dağıtım modunu seçebilir.
** "Finansal" Xie Lirong: Wenxin Qianfan, tek noktadan kurumsal düzeyde büyük ölçekli bir model platformu olarak konumlandırılmıştır, "tek noktadan" ve "kurumsal düzeyde" nasıl anlaşılır? **
Hou Zhenyu: Her şeyden önce, "tek noktadan" yapay zeka, verilere dayalı bir teknolojidir. Yapay zekanın doğumunun başından itibaren verileri toplaması, temizlemesi ve etiketlemesi ve ardından mevcut modellere dayalı eğitim yürütmesi gerekir. . Bütün bir süreç. Baidu, AI araştırma ve geliştirmeden uygulamaya tüm yaşam döngüsünde müşterilerin ihtiyaçlarını karşılayabilen bu yetenekleri sağlar ve kullanımı çok kolaydır.
"Kurumsal seviye"nin yanı sıra, kurumsal seviyedeki uygulamalar kişisel uygulamalar değildir, fotoğraf yüklemek kadar basit değildir. Kurumsal düzeydeki uygulamalar daha rafine ve karmaşık olacak ve ölçek, ölçeklenebilirlik, uygulama maliyetleri, kararlılık ve sağlamlık gibi faktörlerin dikkate alınması gerekiyor.
** "Finans" Xie Lirong: Baidu'ya göre, Wenxin Qianfan büyük ölçekli model platformunun altı özelliği vardır - kullanımı kolay, güvenli, kapsamlı, verimli, açık ve entegre. Kullanım kolaylığı neden önce gelmelidir? Sadece yararlı teknolojilerin yaygınlaştırılacağı doğru mu? **
**Hou Zhenyu: **Kullanım kolaylığı çok önemlidir. Natural Language büyük modeli, müşterilere, herkesin makineyle etkileşime girmesi için uygun, kullanımı kolay bir arayüz sağlayabilir. "Bulut ve zekanın entegrasyonu, yapay zeka kapsayıcılığı", Baidu Smart Cloud'un stratejisidir ve "Yapay zeka kapsayıcılığı" her zaman ideallerimizden biri olmuştur. AI sadece fildişi kulesinde yüksek bir teknoloji olamaz.Veri kullanımı, kaynak kullanımı ve AI'nın insan kullanımı için eşik de dahil olmak üzere AI kullanma eşiği düşürülmelidir.Bu nedenle, kullanım kolaylığı çok önemlidir.
**"Finans" Xie Lirong: Son üç ayda, halk yapay zeka modelleriyle oldukça popüler hale geldi. Binlerce endüstri için büyük modeller için ticari fırsat geldi mi? İyi bir iş ritmi nasıl olmalıdır? **
**Zhu Yong: **Yapay zekanın büyük modeli, Ar-Ge ve uygulama paradigmalarında çok net değişikliklere sahip. Büyük modeli ne kadar çabuk benimser ve anlarsanız, iş üzerinde o kadar fazla etkisi olacaktır. Bu bir evet ya da hayır sorusu değil. Hız söz konusu olduğunda, farklı şirketler büyük modelleri farklı şekillerde benimsiyor. Bazı kuruluşlar, tek noktalı bir uygulama denemesinden başlayabilir ve hizmetleri aramak için genel bulutu kullanabilir, böylece hızlı bir şekilde doğrulayabilir ve daha düşük bir maliyetle demo geliştirme yapabilirler.
Öte yandan, ister büyük ister küçük bir işletme olsun, yapay zeka yerel düşüncesini geliştirmek gerekiyor. Örneğin, bazı uygulamalar kademeli olarak dönüştürülebilir ve yükseltilebilir. Başka bir yaklaşıma yeniden düzenleme denir.Baidu'nun şirket içi açıklamasına göre, gelecekte tüm ürünler büyük modele göre yeniden yapılacak.
** Büyük model pazarında balon mu var? **
** "Finansal" Xie Lirong: İş odaklı B-end pazarında gerçekten bu kadar çok büyük modele ihtiyacınız var mı? **
**Hou Zhenyu:**Kişisel görüşüm, temel büyük modelin çok fazla şeye ihtiyacı olmadığı yönünde. Tabii ki, bu sadece sondan ileriye bakmak. Ancak, herhangi bir endüstrinin gelişiminin erken dönemlerinde, pazar müreffeh ve köpüklü hale gelir. Endüstriyel gelişme açısından bakıldığında, artık bazı balonlara izin vermeliyiz. Bununla da yüzleşmeliyiz. Ancak yine de, büyük dalgalar kumları süpürdükten sonra, temel model hizmetleri sağlayanların hala birkaç şirket olduğuna inanıyorum.
**Zhu Yong: **Temel büyük model doğrultusunda, şu anda birçok oyuncu olmasına rağmen, hızlı yinelemeyi sürdürmek, sürekli olarak daha kapsamlı ve eksiksiz bir araç zinciri geliştirmek ve müşteri bazında ürün yeteneklerini sürekli iyileştirmek gerçekten zor geribildirim şeyler. Bu nedenle, büyük model şu anda çok sıcak olsa da, uzun mesafeli bir yarış Sonunda, günümüzün bulut bilişim manzarası gibi olacak ve pazar yavaş yavaş yakınsayacak.
** "Finansal" Xie Lirong: Sunucu donanımı yapan birçok şirket aynı zamanda büyük ölçekli endüstri modelleri yapmak istiyor. Baidu onların müşterisiydi ama şimdi birbirleriyle rekabet ediyorlar. Birlikte barış içinde nasıl yaşamalıyız? **
Hou Zhenyu: Rekabet hakkında doğrudan konuşabileceğimizi sanmıyorum. Hâlâ işbirliğine dayalı bir ilişki içindeyiz. İki taraf gerçekten de benzer hizmetlere sahip olacak ve aynı zamanda benzer sektörlerle karşı karşıya kalacak, ancak biz ve geleneksel donanım üreticileri daha tamamlayıcıyız. Baidu, İnternet genlerine sahip bir AI şirketidir. Büyük miktarda genel amaçlı veri ve genel amaçlı büyük bir model biriktirmiştir. Avantajları, AI, yazılım, teknoloji ve diğer alanlarda yatmaktadır. Geleneksel donanım üreticileri, endüstri verilerini biriktirmiş ve geleneksel devlet ve kurumsal endüstriler gibi dikey alanlarda Teknik Bilgiler geliştirmiştir. Büyük modeller inşa etmede iki tarafın farklı güçleri vardır. Baidu ve H3C gibi kuruluşlar, yalnızca sunucu ve anahtar satın alma konusunda ortak olmakla kalmaz, aynı zamanda ortaklaşa büyük modeller oluşturur.
** "Finansal" Xie Lirong: Baidu genellikle rakiplerinin büyük modellerinin ilerlemesine dikkat eder mi? **
Zhu Yong: Birincisi, teknoloji ve genel etki. İkincisi, destekleyici araçlar. Üçüncüsü, iş modeli. Üç ya da dört yıl öncesine giderseniz, yapay zeka pazarı hala nispeten uzaktaydı, ancak bugün derin öğrenme teknolojisi, ürün ticarileştirme, yatırım ve açık kaynak ekolojisi hızlanıyor.
** "Finansal" Xie Lirong: Önümüzdeki birkaç yıl içinde, büyük ölçekli modeller Baidu'nun çekirdeğinin ana yönü olacak mı? Neden? **
**Hou Zhenyu: **Büyük modeller, Baidu'nun temel odak noktası olacak. Baidu bir AI şirketidir ve büyük modeller, AI'nın önemli bir geliştirme yönüdür. İster C tarafında olsun, ister B tarafında olsun, Baidu'nun ürün ve hizmetlerinde büyük değişiklikler getirecek. Baidu için büyük modeller hem bir fırsat hem de bir meydan okuma olan çok heyecan verici. Baidu büyük modellere yatırım yapmaya devam edecek.Büyük modellerin bulut bilişimi yapay zeka çağına doğru hızlandıracağına ve bulut bilişim ortamını yeniden şekillendireceğine inanıyorum.MaaS'ın (Model as a Service) durumu giderek daha önemli hale gelecek ve Smart Cloud tarafından önerilen "bulut ve zekanın entegrasyonu" stratejisi ve "AI kapsayıcılığı" idealinin Baidu'nun gerçekleştirilmesini de hızlandıracak.
** "Finansal" Xie Lirong: Yapay zekanın 2016'da başlayan son ticarileştirme turunda bazı sorunlar yaşandı ve yapay zeka şirketleri çok sayıda sıkıcı ve ayrıntılı özelleştirme projesi yapmak zorunda kaldı. Büyük modeller, yapay zekanın ticarileştirilmesinin son aşamasında karşılaşılan sorunlardan nasıl kaçınabilir? **
Hou Zhenyu: Bu büyük ölçekli model endüstri iniş turu, on yıl önce derin öğrenmenin temsil ettiği yapay zeka endüstrisinden farklı. Bu, önceki yatırımlardan farklı olarak AI araştırma ve geliştirme için yeni bir paradigmadır. Büyük ölçekli modellerin ortaya çıkmasından önce, AI en çok eleştirilen ve uygulanması en zor olanı, gerçek endüstriyel ortamın parçalanmış olmasıydı. Örneğin, kapıların yüz tanıması ile ödemenin yüz tanıması farklıdır. Işık ve ortam farklı olduğu için farklı uygulamalara yönelik olması ve müşterilerin biriktirdiği verilere göre eğitimin sıfırdan yapılması ve ardından sahneye uyarlanması gerekir. Bu tür özelleştirilmiş teslimat çok külfetlidir.
Ancak temel büyük model altında, çok fazla ince ayar verisi olmadan ve çok fazla eğitim turu olmadan çok iyi sonuçlar elde edilebilir. Temel büyük modeller, birçok senaryoyu eskisinden çok daha kolay çözer. Büyük modellerin genelleme yeteneği eskisinden çok daha güçlüdür. Bu, AI inişinin son turundan farklı. Geçen yıl 1 milyar parametreli bir modele büyük model deniyordu, ancak şimdi model parametreleri genellikle yüz milyarlarca. 100 milyardan fazla parametre ile istihbarat, daha güçlü genelleme yetenekleri ve çeşitli senaryolarda genel yetenekler ortaya çıkacaktır.
** "Finansal" Xie Lirong: Bir sektöre çok sayıda insan akın ettiğinde, balonlar kaçınılmaz olabilir. Büyük model sağlıklı bir şekilde geliştirilecekse ne gibi önerileriniz var? **
Hou Zhenyu: Büyük model uygulayıcılara tavsiyem, elinizden geleni yapın. Hepsini kendi başına yapmak zorunda değilsin. Bunun yerine, AI'nın ticarileştirilmesini düşünün ve yeteneklerinize en uygun senaryoları ve zincirleri bulun. Endüstri erken aşamada hızla geliştiğinde, belirli balonlara izin verilmesini umuyoruz. Bununla birlikte, politika, teknoloji uygulamasının denetimi ve teknolojinin kalitesini değerlendirmek için endüstri standartları konusunda bir fikir birliğine varabilir. Sağlıklı bir şekilde gelişebilmemiz için uyulması gereken standartlar ve uyulması gereken kurallar vardır.
Zhu Yong: Düşünce tarzımızı da değiştirmemiz gerekiyor. Büyük model bir dönüm noktası teknolojisi, yıkıcı bir teknoloji. Açık fikirli olun ve öğrenmeye devam edin.
View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
Diyalog | Üç ayda 79 temel büyük ölçekli model doğdu Çin'in ne tür büyük ölçekli modellere ihtiyacı var?
Metin: Wu Junyu Editör: Xie Lirong
Kaynak: Finance Eleven
ChatGPT'nin geçen yılın sonunda piyasaya sürülmesinden sonra Çinli şirketler en az 79 temel büyük model yayınladı. Ancak, büyük modellerin çoğu, dış dünya tarafından ChatGPT ile teknik bir boşluğa sahip olarak kabul edilir. Büyük ölçekli model işi kapıda Çin'in ne tür büyük ölçekli bir modele ihtiyacı var?
Aralık 2022'de, Microsoft'un yatırım yaptığı bir yapay zeka başlangıç şirketi olan OpenAI, sohbete dayalı bir yapay zeka ChatGPT'yi kullanıma sundu. ChatGPT, temelde OpenAI tarafından bağımsız olarak geliştirilen ve yaklaşık 180 milyar parametre içeren büyük bir GPT dili modelidir. Bu yılın Şubat ayında Nvidia CEO'su Huang Renxun, "ChatGPT, AI için iPhone anını başlattı" yorumunu yaptı. Huang Renxun, büyük modellerin uygulama geliştirme eşiğini düşürdüğüne ve tüm uygulamaların büyük modellerle yeniden yapılmaya değer olduğuna inanıyor.
Bu Huang Renxun'un ailesinin sözleri değil, herkes fırsatı görüyor. Bu yıl Mart ayından itibaren Çinli şirketler de büyük ölçekli model ürünleri piyasaya sürmek için yarışıyor. Bunlar arasında Baidu'nun Wenxin modeli, Ali'nin Tongyi modeli ve Tencent'in endüstri modeli gibi en iyi şirketlerin yanı sıra Xunfei ve SenseTime gibi endüstri şirketlerinin yanı sıra bir dizi yeni şirket yer alıyor. Mayıs ayında, Bilim ve Teknoloji Bakanlığı bünyesindeki Çin Bilimsel ve Teknolojik Bilgi Enstitüsü, "Çin'in Yapay Zeka Büyük Model Haritası Üzerine Araştırma Raporu"nu yayınladı. Rapora göre, 28 Mayıs itibarıyla Çin'de parametreleri 1 milyarın üzerinde olan en az 79 temel büyük ölçekli model piyasaya sürüldü.
**Şu anda piyasada bulunan AI modellerinin tümü "büyük modeller" olarak adlandırılsa da, parametre sayısı varsayılan olarak büyük modeller ve küçük modeller için tanımlayıcı faktörlerden biri olarak kabul edilir. **Baidu Group başkan yardımcısı Hou Zhenyu, Caijing muhabirine 2022'de 1 milyar parametreye sahip bir modele büyük model denildiğini söyledi. Ancak mevcut büyük model parametreleri genellikle yüz milyarlarcadır. Çünkü "akıllı çıkış" etkisi 100 milyardan fazla parametre ile ortaya çıkacağı için genelleme yeteneği oluşacak ve çeşitli senaryolarda evrensel yetenek oluşacaktır. Bu büyük modele dayalı ince ayarlı model, daha iyi endüstriyel uygulama etkisine sahiptir.
**"Akıllı çıkış" etkisi, model ölçeği ve bilgi işlem gücü seviyesinin belirli bir parametre eşiğini aşmasının ardından AI etkisinin artık rastgele bir olasılık olayı olmayacağı gerçeğini ifade eder. **Genel alanda, parametre miktarı ne kadar fazlaysa, genel olarak istihbaratın ortaya çıkma olasılığı ve yapay zekanın doğruluğu o kadar yüksek olur. Özel dikey alanda, büyük parametreli model kırpıldıktan ve optimize edildikten sonra doğru sonuçlar elde etmek daha kolaydır.
Çin'de en az 79 büyük ölçekli model ortaya çıkmış olsa da, Caijing'in görüştüğü birçok sektör profesyoneli, büyük ölçekli modellerin bilgi işlem gücü, algoritmalar ve veri birikimi gerektirdiğine inanıyor. Yüksek performanslı GPU yongalarının kıtlığı, yüksek donanım satın alma maliyetleri ve yüksek işletme maliyetleri nedeniyle, Çin'de büyük modellerin ticarileştirilmesi yoluyla çalışacak sermaye rezervlerine, stratejik iradeye ve pratik yeteneklere sahip çok az şirket var. "Yüz Model Savaşı"nda, ürünlerin çoğu ile ChatGPT arasında gerçekten de bir boşluk var.
Kargaşadan sonra, büyük model çılgınlığı yavaş yavaş gerçeğe dönüyor. Yurtiçi ve yurtdışındaki büyük ölçekli model pazarında daha rasyonel düşünme ortaya çıkıyor - ticarileştirilemeyen ChatGPT sadece bir oyuncak olabilir ve kurumsal bir uygulamaya dönüşebilen büyük ölçekli bir model endüstriyel değere sahiptir.
Apple, Samsung ve JPMorgan Chase gibi şirketler, güvenlik endişeleri nedeniyle çalışanlarının ChatGPT kullanmasını yasakladı. Öte yandan, ChatGPT kullanıcılarının büyümesi ve elde tutulması da bir darboğaza ulaştı. BenzerWeb web sitesi analiz aracından alınan verilere göre, ChatGPT'nin Ocak-Mayıs dönemindeki trafik artış oranları %131,6, %62,5, %55,8, %12,6 ve %2,8 olarak gerçekleşti. Haziran başında bir Morgan Stanley anketi, yanıt verenlerin yalnızca %19'unun ChatGPT kullandıklarını ve yalnızca %4'ünün ChatGPT'ye güvendiklerini söylediğini gösterdi.
Hou Zhenyu, "Bu yılın Mart ayında, müşteriler bizimle büyük ölçekli modellerin ihtiyaçları hakkında ilk kez konuşmaya başladıklarında, hepsi hayal güçlerini kullanarak daha fazla bilimkurgu istiyorlardı. Ancak Nisan'dan sonra, büyük- ölçekli modeller ortaya çıktı ve herkes yavaşladı. Yavaş yavaş daha gerçek ihtiyaçları gördü.” Sübjektif ve nesnel faktörlerin etkisi altında, küresel temel büyük ölçekli modeller esas olarak To B endüstri pazarına yöneliktir.
**To C ucunda büyük modellerin ticarileştirilmesi yavaştır. **Şu anda, yüksek işlem gücü maliyeti gibi sorunlarla karşı karşıyayız ve kullanıcı ölçeği ne kadar büyük olursa, işletmelerin kayıpları da o kadar büyük olur. Yanlış "gürültü" çıkarmak da kaçınılmazdır ve hatta bilgi sızıntısı ve politika denetimi gibi etik zorluklar vardır. Microsoft bile yalnızca araç ürünlerinde (ofis ofis paketleri, web tarayıcıları, Photoshop gibi fotoğraf düzenleme araçları) büyük modeller kullanır. Microsoft'un araç şirketlerine hizmet satmasının özü, hâlâ B'ye ticarileştirmedir.
**B-end kurumsal müşteriler için büyük modeller uygulamak pragmatik bir yaklaşımdır. **Endüstri pazarında müşteri ihtiyaçları güçlü ve nettir. Tüm dünyada perakende, finans, üretim, devlet ve diğer alanlar, akıllı yükseltmeler için büyük modellere güveniyor. Endüstri fikir birliği, büyük bir model temelinde endüstri bilgisine dayalı olarak ince ayar yapılmış bir modelin, optimize edilmemiş genel amaçlı büyük bir modelden daha iyi performans göstereceği yönündedir.
Pazar araştırma şirketi IDC tarafından bu yılın Mayıs ayında yayınlanan verilere göre, Çin'in yapay zeka pazarının 2022'deki toplam büyüklüğü, 8,13 milyar ABD doları donanım, 2,69 milyar ABD doları yazılım ve 1,41 milyar ABD doları hizmetler dahil olmak üzere 12,2 milyar ABD doları olacak. IDC, 2026'da Çin'in yapay zeka pazarının, donanım için 14,85 milyar ABD doları, yazılım için 7,69 milyar ABD doları ve hizmetler için 3,89 milyar ABD doları olmak üzere 26,9 milyar ABD dolarına ulaşacağını tahmin ediyor. Donanım, yazılım ve hizmetlerin bileşik yıllık büyüme oranları sırasıyla %15,1, %32,0 ve %28,5'tir.
Muhatap Profili:
Baidu Group başkan yardımcısı Hou Zhenyu (Baidu Smart Cloud Business Group'un bulut bilgi işlem üretim araştırma ekibinden ve temel teknoloji mühendisliği ekibinden sorumlu)
Baidu Akıllı Bulut Başkan Yardımcısı Zhu Yong (Baidu Akıllı Bulut Uygulama Ürün Merkezinden sorumlu)
Sunucu: Xie Lirong, Caijing Magazine Genel Yayın Yönetmeni Yardımcısı
Aşağıda, diyalog kaydının kısaltılmış bir versiyonu bulunmaktadır:
**Büyük model lüks bir oyun mu? **
** "Finansal" Xie Lirong: Çin, büyük ölçekli bir girişimcilik dalgası başlattı ve büyük ölçekli modeller için eşik çok yüksek, ancak Çin pazarının mevcut durumu, giriş hızı ve ölçeği? **
Zhu Yong: Büyük modeller için eşik görecelidir ve farklı türde oyuncular olacaktır. İlk kategori Baidu ile aynıdır ve sıfırdan temel bir büyük model oluşturur. Bunun bilgi işlem gücü, algoritmalar, veriler ve yetenekler için çok yüksek gereksinimleri vardır.
Verileri örnek olarak alırsak, temel büyük model, İnternet verileri, profesyonel saha verileri, haber bilgileri verileri ve yüksek kaliteli profesyonel olarak etiketlenmiş veriler dahil olmak üzere çok sayıda veri eğitimi gerektirir. Bilgi işlem gücünü örnek olarak alırsak, ChatGPT gibi yüz milyarlarca parametreye sahip büyük bir modelin, NVIDIA'nın en üst düzey A100/H100 GPU'su ile 100 gün boyunca sürekli olarak eğitilmesi gerekir. Algoritmalar ve yetenekler de önemlidir. Tıpkı farklı şeflerin aynı ham maddeye dayalı farklı tatlarda yemekler pişirmesi gibi, mühendislerin de farklı eğitim yöntemleri vardır. Bu, uzun vadeli pratik deneyim birikimini gerektirir, bu nedenle eşik çok yüksektir.
İkinci kategori, temel büyük modelin yeteneklerine dayalı olarak biraz ince ayar ve hedefli özelleştirme gerektiren büyük endüstri modelidir. Bu, geçmişte sıfırdan veri etiketleme ve algoritma ince ayarının maliyetinden çok daha düşük. Üçüncü kategori, ilk iki büyük modele dayalı uygulamalar geliştirir.Baidu, diğer şirketler ve hatta bazı açık kaynak platformları, yazılım geliştirme eşiğini düşürmek için geliştirme araçları sağlar.
** "Finansal" Xie Lirong: Çin'in büyük ölçekli modellerinin küresel pazardaki seviyesi nedir? **
**Hou Zhenyu:**Şahsen Çin'in büyük ölçekli modellerinin küresel pazarda hâlâ lider durumda olduğunu düşünüyorum. Büyük ölçekli model geliştirme ve arama motoru geliştirme aslında benzerdir ve her ikisi de çok derin teknik birikim gerektirir. Küresel bir bakış açısından, arama motoru teknolojisinde bağımsız araştırma ve geliştirme yapan yalnızca birkaç ülke vardır. Şu anda, Çin ve Amerika Birleşik Devletleri tamamen bağımsız olarak büyük ölçekli model teknolojisi geliştirebilen tek iki ülke olabilir.
** "Finans" Xie Lirong: Büyük modellerde mutlak ilerleme ve gerilik var mı? **
**Hou Zhenyu: **Büyük modeller kesinlikle iyi ya da kötü değildir. Farklı alanlarda belirli farklılıklar gösterse de akıllı telefon seçmek gibidir. Kimi Apple kullanıyor, kimi Android kullanıyor, en uygunu en iyisidir. Büyük model ilk kez piyasaya sürüldüğünde, insanlar genellikle bu model hakkında bazı zor sorular sordu. Ama aslında, gerçekten ciddi bir kurumsal düzeyde ortamda, bu tür senaryolar çok azdır. İşletmelerin iş senaryolarına göre kendilerine daha uygun olan büyük bir model seçmeleri gerekiyor. Özellikle Çinli firmaların Çinceyi daha iyi anlayan ve Çinli firmaların özelliklerine uygun ürünleri seçmesi gerekiyor.
** "Finans" Xie Lirong: Baidu büyük ölçekli modele ne kadar kaynak ve yetenek yatırımı yaptı? **
**Hou Zhenyu: **AI büyük ölçekli modeli, Baidu'nun sürekli ve kapsamlı yüksek yoğunluklu yatırım gerektiren temel stratejisidir. Hesaplama gücünü örnek alırsak, geçmişte biriktirdiğimiz GPU sayısının birikimi onbinlerle ölçülür ki bu çok büyük bir yatırımdır. Baidu ayrıca, modelleri daha hızlı ve daha iyi eğitmek için yıllar içinde eksiksiz bir takım zincirleri geliştirdi.
Baidu, son 10 yılda yapay zekaya 100 milyar yuan'dan fazla yatırım yaptı. Bir teknoloji şirketi olarak Baidu, her yıl gelirinin %20'sinden fazlasını Ar-Ge'ye harcıyor. (Açıklamalar: 2019'dan sonra, Baidu'nun temel Ar-Ge harcamaları uzun bir süre gelirin %20'sinden fazlasını oluşturdu. 2022'de Baidu'nun Ar-Ge harcama oranı %24 oldu ve Çinli teknoloji şirketleri arasında Huawei'nin %25'ten sonra ikinci sırada yer aldı. Aiqi Baidu'nun sanattan sonra kendi işi var), ancak büyük model, bir model yapmak için bir miktar para yatırmak kadar basit değil. Ar-Ge platformu.
**Hou Zhenyu: **Para, kartlar ve veriler kendi başlarına çok zorlayıcıdır. Start-up şirketler temel büyük ölçekli modeller yaparlar.Minimum bilgi işlem gücü, yeterli ve kaliteli veri ve deneyimli yapay zeka Ar-Ge personelinin yanı sıra modelleri ve işlem gücünü iyi yönetebilen bir yapay zeka geliştirme platformuna da ihtiyaç duyarlar. Şu anda, büyük şirketler bu platformları bulut biçiminde harici hizmetler sağlamak için kullanacak. Örneğin, Baidu Smart Cloud, Wenxin Qianfan büyük ölçekli model platformu aracılığıyla harici hizmetler sağlar. Bununla birlikte, temel bir büyük modeli sıfırdan eğitme eşiği hala çok yüksektir. Çünkü büyük model eğitilmek için yeterli olmayıp sürekli çevik yinelemeler gerektirir ve büyük şirketler nispeten daha olgun olacaktır.
** "Finansal" Xie Lirong: Bazı şirketler kendi büyük modellerini oluşturmaya başlıyor. Kendi başınıza büyük bir model oluşturmak gerekli midir? 2014'te genel bulut yeni ortaya çıktığında, bazı müşteriler veri güvenliği konusunda endişeliydi.Büyük modeller kullandıklarında da bu sorundan endişe duyuyorlar mı? **
**Hou Zhenyu:**Her şirketin büyük ölçekli bir model kullanması gerekir, ancak her işletmenin kendi başına büyük ölçekli bir model mi yapması gerekir? Öyle düşünmüyorum. Temel bir büyük modeli sıfırdan kendi başınıza yapmak çok pahalıdır. Kuruluşlar, başkalarının temel modellerinde ince ayar yapmak için kendi verilerini kullanabilir ve ayrıca çok iyi sonuçlar elde edebilir.
Zhu Yong: Bence işletmelerin büyük modelleri nasıl kullanacakları ve büyük modellerden nasıl iyi bir şekilde yararlanacakları hakkında daha fazla düşünmeleri gerekiyor. Her işletmenin kendi modeli olabilir, ancak baştan başlamaya gerek yoktur. Çünkü Baidu gibi şirketler iyi bir teknik altyapı sağladı. Müşteriler için daha uygun maliyetli bir seçim olan bazı özelleştirilmiş ürünler yapmak için Baidu'ya güvenebilirsiniz. Veri güvenliği sorunu, büyük modellerin ortaya çıkmasının getirdiği yeni bir sorun değildir. Bulut bilişim ile kıyaslanacak olursa genel bulut, özel bulut, barındırma vb. Büyük ölçekli iş modelinde, ilgili ürün ve çözümleri tamamen değerlendirdik.
** "Finansal" Xie Lirong: Akıllı telefonların ve bulutların popülaritesi, düşük fiyatından kaynaklanmaktadır. Çin'in büyük modeli ne zaman genel uygulama aşamasına girecek? **
Hou Zhenyu: Büyük modelin kendisi çok fazla maliyet tasarrufu sağlıyor. Geçmişte işletmeler yapay zeka uygulamaları geliştirirken uygulama senaryolarına göre veri temizleme, etiketleme, model eğitimi, akıl yürütme ve optimizasyon yapma ihtiyacı duyuyordu. Sahne ne kadar küçük olursa olsun, tüm işlem yapılmalıdır ve maliyet çok yüksektir. Ancak büyük modele dayalı olarak, geçmişte bu kadar çok veriye, zamana, kaynağa ve insan gücüne ihtiyaç yoktur. Yapay zeka uygulamasının eşiğini büyük ölçüde azaltabileceğinden, işletmelerin büyük ölçekli model teknolojisine mümkün olan en kısa sürede dikkat etmesini ve kullanmasını öneriyorum.
**Çinli şirketlerin hangi büyük modellere ihtiyacı var? **
** "Finans" Xie Lirong: Baidu'nun Wenxin büyük ölçekli modeli, Mart ayında şirket içi testlere başladı. Kurum içi test sırasında işletme kendi ihtiyaçlarını açıkça ortaya koyabiliyor mu? İhtiyaçları nerede yoğunlaşıyor? **
**Zhu Yong:**Mart ayındaki dahili testten bu yana, art arda 150.000'den fazla müşteriden erişim talebi aldık. Aynı zamanda yüzlerce ortak, olay yerinde bizimle birlikte araştırma ve geliştirme testleri yapıyor. Bu, İnternet, imalat ve finans gibi farklı endüstrileri kapsar ve içindeki birçok senaryo yüksek değere sahiptir. Özetlemek gerekirse, birkaç yüksek sıklık senaryosu kategorisi vardır: bilgi yönetimi, içerik oluşturma (pazarlama metin yazarlığı, medya bilgileri dahil), akıllı müşteri hizmetleri, kod oluşturma ve ofis verimliliğini artırma.
** "Finansal" Xie Lirong: Dijital dönüşüm pazarında uzun süredir devam eden bir sorun var, birçok müşteri ne istediğini bilmiyor. Büyük modeller alanında da bu çelişki var mı? **
**Zhu Yong: **Farklı sektörler ve farklı müşteriler arasında gerçekten de farklılıklar var. Büyük model çıktıktan sonra internet sektörü en son gelişmeleri yakından takip etti, teknik anlayışları ve ürün bilişleri çok gelişmiş, bu nedenle birlikte hızlı bir şekilde araştırma geliştirme testleri yapabiliyoruz, demolar ve ürün yenilikleri yapabiliyoruz.
Bazı geleneksel endüstrilerin dijital temeli nispeten zayıftır, bu nedenle Baidu, müşterilerle birlikte yaratacak, yapay zeka yeteneklerini endüstrideki sorunlu noktalarla birleştirecek ve çok sayıda yeni ürün konsepti üretecek çok sayıda mühendise sahip olacaktır. Yapay zeka teknolojisi endüstri ile birleştiğinde bir yandan teknolojiyi ve yapay zekayı anlamak, diğer yandan sektörü anlamak gerekiyor. Bu nedenle, müşteriler ve ortaklarla bağlantı kurduğumuzda, genellikle her iki tarafın da birlikte yaratmasına ihtiyaç duyarız.
** "Finansal" Xie Lirong: Baidu, farklı sektörlere ve farklı müşteri türlerine nasıl büyük ölçekli model hizmetleri sağlıyor? Müşterinin bakış açısından maliyet performansı nasıl değerlendirilir? **
Zhu Yong: Fiyat açısından, işletme sadece deniyorsa ve fiyata duyarlıysa genel bulut hizmetlerini kullanabilir. Arama hacmine göre Kullandıkça öde (kullandığınız kadar) ) tek seferlik bir temel gerektirmez Tesislere yapılan yatırım da genel bulutun bir avantajıdır. Bazı şirketler büyük altyapı yatırımları yapmaya ve kendi akıllı uygulamalarını oluşturmaya isteklidir.Baidu, eksiksiz bir AI modelleri ve AI temelleri seti sağlayabilir ve şirketler AI modellerine ve AI temellerine dayalı uygulamalar geliştirebilir.
** "Finansal" Xie Lirong: Şirketler kendilerine uygun büyük bir modeli nasıl seçerler? **
Hou Zhenyu: İlk olarak, büyük bir model seçmenin temeli model etkisi olmalıdır. Kuruluşların, büyük modellerin kullanım senaryolarında oynayabileceği değeri değerlendirmesi gerekir. İkincisi, yineleme hızına odaklanın. Yalnızca temel büyük modelin kendisinin canlı olup olmadığına değil, aynı zamanda platformun eksiksiz bir araç zincirine sahip olup olmadığına, uygun ikincil geliştirmeyi ve model yeniden eğitimini destekleyip desteklemediğine ve büyük modellerin daha iyi yinelenmesini destekleyip desteklemediğine de bağlıdır. Üçüncüsü, büyük modelin gerçek iniş maliyeti ve teslimat şekli. Kuruluşlar, ihtiyaçlarına göre genel bulut ve özel bulut dağıtım modunu seçebilir.
** "Finansal" Xie Lirong: Wenxin Qianfan, tek noktadan kurumsal düzeyde büyük ölçekli bir model platformu olarak konumlandırılmıştır, "tek noktadan" ve "kurumsal düzeyde" nasıl anlaşılır? **
Hou Zhenyu: Her şeyden önce, "tek noktadan" yapay zeka, verilere dayalı bir teknolojidir. Yapay zekanın doğumunun başından itibaren verileri toplaması, temizlemesi ve etiketlemesi ve ardından mevcut modellere dayalı eğitim yürütmesi gerekir. . Bütün bir süreç. Baidu, AI araştırma ve geliştirmeden uygulamaya tüm yaşam döngüsünde müşterilerin ihtiyaçlarını karşılayabilen bu yetenekleri sağlar ve kullanımı çok kolaydır.
"Kurumsal seviye"nin yanı sıra, kurumsal seviyedeki uygulamalar kişisel uygulamalar değildir, fotoğraf yüklemek kadar basit değildir. Kurumsal düzeydeki uygulamalar daha rafine ve karmaşık olacak ve ölçek, ölçeklenebilirlik, uygulama maliyetleri, kararlılık ve sağlamlık gibi faktörlerin dikkate alınması gerekiyor.
** "Finans" Xie Lirong: Baidu'ya göre, Wenxin Qianfan büyük ölçekli model platformunun altı özelliği vardır - kullanımı kolay, güvenli, kapsamlı, verimli, açık ve entegre. Kullanım kolaylığı neden önce gelmelidir? Sadece yararlı teknolojilerin yaygınlaştırılacağı doğru mu? **
**Hou Zhenyu: **Kullanım kolaylığı çok önemlidir. Natural Language büyük modeli, müşterilere, herkesin makineyle etkileşime girmesi için uygun, kullanımı kolay bir arayüz sağlayabilir. "Bulut ve zekanın entegrasyonu, yapay zeka kapsayıcılığı", Baidu Smart Cloud'un stratejisidir ve "Yapay zeka kapsayıcılığı" her zaman ideallerimizden biri olmuştur. AI sadece fildişi kulesinde yüksek bir teknoloji olamaz.Veri kullanımı, kaynak kullanımı ve AI'nın insan kullanımı için eşik de dahil olmak üzere AI kullanma eşiği düşürülmelidir.Bu nedenle, kullanım kolaylığı çok önemlidir.
**"Finans" Xie Lirong: Son üç ayda, halk yapay zeka modelleriyle oldukça popüler hale geldi. Binlerce endüstri için büyük modeller için ticari fırsat geldi mi? İyi bir iş ritmi nasıl olmalıdır? **
**Zhu Yong: **Yapay zekanın büyük modeli, Ar-Ge ve uygulama paradigmalarında çok net değişikliklere sahip. Büyük modeli ne kadar çabuk benimser ve anlarsanız, iş üzerinde o kadar fazla etkisi olacaktır. Bu bir evet ya da hayır sorusu değil. Hız söz konusu olduğunda, farklı şirketler büyük modelleri farklı şekillerde benimsiyor. Bazı kuruluşlar, tek noktalı bir uygulama denemesinden başlayabilir ve hizmetleri aramak için genel bulutu kullanabilir, böylece hızlı bir şekilde doğrulayabilir ve daha düşük bir maliyetle demo geliştirme yapabilirler.
Öte yandan, ister büyük ister küçük bir işletme olsun, yapay zeka yerel düşüncesini geliştirmek gerekiyor. Örneğin, bazı uygulamalar kademeli olarak dönüştürülebilir ve yükseltilebilir. Başka bir yaklaşıma yeniden düzenleme denir.Baidu'nun şirket içi açıklamasına göre, gelecekte tüm ürünler büyük modele göre yeniden yapılacak.
** Büyük model pazarında balon mu var? **
** "Finansal" Xie Lirong: İş odaklı B-end pazarında gerçekten bu kadar çok büyük modele ihtiyacınız var mı? **
**Hou Zhenyu:**Kişisel görüşüm, temel büyük modelin çok fazla şeye ihtiyacı olmadığı yönünde. Tabii ki, bu sadece sondan ileriye bakmak. Ancak, herhangi bir endüstrinin gelişiminin erken dönemlerinde, pazar müreffeh ve köpüklü hale gelir. Endüstriyel gelişme açısından bakıldığında, artık bazı balonlara izin vermeliyiz. Bununla da yüzleşmeliyiz. Ancak yine de, büyük dalgalar kumları süpürdükten sonra, temel model hizmetleri sağlayanların hala birkaç şirket olduğuna inanıyorum.
**Zhu Yong: **Temel büyük model doğrultusunda, şu anda birçok oyuncu olmasına rağmen, hızlı yinelemeyi sürdürmek, sürekli olarak daha kapsamlı ve eksiksiz bir araç zinciri geliştirmek ve müşteri bazında ürün yeteneklerini sürekli iyileştirmek gerçekten zor geribildirim şeyler. Bu nedenle, büyük model şu anda çok sıcak olsa da, uzun mesafeli bir yarış Sonunda, günümüzün bulut bilişim manzarası gibi olacak ve pazar yavaş yavaş yakınsayacak.
** "Finansal" Xie Lirong: Sunucu donanımı yapan birçok şirket aynı zamanda büyük ölçekli endüstri modelleri yapmak istiyor. Baidu onların müşterisiydi ama şimdi birbirleriyle rekabet ediyorlar. Birlikte barış içinde nasıl yaşamalıyız? **
Hou Zhenyu: Rekabet hakkında doğrudan konuşabileceğimizi sanmıyorum. Hâlâ işbirliğine dayalı bir ilişki içindeyiz. İki taraf gerçekten de benzer hizmetlere sahip olacak ve aynı zamanda benzer sektörlerle karşı karşıya kalacak, ancak biz ve geleneksel donanım üreticileri daha tamamlayıcıyız. Baidu, İnternet genlerine sahip bir AI şirketidir. Büyük miktarda genel amaçlı veri ve genel amaçlı büyük bir model biriktirmiştir. Avantajları, AI, yazılım, teknoloji ve diğer alanlarda yatmaktadır. Geleneksel donanım üreticileri, endüstri verilerini biriktirmiş ve geleneksel devlet ve kurumsal endüstriler gibi dikey alanlarda Teknik Bilgiler geliştirmiştir. Büyük modeller inşa etmede iki tarafın farklı güçleri vardır. Baidu ve H3C gibi kuruluşlar, yalnızca sunucu ve anahtar satın alma konusunda ortak olmakla kalmaz, aynı zamanda ortaklaşa büyük modeller oluşturur.
** "Finansal" Xie Lirong: Baidu genellikle rakiplerinin büyük modellerinin ilerlemesine dikkat eder mi? **
Zhu Yong: Birincisi, teknoloji ve genel etki. İkincisi, destekleyici araçlar. Üçüncüsü, iş modeli. Üç ya da dört yıl öncesine giderseniz, yapay zeka pazarı hala nispeten uzaktaydı, ancak bugün derin öğrenme teknolojisi, ürün ticarileştirme, yatırım ve açık kaynak ekolojisi hızlanıyor.
** "Finansal" Xie Lirong: Önümüzdeki birkaç yıl içinde, büyük ölçekli modeller Baidu'nun çekirdeğinin ana yönü olacak mı? Neden? **
**Hou Zhenyu: **Büyük modeller, Baidu'nun temel odak noktası olacak. Baidu bir AI şirketidir ve büyük modeller, AI'nın önemli bir geliştirme yönüdür. İster C tarafında olsun, ister B tarafında olsun, Baidu'nun ürün ve hizmetlerinde büyük değişiklikler getirecek. Baidu için büyük modeller hem bir fırsat hem de bir meydan okuma olan çok heyecan verici. Baidu büyük modellere yatırım yapmaya devam edecek.Büyük modellerin bulut bilişimi yapay zeka çağına doğru hızlandıracağına ve bulut bilişim ortamını yeniden şekillendireceğine inanıyorum.MaaS'ın (Model as a Service) durumu giderek daha önemli hale gelecek ve Smart Cloud tarafından önerilen "bulut ve zekanın entegrasyonu" stratejisi ve "AI kapsayıcılığı" idealinin Baidu'nun gerçekleştirilmesini de hızlandıracak.
** "Finansal" Xie Lirong: Yapay zekanın 2016'da başlayan son ticarileştirme turunda bazı sorunlar yaşandı ve yapay zeka şirketleri çok sayıda sıkıcı ve ayrıntılı özelleştirme projesi yapmak zorunda kaldı. Büyük modeller, yapay zekanın ticarileştirilmesinin son aşamasında karşılaşılan sorunlardan nasıl kaçınabilir? **
Hou Zhenyu: Bu büyük ölçekli model endüstri iniş turu, on yıl önce derin öğrenmenin temsil ettiği yapay zeka endüstrisinden farklı. Bu, önceki yatırımlardan farklı olarak AI araştırma ve geliştirme için yeni bir paradigmadır. Büyük ölçekli modellerin ortaya çıkmasından önce, AI en çok eleştirilen ve uygulanması en zor olanı, gerçek endüstriyel ortamın parçalanmış olmasıydı. Örneğin, kapıların yüz tanıması ile ödemenin yüz tanıması farklıdır. Işık ve ortam farklı olduğu için farklı uygulamalara yönelik olması ve müşterilerin biriktirdiği verilere göre eğitimin sıfırdan yapılması ve ardından sahneye uyarlanması gerekir. Bu tür özelleştirilmiş teslimat çok külfetlidir.
Ancak temel büyük model altında, çok fazla ince ayar verisi olmadan ve çok fazla eğitim turu olmadan çok iyi sonuçlar elde edilebilir. Temel büyük modeller, birçok senaryoyu eskisinden çok daha kolay çözer. Büyük modellerin genelleme yeteneği eskisinden çok daha güçlüdür. Bu, AI inişinin son turundan farklı. Geçen yıl 1 milyar parametreli bir modele büyük model deniyordu, ancak şimdi model parametreleri genellikle yüz milyarlarca. 100 milyardan fazla parametre ile istihbarat, daha güçlü genelleme yetenekleri ve çeşitli senaryolarda genel yetenekler ortaya çıkacaktır.
** "Finansal" Xie Lirong: Bir sektöre çok sayıda insan akın ettiğinde, balonlar kaçınılmaz olabilir. Büyük model sağlıklı bir şekilde geliştirilecekse ne gibi önerileriniz var? **
Hou Zhenyu: Büyük model uygulayıcılara tavsiyem, elinizden geleni yapın. Hepsini kendi başına yapmak zorunda değilsin. Bunun yerine, AI'nın ticarileştirilmesini düşünün ve yeteneklerinize en uygun senaryoları ve zincirleri bulun. Endüstri erken aşamada hızla geliştiğinde, belirli balonlara izin verilmesini umuyoruz. Bununla birlikte, politika, teknoloji uygulamasının denetimi ve teknolojinin kalitesini değerlendirmek için endüstri standartları konusunda bir fikir birliğine varabilir. Sağlıklı bir şekilde gelişebilmemiz için uyulması gereken standartlar ve uyulması gereken kurallar vardır.
Zhu Yong: Düşünce tarzımızı da değiştirmemiz gerekiyor. Büyük model bir dönüm noktası teknolojisi, yıkıcı bir teknoloji. Açık fikirli olun ve öğrenmeye devam edin.