🎆 Tahun Baru, Keberuntungan Baru! Bergabunglah dalam Perayaan Undian Keberuntungan Terbaik!
🎉 Kredit Kehormatan Komunitas Gate.io Undian Keberuntungan Tahun Baru - Fase 6 resmi diluncurkan!
Mulai undian beruntung sekarang 👉
https://www.gate.io/activities/creditprize?now_period=6 🌟 Bagaimana Cara Berpartisipasi?
1️⃣ Pergi ke [Pusat Kredit] di gate Post dan selesaikan tugas seperti memposting, berkomentar, dan menyukai untuk mendapatkan Kredit Kehormatan.
2️⃣ Ambang batas partisipasi yang lebih rendah: Dapatkan 300 kredit untuk mendapatkan satu entri dalam undian beruntung!
🎁 Ikutlah dalam
Vertikal VS Umum, model besar mendekati titik pertandingan pertama
Sumber: Keuangan Shenmou, penulis | Zhang Wei
Kredit gambar: Dihasilkan oleh alat AI tak terbatas
Medan pertempuran untuk megamodel AI sedang terpecah-pecah.
Sebagai sumbu, Chatgpt membuka pintu ke era AI2.0, dan AI2.0 dicirikan oleh "kecerdasan industri dan digitalisasi", yang dapat menggantikan tenaga kerja secara efisien dan digunakan secara luas di semua lapisan masyarakat. sudah melewati masa pelarian, penerapan model besar AI lebih realistis.
Manifestasi yang paling khas adalah model AI besar keluar dari lingkaran lebih luas, tidak hanya di sisi B. Misalnya, meskipun chatGPT telah dirilis selama lebih dari setengah tahun, penulis masih dapat mendengar suara-suara pekerja migran berbicara tentang chatGPT di kedai kopi di lantai bawah Shanghai CBD; menurut laporan media, beberapa perusahaan juga menggunakan AIGC sebagai alat produktivitas.
Seperti yang dikatakan Zhang Yong, ketua dan CEO Alibaba Group dan CEO Alibaba Cloud Intelligence Group: Menghadapi era AI, semua produk layak dilakukan ulang dengan model besar.
Pabrik-pabrik besar, lembaga penelitian ilmiah, dan pengusaha semuanya telah berakhir.
Pabrikan besar seperti Baidu Wenxin Yiyan, Huawei Pangu, 360 Zhinao, Shangtang Rixin, Ali Tongyi Qianwen, Jingdong Lingxi, Kunlun Wanwei Tiangong dan model besar lainnya telah muncul berturut-turut, diikuti oleh Tencent Hunyuan, HKUST Model besar seperti Xunfei Xinghuo sudah menunggu di garis untuk online.
Pengusaha juga memiliki selebritas: Wang Xiaochuan, pendiri Sogou, Wang Huiwen, salah satu pendiri Meituan, Kaifu Li, ketua Sinovation Works, dan lainnya membuat penampilan profil tinggi dalam model besar AI.
Kegemaran model skala besar AI yang berlangsung selama lebih dari beberapa bulan telah melahirkan dua jalur.
Perlombaan senjata AI, diferensiasi model besar
Model besar AI telah memasuki tahap kompetisi, dan jalurnya secara bertahap menyimpang.
Saat model AI berangsur-angsur memanas, menurut statistik media, pada awal Februari hanya ada 29 saham di bagian "ChatGPT" Oriental Fortune, dan sekarang sudah mencapai 61 saham, dan jumlahnya masih terus meningkat. . Menurut statistik yang tidak lengkap, sampai sekarang, lebih dari 40 perusahaan dan institusi di negara saya telah merilis produk model skala besar atau mengumumkan rencana model skala besar.
Di antara mereka, pemain yang berpartisipasi dalam "perlombaan senjata" model skala besar AI juga telah mengembangkan dua arah pengembangan. Model besar vertikal dan model besar umum menjadi dua arah pengembangan utama di bidang kecerdasan buatan.
Model besar vertikal mengacu pada model yang dioptimalkan untuk domain atau tugas tertentu, seperti pengenalan suara, pemrosesan bahasa alami, klasifikasi gambar, dll.
Saat ini, semakin banyak perusahaan yang mengikuti jalur model skala besar vertikal. Xueersi mengumumkan bahwa mereka sedang mengembangkan model matematika besar yang dikembangkan sendiri, bernama MathGPT, untuk penggemar matematika dan lembaga penelitian ilmiah di seluruh dunia; pada 6 Mei, Taoyun Technology mengumumkan peluncuran model kognitif besar untuk anak-anak - Cognitive Big Alpha Egg Children Model tersebut menghadirkan pengalaman interaktif baru bagi anak-anak dalam hal melatih ekspresi, menumbuhkan EQ, menginspirasi kreativitas, dan membantu pembelajaran.
Model besar umum mengacu pada model yang dapat menangani banyak tugas dan domain, seperti BERT, GPT, dll.
Karena keunggulan modal dan bakat, pabrikan besar terutama membidik jalur model besar untuk keperluan umum.
Manufaktur besar membidik model besar untuk keperluan umum. Di satu sisi, mereka dapat menggabungkan kemampuan AI dengan produk mereka sendiri. Perusahaan Internet yang lebih representatif dan raksasa teknologi seperti Alibaba, Huawei, dan Baidu.
Misalnya, setelah integrasi Microsoft GPT-4 ke dalam ember keluarga Office, "Tongyi Qianwen" Ali juga telah mulai mengakses DingTalk. Pengguna dapat menghasilkan konten dalam dokumen, dan dalam konferensi video, mereka dapat menghasilkan setiap tampilan dan konten Pribadi.
Misalnya, model besar Baidu juga dapat digabungkan dengan bisnisnya sendiri. "Wen Xin Yi Yan" dapat memiliki transformasi kualitatif dalam iterasi mesin telusur. "Yuyan" dari NetEase dan "ChatJD" dari JD.com dapat digunakan pertama kali di industri sendiri.
Di sisi lain, model besar untuk keperluan umum memiliki penerapan yang luas, dan mereka yang mengungguli lebih dulu dapat membangun keunggulan penggerak pertama dan menjadi pemimpin di era AI2.0. Lagi pula, semua orang tahu kebenaran bahwa "yang berlari cepat mendapatkan daging, dan yang berlari lambat hanya bisa makan sisa makanan".
Model besar aplikasi vertikal dapat digambarkan sebagai "aliran yang jelas". Karena model besar aplikasi vertikal lebih sesuai dengan kebutuhan skenario vertikal dan memiliki kualitas lebih tinggi daripada model besar pada umumnya, banyak perusahaan juga telah melihat peluangnya. Misalnya, Shenlan, Mobvoi, Youdao, dan perusahaan lain yang berfokus pada trek AI tertentu.
Pengembangan model vertikal besar terutama tercermin dalam peningkatan berkelanjutan kinerja model di berbagai bidang, misalnya, tingkat kesalahan pengenalan ucapan menurun dari tahun ke tahun, dan kemampuan pemahaman semantik pemrosesan bahasa alami terus meningkat. Model besar umum telah membuat kemajuan luar biasa dalam pembelajaran multi-tugas dan pembelajaran transfer, dan telah menjadi arah penelitian penting di bidang pemrosesan bahasa alami.
Misalnya, model biologis besar dapat meningkatkan efisiensi obat-obatan AI. Laporan penelitian asing menunjukkan bahwa AI dapat meningkatkan tingkat keberhasilan penelitian dan pengembangan obat baru sebesar 16,7%, dan penelitian dan pengembangan obat yang dibantu AI dapat menghemat US$54 miliar dalam biaya penelitian dan pengembangan setiap tahun, dan menghemat 40% hingga 60% dari waktu dan biaya dalam proses utama penelitian dan pengembangan. Menurut informasi publik Nvidia, penggunaan teknologi AI dapat mempersingkat waktu yang diperlukan untuk penemuan obat dini menjadi sepertiga dan menghemat biaya hingga seperseratus.
Dari sudut pandang industri, model umum adalah "ensiklopedia", yang dapat menjawab setiap pertanyaan dan berlaku untuk tanah industri yang berbeda, sedangkan model vertikal mirip dengan seorang ahli dalam satu bidang. Meskipun profesional, audiensnya adalah ditakdirkan untuk menjadi sejumlah kecil orang.
Data fatal
Keuntungan dari model besar vertikal adalah tidak cukup "besar": daya komputasi tidak cukup besar, dan kesulitan algoritme rendah.
Setelah Wang Xiaochuan memasuki jalur model skala besar, ia selalu menekankan bahwa arah upaya masa depan bukanlah melakukan AGI (Kecerdasan Buatan Umum) seperti OpenAI, tetapi membuat model skala besar secara vertikal di bidang spesifik tertentu dan mewujudkan aplikasi pendaratan .
Model besar dalam arti luas sebenarnya menggambarkan model besar untuk keperluan umum Sama seperti model "besar", alasan mengapa model besar itu "besar" adalah karena banyaknya parameter dan jumlah data yang sangat besar, yang berdampak besar pada algoritme, daya komputasi, dan ruang penyimpanan data Persyaratan besar, dan ini bukan hanya orang yang bisa menebusnya, tetapi juga membutuhkan banyak uang. Tahukah Anda, kesuksesan Open AI juga dibangun oleh Microsoft dengan miliaran dolar. Permintaan modal yang besar juga menjadi ujian bagi keteguhan produsen besar dalam riset dan pengembangan.
Dalam lima tahun terakhir, volume parameter model besar AI telah meningkat dengan urutan besarnya setiap tahun.Misalnya, volume parameter GPT-4 adalah 16 kali lipat dari GPT-3, mencapai 1,6 triliun; dan dengan diperkenalkannya data multimodal seperti gambar, audio dan video, volume data model besar juga berkembang pesat. Artinya jika ingin bermain dengan model besar, Anda harus memiliki daya komputasi yang besar.
Dibandingkan dengan pabrikan besar, perusahaan yang membuat model skala besar vertikal memiliki dana, daya komputasi, dan data yang relatif langka, sehingga mereka sebenarnya tidak berada di garis awal yang sama dengan pemain model skala besar tujuan umum.
Sama seperti kendaraan energi baru yang tidak dapat dipisahkan dari tiga komponen utama motor, baterai, dan kontrol elektronik, model besar AI tidak dapat dipisahkan dari dukungan daya komputasi, algoritme, dan data.
Di antara daya komputasi, algoritme, dan data, data adalah kesulitan dari model vertikal besar.
Di antara ketiga elemen tersebut, kesulitan penelitian dan pengembangan algoritme relatif rendah, perusahaan saat ini memiliki algoritme jalur mereka sendiri untuk mengimplementasikan model besar, dan ada banyak proyek sumber terbuka untuk referensi.
Chip menentukan daya komputasi. Model AI besar secara keseluruhan membutuhkan chip berperforma lebih tinggi untuk menyelesaikan pelatihan dan pembangunan jaringan saraf model keseluruhan. Namun, chip saat ini kurang dikembangkan sendiri, dan sebagian besar masih bersumber dari eksternal. Misalnya chip yang paling cocok untuk ChatGPT adalah dari Nvidia, chip flagship H100 dan chip sub-flagship A100.
Kesulitannya terletak pada data. Data berkualitas tinggi adalah kunci untuk membantu pelatihan dan penyetelan AI. Data yang cukup dan kaya adalah fondasi model besar AI generatif.
Menurut pengungkapan OpenAI sebelumnya, jumlah parameter ChatGPT3 saja sudah mencapai 175 miliar, dan data pelatihan sudah mencapai 45TB.
Karena perkembangan Internet seluler China yang relatif matang, sejumlah besar sumber daya data China disimpan di berbagai perusahaan atau institusi, sehingga sulit untuk dibagikan.
"Karena banyak data bisnis, data logistik, data keuangan, dll. dari perusahaan adalah data domain pribadi yang sangat inti, sulit untuk membayangkan bahwa China Star Optoelektronik atau PetroChina akan menggunakan data tersebut untuk pelatihan orang lain." Xu Hui, CEO Chuangxinqizhi, baru-baru ini diwawancarai oleh sekuritas Dalam wawancara dengan Times, dia juga berkata blak-blakan.
Mengambil contoh industri farmasi AI, model biologis besar menghadapi masalah "terjebak" oleh teknologi. Biaya untuk mendapatkan data eksperimen presisi tinggi untuk penelitian dan pengembangan obat relatif tinggi, dan ada sejumlah besar data yang tidak berlabel di database publik. jumlah data presisi tinggi, sehingga persyaratan yang lebih tinggi diajukan untuk konstruksi model.
**Siapa yang akan mendapatkan pot emas pertama? **
Terlepas dari modelnya, komersialisasi adalah masalah inti. Dilihat dari pemain AI saat ini dengan model besar, mereka dengan cepat memajukan pemberdayaan dan komersialisasi.
Meskipun model skala besar tujuan umum dan model skala besar vertikal mengambil jalur yang berbeda, mereka pada dasarnya masih "keluarga" dan berada di jalur yang sama, sehingga masalah persaingan tidak dapat dihindari.
Untuk model skala besar umum, model skala besar vertikal mendarat terlebih dahulu, dan jalur model skala besar umum akan lebih sempit. Demikian pula, setelah model skala besar tujuan umum dengan cepat merebut pasar, akan lebih sulit bagi model skala besar vertikal dengan lini bisnis sempit untuk menghasilkan uang.
Pada tahap ideal, apakah itu model ekonomi atau nilai universal, model skala besar tujuan umum lebih baik daripada model skala besar vertikal. Namun, kehidupan nyata bukanlah utopia, siapa pun yang berlari lebih cepat antara model skala besar serba guna dan model skala besar vertikal bergantung pada persaingan di antara berbagai perusahaan.
Dilihat dari panasnya AIGC tahun lalu. Dibandingkan dengan mengizinkan pengguna menggunakan AI untuk menghasilkan konten dengan ambang batas yang lebih rendah pada C-end, beberapa pelaku pasar percaya bahwa B-end akan menjadi model bisnis AIGC yang lebih penting.
Huawei juga lebih memperhatikan bisnis ToB-nya sendiri. Pada konferensi pers, Huawei menyatakan bahwa model besar Huawei Pangu terutama menggunakan AI untuk memberdayakan industri dan digunakan di banyak industri seperti tenaga listrik, keuangan, dan pertanian, di antaranya model besar CV digunakan di pertambangan, dan NLP model besar digunakan dalam pengambilan dokumen cerdas.
Misalnya, Baidu, yang berspesialisasi dalam mesin pencari, telah meluncurkan Wenxin Yiyan dengan atribut pencarian seperti GPT-3.
Selain ChatGPT, sebenarnya sebelum hembusan model skala besar AI, ada adegan pendaratan Model "besar" ini sebenarnya sebagian besar adalah model skala besar vertikal.
Menghasilkan uang lebih penting daripada mendarat.
Menurut laporan Guosheng Securities "Berapa Banyak Daya Komputasi yang Dibutuhkan untuk ChatGPT", diperkirakan bahwa biaya pelatihan GPT-3 adalah sekitar 1,4 juta dolar AS, dan untuk beberapa LLM (Large Language Model) yang lebih besar, biaya pelatihan antara 2 juta dolar AS dan 12 juta dolar AS antara. Berdasarkan rata-rata jumlah pengunjung unik ChatGPT pada bulan Januari sebesar 13 juta, permintaan chip terkait lebih dari 30.000 GPU NVIDIA A100, biaya investasi awal sekitar 800 juta dolar AS, dan biaya listrik harian sekitar 50.000 dolar AS.
Tidak ada keraguan bahwa model skala besar tujuan umum lebih banyak digunakan dalam skenario pendaratan. Untuk pemain yang percaya diri dengan model skala besar tujuan umum, komersialisasi adalah yang kedua. Model skala besar vertikal membutuhkan komersialisasi yang lebih cepat untuk menutupi bagian bawah garis, sehingga model skala besar vertikal memiliki lebih banyak keuntungan Probabilitas tinggi dan tingkat adopsi yang lebih cepat.
Tidak ada jawaban pasti siapa yang dapat membentuk keunggulan absolut terlebih dahulu. "Perlombaan senjata" model besar AI ini seperti kupu-kupu yang berubah dari web1 ke web2. Perusahaan berpacu dengan waktu, dan siapa pun yang mengambil peluang terlebih dahulu akan merebut pasar.