🎯 Ingin Lebih Banyak Paparan dan Kesempatan untuk Ditampilkan di Halaman Utama?
📣 Kirim dengan #I Wanna Get Featured# dan Bagikan Hadiah Unggulan $100 Setiap Minggu!
Setiap hari Rabu dan Jumat, satu poster berkualitas akan dipilih untuk menerima Voucher Pengembalian Biaya Trading $50!
Pos berkualitas akan ditandai sebagai "Unggulan," diprioritaskan untuk rekomendasi pengguna lebih banyak, dan diumumkan di saluran gate_Post!
Catatan: Voucher Pengembalian Biaya Perdagangan berlaku selama 30 hari. Harap gunakan dalam periode ini.
Cara bergabung:
1️⃣ Posting konten berkualitas tinggi, s
Dialog | 79 model dasar skala besar lahir dalam tiga bulan Model skala besar seperti apa yang dibutuhkan China?
Teks: Wu Junyu Editor: Xie Lirong
Sumber: Finance Eleven
Setelah ChatGPT dirilis pada akhir tahun lalu, perusahaan China telah merilis setidaknya 79 model besar dasar. Namun, sebagian besar model besar dianggap oleh dunia luar memiliki celah teknis dengan ChatGPT. Bisnis model skala besar sudah dekat Model skala besar seperti apa yang dibutuhkan China?
Pada Desember 2022, OpenAI, sebuah perusahaan startup AI yang diinvestasikan oleh Microsoft, meluncurkan ChatGPT AI percakapan. ChatGPT pada dasarnya adalah model besar bahasa GPT yang dikembangkan secara independen oleh OpenAI, yang berisi hampir 180 miliar parameter. Pada bulan Februari tahun ini, CEO Nvidia Huang Renxun berkomentar bahwa "ChatGPT mengantar momen iPhone untuk AI". Huang Renxun percaya bahwa model besar menurunkan ambang batas untuk pengembangan aplikasi, dan semua aplikasi layak dilakukan ulang dengan model besar.
Ini bukan perkataan keluarga Huang Renxun, semua orang melihat peluang. Awal Maret tahun ini, perusahaan China juga berlomba-lomba merilis produk model berskala besar. Ini termasuk perusahaan top, seperti model Wenxin Baidu, model Tongyi Ali, dan model industri Tencent, serta perusahaan industri seperti Xunfei dan SenseTime, serta sejumlah perusahaan start-up. Pada bulan Mei, Institut Informasi Ilmiah dan Teknologi China di bawah Kementerian Sains dan Teknologi merilis "Laporan Penelitian tentang Peta Model Besar Kecerdasan Buatan China". Menurut laporan tersebut, pada 28 Mei, setidaknya 79 model skala besar dasar dengan parameter di atas 1 miliar telah dirilis di China.
**Meskipun model AI yang saat ini dirilis di pasaran semuanya disebut "model besar", jumlah parameter secara default dianggap sebagai salah satu faktor penentu untuk model besar dan model kecil. **Hou Zhenyu, wakil presiden Grup Baidu, mengatakan kepada reporter Caijing bahwa model dengan 1 miliar parameter pada tahun 2022 disebut model besar. Tetapi parameter model besar saat ini seringkali mencapai ratusan miliar. Karena efek "kemunculan cerdas" akan muncul dengan lebih dari 100 miliar parameter, kemampuan generalisasi akan terbentuk, dan kemampuan universal dalam berbagai skenario akan terbentuk. Model yang disesuaikan berdasarkan model besar ini memiliki efek aplikasi industri yang lebih baik.
**Efek "kemunculan cerdas" mengacu pada fakta bahwa setelah skala model dan tingkat daya komputasi melebihi ambang batas parameter tertentu, efek AI tidak lagi menjadi peristiwa probabilitas acak. **Di bidang umum, semakin besar jumlah parameter, semakin besar kemungkinan munculnya kecerdasan secara umum, dan semakin tinggi akurasi AI. Di bidang vertikal khusus, lebih mudah mendapatkan hasil yang akurat setelah model parameter besar dipotong dan dioptimalkan.
Meskipun setidaknya 79 model skala besar telah muncul di China, banyak profesional industri yang diwawancarai oleh Caijing percaya bahwa model skala besar memerlukan daya komputasi, algoritme, dan akumulasi data. Karena kekurangan chip GPU berperforma tinggi, biaya pengadaan perangkat keras yang tinggi, dan biaya pengoperasian yang tinggi, sangat sedikit perusahaan di China yang memiliki cadangan modal, kemauan strategis, dan kemampuan praktis untuk dijalankan melalui komersialisasi model besar. Dalam "Perang Seratus Model", memang ada celah antara sebagian besar produk dan ChatGPT.
Setelah heboh, maniak model besar itu perlahan kembali ke dunia nyata. Pemikiran yang lebih rasional muncul di pasar model skala besar di dalam dan luar negeri-ChatGPT yang tidak dapat dikomersialkan hanya dapat berupa mainan, dan model skala besar yang dapat menjadi aplikasi perusahaan memiliki nilai industri.
Perusahaan seperti Apple, Samsung, dan JPMorgan Chase telah melarang karyawan menggunakan ChatGPT karena masalah keamanan. Di sisi lain, pertumbuhan dan retensi pengguna ChatGPT juga mengalami hambatan. Menurut data dari alat analisis situs web SimilarWeb, tingkat pertumbuhan lalu lintas ChatGPT dari Januari hingga Mei adalah 131,6%, 62,5%, 55,8%, 12,6%, dan 2,8%. Pada awal Juni, survei Morgan Stanley menunjukkan bahwa hanya 19% responden yang mengatakan telah menggunakan ChatGPT, dan hanya 4% yang mengatakan bahwa mereka mengandalkan ChatGPT.
Hou Zhenyu berkata, "Pada bulan Maret tahun ini, ketika pelanggan pertama kali berbicara dengan kami tentang kebutuhan model skala besar, mereka semua menggunakan imajinasi mereka, meminta lebih banyak sci-fi. Namun setelah April, keterbatasan besar- model skala terungkap, dan semua orang melambat. Perlahan-lahan melihat lebih banyak kebutuhan aktual.” Di bawah pengaruh faktor subjektif dan objektif, model skala besar dasar global terutama berorientasi pada pasar industri To B.
**Komersialisasi model besar di ujung To C lambat. **Saat ini, kami menghadapi masalah seperti tingginya biaya daya komputasi, dan semakin besar skala pengguna, semakin besar kerugian perusahaan. Juga tidak dapat dihindari untuk mengeluarkan "noise" yang salah, dan bahkan ada tantangan etis seperti kebocoran informasi dan pengawasan kebijakan. Bahkan Microsoft hanya menerapkan model besar dalam produk alat (office office suite, browser web, alat pengeditan foto seperti Photoshop). Inti dari layanan penjualan Microsoft kepada perusahaan alat masih merupakan komersialisasi To B.
** Ini adalah pendekatan pragmatis untuk mengimplementasikan model besar untuk pelanggan perusahaan To B-end. **Di pasar industri, kebutuhan pelanggan sangat kuat dan jelas. Di seluruh dunia, ritel, keuangan, manufaktur, pemerintahan, dan bidang lainnya mengandalkan model besar untuk peningkatan cerdas. Konsensus industri adalah bahwa model yang telah disesuaikan berdasarkan pengetahuan industri berdasarkan model besar akan berkinerja lebih baik daripada model besar tujuan umum yang tidak dioptimalkan.
Menurut data yang dirilis oleh firma riset pasar IDC pada Mei tahun ini, ukuran total pasar kecerdasan buatan China pada 2022 akan mencapai US$12,2 miliar, termasuk US$8,13 miliar untuk perangkat keras, US$2,69 miliar untuk perangkat lunak, dan US$1,41 miliar untuk layanan. IDC memperkirakan pada tahun 2026, pasar kecerdasan buatan China akan mencapai US$26,9 miliar, termasuk US$14,85 miliar untuk perangkat keras, US$7,69 miliar untuk perangkat lunak, dan US$3,89 miliar untuk layanan. Tingkat pertumbuhan tahunan gabungan dari perangkat keras, perangkat lunak, dan layanan masing-masing adalah 15,1%, 32,0%, dan 28,5%.
Profil Pembicara:
Hou Zhenyu, wakil presiden Baidu Group (bertanggung jawab atas tim penelitian produksi cloud computing dan tim teknik teknologi dasar Baidu Smart Cloud Business Group)
Zhu Yong, Wakil Presiden Baidu Smart Cloud (menanggung jawab Pusat Produk Aplikasi Baidu Smart Cloud)
Pembawa acara: Xie Lirong, Wakil Pemimpin Redaksi Majalah Caijing
Berikut ini adalah versi ringkas dari catatan dialog:
**Apakah model besar adalah permainan mewah? **
** "Keuangan" Xie Lirong: China telah memicu gelombang kewirausahaan skala besar, dan ambang batas untuk model skala besar sangat tinggi, tetapi situasi pasar China saat ini tampaknya tidak demikian dalam hal kecepatan dan skala masuknya? **
Zhu Yong: Ambang batas untuk model besar bersifat relatif, dan akan ada berbagai jenis pemain. Kategori pertama sama dengan Baidu, membuat model besar dasar dari nol. Ini memiliki persyaratan yang sangat tinggi untuk daya komputasi, algoritme, data, dan bakat.
Mengambil data sebagai contoh, model besar dasar membutuhkan pelatihan data yang masif, termasuk data Internet, data lapangan profesional, data informasi berita, dan data berlabel profesional berkualitas tinggi. Mengambil daya komputasi sebagai contoh, model besar dengan ratusan miliar parameter seperti ChatGPT perlu dilatih terus menerus selama 100 hari dengan GPU A100/H100 paling canggih NVIDIA. Algoritma dan bakat juga merupakan kunci. Insinyur memiliki metode pelatihan yang berbeda, seperti koki yang berbeda memasak hidangan dengan rasa berbeda berdasarkan bahan mentah yang sama. Ini membutuhkan akumulasi pengalaman praktis jangka panjang, sehingga ambang batasnya sangat tinggi.
Kategori kedua adalah model industri besar, yang membutuhkan beberapa penyesuaian dan penyesuaian yang ditargetkan berdasarkan kemampuan model besar dasar. Ini jauh lebih rendah daripada biaya pelabelan data dan penyempurnaan algoritme dari awal di masa lalu. Kategori ketiga mengembangkan aplikasi berdasarkan dua model besar pertama Baidu, perusahaan lain dan bahkan beberapa platform sumber terbuka menyediakan alat pengembangan untuk menurunkan ambang batas pengembangan perangkat lunak.
** "Keuangan" Xie Lirong: Apa level model skala besar China di pasar global? **
**Hou Zhenyu:**Secara pribadi, menurut saya model skala besar China masih memimpin di pasar global. Pengembangan model skala besar dan pengembangan mesin pencari sebenarnya serupa, dan keduanya membutuhkan akumulasi teknis yang sangat dalam. Dari perspektif global, hanya ada beberapa negara yang memiliki penelitian dan pengembangan teknologi mesin pencari independen. Saat ini, China dan Amerika Serikat mungkin satu-satunya dua negara yang dapat sepenuhnya mengembangkan teknologi model skala besar secara mandiri.
** "Keuangan" Xie Lirong: Apakah ada kemajuan dan keterbelakangan absolut dalam model besar? **
**Hou Zhenyu: **Model besar tidak sepenuhnya baik atau buruk. Meski mungkin memiliki perbedaan tertentu di berbagai bidang, itu seperti memilih smartphone. Beberapa orang menggunakan Apple, beberapa orang menggunakan Android, yang paling cocok adalah yang terbaik. Saat model besar pertama kali diluncurkan, orang sering mengajukan beberapa pertanyaan rumit tentangnya. Namun nyatanya, dalam lingkungan tingkat perusahaan yang benar-benar serius, hanya ada sedikit skenario seperti itu. Perusahaan perlu memilih model besar yang lebih cocok untuk mereka sesuai dengan skenario bisnis mereka. Perusahaan China, khususnya, perlu memilih produk yang memiliki pemahaman bahasa China yang lebih baik dan sesuai dengan karakteristik perusahaan China.
** "Keuangan" Xie Lirong: Berapa banyak sumber daya dan bakat yang diinvestasikan Baidu dalam model berskala besar? **
**Hou Zhenyu: **Model skala besar AI adalah strategi inti Baidu, yang membutuhkan investasi intensitas tinggi yang berkelanjutan dan komprehensif. Mengambil daya komputasi sebagai contoh, akumulasi jumlah GPU yang kami kumpulkan di masa lalu diukur dalam puluhan ribu, yang merupakan investasi besar. Baidu juga telah mengembangkan rangkaian alat lengkap selama bertahun-tahun untuk melatih model lebih cepat dan lebih baik.
Dalam 10 tahun terakhir, Baidu telah menginvestasikan lebih dari 100 miliar yuan di AI. Sebagai perusahaan teknologi, Baidu menghabiskan lebih dari 20% pendapatannya untuk R&D setiap tahun. (Keterangan: Setelah 2019, pengeluaran R&D inti Baidu menyumbang lebih dari 20% pendapatan untuk waktu yang lama. Pada 2022, tingkat pengeluaran R&D Baidu adalah 24%, kedua setelah Huawei 25% di antara perusahaan teknologi China. Inti Baidu merujuk pada pengecualian Aiqi Baidu memiliki bisnisnya sendiri setelah seni), tetapi model besar tidak sesederhana menginvestasikan sejumlah uang untuk membuat model. Ini membutuhkan daya komputasi, data, dan insinyur AI berpengalaman untuk menumpuk dalam waktu lama pada barang Platform R&D.
**Hou Zhenyu: **Uang, kartu, dan data itu sendiri sangat menantang. Perusahaan pemula membuat model skala besar dasar. Selain daya komputasi minimum, data yang cukup dan berkualitas tinggi, serta personel R&D AI yang berpengalaman, mereka juga membutuhkan platform pengembangan AI yang dapat mengelola model dan daya komputasi dengan baik. Saat ini, perusahaan besar akan menggunakan platform tersebut untuk menyediakan layanan eksternal berupa cloud. Misalnya, Baidu Smart Cloud menyediakan layanan eksternal melalui platform model skala besar Wenxin Qianfan. Namun, ambang batas untuk melatih model besar dasar dari awal masih sangat tinggi. Karena model besar tidak cukup untuk dilatih, tetapi juga membutuhkan iterasi gesit yang berkelanjutan, dan perusahaan besar akan relatif lebih matang.
** "Keuangan" Xie Lirong: Beberapa perusahaan mulai membangun model besar mereka sendiri. Apakah perlu membuat model besar sendiri? Ketika cloud publik baru muncul pada tahun 2014, beberapa pelanggan mengkhawatirkan keamanan data, apakah mereka juga mengkhawatirkan masalah ini saat menggunakan model besar? **
**Hou Zhenyu:**Setiap perusahaan harus menggunakan model skala besar, tetapi apakah setiap perusahaan perlu membuat model skala besar sendiri? Saya kira tidak demikian. Sangat mahal untuk membuat sendiri model besar dasar dari awal. Perusahaan dapat menggunakan data mereka sendiri untuk menyempurnakan model dasar orang lain, dan mereka juga dapat mencapai hasil yang sangat baik.
Zhu Yong: Menurut saya, perusahaan harus lebih memikirkan cara menggunakan model besar dan cara memanfaatkan model besar dengan baik. Setiap bisnis dapat memiliki maketnya sendiri, tetapi tidak perlu memulai dari awal. Karena perusahaan seperti Baidu telah memberikan basis teknis yang baik. Anda dapat mengandalkan Baidu untuk membuat beberapa produk yang disesuaikan, yang merupakan pilihan hemat biaya yang lebih baik bagi pelanggan. Masalah keamanan data bukanlah masalah baru yang ditimbulkan oleh munculnya model-model besar. Jika dibandingkan dengan cloud computing, ada public cloud, private cloud, hosting dan sebagainya. Dalam model bisnis berskala besar, kami telah sepenuhnya mempertimbangkan produk dan solusi yang sesuai.
** "Keuangan" Xie Lirong: Popularitas smartphone dan cloud disebabkan oleh harganya yang murah. Kapan model besar China akan memasuki tahap aplikasi umum? **
Hou Zhenyu: Model besar itu sendiri membawa banyak penghematan biaya. Dulu, ketika perusahaan mengembangkan aplikasi AI, mereka perlu melakukan pembersihan data, pelabelan, pelatihan model, penalaran, dan pengoptimalan sesuai dengan skenario aplikasi. Sekecil apa pun pemandangannya, seluruh proses harus dilakukan, dan biayanya sangat tinggi. Namun berdasarkan model besar, tidak diperlukan begitu banyak data, waktu, sumber daya, dan tenaga kerja di masa lalu. Saya menyarankan agar perusahaan memperhatikan dan menggunakan teknologi model skala besar sesegera mungkin, karena ini dapat sangat mengurangi ambang penerapan AI.
**Model besar apa yang dibutuhkan perusahaan China? **
** "Keuangan" Xie Lirong: Model skala besar Wenxin Baidu memulai pengujian internal pada bulan Maret. Selama pengujian internal, dapatkah perusahaan dengan jelas mengedepankan kebutuhannya sendiri? Di mana kebutuhan mereka terkonsentrasi? **
**Zhu Yong:**Sejak pengujian internal pada bulan Maret, kami secara berturut-turut telah menerima permintaan akses dari lebih dari 150.000 pelanggan. Pada saat yang sama, ratusan mitra sedang melakukan uji penelitian dan pengembangan bersama kami di lokasi. Ini mencakup berbagai industri seperti Internet, manufaktur, dan keuangan, dan banyak skenario di dalamnya bernilai tinggi. Singkatnya, ada beberapa kategori skenario frekuensi tinggi—manajemen pengetahuan, pembuatan konten (termasuk copywriting pemasaran, informasi media), layanan pelanggan cerdas, pembuatan kode, dan peningkatan efisiensi kantor.
** "Keuangan" Xie Lirong: Ada masalah lama di pasar transformasi digital, banyak pelanggan tidak tahu apa yang mereka inginkan. Di bidang model besar, apakah kontradiksi ini juga ada? **
**Zhu Yong: **Memang ada perbedaan antara industri yang berbeda dan pelanggan yang berbeda. Setelah model besar keluar, industri Internet sangat memperhatikan perkembangan terbarunya, pemahaman teknis dan kognisi produk mereka sangat maju, sehingga kami dapat dengan cepat melakukan penelitian dan pengembangan bersama, dan membuat demo dan inovasi produk.
Fondasi digital dari beberapa industri tradisional relatif lemah, sehingga Baidu akan memiliki banyak insinyur untuk berkreasi bersama dengan pelanggan, menggabungkan kemampuan AI dengan kelemahan industri mereka, dan menghasilkan banyak konsep produk yang sangat baru. Ketika teknologi AI digabungkan dengan industri, perlu untuk memahami teknologi dan AI di satu sisi, dan memahami industri di sisi lain. Oleh karena itu, saat kami terhubung dengan pelanggan dan mitra, kami sering membutuhkan kedua belah pihak untuk berkreasi bersama.
** "Keuangan" Xie Lirong: Bagaimana Baidu menyediakan layanan model skala besar untuk industri yang berbeda dan jenis pelanggan yang berbeda? Bagaimana cara mengevaluasi kinerja biaya dari sudut pandang pelanggan? **
Zhu Yong: Dalam hal harga, jika perusahaan hanya mencoba dan peka terhadap harga, ia dapat menggunakan layanan cloud publik. Menurut volume panggilan, Bayar sesuai pemakaian (sebanyak yang Anda gunakan ) tidak memerlukan basis satu kali Investasi dalam fasilitas juga merupakan keuntungan dari cloud publik. Beberapa perusahaan bersedia melakukan investasi infrastruktur besar dan membangun aplikasi cerdas mereka sendiri Baidu dapat menyediakan satu set lengkap model AI dan basis AI, dan perusahaan dapat mengembangkan aplikasi berdasarkan model AI dan basis AI.
** "Keuangan" Xie Lirong: Bagaimana perusahaan memilih model besar yang cocok untuk mereka? **
Hou Zhenyu: Pertama, itu harus menjadi efek model, yang menjadi dasar untuk memilih model besar. Perusahaan perlu mengevaluasi nilai yang dapat dimainkan oleh model besar dalam skenario penggunaan. Kedua, fokus pada kecepatan iterasi. Itu tidak hanya bergantung pada apakah model besar dasar itu sendiri memiliki vitalitas, tetapi juga pada apakah platform memiliki rantai alat yang lengkap, mendukung pengembangan sekunder yang nyaman dan pelatihan ulang model, dan mendukung iterasi model besar yang lebih baik. Ketiga, biaya pendaratan aktual dan bentuk pengiriman model besar. Perusahaan dapat memilih mode pengiriman cloud publik dan cloud pribadi sesuai dengan kebutuhan mereka.
** Xie Lirong "Keuangan": Wenxin Qianfan diposisikan sebagai platform model skala besar tingkat perusahaan satu atap, bagaimana memahami "satu atap" dan "tingkat perusahaan"? **
Hou Zhenyu: Pertama-tama, "one-stop", AI adalah teknologi yang digerakkan oleh data. Sejak awal kelahirannya, AI perlu mengumpulkan, membersihkan, dan melabeli data, lalu melakukan pelatihan berdasarkan model yang ada. Setelah pelatihan, AI perlu mengelola data yang disesuaikan dan versi model, dan akhirnya menerapkannya untuk penggunaan bisnis . Ini adalah keseluruhan proses. Baidu menyediakan kemampuan ini, dan sangat mudah digunakan, yang dapat memenuhi kebutuhan pelanggan di seluruh siklus hidup penelitian dan pengembangan AI hingga aplikasi.
Selain "tingkat perusahaan", aplikasi tingkat perusahaan bukanlah aplikasi pribadi, tidak sesederhana mengunggah foto. Aplikasi tingkat perusahaan akan lebih halus dan kompleks, dan faktor-faktor seperti skala, skalabilitas, biaya implementasi, serta stabilitas dan ketahanan perlu dipertimbangkan.
** "Keuangan" Xie Lirong: Menurut Baidu, platform model skala besar Wenxin Qianfan memiliki enam karakteristik - mudah digunakan, aman, komprehensif, efisien, terbuka, dan terintegrasi. Mengapa kemudahan penggunaan harus didahulukan? Benarkah hanya teknologi yang bermanfaat yang akan dipopulerkan? **
**Hou Zhenyu: **Kemudahan penggunaan sangat penting. Model besar bahasa alami dapat memberi pelanggan antarmuka yang lebih mudah digunakan, yang nyaman bagi semua orang untuk berinteraksi dengan mesin. "Integrasi cloud dan kecerdasan, inklusivitas AI" adalah strategi Baidu Smart Cloud, dan "inklusivitas AI" selalu menjadi salah satu cita-cita kami. AI tidak bisa hanya teknologi tinggi di menara gading, ambang penggunaan AI harus diturunkan, termasuk ambang penggunaan data, penggunaan sumber daya, dan penggunaan AI oleh manusia, oleh karena itu, kemudahan penggunaan sangat penting.
** "Keuangan" Xie Lirong: Dalam tiga bulan terakhir, publik telah dipopulerkan dengan baik dengan model kecerdasan buatan. Untuk ribuan industri, apakah peluang komersial untuk model besar datang? Seperti apa seharusnya ritme bisnis yang baik? **
**Zhu Yong: **Model besar kecerdasan buatan memiliki perubahan yang sangat jelas dalam R&D dan paradigma aplikasi. Semakin cepat Anda merangkul dan memahami model besar, semakin besar dampaknya pada bisnis. Ini bukan pertanyaan ya atau tidak. Dalam hal mondar-mandir, perusahaan yang berbeda merangkul model besar dengan cara yang berbeda. Beberapa perusahaan dapat memulai dari uji coba aplikasi satu titik dan menggunakan cloud publik untuk memanggil layanan, sehingga mereka dapat dengan cepat memverifikasi dan melakukan pengembangan demo dengan biaya lebih rendah.
Di sisi lain, tidak peduli itu adalah perusahaan besar atau kecil, perlu menumbuhkan pemikiran asli AI. Misalnya, beberapa aplikasi dapat diubah dan ditingkatkan secara bertahap. Pendekatan lain disebut refactoring Menurut pernyataan internal Baidu, semua produk di masa depan akan dibuat ulang berdasarkan model besar.
** Apakah ada gelembung di pasar model besar? **
** "Keuangan" Xie Lirong: Apakah Anda benar-benar membutuhkan begitu banyak model besar di pasar B-end yang berorientasi bisnis? **
**Hou Zhenyu:**Pendapat pribadi saya adalah bahwa model besar dasar tidak membutuhkan begitu banyak. Tentu saja, ini hanya menantikan dari akhir. Namun di awal perkembangan industri apa pun, pasar menjadi makmur dan berbusa. Dari perspektif pembangunan industri, kita harus membiarkan beberapa gelembung sekarang. Kita juga harus menghadapi ini. Tapi saya masih percaya bahwa setelah ombak besar menghanyutkan pasir, masih sedikit perusahaan yang akhirnya menyediakan layanan model dasar.
**Zhu Yong: **Dalam arah model besar dasar, meskipun ada banyak pemain sekarang, sangat sulit untuk mempertahankan iterasi yang cepat, terus mengembangkan rantai alat yang lebih komprehensif dan lengkap, dan terus meningkatkan kemampuan produk berdasarkan pelanggan umpan balik hal. Oleh karena itu, meskipun model besar mungkin sangat panas sekarang, ini adalah balapan jarak jauh, pada akhirnya akan menjadi seperti lanskap komputasi awan saat ini, dan pasar secara bertahap akan bertemu.
** "Keuangan" Xie Lirong: Banyak perusahaan yang membuat perangkat keras server juga ingin membuat model industri berskala besar. Baidu dulunya adalah pelanggan mereka, tetapi sekarang mereka bersaing satu sama lain. Bagaimana seharusnya kita hidup bersama dengan damai? **
Hou Zhenyu: Saya rasa kita tidak bisa langsung membicarakan persaingan. Kita masih menjalin hubungan kerja sama terlebih dahulu. Kedua belah pihak memang akan memiliki layanan serupa dan menghadapi industri serupa pada saat yang sama, tetapi kami dan produsen perangkat keras tradisional lebih saling melengkapi. Baidu adalah perusahaan AI dengan gen Internet, telah mengumpulkan sejumlah besar data untuk tujuan umum dan model besar untuk tujuan umum, keunggulannya terletak pada AI, perangkat lunak, teknologi, dan bidang lainnya. Produsen perangkat keras tradisional telah mengumpulkan data industri dan mengembangkan Pengetahuan di bidang vertikal seperti industri pemerintah dan perusahaan tradisional. Kedua belah pihak memiliki kekuatan yang berbeda dalam membangun model besar. Perusahaan seperti Baidu dan H3C tidak hanya menjadi mitra dalam membeli server dan sakelar, tetapi juga bersama-sama membangun model besar.
** "Keuangan" Xie Lirong: Baidu biasanya memperhatikan kemajuan model besar pesaing? **
Zhu Yong: Pertama, teknologi dan efek keseluruhan. Kedua, alat pendukung. Ketiga, model bisnis. Jika Anda kembali tiga atau empat tahun yang lalu, pasar kecerdasan buatan masih relatif jauh, tetapi saat ini teknologi pembelajaran mendalam, komersialisasi produk, investasi, dan ekologi sumber terbuka semuanya semakin cepat.
** "Keuangan" Xie Lirong: Dalam beberapa tahun ke depan, apakah model skala besar akan menjadi arah utama inti Baidu? Mengapa? **
**Hou Zhenyu: **Model besar akan menjadi fokus utama Baidu. Baidu adalah perusahaan AI, dan model besar merupakan arah pengembangan AI yang penting. Apakah itu di sisi Ke C atau di sisi Ke B, itu akan membawa perubahan besar pada produk dan layanan Baidu. Bagi Baidu, model besar sangat menarik, yang merupakan peluang sekaligus tantangan. Baidu akan terus berinvestasi dalam model besar. Saya yakin model besar akan mempercepat komputasi awan ke era AI dan membentuk kembali lanskap komputasi awan. Status MaaS (Model sebagai Layanan) akan menjadi semakin penting, dan itu juga akan mempercepat realisasi Baidu Strategi "integrasi cloud dan kecerdasan" dan cita-cita "inklusivitas AI" yang diusulkan oleh Smart Cloud.
** "Keuangan" Xie Lirong: Putaran terakhir komersialisasi kecerdasan buatan yang dimulai pada tahun 2016 memiliki beberapa masalah, dan perusahaan AI harus melakukan banyak proyek penyesuaian yang membosankan dan mendetail. Bagaimana model besar dapat menghindari masalah yang dihadapi pada putaran terakhir komersialisasi kecerdasan buatan? **
Hou Zhenyu: Putaran pendaratan industri model berskala besar ini berbeda dengan industri AI yang diwakili oleh pembelajaran mendalam sepuluh tahun lalu. Ini adalah paradigma baru untuk penelitian dan pengembangan AI, yang berbeda dari investasi sebelumnya. Sebelum munculnya model skala besar, AI paling banyak dikritik dan yang paling sulit diterapkan adalah lingkungan industri yang sebenarnya terfragmentasi. Misalnya, pengenalan wajah gerbang dan pengenalan wajah pembayaran berbeda. Karena cahaya dan lingkungan berbeda, perlu berorientasi pada aplikasi yang berbeda, dan pelatihan harus dilakukan dari awal sesuai dengan data yang dikumpulkan oleh pelanggan, dan kemudian disesuaikan dengan pemandangan. Jenis pengiriman yang disesuaikan ini sangat rumit.
Namun di bawah model dasar yang besar, hasil yang sangat baik dapat diperoleh tanpa terlalu banyak data penyetelan halus dan tanpa terlalu banyak putaran pelatihan. Model dasar besar memecahkan banyak skenario jauh lebih mudah dari sebelumnya. Kemampuan generalisasi model besar jauh lebih kuat dari sebelumnya. Ini berbeda dengan putaran terakhir pendaratan AI. Tahun lalu, model dengan 1 miliar parameter disebut model besar, tetapi sekarang parameter model seringkali mencapai ratusan miliar. Dengan lebih dari 100 miliar parameter, kecerdasan akan muncul, kemampuan generalisasi yang lebih kuat, dan kemampuan umum dalam berbagai skenario.
** "Keuangan" Xie Lirong: Ketika banyak orang masuk ke dalam suatu industri, gelembung mungkin tidak terhindarkan. Jika model besar akan dikembangkan dengan cara yang sehat, saran apa yang Anda miliki? **
Hou Zhenyu: Saran saya untuk praktisi model besar adalah lakukan apa yang Anda bisa. Anda tidak harus melakukan semuanya sendiri. Alih-alih, pertimbangkan komersialisasi AI dan temukan skenario dan rantai yang paling sesuai dengan kemampuan Anda. Kami berharap ketika industri berkembang pesat di tahap awal, gelembung-gelembung tertentu dibiarkan. Namun, kebijakan dapat mencapai konsensus tentang pengawasan penerapan teknologi dan standar industri untuk mengevaluasi kualitas teknologi. Ada standar yang harus diikuti dan aturan yang harus diikuti, sehingga kita bisa berkembang dengan cara yang sehat.
Zhu Yong: Kita juga perlu mengubah cara berpikir kita. Model besarnya adalah teknologi DAS, teknologi subversif. Tetap berpikiran terbuka dan terus belajar.