🤩 Ексклюзивна спільнота для власників GT тепер доступна!
✨ Приєднуйтесь до нас та отримайте 15,000 USDT фьючерсний бонус + 2000 MOVE!
Як приєднатися:
1️⃣ Надішліть свій UID: https://www.gate.io/questionnaire/5695
2️⃣ Перші 1,000 учасників отримають бонус на майбутнє — не пропустіть!
3️⃣ Приєднуйтесь до ексклюзивних подій, щоб мати можливість виграти токени MOVE, популярні винагороди, товари та отримати ранній доступ до роздач та новин!
💡 Лише для власників GT, з неймовірними перевагами, які надходять!
#GTHolders# #Gateio# #MOVE#
Діалог | За три місяці народилося 79 базових масштабних моделей Які масштабні моделі потрібні Китаю?
Текст: У Цзюнью Редактор: Се Ліронг
Джерело: Finance Eleven
Джерело зображення: створено Unbounded AI
Після випуску ChatGPT наприкінці минулого року китайські компанії випустили щонайменше 79 базових великих моделей. Однак зовнішній світ вважає, що більшість великих моделей мають технічну прогалину з ChatGPT. Масштабний модельний бізнес неминучий. Яка масштабна модель потрібна Китаю?
У грудні 2022 року OpenAI, компанія-стартап зі штучного інтелекту, інвестована Microsoft, запустила розмовний AI ChatGPT. ChatGPT — це, по суті, велика модель мови GPT, незалежно розроблена OpenAI, яка містить майже 180 мільярдів параметрів. У лютому цього року генеральний директор Nvidia Хуан Реньсюнь прокоментував, що «ChatGPT відкрив момент для iPhone для ШІ». Хуан Реньсюнь вважає, що великі моделі знижують поріг для розробки додатків, і всі додатки варто переробити з великими моделями.
Це не слова родини Хуан Реньсюня, кожен бачить можливість. Починаючи з березня цього року, китайські компанії також змагаються за випуск великомасштабних моделей продукції. До них належать провідні компанії, такі як модель Wenxin Baidu, модель Tongyi Ali та індустріальна модель Tencent, а також галузеві компанії, такі як Xunfei та SenseTime, а також низка компаній-початківців. У травні Китайський інститут наукової та технологічної інформації при Міністерстві науки і технологій опублікував «Звіт про дослідження великої моделі штучного інтелекту Китаю». Згідно з повідомленням, станом на 28 травня в Китаї було випущено щонайменше 79 базових великомасштабних моделей з параметрами понад 1 мільярд.
Велике значення має кількість параметрів моделі. Наразі провідні компанії, такі як Baidu та Ali, оголошують, що обсяг параметрів Wenxin і Tongyi зазвичай становить 100 мільярдів, наприклад, обсяг параметрів великої моделі Wenxin становить 260 мільярдів. Параметри великих моделей інших підприємств або компаній-початківців зазвичай знаходяться на рівні 10 млрд або 1 млрд.
**Незважаючи на те, що всі моделі штучного інтелекту, випущені на ринок, називаються «великими моделями», кількість параметрів за замовчуванням вважається одним із визначальних факторів для великих і малих моделей. **Хоу Женю, віце-президент Baidu Group, сказав репортеру Caijing, що модель з 1 мільярдом параметрів у 2022 році називається великою моделлю. Але поточні параметри великої моделі часто складають сотні мільярдів. Оскільки ефект «інтелектуального виникнення» з’явиться з більш ніж 100 мільярдами параметрів, сформується здатність до узагальнення та сформується універсальна здатність у різних сценаріях. Тонко налаштована модель на основі цієї великої моделі має кращий ефект промислового застосування.
**Ефект «інтелектуальної появи» означає той факт, що після того, як масштаб моделі та рівень обчислювальної потужності перевищать певний поріг параметра, ефект AI більше не буде випадковою ймовірнісною подією. **У загальному полі, чим більша кількість параметрів, тим більша ймовірність загального появи інтелекту та вища точність ШІ. У виділеному вертикальному полі легше отримати точні результати після обрізання та оптимізації моделі з великими параметрами.
Хоча в Китаї з’явилося щонайменше 79 великомасштабних моделей, багато професіоналів галузі, опитаних Caijing, вважають, що для великомасштабних моделей потрібна обчислювальна потужність, алгоритми та накопичення даних. Через дефіцит високопродуктивних графічних процесорів, високі витрати на закупівлю апаратного забезпечення та високі експлуатаційні витрати, у Китаї дуже мало компаній, які мають капітальні резерви, стратегічну волю та практичні можливості для комерціалізації великих моделей. У «Війні сотень моделей» справді існує розрив між більшістю продуктів і ChatGPT.
Після скандалу манія великої моделі поволі повертається до реальності. На ринку великомасштабних моделей вдома та за кордоном з’являється більш раціональне мислення – ChatGPT, який не можна комерціалізувати, може бути лише іграшкою, а масштабна модель, яка може стати корпоративним додатком, має промислову цінність.
Такі компанії, як Apple, Samsung і JPMorgan Chase, заборонили своїм співробітникам використовувати ChatGPT через проблеми безпеки. З іншого боку, зростання та утримання користувачів ChatGPT також досягло вузького місця. Згідно з даними інструменту аналізу веб-сайтів SimilarWeb, темпи зростання відвідуваності ChatGPT з січня по травень склали 131,6%, 62,5%, 55,8%, 12,6% і 2,8%. На початку червня опитування Morgan Stanley показало, що лише 19% респондентів сказали, що вони використовували ChatGPT, і лише 4% сказали, що покладаються на ChatGPT.
Хоу Женю сказав: «У березні цього року, коли клієнти вперше почали говорити з нами про потреби у великомасштабних моделях, усі вони використовували свою уяву, вимагаючи більше наукової фантастики. Але після квітня обмеження великих були виявлені масштабні моделі, і всі сповільнилися Повільно побачили більш реальні потреби.
**Комерціалізація великих моделей у кінці To C відбувається повільно. **На даний момент ми стикаємося з такими проблемами, як висока вартість обчислювальної потужності, і чим більший масштаб користувачів, тим більші втрати підприємств. Також неминуче виводиться неправильний «шум», і існують навіть етичні проблеми, такі як витік інформації та нагляд за політикою. Навіть Microsoft розгортає лише великі моделі в інструментальних продуктах (офісних офісних пакетах, веб-переглядачах, інструментах для редагування фотографій, таких як Photoshop). Суть продажу послуг Microsoft інструментальним компаніям все ще полягає в комерціалізації.
**Це прагматичний підхід до впровадження великих моделей для корпоративних клієнтів класу B. **На галузевому ринку потреби клієнтів рішучі та чіткі. У всьому світі роздрібна торгівля, фінанси, виробництво, уряд та інші галузі покладаються на великі моделі для інтелектуального оновлення. Індустріальний консенсус полягає в тому, що модель, яка була налаштована на основі галузевих знань на основі великої моделі, працюватиме краще, ніж неоптимізована базова велика модель загального призначення.
Згідно з даними, опублікованими дослідницькою компанією IDC у травні цього року, загальний розмір китайського ринку штучного інтелекту в 2022 році становитиме 12,2 мільярда доларів США, включаючи 8,13 мільярда доларів США на апаратне забезпечення, 2,69 мільярда доларів США на програмне забезпечення та 1,41 мільярда доларів США на послуги. IDC прогнозує, що в 2026 році ринок штучного інтелекту в Китаї досягне 26,9 мільярда доларів США, включаючи 14,85 мільярда доларів США на апаратне забезпечення, 7,69 мільярда доларів США на програмне забезпечення та 3,89 мільярда доларів США на послуги. Сумарні річні темпи зростання обладнання, програмного забезпечення та послуг становлять 15,1%, 32,0% і 28,5% відповідно.
Фанатизм завжди повертає до реальності. У червні «Фінанси» провели діалог із віце-президентом Baidu Group Хоу Чженью та віце-президентом Baidu Smart Cloud Чжу Йонгом на тему «Яка модель насправді потрібна Китаю?» Хоу Чженью та Чжу Юн глибоко брав участь у Baidu Wenxin Qianfan. У цій розмові ми обговорили три основні питання: створення модельної платформи та формування комерційної екології: чи є велика модель розкішною грою? Яка велика модель потрібна підприємству? Чи є бульбашка на великому модельному ринку?
Профіль співрозмовника:
Хоу Женю, віце-президент Baidu Group (відповідальний за дослідницьку групу хмарних обчислень і групу інженерів базових технологій Baidu Smart Cloud Business Group)
Чжу Юн, віце-президент Baidu Smart Cloud (відповідальний за Baidu Smart Cloud Application Product Center)
Ведучий: Се Ліжун, заступник головного редактора журналу Caijing
Нижче подано скорочену версію запису діалогу:
**Чи є велика модель розкішною грою? **
** «Фінансовий» Се Ліжун: У Китаї розпочалася хвиля великого підприємництва, і поріг для великомасштабних моделей дуже високий, але поточна ситуація на китайському ринку не виглядає такою з точки зору швидкість і масштаб вступу? **
Чжу Юн: Поріг для великих моделей відносний, і будуть різні типи гравців. Перша категорія така ж, як Baidu, створює базову велику модель з нуля. Це має дуже високі вимоги до обчислювальної потужності, алгоритмів, даних і талантів.
Беручи дані як приклад, базова велика модель вимагає масового навчання даних, включаючи дані Інтернету, професійні дані, дані новин і високоякісні дані з професійними мітками. Взявши, наприклад, обчислювальну потужність, велику модель із сотнями мільярдів параметрів, як-от ChatGPT, потрібно безперервно навчати протягом 100 днів із найсучаснішим графічним процесором NVIDIA A100/H100. Алгоритми та таланти також є ключовими. Інженери мають різні методи навчання, так само як різні кухарі готують страви з різними смаками на основі однієї сировини. Для цього потрібне накопичення тривалого практичного досвіду, тому поріг дуже високий.
Друга категорія — це велика промислова модель, яка потребує певного тонкого налаштування та цілеспрямованого налаштування на основі можливостей базової великої моделі. Це набагато менше, ніж вартість маркування даних і тонкого налаштування алгоритму з нуля в минулому. Третя категорія розробляє програми на основі перших двох великих моделей. Baidu, інші компанії та навіть деякі платформи з відкритим кодом надають інструменти розробки, щоб знизити поріг для розробки програмного забезпечення.
** «Фінансовий» Се Ліжун: Який рівень великомасштабних моделей Китаю на світовому ринку? **
**Хоу Чженью:**Особисто я вважаю, що китайські великомасштабні моделі все ще лідирують на світовому ринку. Розробка великомасштабної моделі та розробка пошукової системи насправді схожі, і обидва вимагають дуже глибокого технічного накопичення. З глобальної точки зору існує лише кілька країн, які проводять незалежні дослідження та розробку технологій пошукових систем. На даний момент Китай і Сполучені Штати можуть бути єдиними двома країнами, які можуть повністю незалежно розробляти технологію великомасштабних моделей.
** «Фінанси» Се Ліжун: Чи є абсолютний прогрес і відсталість у великих моделях? **
**Хоу Женю: **Великі моделі не є абсолютно хорошими чи поганими. Хоча це може мати певні відмінності в різних областях, це як вибір смартфона. Хтось використовує Apple, хтось Android, найбільш підходящий – найкращий. Коли велика модель була вперше запущена, люди часто ставили кілька каверзних запитань про неї. Але насправді в справді серйозному середовищі корпоративного рівня таких сценаріїв дуже мало. Підприємствам необхідно вибрати велику модель, яка більше підходить для них відповідно до їхніх бізнес-сценаріїв. Китайським компаніям, зокрема, необхідно вибирати продукти, які краще розуміють китайську мову та відповідають характеристикам китайських компаній.
** «Фінанси» Се Ліжун: Скільки ресурсів і талантів Baidu вклав у масштабну модель? **
**Хоу Чженью: **Великомасштабна модель штучного інтелекту є основною стратегією Baidu, яка потребує безперервних і комплексних інтенсивних інвестицій. Якщо взяти як приклад обчислювальну потужність, накопичення кількості графічних процесорів, які ми накопичили в минулому, вимірюється десятками тисяч, що є величезною інвестицією. Baidu також розробив повний набір ланцюжків інструментів протягом багатьох років, щоб тренувати моделі швидше та краще.
За останні 10 років Baidu інвестував понад 100 мільярдів юанів у ШІ. Як технологічна компанія, Baidu щороку витрачає понад 20% свого доходу на дослідження та розробки. (Примітки: після 2019 року основні витрати Baidu на дослідження та розробки протягом тривалого часу становили понад 20% доходу. У 2022 році рівень витрат Baidu на дослідження та розробки становив 24%, поступаючись лише Huawei 25% серед китайських технологічних компаній. Основні витрати Baidu стосуються виключення Aiqi Baidu має власний бізнес після мистецтва), але велика модель не така проста, як інвестувати суму грошей, щоб створити модель. Це вимагає обчислювальної потужності, даних і досвідчених інженерів штучного інтелекту, щоб накопичувати протягом тривалого часу на хорошу Платформа R&D.
**"Фінанси" Се Ліронг: Окрім грошей, карток і даних, які проблеми постають перед новоствореною компанією, щоб створити базову великомасштабну модель? **
**Хоу Женю: **Гроші, картки та дані самі по собі дуже складні. Компанії-початківці створюють базові великомасштабні моделі. Окрім мінімальної обчислювальної потужності, достатньої кількості високоякісних даних і досвідченого персоналу з досліджень і розробок у сфері штучного інтелекту, їм також потрібна платформа розробки штучного інтелекту, яка може добре керувати моделями та обчислювальною потужністю. Зараз великі компанії будуть використовувати ці платформи для надання зовнішніх послуг у вигляді хмар. Наприклад, Baidu Smart Cloud надає зовнішні послуги через платформу великомасштабної моделі Wenxin Qianfan. Однак поріг для навчання базової великої моделі з нуля все ще дуже високий. Оскільки великої моделі недостатньо для навчання, вона також вимагає безперервних гнучких ітерацій, і великі компанії будуть відносно зрілішими.
** "Фінансовий" Се Ліронг: Деякі компанії починають створювати власні великі моделі. Чи потрібно самому будувати велику модель? Коли публічна хмара тільки з’являлася в 2014 році, деякі клієнти хвилювалися про безпеку даних. Чи вони також турбуються про цю проблему, коли використовують великі моделі? **
**Хоу Женю:**Кожна компанія повинна використовувати великомасштабну модель, але чи потрібно кожному підприємству виготовляти великомасштабну модель самостійно? Я так не думаю. Самостійно зробити з нуля базову велику модель дуже дорого. Підприємства можуть використовувати власні дані для точного налаштування базових моделей інших людей, і вони також можуть досягти дуже хороших результатів.
Чжу Юн: Я вважаю, що підприємства повинні більше думати про те, як використовувати великі моделі та як ефективно використовувати великі моделі. Кожен бізнес може мати власний макет, але не потрібно починати спочатку. Тому що такі компанії, як Baidu, забезпечили хорошу технічну базу. Ви можете покластися на Baidu, щоб виготовити деякі індивідуальні продукти, що є кращим рентабельним вибором для клієнтів. Проблема безпеки даних не є новою проблемою, спричиненою появою великих моделей. Якщо порівнювати з хмарними обчисленнями, то існує публічна хмара, приватна хмара, хостинг тощо. У масштабній бізнес-моделі ми повністю врахували відповідні продукти та рішення.
** «Фінансовий» Се Ліронг: Популярність смартфонів і хмар обумовлена низькою ціною. Коли велика китайська модель вийде на стадію загального застосування? **
Хоу Женю: Велика модель сама по собі значно економить кошти. У минулому, коли підприємства розробляли додатки штучного інтелекту, їм потрібно було виконувати очищення даних, маркування, навчання моделі, міркування та оптимізацію відповідно до сценаріїв застосування. Незалежно від того, наскільки маленькою є сцена, потрібно виконати весь процес, а вартість дуже висока. Але на основі великої моделі немає потреби в такій великій кількості даних, часу, ресурсів і робочої сили в минулому. Я пропоную підприємствам якнайшвидше звернути увагу на технологію великомасштабних моделей і використовувати їх, оскільки це може значно знизити поріг застосування ШІ.
**Які великі моделі потрібні китайським компаніям? **
** "Фінанси" Се Ліжун: Велика модель Wenxin від Baidu почала внутрішнє тестування в березні. Чи може підприємство під час внутрішнього тестування чітко висунути власні потреби? Де зосереджені їхні потреби? **
**Чжу Юн:**З моменту внутрішнього тестування в березні ми отримали запити на доступ від понад 150 000 клієнтів. У той же час сотні партнерів проводять дослідницькі та дослідницькі випробування з нами на сцені. Це охоплює різні галузі, такі як Інтернет, виробництво та фінанси, і багато сценаріїв у ньому мають високу цінність. Підводячи підсумок, можна виділити кілька категорій високочастотних сценаріїв — управління знаннями, створення контенту (включаючи маркетинговий копірайтинг, медіа-інформацію), інтелектуальне обслуговування клієнтів, генерація коду та підвищення ефективності офісу.
** "Фінансовий" Се Ліжун: На ринку цифрової трансформації існує давня проблема, багато клієнтів не знають, чого хочуть. У сфері великих моделей також існує ця суперечність? **
**Чжу Юн: **Дійсно існують відмінності між різними галузями промисловості та різними клієнтами. Після виходу великої моделі інтернет-індустрія звернула пильну увагу на її останні досягнення. Їхнє технічне розуміння та пізнання продукту дуже просунуті, тож ми можемо швидко проводити дослідницькі та дослідницькі тести разом, а також робити демонстрації та інновації продуктів.
Цифрова основа деяких традиційних галузей відносно слабка, тому Baidu матиме велику кількість інженерів, які будуть працювати разом із клієнтами, поєднувати можливості штучного інтелекту з проблемними точками своєї галузі та створювати багато дуже нових концепцій продуктів. Коли технологія штучного інтелекту поєднується з галуззю, необхідно розуміти технології та штучний інтелект, з одного боку, і розуміти галузь, з іншого боку. Тому, коли ми спілкуємося з клієнтами та партнерами, нам часто потрібно, щоб обидві сторони творили разом.
** "Фінансовий" Се Ліронг: Як Baidu надає широкомасштабні модельні послуги різним галузям і різним типам клієнтів? Як оцінити ефективність витрат з точки зору клієнта? **
Чжу Юн: З точки зору ціни, якщо підприємство просто намагається і чутливе до ціни, воно може використовувати загальнодоступні хмарні служби. Відповідно до обсягу дзвінків, оплата за використання (скільки ви використовуєте ) не вимагає одноразового використання. Інвестиції в об’єкти також є перевагою публічної хмари. Деякі компанії готові робити великі інвестиції в інфраструктуру та створювати власні інтелектуальні програми. Baidu може надати повний набір моделей ШІ та баз ШІ, а компанії можуть розробляти програми на основі моделей ШІ та баз ШІ.
** "Фінансовий" Се Ліронг: Як компанії вибирають велику модель, яка їм підходить? **
Хоу Женю: По-перше, це має бути ефект моделі, який є основою для вибору великої моделі. Підприємствам необхідно оцінити цінність великих моделей у сценаріях використання. По-друге, зосередьтеся на швидкості ітерації. Це залежить не лише від того, чи має базова велика модель життєздатність, а й від того, чи має платформа повний ланцюжок інструментів, чи підтримує зручну вторинну розробку та перенавчання моделі, а також підтримує кращу ітерацію великих моделей. По-третє, реальна вартість посадки і форма доставки великої моделі. Підприємства можуть вибрати режим доставки публічної та приватної хмари відповідно до своїх потреб.
** "Фінансовий" Се Ліжун: Wenxin Qianfan позиціонується як універсальна платформа великомасштабної моделі корпоративного рівня, як розуміти "єдине вікно" та "рівень підприємства"? **
Хоу Женю: По-перше, «єдине зупинення», штучний інтелект — це технологія, що керується даними. З самого початку ШІ повинен збирати, очищати та маркувати дані, а потім проводити навчання на основі існуючих моделей. Після навчання він повинен керувати точно налаштованими даними та версіями моделей і, нарешті, використовувати їх у бізнесі. . Це цілий процес. Baidu надає ці можливості, і він дуже простий у використанні, що може задовольнити потреби клієнтів протягом усього життєвого циклу від досліджень і розробок ШІ до застосування.
Окрім «корпоративного рівня», програми корпоративного рівня не є персональними програмами, не такими простими, як завантаження фотографій. Програми корпоративного рівня будуть більш досконалими та складними, і такі фактори, як масштаб, масштабованість, витрати на впровадження, а також стабільність і надійність, повинні враховуватися.
** «Фінанси» Се Ліжун: За словами Baidu, платформа великомасштабної моделі Wenxin Qianfan має шість характеристик: проста у використанні, безпечна, комплексна, ефективна, відкрита та інтегрована. Чому зручність використання має бути на першому місці? Чи правда, що популяризуватимуться лише корисні технології? **
**Хоу Женю: **Простота використання дуже важлива. Велика модель природної мови може надати клієнтам простий у використанні інтерфейс, який зручний для взаємодії з машиною. «Інтеграція хмари та інтелекту, інклюзивність ШІ» — це стратегія Baidu Smart Cloud, і «інклюзивність ШІ» завжди була одним із наших ідеалів. Штучний інтелект не може бути лише високою технологією. Необхідно знизити поріг для використання ШІ, включаючи поріг використання даних, використання ресурсів і використання ШІ людиною. Тому простота використання дуже важлива.
**"Фінанси" Се Ліжун: За останні три місяці громадськість отримала широку популярність завдяки моделям штучного інтелекту. Чи з’явилися комерційні можливості для великих моделей у тисячах галузей? Яким повинен бути хороший бізнес-ритм? **
**Чжу Юн: **Велика модель штучного інтелекту має дуже чіткі зміни в парадигмах досліджень і розробок і застосування. Чим раніше ви приймете та зрозумієте велику модель, тим більше вона матиме вплив на бізнес. Це не питання так чи ні. Коли справа доходить до темпу, різні компанії по-різному сприймають великі моделі. Деякі підприємства можуть почати з пробної версії програми в одній точці та використовувати загальнодоступну хмару для виклику служб, щоб вони могли швидко перевірити та виконати демонстраційну розробку за нижчою ціною.
З іншого боку, незалежно від того, велике це чи мале підприємство, необхідно культивувати штучне мислення. Наприклад, деякі програми можна трансформувати та оновлювати поступово. Інший підхід називається рефакторинг.Згідно з внутрішньою заявою Baidu, усі продукти в майбутньому будуть перероблені на основі великої моделі.
** Чи є бульбашка на ринку великих моделей? **
** "Фінансовий" Се Ліронг: Вам справді потрібна така кількість великих моделей на бізнес-орієнтованому ринку B-end? **
**Хоу Женю:**Моя особиста думка полягає в тому, що базовій великій моделі не потрібно так багато. Звичайно, це лише очікування з кінця. Але на початку розвитку будь-якої галузі ринок стає процвітаючим і пінним. З точки зору промислового розвитку, ми повинні зараз допустити деякі бульбашки. Ми також повинні змиритися з цим. Але я все ще вірю, що після того, як великі хвилі змили пісок, лише кілька компаній надають базові модельні послуги.
**Чжу Юн: **Щодо базової великої моделі, хоча зараз є багато гравців, дуже важко підтримувати швидку ітерацію, постійно розробляти всебічніший і повніший ланцюжок інструментів і постійно вдосконалювати можливості продукту на основі клієнта. речі зворотного зв'язку. Тому, хоча велика модель зараз може бути дуже актуальною, це гонка на довгі дистанції.Зрештою, це буде схоже на сьогоднішній ландшафт хмарних обчислень, і ринок поступово об’єднається.
** "Фінансовий" Се Ліронг: Багато компаній, які виробляють серверне обладнання, також хочуть створювати масштабні промислові моделі. Раніше Baidu був їхнім клієнтом, але тепер вони конкурують один з одним. Як нам мирно жити разом? **
Hou Zhenyu: Я не думаю, що ми можемо прямо говорити про конкуренцію. Ми все ще насамперед стосунки співпраці. Обидві сторони справді матимуть подібні послуги та працюватимуть у подібних галузях водночас, але ми та традиційні виробники обладнання більше доповнюємо один одного. Baidu — це компанія ШІ з генами Інтернету. Вона накопичила велику кількість даних загального призначення та велику модель загального призначення. Її переваги полягають у ШІ, програмному забезпеченні, технологіях та інших сферах. Традиційні виробники апаратного забезпечення накопичили галузеві дані та розробили ноу-хау у вертикальних сферах, таких як традиційні державні та корпоративні галузі. Дві сторони мають різні переваги у створенні великих моделей. Такі підприємства, як Baidu і H3C, не тільки є партнерами в купівлі серверів і комутаторів, але й спільно створюють великі моделі.
** "Фінансовий" Се Ліронг: Baidu зазвичай звертає увагу на прогрес великих моделей конкурентів? **
Чжу Юн: По-перше, технологія та загальний ефект. По-друге, допоміжні інструменти. По-третє, бізнес-модель. Якщо повернутися на три-чотири роки тому, ринок штучного інтелекту був ще відносно далеким, але сьогодні технології глибокого навчання, комерціалізація продуктів, інвестиції та екологія з відкритим кодом прискорюються.
** «Фінансовий» Се Ліжун: чи будуть великомасштабні моделі основним напрямком діяльності Baidu в найближчі кілька років? чому **
**Хоу Женю: **Великі моделі будуть основним напрямком Baidu. Baidu — це компанія зі штучного інтелекту, і великі моделі є важливим напрямком розвитку ШІ. Незалежно від того, чи буде це на стороні C чи на стороні B, це принесе величезні зміни до продуктів і послуг Baidu. Для Baidu великі моделі — це дуже цікаво, це одночасно й можливість, і виклик. Baidu продовжить інвестувати у великі моделі. Я вірю, що великі моделі прискорять хмарні обчислення в епоху ШІ та змінять ландшафт хмарних обчислень. Статус MaaS (модель як послуга) ставатиме все більш важливим, і це також прискорить реалізацію стратегії «інтеграції хмари та інтелекту» Baidu та ідеалу «інклюзивності ШІ», запропонованого Smart Cloud.
** «Фінансовий» Се Ліронг: Останній раунд комерціалізації штучного інтелекту, який розпочався у 2016 році, мав певні проблеми, і компаніям, що займаються штучним інтелектом, довелося виконати багато нудних і детальних проектів налаштування. Як великі моделі можуть уникнути проблем, які виникли в останньому раунді комерціалізації штучного інтелекту? **
Hou Zhenyu: Цей раунд масштабної посадки модельної індустрії відрізняється від індустрії ШІ, представленої глибоким навчанням десять років тому. Це нова парадигма досліджень і розробок ШІ, яка відрізняється від попередніх інвестицій. До появи великомасштабних моделей ШІ піддавався найбільшій критиці, і найважчим для реалізації було те, що фактичне промислове середовище було фрагментованим. Наприклад, розпізнавання обличчя воріт і розпізнавання обличчя платежу відрізняються. Оскільки світло та оточення різні, їх потрібно орієнтувати на різні програми, а навчання слід проводити з нуля відповідно до даних, накопичених клієнтами, а потім адаптувати до сцени. Такий вид індивідуальної доставки є дуже громіздким.
Але за базової великої моделі дуже хороші результати можна отримати без надто тонкого налаштування даних і без надто великої кількості циклів навчання. Базові великі моделі вирішують багато сценаріїв набагато легше, ніж раніше. Здатність до узагальнення великих моделей набагато сильніша, ніж раніше. Це відрізняється від останнього раунду посадки ШІ. Торік модель з 1 мільярдом параметрів називали великою моделлю, але зараз параметри моделі часто обчислюються сотнями мільярдів. Завдяки більш ніж 100 мільярдам параметрів з’явиться інтелект, сильніші можливості узагальнення та загальні можливості в різних сценаріях.
** "Фінансовий" Се Ліжун: коли в галузь приходить багато людей, бульбашки можуть бути неминучими. Якщо велику модель потрібно розробляти здоровим способом, які у вас є пропозиції? **
Хоу Чженью: Моя порада великим моделям: робіть усе, що можете. Ви не повинні робити це все самостійно. Натомість подумайте про комерціалізацію ШІ та знайдіть сценарії та ланцюжки, які найкраще відповідають вашим можливостям. Ми сподіваємося, що коли індустрія швидко розвивається на ранній стадії, допускаються певні бульбашки. Однак політика може досягти консенсусу щодо нагляду за застосуванням технології та галузевих стандартів для оцінки якості технології. Існують стандарти та правила, яких слід дотримуватися, щоб ми могли розвиватися здоровим шляхом.
Чжу Юн: Нам також потрібно змінити наш спосіб мислення. Велика модель — це переломна технологія, підривна технологія. Будьте відкритими та продовжуйте навчатися.