عمودي VS عمودي ، اقترب النموذج الكبير من نقطة المباراة الأولى

المصدر: Shenmou Finance ، مؤلف | Zhang Wei

رصيد الصورة: تم إنشاؤه بواسطة أدوات * Unbounded AI *

تتفتت ساحة معركة النماذج الضخمة للذكاء الاصطناعي.

بصفته المصهر ، فتح Chatgpt الباب لعصر AI2.0 ، ويتميز AI2.0 بـ "الذكاء الصناعي والرقمنة" ، والتي يمكن أن تحل محل العمالة بكفاءة وتستخدم على نطاق واسع في جميع مناحي الحياة. استكشاف Metaverse ، الذي لقد مر بالفعل فترة الهروب ، فإن تنفيذ نموذج الذكاء الاصطناعي الكبير أكثر واقعية.

المظهر الأكثر شيوعًا هو أن نموذج الذكاء الاصطناعي الكبير يخرج من الدائرة على نطاق أوسع ، وليس فقط في الجانب B. على سبيل المثال ، على الرغم من إطلاق chatGPT لأكثر من نصف عام ، لا يزال بإمكان المؤلف سماع أصوات العمال المهاجرين الذين يتحدثون عن chatGPT في المقهى في الطابق السفلي في شنغهاي سي بي دي ؛ وفقًا لتقارير وسائل الإعلام ، تستخدم بعض الشركات أيضًا AIGC باعتبارها أداة الإنتاجية.

كما قال Zhang Yong ، رئيس مجلس الإدارة والرئيس التنفيذي لمجموعة Alibaba والرئيس التنفيذي لمجموعة Alibaba Cloud Intelligence Group: في مواجهة عصر الذكاء الاصطناعي ، تستحق جميع المنتجات إعادة تصميمها باستخدام نموذج كبير.

لقد انتهت المصانع الكبيرة ومؤسسات البحث العلمي ورجال الأعمال.

ظهرت الشركات المصنعة الكبرى مثل Baidu Wenxin Yiyan و Huawei Pangu و 360 Zhinao و Shangtang Rixin و Ali Tongyi Qianwen و Jingdong Lingxi و Kunlun Wanwei Tiangong ونماذج كبيرة أخرى على التوالي ، تليها Tencent Hunyuan و HKUST نماذج كبيرة مثل Xunfei Xinghuo تنتظر في خط للاتصال بالإنترنت.

رواد الأعمال لديهم أيضًا مشاهير ، مثل وانغ شياوتشوان ، مؤسس شركة سوجو ، ووانغ هوي ون ، المؤسس المشارك لشركة ميتوان ، وكايفو لي ، رئيس شركة سينوفيشن وركس ، وآخرون ظهروا بشكل بارز في نماذج الذكاء الاصطناعي الكبيرة.

أدى جنون نموذج الذكاء الاصطناعي واسع النطاق الذي استمر لأكثر من بضعة أشهر إلى ظهور مسارين.

** سباق تسلح بالذكاء الاصطناعي ، تمايز كبير في النماذج **

دخلت نماذج الذكاء الاصطناعي الكبيرة مرحلة المنافسة ، وتتباعد المسارات تدريجيًا.

مع تسخين نموذج الذكاء الاصطناعي تدريجيًا ، وفقًا لإحصاءات وسائل الإعلام ، في بداية شهر فبراير ، كان هناك 29 سهمًا فقط في قسم "ChatGPT" في Oriental Fortune ، وقد وصل الآن إلى 61 سهمًا ، ولا يزال الرقم في ارتفاع . وفقًا لإحصاءات غير مكتملة ، حتى الآن ، أصدرت أكثر من 40 شركة ومؤسسة في بلدي منتجات نماذج واسعة النطاق أو أعلنت عن خطط نموذجية واسعة النطاق.

من بينها ، طور اللاعبون المشاركون في "سباق التسلح" لنماذج الذكاء الاصطناعي واسعة النطاق اتجاهين للتطوير. أصبحت النماذج العمودية الكبيرة والنماذج الكبيرة العامة اتجاهين رئيسيين للتنمية في مجال الذكاء الاصطناعي.

تشير النماذج العمودية الكبيرة إلى النماذج المحسّنة لمجالات أو مهام محددة ، مثل التعرف على الكلام ومعالجة اللغة الطبيعية وتصنيف الصور وما إلى ذلك.

في الوقت الحالي ، تنضم المزيد والمزيد من الشركات إلى مسار النماذج العمودية واسعة النطاق. أعلنت Xueersi أنها تطور نموذجًا رياضيًا كبيرًا تم تطويره ذاتيًا ، باسم MathGPT ، لعشاق الرياضيات ومؤسسات البحث العلمي حول العالم ؛ في 6 مايو ، أعلنت Taoyun Technology عن إطلاق نموذج معرفي كبير للأطفال - Alpha Egg Children Cognitive Big يجلب النموذج تجربة تفاعلية جديدة للأطفال من حيث ممارسة التعبير ، وتنمية الذكاء العاطفي ، وإلهام الإبداع ، ومساعدة التعلم.

تشير النماذج الكبيرة العامة إلى النماذج التي يمكنها التعامل مع مهام ومجالات متعددة ، مثل BERT و GPT وما إلى ذلك.

نظرًا لمزايا رأس المال والمواهب ، تهدف كبرى الشركات المصنعة بشكل أساسي إلى تتبع النماذج الكبيرة للأغراض العامة.

تستهدف الشركات المصنعة الكبيرة النماذج الكبيرة ذات الأغراض العامة. فمن ناحية ، يمكنهم الجمع بين إمكانات الذكاء الاصطناعي ومنتجاتهم الخاصة. المزيد من شركات الإنترنت التمثيلية وعمالقة التكنولوجيا مثل Alibaba و Huawei و Baidu.

على سبيل المثال ، بعد دمج Microsoft لـ GPT-4 في مجموعة عائلة Office ، بدأ "Tongyi Qianwen" الخاص بـ Ali أيضًا في الوصول إلى DingTalk. يمكن للمستخدمين إنشاء محتوى في المستندات ، وفي مؤتمرات الفيديو ، يمكنهم إنشاء كل عرض شخصي ومحتوى.

على سبيل المثال ، يمكن أيضًا دمج نموذج Baidu الكبير مع أعمالها الخاصة. يمكن أن يكون لـ "Wen Xin Yi Yan" تحول نوعي في تكرار محركات البحث. يمكن استخدام "Yuyan" من NetEase و "ChatJD" الخاص بـ JD.com أولاً في الصناعات الخاصة.

من ناحية أخرى ، يتمتع النموذج الكبير للأغراض العامة بإمكانية تطبيق واسعة ، ويمكن لأولئك الذين يتفوقون في الأداء أولاً أن يؤسسوا ميزة المحرك الأول ويصبحوا الرائدين في عصر AI2.0. بعد كل شيء ، يعلم الجميع حقيقة أن "الذين يركضون بسرعة يحصلون على اللحم ، والذين يركضون ببطء لا يمكنهم إلا أكل بقايا الطعام".

يمكن وصف النموذج الكبير للتطبيق الرأسي بأنه "تيار واضح". وبما أن النموذج الكبير للتطبيق العمودي يتماشى بشكل أكبر مع احتياجات السيناريوهات الرأسية وله جودة أعلى من النموذج العام الكبير ، فقد رأت العديد من الشركات الفرص أيضًا. على سبيل المثال ، Shenlan و Mobvoi و Youdao وغيرها من الشركات التي تركز على مسارات محددة للذكاء الاصطناعي.

ينعكس تطوير النماذج الرأسية الكبيرة بشكل أساسي في التحسين المستمر لأداء النموذج في مختلف المجالات.على سبيل المثال ، انخفض معدل الخطأ في التعرف على الكلام عامًا بعد عام ، واستمرت قدرة الفهم الدلالي لمعالجة اللغة الطبيعية في التحسن. حقق النموذج العام الكبير تقدمًا ملحوظًا في التعلم متعدد المهام ونقل التعلم ، وأصبح اتجاهًا بحثيًا مهمًا في مجال معالجة اللغة الطبيعية.

على سبيل المثال ، يمكن للنماذج البيولوجية الكبيرة تحسين كفاءة المستحضرات الصيدلانية التي تعمل بالذكاء الاصطناعي. تشير تقارير الأبحاث الأجنبية إلى أن الذكاء الاصطناعي يمكن أن يزيد من معدل نجاح أبحاث وتطوير الأدوية الجديدة بنسبة 16.7٪ ، وأن البحث والتطوير في مجال العقاقير بمساعدة الذكاء الاصطناعي يمكن أن يوفر 54 مليار دولار أمريكي من تكاليف البحث والتطوير كل عام ، ويوفر 40٪ إلى 60٪ من الوقت والتكلفة في العملية الرئيسية للبحث والتطوير. وفقًا للمعلومات العامة لـ Nvidia ، يمكن أن يؤدي استخدام تقنية الذكاء الاصطناعي إلى تقصير الوقت اللازم لاكتشاف الأدوية المبكر إلى الثلث وتوفير التكاليف إلى واحد إلى مائتين.

من وجهة نظر الصناعة ، فإن النموذج العام هو "موسوعة" يمكنها الإجابة على كل سؤال وتطبيقه على أنواع مختلفة من التربة الصناعية ، بينما النموذج العمودي يشبه الخبير في مجال واحد. وعلى الرغم من كونه محترفًا ، إلا أن جمهوره مقدر أن يكون عدد قليل من الناس.

** البيانات قاتلة **

تتمثل ميزة النموذج العمودي الكبير في أنه ليس "كبيرًا" بما يكفي: قوة الحوسبة ليست كبيرة بما يكفي ، وصعوبة الخوارزمية منخفضة.

بعد دخول Wang Xiaochuan إلى مسار النموذج واسع النطاق ، أكد دائمًا أن اتجاه الجهود المستقبلية لا يتمثل في عمل AGI (الذكاء الاصطناعي العام) مثل OpenAI ، ولكن لعمل نماذج كبيرة الحجم عموديًا في مجالات محددة معينة وتحقيق تطبيقات الهبوط .

يصف النموذج الكبير بالمعنى الواسع نموذجًا كبيرًا للأغراض العامة. تمامًا مثل النموذج "الكبير" ، يرجع سبب كون النموذج الكبير "كبير" إلى العدد الكبير من المعلمات والكم الهائل من البيانات ، لها تأثير كبير على الخوارزميات ، وقوة الحوسبة ، ومساحة تخزين البيانات. المتطلبات الكبيرة ، وهؤلاء ليسوا فقط الأشخاص الذين يمكنهم الاختلاق ، ولكنهم يحتاجون أيضًا إلى الكثير من المال. كما تعلم ، فإن نجاح Open AI تم بناؤه أيضًا بواسطة Microsoft بمليارات الدولارات. يعد الطلب الكبير على رأس المال أيضًا بمثابة اختبار لتحديد الشركات المصنعة الكبرى في مجال البحث والتطوير.

في السنوات الخمس الماضية ، زاد حجم معلمات النماذج الكبيرة للذكاء الاصطناعي بترتيب من حيث الحجم كل عام. على سبيل المثال ، يبلغ حجم معلمة GPT-4 16 ضعفًا لـ GPT-3 ، حيث وصل إلى 1.6 تريليون ؛ ومع التقديم من البيانات متعددة الوسائط مثل الصور والصوت والفيديو ، يتوسع حجم بيانات النماذج الكبيرة بسرعة أيضًا. هذا يعني أنه إذا كنت تريد اللعب بنموذج كبير ، فيجب أن تتمتع بقوة حوسبة كبيرة.

بالمقارنة مع الشركات المصنعة الكبرى ، فإن الشركات التي تصنع نماذج عمودية واسعة النطاق لديها أموال نادرة نسبيًا ، وقوة حاسوبية ، وبيانات ، لذا فهي في الواقع ليست على نفس خط البداية مثل لاعبي النماذج واسعة النطاق للأغراض العامة.

مثلما لا يمكن فصل مركبات الطاقة الجديدة عن المكونات الثلاثة الرئيسية للمحركات والبطاريات وأجهزة التحكم الإلكترونية ، لا يمكن فصل النماذج الكبيرة للذكاء الاصطناعي عن دعم قوة الحوسبة والخوارزميات والبيانات.

من بين قوة الحوسبة والخوارزميات والبيانات ، فإن البيانات هي صعوبة النماذج الرأسية الكبيرة.

من بين العناصر الثلاثة ، تعد صعوبة البحث والتطوير في الخوارزمية منخفضة نسبيًا ، حيث تمتلك الشركات الحالية خوارزميات مسار خاصة بها لتنفيذ النماذج الكبيرة ، وهناك العديد من المشاريع مفتوحة المصدر للرجوع إليها.

تحدد الرقاقة قوة الحوسبة. يحتاج نموذج الذكاء الاصطناعي الكبير الإجمالي إلى شريحة ذات أداء أعلى لإكمال تدريب وبناء النموذج الشامل للشبكة العصبية. ومع ذلك ، فإن الشريحة الحالية أقل تطوراً ذاتيًا ، ولا تزال مصدرًا خارجيًا بشكل أساسي. على سبيل المثال ، الشريحة الأكثر ملاءمة لـ ChatGPT هي من Nvidia ، الشريحة الرئيسية H100 والشريحة الرئيسية الفرعية A100.

الصعوبة تكمن في البيانات. البيانات عالية الجودة هي المفتاح لمساعدة تدريب الذكاء الاصطناعي وضبطه. البيانات الكافية والغنية هي الأساس لنماذج الذكاء الاصطناعي الكبيرة التوليدية.

وفقًا لإفصاح OpenAI السابق ، بلغ عدد معلمات ChatGPT3 وحدها 175 مليارًا ، ووصلت بيانات التدريب إلى 45 تيرابايت.

نظرًا للتطور الناضج نسبيًا للإنترنت عبر الهاتف المحمول في الصين ، يتم تخزين كمية كبيرة من موارد البيانات الصينية في مؤسسات أو مؤسسات مختلفة ، مما يجعل من الصعب مشاركتها.

"نظرًا لأن الكثير من بيانات الأعمال ، والبيانات اللوجستية ، والبيانات المالية ، وما إلى ذلك للمؤسسة هي بيانات نطاق خاص أساسية للغاية ، فمن الصعب تخيل أن China Star Optoelectronics أو PetroChina ستستخدمان البيانات للآخرين للتدريب." Xu Hui ، الرئيس التنفيذي لشركة Chuangxinqizhi ، أجرت مؤخرا مقابلة مع الأوراق المالية في مقابلة مع التايمز ، قال أيضا بصراحة.

بأخذ صناعة المستحضرات الصيدلانية للذكاء الاصطناعي كمثال ، تواجه النماذج البيولوجية الكبيرة مشكلة كونها "عالقة" بالتكنولوجيا. تكلفة الحصول على بيانات تجريبية عالية الدقة لأبحاث وتطوير الأدوية مرتفعة نسبيًا ، وهناك عدد كبير من البيانات غير المصنفة في قاعدة البيانات العامة. من الضروري الاستفادة بشكل جيد من كمية كبيرة من البيانات غير المصنفة وعدد قليل كمية البيانات عالية الدقة ، لذلك يتم طرح متطلبات أعلى لبناء النموذج.

** من سيربح أول قدر من الذهب؟ **

بغض النظر عن النموذج ، فإن التسويق هو القضية الأساسية. انطلاقًا من لاعبي الذكاء الاصطناعي الحاليين الذين لديهم نماذج كبيرة ، فإنهم يتقدمون بسرعة في التمكين والتسويق.

على الرغم من أن النموذج واسع النطاق للأغراض العامة والنموذج العمودي واسع النطاق يسلكان مسارات مختلفة ، إلا أنهما لا يزالان "عائلة" في جوهرهما وهما في نفس المسار ، لذلك لا يمكن تجنب مشكلة المنافسة.

بالنسبة للنموذج العام واسع النطاق ، يهبط النموذج الرأسي واسع النطاق أولاً ، وسيكون مسار النموذج العام واسع النطاق أضيق. وبالمثل ، بعد أن تستحوذ النماذج واسعة النطاق للأغراض العامة على السوق بسرعة ، سيكون من الصعب على النماذج العمودية واسعة النطاق ذات خطوط الأعمال الضيقة كسب المال.

في المرحلة المثالية ، سواء كان نموذجًا اقتصاديًا أو قيمة عالمية ، يكون النموذج واسع النطاق للأغراض العامة أفضل من النموذج الرأسي واسع النطاق. ومع ذلك ، فإن الحياة الواقعية ليست مدينة فاضلة ، فكل من يجري بشكل أسرع بين نموذج الأغراض العامة واسع النطاق والنموذج الرأسي واسع النطاق يعتمد على المنافسة بين مختلف المؤسسات.

انطلاقا من AIGC الساخن العام الماضي. مقارنة بالسماح للمستخدمين باستخدام الذكاء الاصطناعي لإنشاء محتوى بحد أدنى على الطرف C ، يعتقد بعض المشاركين في السوق أن الطرف B سيكون نموذج الأعمال الأكثر أهمية لـ AIGC.

تولي Huawei أيضًا مزيدًا من الاهتمام لأعمال ToB الخاصة بها. في المؤتمر الصحفي ، صرحت شركة Huawei أن نموذج Huawei Pangu الكبير يستخدم بشكل أساسي الذكاء الاصطناعي لتمكين الصناعات ويستخدم في العديد من الصناعات مثل الطاقة الكهربائية والتمويل والزراعة ، ومن بينها ، نموذج CV الكبير يستخدم في المناجم ، و NLP نموذج كبير يستخدم في استرجاع المستندات الذكي.

على سبيل المثال ، أطلقت شركة Baidu ، المتخصصة في محركات البحث ، Wenxin Yiyan بسمات بحث مثل GPT-3.

بالإضافة إلى ChatGPT ، في الواقع ، قبل اندفاع نماذج الذكاء الاصطناعي الكبيرة ، كانت هناك مشاهد هبوط ، وهذه النماذج "الكبيرة" هي في الواقع نماذج عمودية واسعة النطاق.

نموذج اللغة: مثل GPT و BERT وما إلى ذلك ، يستخدم بشكل أساسي في مجال معالجة اللغة الطبيعية ، مثل الترجمة الآلية وتوليد النص وتحليل المشاعر وما إلى ذلك. نماذج الصور: مثل ResNet و Inception وما إلى ذلك ، والتي تُستخدم بشكل أساسي في مجال رؤية الكمبيوتر ، مثل تصنيف الصور ، واكتشاف الهدف ، وتجزئة الصور ، إلخ. نموذج التوصية: مثل DNN و RNN وما إلى ذلك ، والتي تستخدم بشكل أساسي في مجال أنظمة التوصية ، مثل توصية المنتج وتوصية الإعلان. روبوتات المحادثة: مثل Seq2Seq و Transformer وما إلى ذلك ، والتي تستخدم بشكل أساسي في سيناريوهات مثل خدمة العملاء الذكية والمساعدين الأذكياء. التحكم في المخاطر المالية: مثل XGBoost و LightGBM وما إلى ذلك ، والتي تُستخدم بشكل أساسي في سيناريوهات مراقبة المخاطر للمؤسسات المالية مثل البنوك والأوراق المالية ، مثل تسجيل الائتمان ومكافحة الاحتيال. تشخيص الصور الطبية: مثل DeepLung و DeepLesion وما إلى ذلك ، والتي تستخدم بشكل أساسي في مجال تشخيص الصور الطبية ، مثل تشخيص سرطان الرئة والتحليل المرضي.

كسب المال أهم من الهبوط.

وفقًا لتقرير Guosheng Securities "ما مقدار قوة الحوسبة المطلوبة لـ ChatGPT" ، يُقدر أن تكلفة تدريب GPT-3 تبلغ حوالي 1.4 مليون دولار أمريكي ، وبالنسبة لبعض LLM (نموذج اللغة الكبيرة) الأكبر ، فإن تكلفة التدريب بين 2 مليون دولار امريكى و 12 مليون دولار امريكى بين. استنادًا إلى متوسط عدد الزوار الفريدين لـ ChatGPT في يناير البالغ 13 مليونًا ، فإن الطلب على الرقاقة المقابلة هو أكثر من 30.000 وحدة معالجة رسومات NVIDIA A100 ، وتبلغ تكلفة الاستثمار الأولية حوالي 800 مليون دولار أمريكي ، وتبلغ تكلفة الكهرباء اليومية حوالي 50000 دولار أمريكي.

ليس هناك شك في أن النماذج واسعة النطاق للأغراض العامة تُستخدم على نطاق واسع في سيناريوهات الهبوط. بالنسبة للاعبين الذين يثقون في النماذج واسعة النطاق للأغراض العامة ، فإن التسويق يأتي في المرتبة الثانية. تحتاج النماذج العمودية واسعة النطاق إلى تسويق أسرع لتغطية الجزء السفلي الخط ، لذلك تتمتع النماذج العمودية الكبيرة بمزايا أكثر احتمالية عالية ومعدل اعتماد أسرع.

لا توجد إجابة محددة حول من يمكنه تكوين ميزة مطلقة أولاً. إن "سباق التسلح" لنماذج الذكاء الاصطناعي الكبيرة يشبه تمامًا تغيير الفراشة من الويب 1 إلى الويب 2. تتسابق الشركات مع الزمن ، ومن يغتنم الفرصة أولاً سوف يغتنم السوق.

شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
تداول العملات الرقمية في أي مكان وفي أي وقت
امسح لتنزيل تطبيق Gate.io
المنتدى
بالعربية
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)