لماذا باعت MosaicML 1.3 مليار دولار بعد عامين فقط من إنشائها؟

استحوذت شركة Databricks العملاقة للبيانات الضخمة على MosaicML بسعر يقارب 1.3 مليار دولار أمريكي ، وقد تضاعف تقييمها ست مرات في هذه الصفقة ، مما يجعلها أكبر عملية استحواذ في النصف الأول من هذا العام. تم تأسيسها لمدة عامين فقط ويعمل بها أكثر من 60 موظف. ما الذي يدعم التقييم العالي لـ MosaicML؟

في الآونة الأخيرة ، كانت هناك موجة من الاستثمار والاستحواذ في مجال الذكاء الاصطناعي. قامت شركة Salesforce ، وهي شركة مشهورة عالميًا ، بضخ 450 مليون دولار في Anthropic ، بينما نجحت Runway في جمع 141 مليون دولار من التمويل. بالإضافة إلى ذلك ، أعلنت Snowflake أيضًا عن الانتهاء من استحواذها على Neeva ، في حين استحوذت شركة Meituan الصينية العملاقة المحلية على شركة AI Light Years Away مقابل 2.065 مليار.

ومع ذلك ، كانت الصفقة الأكثر شهرة هي بلا شك الاستحواذ على شركة MosaicML الناشئة. ومن المعلوم أن شركة MosaicML استحوذت عليها شركة Databricks العملاقة للبيانات الضخمة مقابل 1.3 مليار دولار أمريكي تقريبًا ، وتضاعف تقييمها ست مرات في هذه الصفقة ، مما يجعلها أكبر عملية استحواذ في النصف الأول من هذا العام. تم تأسيسها لمدة عامين فقط ويعمل بها أكثر من 60 موظف. ما الذي يدعم التقييم العالي لـ MosaicML؟

Databricks تستحوذ على MosaicML لتسريع إضفاء الطابع الديمقراطي على تقنيات الذكاء الاصطناعي التوليدية

أعلنت Databricks مؤخرًا أنها استحوذت على MosaicML ، وهي شركة ناشئة للذكاء الاصطناعي ، مقابل 1.3 مليار دولار (حوالي 9.3 مليار يوان) لتقديم خدمات لبناء أدوات شبيهة بـ ChatGPT للمؤسسات.

بعد الاستحواذ ، ستصبح MosaicML جزءًا من منصة Databricks Lakehouse. سيتم وضع فريق MosaicML بأكمله والتكنولوجيا تحت راية Databricks ، مما يوفر للمؤسسات منصة موحدة لإدارة أصول البيانات وتكون قادرة على استخدام بيانات الملكية الخاصة بها لبناء ، امتلاك نماذج الذكاء الاصطناعي التوليدية الخاصة وحمايتها.

! [تأسست منذ عامين ، تبلغ قيمة كل موظف 21 مليون دولار أمريكي ، فلماذا تبيع MosaicML 1.3 مليار دولار أمريكي؟ ] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-dfdcfbb298-dd1a6f-1c6801)

MosaicML هي شركة ذكاء اصطناعي مولدة شابة جدًا. تأسست في سان فرانسيسكو عام 2021. وقد كشفت علنًا عن جولة واحدة فقط من التمويل ولديها 62 موظفًا فقط. في الجولة الأخيرة من التمويل ، كان تقييمها 220 مليون دولار أمريكي ، أي أن تقييم الاستحواذ على MosaicML قفز بشكل مباشر 6 مرات. الصفقة هي أكبر عملية استحواذ تم الإعلان عنها في مجال الذكاء الاصطناعي التوليدي حتى الآن هذا العام. منذ وقت ليس ببعيد ، أعلنت شركة سنوفليك ، عملاق الحوسبة السحابية ، عن استحواذها على شركة الذكاء الاصطناعي التوليدية الأخرى ، Neeva. بعد بضعة أشهر من جنون الاستثمار ، يبدو أن موجة ضخمة من عمليات الاستحواذ للشركات الناشئة العاملة في مجال الذكاء الاصطناعي جارية.

نشأت Databricks من جامعة كاليفورنيا في بيركلي وشاركت في تطوير مشروع Apache Spark. بصفتها شركة عملاقة لتخزين البيانات وتحليلها ، اعتبارًا من عام 2022 ، ستقدر قيمتها بنحو 31 مليار دولار ، مما يساعد الشركات الكبيرة مثل AT&T و Shell و Walgreens على معالجة البيانات. منذ بعض الوقت ، فتحت للتو نموذجي الكبير Dolly ، بهدف تحقيق تأثير مماثل لـ ChatGPT بمعلمات أقل. بعد أن أصبحت الحوسبة السحابية أكثر شيوعًا ، أثر مفهوم "تكامل البحيرات والمستودعات" الذي اقترحته سبارك بعمق على عدد من الشركات الناشئة في مجال البيانات الضخمة. منذ إنشائها في عام 2013 ، نمت Databricks بسرعة لتصبح شركة Data Infra الأكثر شهرة في العالم. في العام الماضي ، أعلنت Databricks عن إيرادات سنوية تزيد عن مليار دولار ، وبعد الانتهاء من الجولة الأخيرة من التمويل في أغسطس 2021 ، وصل أحدث تقييم لها إلى 38 مليار دولار.

مزايا نماذج سلسلة MosaicML MPT

تم تصنيف نماذج سلسلة MosaicML's MPT من فئة HuggingFace PretrainedModel الأساسية وهي متوافقة تمامًا مع نظام HuggingFace البيئي. يعد نموذج MPT-7B أحد أكثر نماذج MosaicML شيوعًا مع مليارات من المعلمات ويمكنه التعامل مع أكثر من 2000 مهمة معالجة لغة طبيعية. من بينها ، تشتمل طبقة التحسين الخاصة بـ MPT-7B على FlashAttention ومعيار طبقة منخفضة الدقة ، وما إلى ذلك ، والتي يمكن أن تجعل النموذج أسرع 2-7 مرات من أساليب التدريب التقليدية ، وقابلية التوسع شبه الخطية للموارد تضمن أن النماذج ذات المليارات يمكن استخدام المعلمات في القطار في ساعات وليس أيام. أصدرت MosaicML أيضًا نموذجًا جديدًا للغة كبيرة مفتوح المصدر ومتاح تجاريًا MPT-30B ، والذي يحتوي على 30 مليار معلمة ويتفوق على GPT-3.

! [تأسست منذ عامين ، تبلغ قيمة كل موظف 21 مليون دولار أمريكي ، فلماذا تبيع MosaicML 1.3 مليار دولار أمريكي؟ ] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-ca9dc589e1-dd1a6f-1c6801)

مصدر البيانات: تقييم MT-Bench لنماذج MosaicML الرئيسية

مزايا نماذج سلسلة MPT هي كفاءتها العالية وتكلفتها المنخفضة. ازداد تعقيد نماذج الذكاء الاصطناعي التي تستخدم كمية كبيرة من البيانات من أجل "التدريب" بشكل حاد. ويكلف تدريب نموذج الآن ملايين الدولارات على الأقل ، وهو أمر لا يمكن تحمله عمومًا للمؤسسات الصغيرة والمتوسطة الحجم باستثناء الشركات الكبيرة. تسمح نماذج سلسلة MPT من MosaicML للمؤسسات بتدريب نماذج اللغة الخاصة بها بتكلفة أقل وبكفاءة أعلى ، بحيث يمكنهم بسهولة تطبيق تقنية الذكاء الاصطناعي التوليدية وتحقيق أداء أفضل للأعمال. يمكن لمعظم نماذج اللغات مفتوحة المصدر التعامل فقط مع التسلسلات التي تحتوي على بضعة آلاف من الرموز المميزة (انظر الشكل 1). ومع ذلك ، مع منصة MosaicML وعقدة واحدة 8xA100-40GB ، يمكن للمستخدمين بسهولة ضبط MPT-7B للتعامل مع أطوال سياق تصل إلى 65 كيلو بايت. تأتي القدرة على التعامل مع تعديل طول السياق الشديد هذا من ALiBi ، وهو أحد الخيارات المعمارية الرئيسية في MPT-7B.

على سبيل المثال ، يحتوي النص الكامل لـ The Great Gatsby على أقل من 68 ألفًا من الرموز. في أحد الاختبارات ، قرأ النموذج StoryWriter The Great Gatsby وأنتج خاتمة. تظهر إحدى خاتمات إنشاء النموذج في الشكل 2. قرأ StoryWriter The Great Gatsby في حوالي 20 ثانية (حوالي 150000 كلمة في الدقيقة). نظرًا لطول التسلسل الأطول ، تكون سرعة "كتابته" أبطأ من طرز MPT-7B الأخرى ، بمعدل 105 كلمة في الدقيقة. على الرغم من تعديل StoryWriter بطول سياق يبلغ 65 كيلو بايت ، فإن ALiBi تمكن النموذج من استنتاج مدخلات أطول مما تم تدريبه عليه: 68 ألف رمز مميز في حالة The Great Gatsby وما يصل إلى 84 ألف رمز في الاختبار.

! [تأسست منذ عامين ، تبلغ قيمة كل موظف 21 مليون دولار أمريكي ، فلماذا تبيع MosaicML 1.3 مليار دولار أمريكي؟ ] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-c36e2a4613-dd1a6f-1c6801)

الشكل 2: كتب MPT-7B-StoryWriter-65k + خاتمة The Great Gatsby. نتيجة الخاتمة هي توفير النص الكامل لـ "The Great Gatsby" (حوالي 68 ألفًا) كمدخل للنموذج ، متبوعًا بكلمة "خاتمة" والسماح للنموذج بمواصلة الإنشاء.

الترويج لتقنية الذكاء الاصطناعي التوليدية

تقنية الذكاء الاصطناعي التوليدية هي فرع من فروع الذكاء الاصطناعي تستخدم كميات كبيرة من البيانات وخوارزميات التعلم العميق لإنشاء محتوى تلقائيًا مثل النص الأصلي والصور ورمز الكمبيوتر. يتيح ظهور هذه التقنية للأشخاص معالجة البيانات وتحليلها بشكل أكثر ملاءمة وخدمة احتياجات الإنسان بشكل أفضل. مع التطور السريع للبيانات الضخمة وتكنولوجيا الذكاء الاصطناعي ، تم استخدام تقنية الذكاء الاصطناعي التوليدية على نطاق واسع في معالجة اللغة الطبيعية والتعرف على الصور والواقع الافتراضي وغيرها من المجالات. على سبيل المثال ، في مجال معالجة اللغة الطبيعية ، أصبح GPT-4 أحد أكثر نماذج الذكاء الاصطناعي التوليدية شيوعًا ، والتي يمكن استخدامها في مهام مثل إنشاء المقالات وترجمة اللغات والإجابة على الأسئلة. في مجال التعرف على الصور ، يمكن لـ StyleGAN2 إنشاء صور عالية الجودة يمكن استخدامها في تطوير الألعاب وإنتاج الأفلام والتلفزيون والواقع الافتراضي.

ذكر نافين راو ، الرئيس التنفيذي لشركة MosaicML سابقًا ، أنه منذ عام 2018 ، ازداد تعقيد نماذج الذكاء الاصطناعي التي تستخدم كميات كبيرة من البيانات من أجل "التدريب" بشكل حاد ، ويكلف تدريب نموذج الآن ملايين الدولارات على الأقل. المؤسسات الصغيرة والمتوسطة الحجم عموما لا تستطيع تحمله. بعد هذا الاستحواذ ، سيمكن المنتج المشترك لمنصة Databricks's Lakehouse وتقنية MosaicML المؤسسات من استخدام بيانات الملكية الخاصة بها لتدريب وبناء نماذج الذكاء الاصطناعي التوليدية ببساطة وبسرعة وبتكلفة منخفضة. بدون التحكم والملكية ، يمكن أن يستغرق تطوير نموذج الذكاء الاصطناعي المخصص مكان. وفقًا لـ Databricks ، مع النظام الأساسي والدعم الفني لـ Databricks و MosaicML ، سيتم تخفيض تكلفة التدريب واستخدام LLM للمؤسسات بشكل كبير ، ومن المتوقع أن تنخفض إلى آلاف الدولارات. هذا يسهل تعميم الذكاء الاصطناعي التوليدي.

أهمية اقتناء Databricks لـ MosaicML

الغرض الرئيسي من استحواذ Databricks على MosaicML هو تسريع تطوير تكنولوجيا الذكاء الاصطناعي التوليدية وإضفاء الطابع الديمقراطي عليها. من خلال دمج تقنيات وموارد الشركتين ، يمكن لـ Databricks تلبية احتياجات العملاء بشكل أفضل وتقديم حلول أكثر كفاءة وملاءمة. على وجه التحديد ، سيؤدي الاستحواذ إلى إحداث تغييرات في الجوانب التالية:

1. نموذج لغة كبير أكثر كفاءة

بعد أن استحوذت Databricks على MosaicML ، يمكنها دمج نماذج سلسلة MPT في منصة Lakehouse لتزويد العملاء بنماذج لغوية كبيرة أكثر كفاءة وأقل تكلفة. سيساعد هذا المؤسسات على التعامل بشكل أفضل مع مهام معالجة اللغة الطبيعية وتحسين كفاءة الأعمال والدقة.

2. سرعة تدريب أسرع للنموذج

تتميز نماذج سلسلة MPT من MosaicML بتدريب سريع ، مما سيساعد Databricks على توفير خدمات تدريب نموذجية أسرع. هذا مهم بشكل خاص للشركات التي تحتاج إلى الاستجابة بسرعة لمتطلبات السوق ، ومساعدتها على تلبية احتياجات العملاء بشكل أفضل.

3. المزيد من الدمقرطة

إن استحواذ Databricks على MosaicML يعني أيضًا أن إضفاء الطابع الديمقراطي على تقنية الذكاء الاصطناعي التوليدية ستزداد. يمكن لنماذج سلسلة MPT من MosaicML أن تسهل على المؤسسات الصغيرة والمتوسطة الحجم تدريب نماذج اللغة الخاصة بها ، بحيث يمكنهم تطبيق تقنية الذكاء الاصطناعي التوليدية بشكل أفضل وتحقيق أداء أعمال أفضل. سيساعد هذا في تعزيز تطوير وتطبيق تكنولوجيا الذكاء الاصطناعي التوليدية ، وتعزيز تعميم تكنولوجيا الذكاء الاصطناعي وتطويرها.

لخص

تم تصميم تطبيقات الذكاء الاصطناعي التوليدية لإنشاء نص خام وصور ورموز كمبيوتر بناءً على إشارات اللغة الطبيعية للمستخدم. ازداد الاهتمام بالتكنولوجيا منذ أن أطلقت شركة OpenAI للذكاء الاصطناعي ChatGPT ، وهو روبوت محادثة عبر الإنترنت يعمل بالذكاء الاصطناعي ، في نوفمبر الماضي. "يجب أن تكون كل مؤسسة قادرة على الاستفادة من ثورة الذكاء الاصطناعي وأن تتمتع بقدر أكبر من التحكم في كيفية استخدام بياناتها. تتمتع Databricks و MosaicML بفرصة مذهلة لإضفاء الطابع الديمقراطي على الذكاء الاصطناعي وجعل Lakehouse قوة توليد الإنشاءات أفضل مكان للذكاء الاصطناعي ، قال علي قدسي ، الشريك المؤسس والرئيس التنفيذي لشركة Databricks.

لا تكمن أهمية استحواذ Databricks على MosaicML في تسريع تطوير تكنولوجيا الذكاء الاصطناعي التوليدية وإضفاء الطابع الديمقراطي عليها فحسب ، بل أيضًا لدمج تقنيات وموارد الشركتين لتزويد العملاء بحلول أكثر كفاءة وملاءمة. مع التطور السريع والتطبيق السريع لتكنولوجيا الذكاء الاصطناعي ، ستلعب تقنية الذكاء الاصطناعي التوليدية دورًا مهمًا بشكل متزايد.كما أن استحواذ Databricks على MosaicML يعكس أيضًا أهمية واستثمار العديد من الشركات في هذا الاتجاه. تقوم شركات مثل Anthropic و OpenAI بترخيص نماذج لغة جاهزة للشركات ، والتي تقوم بعد ذلك ببناء تطبيقات الذكاء الاصطناعي التوليدية فوقها. تم إنشاء فرص للشركات الناشئة مثل MosaicML ، مدفوعة بالطلب التجاري القوي على هذه النماذج. من عمليات الاستحواذ المتتالية على Snowflake و Databricks ، يمكننا أن نرى أن شركات التكنولوجيا الكبيرة تنتقل تدريجياً من البحث والتطوير المستقل والاستثمار الاستراتيجي إلى مرحلة عمليات الدمج والاستحواذ لتكنولوجيا الذكاء الاصطناعي التوليدية.

مصدر مرجعي:

شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • مشاركة
تعليق
لا توجد تعليقات