SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي

المؤلف الأصلي: ستيفن وانغ

"ما لا أستطيع إنشاؤه ، لا أفهمه."

-ريتشارد فاينمان

مقدمة

أنت تحتضن الانتشار المستقر و MidJourney لإنشاء صور مذهلة.

أنت بارع في استخدام ChatGPT و LLaMa لإنشاء كلمات أنيقة.

يمكنك التبديل بين MuseNet و MuseGAN لإنشاء موسيقى جبلية.

مما لا شك فيه أن القدرة الفريدة للإنسان هي الإبداع ، ولكن في ظل التكنولوجيا المتغيرة باستمرار اليوم ، فإننا نبتكر من خلال إنشاء آلات! يمكن للآلة رسم عمل فني أصلي (رسم) ، وتأليف مقال طويل متماسك (كتابة) ، وتأليف موسيقى شنيعة (تأليف) ، وصياغة استراتيجيات الفوز للألعاب المعقدة (اللعب) ، مع إعطاء أسلوب معين. هذه التقنية هي ** الذكاء الاصطناعي التوليدي ** (الذكاء الاصطناعي التوليدي ، GenAI) ، الآن مجرد بداية لثورة GenAI ، الآن هو أفضل وقت لتعلم GenAI.

1. توليد النماذج والتمييز بينها

GenAI هي كلمة طنانة ، والجوهر وراءها هو ** النموذج التوليدي ** (النموذج التوليدي) ، وهو فرع من التعلم الآلي ، والهدف هو تدريب النموذج على إنشاء بيانات جديدة مماثلة لمجموعة البيانات المحددة.

لنفترض أن لدينا مجموعة بيانات للخيول. أولاً ، يمكننا تدريب نموذج توليدي على مجموعة البيانات هذه لالتقاط القواعد التي تحكم العلاقات المعقدة بين وحدات البكسل في صور الحصان. ثم يتم أخذ عينات من هذا النموذج لإنشاء صور واقعية للخيول التي لم تكن موجودة في مجموعة البيانات الأصلية ، كما هو موضح في الشكل أدناه.

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-ca89ca69a8-dd1a6f-1c6801)

لفهم أهداف وأهمية النموذج التوليدي حقًا ، من الضروري مقارنته بالنموذج التمييزي. في الواقع ، يتم حل معظم المشكلات في التعلم الآلي من خلال النماذج التمييزية ، انظر الأمثلة التالية.

لنفترض أن لدينا مجموعة بيانات من اللوحات ، بعضها لفان جوخ وبعضها لفنانين آخرين. مع وجود بيانات كافية ، يمكننا تدريب نموذج تمييزي للتنبؤ بما إذا كانت لوحة معينة من تصميم فان جوخ ، كما هو موضح في الشكل أدناه.

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-c032c295df-dd1a6f-1c6801)

عند استخدام نموذج تمييزي ، يكون لكل مثال في مجموعة التدريب ملصق (تسمية). لمشكلة الفئتين أعلاه ، عادةً ما تكون تسمية لوحة فان جوخ 1 ، وتسمية لوحة غير فان جوخ هي 0. في الشكل أعلاه ، الاحتمال النهائي المتوقع للنموذج هو 0.83 ، لذلك من المحتمل جدًا أن يكون فان جوخ قد صنعه. على عكس النموذج التمييزي ، لا يتطلب النموذج التوليدي أمثلة لاحتواء الملصقات لأن هدفه هو إنشاء بيانات جديدة ، وليس التنبؤ بتسميات البيانات.

بعد قراءة المثال ، دعونا نستخدم التدوين الرياضي لتحديد النموذج التوليدي والنموذج التمييزي بدقة:

  • نماذج النموذج التمييزي ** P (y | x) ** ، مع إعطاء الميزات ** x ** لتقدير الاحتمال الشرطي للتسمية ** y **.
  • نماذج نموذج التوليد ** P (x) ** تقدر بشكل مباشر احتمالية الميزة ** x ** والعينات من توزيع الاحتمالات هذا لإنشاء ميزات جديدة.

لاحظ أنه حتى لو تمكنا من بناء نموذج تمييزي مثالي لتحديد اللوحات التي رسمها فان جوخ ، فإنه لا يزال لا يعرف كيفية إنشاء لوحة تشبه فان جوخ ، فإنها ستخرج فقط احتمالية ما إذا كانت الصورة من فان جوخ. إمكانية اليد. يمكن ملاحظة أن النماذج التوليدية أكثر صعوبة من النماذج التمييزية.

2. قم بإنشاء إطار عمل للنموذج

قبل الدخول في إطار النموذج التوليدي ، دعنا نلعب لعبة. بافتراض أن النقاط الواردة في الشكل أدناه تم إنشاؤها بواسطة نوع من القواعد ، فإننا نسمي هذه القاعدة ** بيانات ** P ** ، والآن نتيح لك إنشاء ** x ** مختلفة = (x 1 ، x 2) بحيث تكون هذه النقطة يبدو أنه تم إنشاؤه بنفس القواعد ** بيانات ** P.

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-6756aa9efa-dd1a6f-1c6801)

كيف تولد هذه النقطة؟ يمكنك استخدام النقاط المحددة لإنشاء نموذج ** P ** في عقلك ، ويمكن إنشاء النقاط التي تريدها في المواضع التي يشغلها هذا النموذج. يمكن ملاحظة أن النموذج ** P ** هو تقدير لبيانات ** P **. إذن ، أبسط نموذج ** P ** هو المربع البرتقالي في الشكل أدناه. يمكن إنشاء النقاط داخل المربع فقط ، ولكن ليس خارج الصندوق.

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-6d163716b5-dd1a6f-1c6801)

لإنشاء نقطة جديدة ، يمكننا اختيار نقطة عشوائيًا من المربع ، أو بشكل أكثر صرامة ، عينة من نموذج توزيع النموذج ** P **. هذا هو النموذج التوليدي البسيط. تقوم بإنشاء نموذج (مربع برتقالي) من بيانات التدريب (النقاط السوداء) ، ثم تقوم بأخذ عينة من النموذج ، على أمل أن تبدو النقاط التي تم إنشاؤها مشابهة للنقاط الموجودة في مجموعة التدريب.

الآن يمكننا رسمياً اقتراح إطار عمل للتعلم التوليدي.

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-13027798b3-dd1a6f-1c6801)

دعونا الآن نكشف بيانات التوزيع الحقيقي لتوليد البيانات ** P ** ونرى كيف يمكن تطبيق إطار العمل أعلاه على هذا المثال. من الشكل أدناه ، يمكننا أن نرى أن قاعدة توليد البيانات ** P ** البيانات هي أن النقاط موزعة بشكل موحد فقط على اليابسة ، ولن تظهر في المحيط.

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-2a83a57c62-dd1a6f-1c6801)

من الواضح أن نموذجنا ** P ** هو تبسيط لبيانات القاعدة ** P **. يمكن أن يساعدنا فحص النقاط A و B و C في الشكل أعلاه في فهم ما إذا كان النموذج ** P ** يحاكي بنجاح بيانات القاعدة ** P **.

  • لا تتوافق النقطة "أ" مع قاعدة البيانات ** P ** لأنها تظهر في عرض البحر ، ولكن قد يتم إنشاؤها بواسطة النموذج ** P ** لأنها تظهر داخل المربع البرتقالي.
  • لا يمكن إنشاء النقطة B بواسطة النموذج ** P ** لأنها تظهر خارج المربع البرتقالي ، ولكنها تتوافق مع بيانات القاعدة ** P ** لأنها تظهر على الأرض.
  • يتم إنشاء النقطة C بواسطة النموذج ** P ** ، وتتوافق مع بيانات القاعدة ** P **.

يوضح هذا المثال المفاهيم الأساسية وراء النمذجة التوليدية.على الرغم من أن استخدام النماذج التوليدية في الواقع أكثر تعقيدًا ، إلا أن الإطار الأساسي هو نفسه.

3. النموذج التوليدي الأول

لنفترض أنك كبير مسؤولي الموضة (CFO) في إحدى الشركات ومهمتك هي صنع ملابس عصرية جديدة. تلقيت هذا العام 50 مجموعة بيانات حول مجموعات الأزياء (كما هو موضح أدناه) ، وتحتاج إلى إنشاء 10 مجموعات أزياء جديدة.

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-6152ce75e9-dd1a6f-1c6801)

على الرغم من أنك كبير مسؤولي الموضة ، فأنت أيضًا عالم بيانات ، لذلك قررت استخدام النماذج التوليدية لحل هذه المشكلة. بعد قراءة 50 صورة أعلاه ، قررت استخدام خمس ميزات ، ** نوع الملحقات ** (نوع الملحقات) ، ** لون الملابس ** (لون الملابس) ، ** نوع الملابس ** (نوع الملابس) ، ** الشعر اللون ** (لون الشعر) و ** نوع الشعر ** (نوع الشعر) لوصف تنسيق الموضة.

أهم 10 ميزات لبيانات الصورة هي كما يلي.

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-68f821bf37-dd1a6f-1c6801)

تحتوي كل ميزة أيضًا على عدد مختلف من قيم eigenvalues:

  • 3 أنواع من الملحقات (نوع الملحقات):

فارغة ، دائرية ، نظارات شمسية

  • 8 ألوان ملابس:

أسود ، أزرق 01 ، رمادي 01 ، باستيل ، أخضر ، باستيل ، برتقالي ، وردي ، أحمر ، أبيض

  • 4 أنواع من الملابس:

هوديي ، بشكل عام ، قميص ، رقبة ، قميص ، فتحة رقبة

  • 6 ألوان للشعر:

أسود ، أشقر ، بني ، وردي فاتح ، أحمر ، فضي رمادي

  • 7 أنواع للشعر:

NoHair ، LongHairBun ، LongHairy ، LongHair ، مستقيم ، قصير الشعر ، قصير مموج ، قصير الشعر قصير ، مسطح ، قصير الشعر

بهذه الطريقة ، هناك 3 \ * 8 \ * 4 \ * 6 \ * 7 = 4032 مجموعة ميزات ، لذلك يمكن تخيل أن مساحة العينة تحتوي على 4032 نقطة. من 50 نقطة بيانات معينة ، يمكن ملاحظة أن بيانات ** P ** تفضل قيم ميزة معينة لميزات مختلفة. يتضح من الجدول أعلاه أن هناك المزيد من ألوان الملابس البيضاء وألوان الشعر الرمادي الفضي في الصورة. نظرًا لأننا لا نعرف البيانات الحقيقية ** P ** ، يمكننا فقط استخدام هذه البيانات الخمسين لإنشاء نموذج ** P ** بحيث يمكن أن يكون مشابهًا لبيانات ** P **.

3.1 النموذج البسيط

تتمثل إحدى أبسط الطرق في تعيين معلمة احتمالية لكل نقطة في مجموعات الميزات 4032 ، ثم يحتوي النموذج على 4031 معلمة ، لأن مجموع جميع معلمات الاحتمال يساوي 1. الآن دعنا نتحقق من 50 بيانات واحدة تلو الأخرى ، ثم نحدّث معلمات النموذج ** (***** θ 1، θ 2، ...، θ 4031 *** **) ** ، تعبير كل المعلمة هي:

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-63c5341f64-dd1a6f-1c6801)

من بينها ، ** N ** هو عدد البيانات المرصودة ، أي 50 ، و ** n * j *** هو رقم مجموعة ميزة *** j *** th التي تظهر في البيانات الخمسين.

على سبيل المثال ، تظهر مجموعة الميزات (تسمى المجموعة 1) من (LongHairStraight ، Red ، Round ، ShirtScoopNeck ، White) مرتين ، ثم

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-08917bf0f6-dd1a6f-1c6801)

على سبيل المثال ، إذا لم تظهر مجموعة الميزات (تسمى المجموعة 2) من (LongHairStraight ، Red ، Round ، ShirtScoopNeck ، Blue 01) ، فحينئذٍ

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-c9dea88713-dd1a6f-1c6801)

وفقًا للقواعد المذكورة أعلاه ، نحسب قيمة *** θ *** لجميع المجموعات 4031. ليس من الصعب رؤية أن هناك العديد من قيم *** θ *** التي تساوي 0. ما هو أسوأ هو أننا لا نستطيع إنشاء صور غير مرئية جديدة (*** θ *** = 0 يعني أنه لم يتم ملاحظة أي صورة بهذه المجموعة من الميزات). لإصلاح ذلك ، ما عليك سوى إضافة العدد الإجمالي للميزات ، d ، إلى المقام و 1 إلى البسط ، وهي تقنية تسمى تجانس لابلاس.

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-13a68a3a23-dd1a6f-1c6801)

الآن ، كل مجموعة (بما في ذلك تلك غير الموجودة في مجموعة البيانات الأصلية) لها احتمالية غير صفرية لأخذ العينات ، ولكن هذا لا يزال نموذجًا توليديًا غير مُرضٍ نظرًا لأن احتمال وجود نقطة غير موجودة في مجموعة البيانات الأصلية ثابت. إذا حاولنا استخدام مثل هذا النموذج لإنشاء لوحة لفان جوخ ، فسوف يعمل على اللوحتين التاليتين باحتمالية متساوية:

  1. نسخ لوحات فان جوخ الأصلية (ليست موجودة في مجموعة البيانات الأصلية)
  2. لوحات مصنوعة من وحدات بكسل عشوائية (ليست في مجموعة البيانات الأصلية)

من الواضح أن هذا ليس هو النموذج التوليدي الذي نريده ، ونأمل أن يتمكن من تعلم بعض الهياكل المتأصلة من البيانات ، بحيث يمكنه زيادة الوزن الاحتمالي للمناطق في مساحة العينة التي يعتقد أنها أكثر احتمالية ، بدلاً من وضع جميع أوزان الاحتمالية في نقطة وجود مجموعة البيانات.

3.2 النموذج المبسط

يمكن لنموذج Naive Bayes (Naive Bayes) أن يقلل بشكل كبير من عدد مجموعات الميزات المذكورة أعلاه ، ووفقًا لنموذجها ، يُفترض أن تكون كل ميزة مستقلة عن بعضها البعض. بالعودة إلى البيانات أعلاه ، فإن لون شعر الشخص (الميزة ** x * j ***) ليس مرتبطًا بلون ملابسه (الميزة ** x * k ***) ، معبرًا عنه بتعبير رياضي هو:

p (** x * j *** | ** x * k *) = p ( x * k ***)

مع هذا الافتراض ، يمكننا إجراء الحساب

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-80385db200-dd1a6f-1c6801)

يبسط نموذج Naive Bayesian المشكلة الأصلية "تقدير الاحتمالية لكل مجموعة ميزة" إلى "تقدير الاحتمال لكل ميزة". اتضح أننا نحتاج إلى استخدام معلمات 4031 (3 \ * 8 \ * 4 \ * 6 \ * 7) ، الآن هناك حاجة إلى 23 معلمة (3 + 8 + 4 + 6 + 7) فقط ، والتعبير عن كل معلمة هو:

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-a57ddcf3d5-dd1a6f-1c6801)

من بينها ، N هو عدد البيانات المرصودة ، أي 50 ، ** n ****** kl *** هو رقم ميزة *** k *** th و **** l *** رقم eigenvalue تحته.

من خلال إحصائيات 50 بيانات ، يعطي الجدول التالي قيم المعلمات لنموذج Naive Bayesian.

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-ec1c924af9-dd1a6f-1c6801)

لحساب احتمال إنشاء نموذج لميزة بيانات ، ما عليك سوى ضرب الاحتمالات الواردة في الجدول أعلاه ، على سبيل المثال:

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-f4d457ff82-dd1a6f-1c6801)

لم تظهر المجموعة المذكورة أعلاه في مجموعة البيانات الأصلية ، ولكن النموذج لا يزال يعينها باحتمالية غير صفرية ، لذلك كان لا يزال من الممكن إنشاؤها بواسطة النموذج. وبالتالي ، فإن نماذج Naive Bayesian قادرة على تعلم بعض الهياكل من البيانات واستخدامها لتوليد أمثلة جديدة لم تظهر في مجموعة البيانات الأصلية. الصورة أدناه هي صورة لعشر مجموعات أزياء جديدة تم إنشاؤها بواسطة النموذج.

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-aa0a2f7a9e-dd1a6f-1c6801)

في هذه المشكلة ، هناك 5 ميزات فقط تنتمي إلى البيانات منخفضة الأبعاد. ومن المعقول أن يفترض نموذج Naive Bayesian أنها مستقلة عن بعضها البعض ، وبالتالي فإن النتائج التي تم إنشاؤها بواسطة النموذج ليست سيئة. دعنا ننظر إلى مثال على النموذج ينهار.

4. صعوبات في توليد النماذج

4.1 البيانات عالية الأبعاد

بصفتك كبير مسؤولي الموضة ، نجحت في إنشاء 10 توافقات أزياء جديدة مع Naive Bayesian. أنت واثق جدًا من أن نموذجك لا يقهر حتى تصادف مجموعة البيانات التالية.

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-789aa091d5-dd1a6f-1c6801)

لم يعد يتم تمثيل مجموعة البيانات بخمس ميزات ، ولكن يتم تمثيلها بـ 32 \ * 32 = 1024 بكسل ، كل قيمة بكسل يمكن أن تنتقل إلى واحد من 0 إلى 255 ، 0 يعني الأبيض ، 255 يعني الأسود. يسرد الجدول التالي قيم البكسل من 1 إلى 5 لأول 10 صور.

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-05bb7d4e07-dd1a6f-1c6801)

استخدم نفس النموذج لإنشاء 10 مجموعات من مجموعات الأزياء الجديدة. التالي هو نتيجة جيل العارضين. كل منها قبيح ومتشابه ، ولا يمكن التمييز بين ميزات مختلفة. لماذا هذا صحيح؟

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-3ba5009bbe-dd1a6f-1c6801)

بادئ ذي بدء ، نظرًا لأن نموذج Naive Bayesian يقوم بتجميع وحدات البكسل بشكل مستقل ، فإن وحدات البكسل المجاورة متشابهة جدًا في الواقع. بالنسبة للملابس ، في الواقع ، يجب أن تكون وحدات البكسل متماثلة تقريبًا ، ولكن يتم أخذ عينات من النموذج بشكل عشوائي ، وبالتالي فإن الملابس الموجودة في الصورة أعلاه كلها ملونة. ثانيًا ، هناك العديد من الاحتمالات في فضاء عينة عالي الأبعاد ، يمكن التعرف على جزء منها فقط. إذا كان نموذج Naive Bayesian يتعامل مباشرة مع قيم البكسل شديدة الارتباط هذه ، فإن فرص العثور على مجموعة مرضية من القيم تكون صغيرة جدًا.

لتلخيص ، بالنسبة لمساحات العينة ذات الأبعاد المنخفضة والارتباط المنخفض للميزات ، فإن تأثير Naive Bayesian جيد جدًا من خلال أخذ العينات المستقل ؛ ولكن بالنسبة لمساحات العينة ذات الأبعاد العالية والارتباط العالي للميزات ، يتم استخدام وحدات البكسل المستقلة لأخذ العينات للعثور على وجوه بشرية فعالة هي شبه مستحيل.

يسلط هذا المثال الضوء على صعوبتين يجب على النماذج التوليدية التغلب عليها من أجل تحقيق النجاح:

  1. كيف يتعامل النموذج مع التبعيات الشرطية بين السمات عالية الأبعاد؟
  2. كيف يجد النموذج نسبة صغيرة جدًا من الملاحظات التي تفي بالشرط من مساحة عينة عالية الأبعاد؟

لكي تنجح النماذج التوليدية في فضاءات العينة عالية الأبعاد والمترابطة بشكل كبير ، يجب استخدام نماذج التعلم العميق. نحتاج إلى نموذج يمكنه استنتاج الهياكل ذات الصلة من البيانات ، بدلاً من إخبارنا بالافتراضات التي يجب القيام بها في وقت مبكر. يمكن أن يشكل التعلم العميق ميزاته الخاصة في مساحة منخفضة الأبعاد ، وهذا شكل من أشكال ** التعلم التمثيلي ** (التعلم التمثيلي).

4.2 التعلم بالتمثيل

تعلم التمثيل هو معرفة معنى تمثيل البيانات عالية الأبعاد.

لنفترض أنك ذهبت لمقابلة مستخدم إنترنت لم يلتقِ من قبل ، وهناك العديد من الأشخاص الذين لا يستطيعون العثور عليها في مكان الاجتماع ، لذلك اتصلت بها لوصف مظهرك. أعتقد أنك لن تقول إن لون البكسل 1 في صورتك أسود ، ولون البكسل 2 أسود فاتح ، ولون البكسل 3 رمادي وهكذا. على العكس من ذلك ، ستعتقد أن مستخدمي الإنترنت سيكون لديهم فهم عام لمظهر الأشخاص العاديين ، ومن ثم يعطون هذا الفهم لوصف خصائص مجموعة البكسل ، على سبيل المثال ، لديك شعر أسود قصير وجميل ، ترتدي زوجًا من النظارات الذهبية وهلم جرا. عادة مع ما لا يزيد عن 10 أوصاف من هذا القبيل ، يمكن لمستخدم الإنترنت أن يولد صورة لك من عقله.قد تكون الصورة خشنة ، لكنها لا تمنع مستخدم الإنترنت من العثور عليك من بين مئات الأشخاص ، حتى لو لم يسبق لك رؤيتك من قبل.

هذه هي الفكرة الأساسية وراء التعلم التمثيلي ، بدلاً من محاولة صياغة ** مساحة العينة عالية الأبعاد ** (مساحة عينة عالية الأبعاد) ، ولكن باستخدام بعض ** مساحة كامنة منخفضة الأبعاد ** (كامنة منخفضة الأبعاد space) لوصف كل ملاحظة في مجموعة التدريب ، ثم تعلم ** وظيفة رسم الخرائط ** (وظيفة رسم الخرائط) ، والتي يمكن أن تأخذ نقطة في المساحة الكامنة وتعيينها إلى مساحة العينة الأصلية. بمعنى آخر ، تمثل كل نقطة في الفضاء الكامن سمة من سمات البيانات عالية الأبعاد.

إذا لم يكن من السهل فهم الكلمات أعلاه ، فالرجاء الاطلاع على مجموعة التدريب أدناه التي تتكون من بعض صور جرة التدرج الرمادي.

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-d504321c9f-dd1a6f-1c6801)

ليس من الصعب أن نرى أن هذه الجرار يمكن وصفها بخاصيتين فقط: الارتفاع والعرض. لذلك ، يمكننا تحويل مساحة البكسل عالية الأبعاد للصورة إلى مساحة كامنة ثنائية الأبعاد ، كما هو موضح في الشكل أدناه. بهذه الطريقة يمكننا أخذ عينات (النقاط الزرقاء) من المساحة الكامنة ثم تحويلها إلى صورة عبر وظيفة التعيين *** f ***.

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-c198325788-dd1a6f-1c6801)

ليس من السهل على الآلة أن تدرك أن مجموعة البيانات الأصلية يمكن تمثيلها بمساحة كامنة أبسط. أولاً ، تحتاج الآلة إلى تحديد أن الارتفاع والعرض هما بعدي الفضاء الكامنين اللذين يصفان مجموعة البيانات على أفضل وجه ، ثم التعلم وظيفة رسم الخرائط *** f *** يمكن أن تأخذ نقطة في هذا الفضاء وتعيينها إلى خريطة يمكن التدرج الرمادي. يتيح لنا التعلم العميق تدريب الآلات على إيجاد هذه العلاقات المعقدة دون توجيه بشري.

5. تصنيف النماذج المولدة

تهدف جميع أنواع النماذج التوليدية في نهاية المطاف إلى حل نفس المهمة ، لكنها جميعًا تعمل في نموذج الكثافة بطرق مختلفة قليلاً ، وتنقسم عمومًا إلى فئتين:

  • ** النمذجة صراحة ** (النمذجة صراحة) وظيفة الكثافة ،

ولكن بطريقة ما تقيد النموذج من أجل حساب دالة الكثافة ، مثل ** تطبيع نموذج التدفق ** (تطبيع نموذج التدفق)

ولكن لتقريب وظيفة الكثافة ، مثل ** المشفر التلقائي المتغير ** (المشفر التلقائي iational ، VAE) و ** نموذج الانتشار ** (نموذج الانتشار)

  • ** النمذجة الضمنية ** (النمذجة الضمنية) لوظيفة الكثافة ، من خلال عملية عشوائية تولد البيانات مباشرة. على سبيل المثال ، ** شبكة الخصومة التوليدية ** (شبكة الخصومة التوليدية ، GAN)

! [SignalPlus: مقدمة في الذكاء الاصطناعي التوليدي] (https://img-cdn.gateio.im/resized-social/moments-40baef27dd-c6a15fd100-dd1a6f-1c6801)

لخص

الذكاء الاصطناعي التوليدي هو نوع من الذكاء الاصطناعي يمكن استخدامه لإنشاء محتوى وأفكار جديدة ، بما في ذلك النصوص والصور والفيديو والموسيقى. مثل جميع أنواع الذكاء الاصطناعي ، يعد GenAI نموذجًا فائق الضخامة تم تدريبه مسبقًا بواسطة نموذج التعلم العميق بناءً على كمية كبيرة من البيانات ، وغالبًا ما يُسمى ** النموذج الأساسي ** (FM). مع GenAI ، يمكننا رسم المزيد من الصور الرائعة ، وكتابة نص أكثر جمالا ، وتأليف المزيد من الموسيقى المتحركة ، ولكن الخطوة الأولى تتطلب منا فهم كيفية إنشاء GenAI لأشياء جديدة ، كما قال رئيس المقالة ريتشارد فاينمان "لن أفهم ما لا يمكنني إنشاؤه ".

شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • مشاركة
تعليق
لا توجد تعليقات