في 16 فبراير، أعلنت OpenAI عن أحدث نموذج للنشر التوليدي لتحويل النص إلى فيديو يسمى "Sora"، مما يمثل علامة فارقة أخرى في الذكاء الاصطناعي التوليدي مع قدرته على إنتاج مقاطع فيديو عالية الجودة عبر مجموعة واسعة من أنواع البيانات المرئية. على عكس أدوات إنشاء الفيديو المدعومة بالذكاء الاصطناعي مثل Pika، التي تولد بضع ثوانٍ من الفيديو من صور متعددة، يتدرب Sora في المساحة الكامنة المضغوطة لمقاطع الفيديو والصور، ويقسمها إلى بقع زمانية مكانية لإنشاء فيديو قابل للتطوير. علاوة على ذلك، يُظهر النموذج قدرات محاكاة العالمين المادي والرقمي، من خلال العرض التوضيحي الذي مدته 60 ثانية والذي يوصف بأنه "محاكي عالمي للعالم المادي".
يواصل Sora المسار الفني لـ "مصدر البيانات - المحولات - الانتشار - الظهور" الذي شوهد في نماذج GPT السابقة، مما يشير إلى أن نضج تطويره يعتمد أيضًا على القوة الحسابية. ونظرًا لحجم البيانات الأكبر المطلوب للتدريب عبر الفيديو مقارنة بالنص، فمن المتوقع أن يزداد الطلب على الطاقة الحسابية بشكل أكبر. ومع ذلك، كما تمت مناقشته في مقالتنا السابقة "معاينة القطاع الواعد: سوق طاقة الحوسبة اللامركزية"، فقد تم استكشاف أهمية القوة الحاسوبية في عصر الذكاء الاصطناعي، ومع تزايد شعبية الذكاء الاصطناعي، ظهرت العديد من مشاريع الطاقة الحاسوبية، مما استفاد منه آخرون مشاريع Depin (التخزين، الطاقة الحاسوبية، وما إلى ذلك) ذات قيمة كبيرة. بعيدًا عن Depin، تهدف هذه المقالة إلى تحديث واستكمال المناقشات السابقة، والتفكير في الشرر الذي قد ينشأ عن تشابك Web3 والذكاء الاصطناعي والفرص المتاحة ضمن هذا المسار في عصر الذكاء الاصطناعي.
الذكاء الاصطناعي (AI) هو مجال مزدهر يركز على محاكاة الذكاء البشري وتوسيع نطاقه وإثرائه. منذ بدايته في الخمسينيات والستينيات من القرن الماضي، شهد الذكاء الاصطناعي أكثر من نصف قرن من التطور، حيث ظهر كتقنية محورية تدفع التحول المجتمعي والصناعات المختلفة. طوال هذه الرحلة، أدى التقدم المتشابك لثلاثة اتجاهات بحثية أساسية - الرمزية والارتباطية والسلوكية - إلى إرساء الأساس للتقدم السريع للذكاء الاصطناعي اليوم.
الرمزية، والتي يشار إليها أيضًا بالمنطقية أو الاستدلال المبني على القواعد، تفترض أن تكرار الذكاء البشري من خلال معالجة الرموز أمر ممكن. يستخدم هذا النهج الرموز لتمثيل ومعالجة الأشياء والمفاهيم وعلاقاتها ضمن مجال مشكلة معين، وذلك باستخدام التفكير المنطقي لحل المشكلات. حققت الرمزية نجاحًا ملحوظًا، خاصة في الأنظمة الخبيرة وتمثيل المعرفة. مبدأها الأساسي هو أن السلوك الذكي يمكن تحقيقه من خلال التلاعب بالرموز والاستدلال المنطقي، حيث تعمل الرموز بمثابة تجريدات عالية المستوى للعالم الحقيقي.
تسعى الوصلية، والمعروفة أيضًا باسم نهج الشبكة العصبية، إلى تحقيق الذكاء من خلال عكس بنية ووظيفة الدماغ البشري. تقوم هذه المنهجية ببناء شبكات تضم العديد من وحدات المعالجة البسيطة المشابهة للخلايا العصبية وتقوم بضبط نقاط قوة الاتصال بين هذه الوحدات، على غرار المشابك العصبية، لتسهيل التعلم. من خلال التركيز على التعلم والتعميم من البيانات، تعتبر الاتصالية مناسبة تمامًا لمهام مثل التعرف على الأنماط والتصنيف ورسم خرائط المدخلات والمخرجات المستمرة. لقد حقق التعلم العميق، وهو تطور للاتصالية، اختراقات في مجالات مثل التعرف على الصور والكلام، وكذلك معالجة اللغة الطبيعية.
وتؤكد السلوكية، المرتبطة ارتباطًا وثيقًا بالروبوتات المحاكاة الحيوية وأبحاث الأنظمة الذكية المستقلة، أن العناصر الذكية يمكنها التعلم من خلال التفاعل البيئي. على عكس الأساليب السابقة، لا تركز السلوكية على محاكاة التمثيلات الداخلية أو العمليات المعرفية ولكنها تحقق السلوك التكيفي من خلال دورة الإدراك والفعل. ويفترض أن الذكاء يظهر من خلال التفاعل البيئي الديناميكي والتعلم، مما يجعله فعالا بشكل خاص للروبوتات المتنقلة وأنظمة التحكم التكيفية التي تعمل في بيئات معقدة وغير متوقعة.
على الرغم من التباينات الأساسية بينهما، يمكن لهذه الاتجاهات البحثية الثلاثة أن تتآزر وتكمل بعضها البعض في أبحاث وتطبيقات الذكاء الاصطناعي العملية، مما يؤدي بشكل جماعي إلى دفع تطوير هذا المجال.
يمثل المجال المزدهر للمحتوى الناتج عن الذكاء الاصطناعي (AIGC) تطورًا وتطبيقًا للاتصالية، مما يسهل توليد محتوى جديد من خلال محاكاة الإبداع البشري. يتم تدريب هذه النماذج باستخدام مجموعات بيانات واسعة وخوارزميات التعلم العميق لتمييز الهياكل والعلاقات والأنماط الأساسية داخل البيانات. بناءً على مدخلات المستخدم، ينتجون مخرجات متنوعة بما في ذلك الصور ومقاطع الفيديو والأكواد والموسيقى والتصميمات والترجمات والإجابات على الأسئلة والنصوص. في الوقت الحاضر، يتكون AIGC بشكل أساسي من ثلاثة عناصر: التعلم العميق (DL)، والبيانات الضخمة، والقوة الحسابية الضخمة.
يستخدم التعلم العميق، وهو مجموعة فرعية من التعلم الآلي (ML)، خوارزميات مصممة على غرار الشبكات العصبية للدماغ البشري. مثلما يتكون الدماغ البشري من خلايا عصبية مترابطة تعالج المعلومات، تتكون الشبكات العصبية للتعلم العميق من طبقات متعددة من الخلايا العصبية الاصطناعية التي تؤدي عمليات حسابية داخل الكمبيوتر. تستفيد هذه الخلايا العصبية الاصطناعية، أو العقد، من العمليات الرياضية لمعالجة البيانات وحل المشكلات المعقدة من خلال خوارزميات التعلم العميق.
تتكون الشبكات العصبية من طبقات: الإدخال، والمخفية، والإخراج، مع معلمات تربط هذه الطبقات.
· طبقة الإدخال: الطبقة الأولى من الشبكة العصبية، تتلقى بيانات الإدخال الخارجية. تتوافق كل خلية عصبية داخل هذه الطبقة مع إحدى ميزات البيانات المدخلة. على سبيل المثال، عند معالجة بيانات الصورة، قد تمثل الخلايا العصبية الفردية قيم البكسل.
· الطبقات المخفية: بعد طبقة الإدخال، تقوم الطبقات المخفية بمعالجة البيانات ونقلها عبر الشبكة. تقوم هذه الطبقات بتحليل المعلومات على مستويات مختلفة، وتكييف سلوكها عندما تتلقى مدخلات جديدة. يمكن أن تحتوي شبكات التعلم العميق على مئات الطبقات المخفية، مما يسمح بتحليل المشكلات متعددة الأوجه. على سبيل المثال، عند تصنيف حيوان غير مألوف من صورة ما، يمكن للشبكة مقارنته بالحيوانات المعروفة من خلال تقييم خصائصه مثل شكل الأذن وعدد الأرجل وحجم حدقة العين. تعمل الطبقات المخفية بشكل مشابه، حيث تعالج كل منها ميزات حيوانية مختلفة للمساعدة في التصنيف الدقيق.
· طبقة الإخراج: الطبقة الأخيرة من الشبكة العصبية، تنتج مخرجات الشبكة. تمثل الخلايا العصبية الموجودة في هذه الطبقة فئات أو قيم المخرجات المحتملة. في مهام التصنيف، قد تتوافق كل خلية عصبية مع فئة ما، بينما في مهام الانحدار، يمكن أن تحتوي طبقة الإخراج على خلية عصبية واحدة تتنبأ قيمتها بالنتيجة.
· المعلمات: في الشبكات العصبية، يتم تمثيل الاتصالات بين الطبقات المختلفة بالأوزان والتحيزات، والتي يتم تحسينها أثناء عملية التدريب لتمكين الشبكة من التعرف بدقة على الأنماط في البيانات وإجراء التنبؤات. يمكن لزيادة المعلمات أن تعزز قدرة نموذج الشبكة العصبية، أي القدرة على التعلم وتمثيل الأنماط المعقدة في البيانات. ومع ذلك، فإن هذا يزيد أيضًا من الطلب على القوة الحسابية.
يتطلب التدريب الفعال على الشبكات العصبية عادةً بيانات واسعة النطاق ومتنوعة وعالية الجودة ومتعددة المصادر. تشكل هذه البيانات حجر الزاوية للتدريب والتحقق من صحة نماذج التعلم الآلي. ومن خلال تحليل البيانات الضخمة، يمكن لنماذج التعلم الآلي تحديد الأنماط والعلاقات داخل البيانات، مما يسهل التنبؤات أو التصنيفات.
البنية المعقدة متعددة الطبقات للشبكات العصبية، والمعلمات العديدة، ومتطلبات معالجة البيانات الضخمة، وأساليب التدريب التكرارية (بما في ذلك حسابات الانتشار الأمامية والخلفية المتكررة، بما في ذلك حسابات وظائف التنشيط والخسارة، وحسابات التدرج، وتحديثات الوزن)، والحوسبة عالية الدقة الاحتياجات، وقدرات الحوسبة المتوازية، وتقنيات التحسين والتنظيم، وتقييم النماذج وعمليات التحقق من صحتها تساهم بشكل جماعي في المتطلبات الحسابية الكبيرة.
يمثل Sora، أحدث نموذج للذكاء الاصطناعي لجيل الفيديو من OpenAI، تقدمًا كبيرًا في قدرة الذكاء الاصطناعي على معالجة وفهم البيانات المرئية المتنوعة. من خلال استخدام شبكات ضغط الفيديو وتقنيات التصحيح الزماني المكاني، يستطيع Sora تحويل كميات هائلة من البيانات المرئية التي تم التقاطها في جميع أنحاء العالم ومن أجهزة مختلفة إلى تمثيل موحد. تتيح هذه القدرة المعالجة الفعالة وفهم المحتوى المرئي المعقد. يستخدم Sora نماذج الانتشار المشروطة بالنص لإنشاء مقاطع فيديو أو صور مرتبطة بشكل كبير بالمطالبات النصية، مما يعرض الإبداع الرائع والقدرة على التكيف.
على الرغم من الإنجازات التي حققها سورا في مجال إنشاء الفيديو ومحاكاة التفاعلات في العالم الحقيقي، إلا أنه يواجه بعض القيود. وتشمل هذه دقة محاكاة العالم المادي، والاتساق في إنشاء مقاطع فيديو طويلة، وفهم التعليمات النصية المعقدة، والكفاءة في التدريب والتوليد. في الأساس، يتبع Sora المسار الفني "للبيانات الضخمة - المحولات - الانتشار - الظهور"، والذي تسهله القوة الحسابية الاحتكارية لشركة OpenAI وميزة المتحرك الأول، مما يؤدي إلى شكل من أشكال جماليات القوة الغاشمة. ومع ذلك، لا تزال شركات الذكاء الاصطناعي الأخرى تمتلك القدرة على تجاوز سورا من خلال الابتكار التكنولوجي.
في حين أن اتصال Sora بـ blockchain لا يزال متواضعًا، فمن المتوقع أنه في العام أو العامين المقبلين، سيؤدي تأثير Sora إلى ظهور أدوات أخرى عالية الجودة لتوليد الذكاء الاصطناعي والتطور السريع. من المتوقع أن تؤثر هذه التطورات على قطاعات Web3 المختلفة مثل GameFi والمنصات الاجتماعية والمنصات الإبداعية وDepin وما إلى ذلك. وبالتالي، يعد اكتساب فهم عام لـ Sora أمرًا ضروريًا، ويصبح التفكير في كيفية تكامل الذكاء الاصطناعي بشكل فعال مع Web3 في المستقبل أحد الاعتبارات الحاسمة. .
كما ناقشنا سابقًا، يمكن تلخيص المكونات الأساسية الضرورية للذكاء الاصطناعي التوليدي في ثلاثة عناصر رئيسية: الخوارزميات، والبيانات، والقدرة الحاسوبية. وعلى العكس من ذلك، فإن الذكاء الاصطناعي، باعتباره أداة عالمية ذات تأثيرات بعيدة المدى على أساليب الإنتاج، يُحدث ثورة في كيفية عمل الصناعات. وفي الوقت نفسه، فإن التأثيرات الكبيرة لتكنولوجيا blockchain ذات شقين: فهي تعيد هيكلة علاقات الإنتاج وتتيح اللامركزية. وبالتالي، فإن التقارب بين هاتين التقنيتين يمكن أن يؤدي إلى أربعة مسارات محتملة:
يهدف هذا القسم إلى تقديم نظرة ثاقبة للمشهد الحالي لقوة الحوسبة. في عالم الذكاء الاصطناعي، تتمتع القوة الحاسوبية بأهمية هائلة. لقد وصل الطلب على القوة الحاسوبية في الذكاء الاصطناعي، وخاصة بعد ظهور سورا، إلى مستويات غير مسبوقة. خلال المنتدى الاقتصادي العالمي في دافوس بسويسرا عام 2024، أكد سام ألتمان، الرئيس التنفيذي لشركة OpenAI، على أن قوة الحوسبة والطاقة تمثل في الوقت الحالي أهم القيود، ملمحًا إلى معادلتها للعملة في المستقبل. وفي وقت لاحق، في العاشر من فبراير، أعلن سام ألتمان عن خطة رائدة عبر تويتر لجمع مبلغ مذهل قدره 7 تريليون دولار أمريكي (أي ما يعادل 40٪ من الناتج المحلي الإجمالي للصين في عام 2023) لإحداث ثورة في صناعة أشباه الموصلات العالمية، بهدف إنشاء إمبراطورية أشباه الموصلات. في السابق، كانت اعتباراتي المتعلقة بقدرة الحوسبة مقتصرة على القيود الوطنية واحتكارات الشركات؛ ومع ذلك، فإن فكرة وجود كيان واحد يطمح إلى السيطرة على قطاع أشباه الموصلات العالمي هي فكرة رائعة حقا.
إن أهمية قوة الحوسبة اللامركزية واضحة. تقدم ميزات Blockchain حلولاً للقضايا السائدة المتمثلة في احتكار قوة الحوسبة والتكاليف الباهظة المرتبطة بالحصول على وحدات معالجة الرسومات المتخصصة. من منظور متطلبات الذكاء الاصطناعي، يمكن تصنيف استخدام الطاقة الحاسوبية إلى جانبين: الاستدلال والتدريب. المشاريع التي تركز في المقام الأول على التدريب نادرة بسبب التكامل المعقد المطلوب للشبكات اللامركزية والمتطلبات الكبيرة للأجهزة، مما يشكل عوائق كبيرة أمام التنفيذ. على العكس من ذلك، تعد مهام الاستدلال أبسط نسبيًا، مع تصميمات شبكات لامركزية أقل تعقيدًا ومتطلبات أقل للأجهزة وعرض النطاق الترددي، مما يمثل وسيلة أكثر سهولة للوصول.
يحمل مشهد قوة الحوسبة المركزية إمكانات هائلة، وغالباً ما ترتبط بواصف "مستوى التريليون"، ويظل موضوعاً مثيراً للغاية في عصر الذكاء الاصطناعي. ومع ذلك، فعند ملاحظة العدد الكبير من المشاريع الأخيرة، يبدو أن الكثير منها عبارة عن مساعي تم تصميمها على عجل بهدف الاستفادة من الاتجاهات السائدة. وفي حين أن هذه المشاريع غالباً ما تؤيد اللامركزية، فإنها تميل إلى تجنب المناقشات حول أوجه القصور في الشبكات اللامركزية. علاوة على ذلك، هناك درجة ملحوظة من التوحيد في التصميم، حيث تتبنى العديد من المشاريع أساليب مماثلة (مثل تصميم L2 بنقرة واحدة بالإضافة إلى تصميم التعدين)، مما قد يؤدي إلى الفشل وتعقيد الجهود للتمييز عن سباق الذكاء الاصطناعي التقليدي.
تم تصميم خوارزميات التعلم الآلي لتعلم الأنماط والقواعد من البيانات، مما يمكنها من إجراء تنبؤات أو قرارات بناءً على هذه الأنماط المستفادة. نظرًا للتعقيد الذي ينطوي عليه تصميمها وتحسينها، فإن الخوارزميات بطبيعتها كثيفة الاستخدام للتكنولوجيا، وتتطلب خبرة عميقة وابتكارًا تكنولوجيًا. إنها بمثابة العمود الفقري لتدريب نماذج الذكاء الاصطناعي، حيث تحدد كيفية معالجة البيانات لاستخلاص رؤى مفيدة أو اتخاذ القرارات. تم تصميم خوارزميات الذكاء الاصطناعي التوليدية البارزة، مثل شبكات الخصومة التوليدية (GANs) وأجهزة التشفير التلقائي المتغيرة (VAEs) والمحولات، لمجالات محددة مثل الرسم أو التعرف على اللغة أو الترجمة أو إنشاء الفيديو، وهي مفيدة في تدريب نماذج الذكاء الاصطناعي المتخصصة.
إن العدد الكبير من الخوارزميات والنماذج ذات نقاط القوة المميزة يثير السؤال: هل يمكن دمجها في نموذج متعدد الاستخدامات؟ ويقود مشروع Bittensor، وهو مشروع بارز مؤخرًا، الجهود في هذا الاتجاه من خلال تحفيز التعاون بين نماذج وخوارزميات الذكاء الاصطناعي المختلفة، وبالتالي تعزيز تطوير نماذج ذكاء اصطناعي أكثر كفاءة وقدرة. وتركز مبادرات أخرى، مثل Commune AI، على تعزيز التعاون في مجال الكود، على الرغم من أن مشاركة الخوارزميات والنماذج لا تزال تمثل تحديًا بسبب طبيعتها الخاصة داخل شركات الذكاء الاصطناعي.
يعد مفهوم النظام البيئي التعاوني للذكاء الاصطناعي مثيرًا للاهتمام، حيث يستفيد من تقنية blockchain للتخفيف من العيوب المرتبطة بخوارزميات الذكاء الاصطناعي المعزولة. ومع ذلك، لم يتم بعد تحديد قدرتها على توليد القيمة المقابلة. تمتلك شركات الذكاء الاصطناعي القائمة، والمجهزة بخوارزميات ونماذج خاصة، قدرات قوية في تحديث تقنياتها وتكرارها ودمجها. على سبيل المثال، تقدمت OpenAI بسرعة من نماذج إنشاء النصوص المبكرة إلى النماذج التوليدية متعددة المجالات في غضون عامين. قد تحتاج مشاريع مثل Bittensor إلى استكشاف مسارات مبتكرة في مجالاتها المستهدفة للتنافس بفعالية.
من وجهة نظر مبسطة، يعد دمج البيانات الخاصة لتغذية الذكاء الاصطناعي والبيانات التوضيحية من السبل التي تتناغم جيدًا مع تقنية blockchain. تدور الاهتمامات الأساسية حول كيفية إحباط البيانات غير المرغوب فيها والأنشطة الضارة. علاوة على ذلك، يمكن أن يكون تخزين البيانات مفيدًا لمشاريع Depin مثل FIL وAR.
وبالنظر إلى الأمر من زاوية أكثر تعقيدًا، فإن الاستفادة من بيانات blockchain للتعلم الآلي (ML) لمعالجة إمكانية الوصول إلى بيانات blockchain يمثل اتجاهًا مقنعًا آخر، كما استكشفته جيزة.
من الناحية النظرية، يمكن الوصول إلى بيانات blockchain في أي وقت وتعكس حالة blockchain بأكملها. ومع ذلك، بالنسبة لأولئك الذين هم خارج النظام البيئي لـ blockchain، فإن الوصول إلى مجموعات البيانات الشاملة هذه ليس بالأمر السهل. يتطلب تخزين blockchain بأكمله خبرة كبيرة وموارد أجهزة متخصصة.
للتغلب على تحديات الوصول إلى بيانات البلوكشين، شهدت الصناعة ظهور العديد من الحلول. على سبيل المثال، يوفر موفرو RPC الوصول إلى العقدة من خلال واجهات برمجة التطبيقات، بينما تسهل خدمات الفهرسة استرجاع البيانات عبر SQL وGraphQL، مما يلعب دورًا محوريًا في تخفيف المشكلة. ومع ذلك، فإن هذه الأساليب لها حدودها. خدمات RPC غير كافية لحالات الاستخدام عالية الكثافة التي تتطلب استعلامات بيانات موسعة وغالبًا ما تفشل في تلبية الطلب. وفي الوقت نفسه، على الرغم من أن خدمات الفهرسة تقدم نهجًا أكثر تنظيمًا لاستعادة البيانات، فإن تعقيد بروتوكولات Web3 يجعل إنشاء استعلامات فعالة أمرًا صعبًا للغاية، مما يستلزم أحيانًا مئات أو حتى آلاف الأسطر من التعليمات البرمجية المعقدة. يشكل هذا التعقيد عائقًا كبيرًا أمام ممارسي البيانات العامة وأولئك الذين لديهم فهم محدود لتعقيدات Web3. ويؤكد التأثير الجماعي لهذه القيود على ضرورة إيجاد طريقة أكثر سهولة وقابلية للاستخدام للحصول على بيانات البلوكشين والاستفادة منها، وهو ما يمكن أن يحفز التطبيق والابتكار على نطاق أوسع في هذا المجال.
وبالتالي، فإن دمج ZKML (التعلم الآلي بدون معرفة، والذي يخفف عبء التعلم الآلي على السلسلة) مع بيانات blockchain عالية الجودة يمكن أن يؤدي إلى مجموعات بيانات تعالج تحديات إمكانية الوصول إلى بيانات blockchain. يتمتع الذكاء الاصطناعي بالقدرة على تقليل العوائق التي تحول دون الوصول إلى بيانات blockchain بشكل كبير. وبمرور الوقت، يمكن للمطورين والباحثين وعشاق تعلم الآلة الوصول إلى المزيد من مجموعات البيانات عالية الجودة وذات الصلة لصياغة حلول فعالة ومبتكرة.
منذ ظهور ChatGPT3 في عام 2023، أصبح تمكين الذكاء الاصطناعي للتطبيقات اللامركزية اتجاهًا شائعًا للغاية. ويمكن دمج الذكاء الاصطناعي التوليدي القابل للتطبيق على نطاق واسع من خلال واجهات برمجة التطبيقات، وبالتالي تبسيط وذكاء منصات البيانات، وروبوتات التداول، وموسوعات blockchain، والتطبيقات الأخرى. ويمكنه أيضًا أن يعمل كروبوتات دردشة (مثل Myshell) أو مرافقين للذكاء الاصطناعي (مثل Sleepless AI)، وحتى إنشاء شخصيات غير قابلة للعب في ألعاب blockchain باستخدام الذكاء الاصطناعي التوليدي. ومع ذلك، نظرًا لانخفاض العوائق التقنية، فإن معظم عمليات التنفيذ هي مجرد تعديلات بعد دمج واجهة برمجة التطبيقات (API)، وغالبًا ما يكون التكامل مع المشاريع نفسها غير كامل، وبالتالي نادرًا ما يتم ذكرها.
مع ظهور Sora، أعتقد شخصيًا أن تمكين الذكاء الاصطناعي لـ GameFi (بما في ذلك metaverse) والمنصات الإبداعية سيكون التركيز الأساسي للمضي قدمًا. نظرًا للطبيعة التصاعدية لمجال Web3، فمن غير المحتمل إنتاج منتجات يمكنها التنافس بشكل مباشر مع الألعاب التقليدية أو الشركات الإبداعية. ومع ذلك، فإن ظهور سورا لديه القدرة على كسر هذا الجمود، ربما في غضون عامين إلى ثلاثة أعوام فقط. من العرض التوضيحي لـ Sora، يبدو أنها قادرة على التنافس مع شركات الدراما الصغيرة. بالإضافة إلى ذلك، يمكن لثقافة المجتمع النشطة لـ Web3 أن تعزز عددًا كبيرًا من الأفكار المثيرة للاهتمام. عندما يكون الحد الوحيد هو الخيال، فإن الحواجز بين الصناعة من أسفل إلى أعلى والصناعة التقليدية من أعلى إلى أسفل سوف تنهار.
مع استمرار تقدم أدوات الذكاء الاصطناعي الإبداعية، فإننا على استعداد لتجربة المزيد من "لحظات iPhone" التحويلية في المستقبل. على الرغم من الشكوك الأولية المحيطة بتكامل الذكاء الاصطناعي مع Web3، فأنا على ثقة من أن المسارات الحالية تسير بشكل عام على المسار الصحيح، وإن كان ذلك مع ثلاث نقاط أساسية تتطلب الاهتمام: الضرورة والكفاءة والتوافق. ورغم أن التقارب بين هذه المجالات يظل استكشافيا، فلا ينبغي له أن يمنعنا من تصور تبنيه على نطاق واسع في السوق الصاعدة المقبلة.
يعد الحفاظ على عقلية الفضول والتقبل للأفكار الجديدة أمرًا بالغ الأهمية. وتؤكد السوابق التاريخية، مثل الانتقال السريع من العربات التي تجرها الخيول إلى السيارات وتطور النقوش في NFTs السابقة، على أهمية تجنب التحيزات المفرطة، والتي غالبا ما تؤدي إلى ضياع الفرص.
في 16 فبراير، أعلنت OpenAI عن أحدث نموذج للنشر التوليدي لتحويل النص إلى فيديو يسمى "Sora"، مما يمثل علامة فارقة أخرى في الذكاء الاصطناعي التوليدي مع قدرته على إنتاج مقاطع فيديو عالية الجودة عبر مجموعة واسعة من أنواع البيانات المرئية. على عكس أدوات إنشاء الفيديو المدعومة بالذكاء الاصطناعي مثل Pika، التي تولد بضع ثوانٍ من الفيديو من صور متعددة، يتدرب Sora في المساحة الكامنة المضغوطة لمقاطع الفيديو والصور، ويقسمها إلى بقع زمانية مكانية لإنشاء فيديو قابل للتطوير. علاوة على ذلك، يُظهر النموذج قدرات محاكاة العالمين المادي والرقمي، من خلال العرض التوضيحي الذي مدته 60 ثانية والذي يوصف بأنه "محاكي عالمي للعالم المادي".
يواصل Sora المسار الفني لـ "مصدر البيانات - المحولات - الانتشار - الظهور" الذي شوهد في نماذج GPT السابقة، مما يشير إلى أن نضج تطويره يعتمد أيضًا على القوة الحسابية. ونظرًا لحجم البيانات الأكبر المطلوب للتدريب عبر الفيديو مقارنة بالنص، فمن المتوقع أن يزداد الطلب على الطاقة الحسابية بشكل أكبر. ومع ذلك، كما تمت مناقشته في مقالتنا السابقة "معاينة القطاع الواعد: سوق طاقة الحوسبة اللامركزية"، فقد تم استكشاف أهمية القوة الحاسوبية في عصر الذكاء الاصطناعي، ومع تزايد شعبية الذكاء الاصطناعي، ظهرت العديد من مشاريع الطاقة الحاسوبية، مما استفاد منه آخرون مشاريع Depin (التخزين، الطاقة الحاسوبية، وما إلى ذلك) ذات قيمة كبيرة. بعيدًا عن Depin، تهدف هذه المقالة إلى تحديث واستكمال المناقشات السابقة، والتفكير في الشرر الذي قد ينشأ عن تشابك Web3 والذكاء الاصطناعي والفرص المتاحة ضمن هذا المسار في عصر الذكاء الاصطناعي.
الذكاء الاصطناعي (AI) هو مجال مزدهر يركز على محاكاة الذكاء البشري وتوسيع نطاقه وإثرائه. منذ بدايته في الخمسينيات والستينيات من القرن الماضي، شهد الذكاء الاصطناعي أكثر من نصف قرن من التطور، حيث ظهر كتقنية محورية تدفع التحول المجتمعي والصناعات المختلفة. طوال هذه الرحلة، أدى التقدم المتشابك لثلاثة اتجاهات بحثية أساسية - الرمزية والارتباطية والسلوكية - إلى إرساء الأساس للتقدم السريع للذكاء الاصطناعي اليوم.
الرمزية، والتي يشار إليها أيضًا بالمنطقية أو الاستدلال المبني على القواعد، تفترض أن تكرار الذكاء البشري من خلال معالجة الرموز أمر ممكن. يستخدم هذا النهج الرموز لتمثيل ومعالجة الأشياء والمفاهيم وعلاقاتها ضمن مجال مشكلة معين، وذلك باستخدام التفكير المنطقي لحل المشكلات. حققت الرمزية نجاحًا ملحوظًا، خاصة في الأنظمة الخبيرة وتمثيل المعرفة. مبدأها الأساسي هو أن السلوك الذكي يمكن تحقيقه من خلال التلاعب بالرموز والاستدلال المنطقي، حيث تعمل الرموز بمثابة تجريدات عالية المستوى للعالم الحقيقي.
تسعى الوصلية، والمعروفة أيضًا باسم نهج الشبكة العصبية، إلى تحقيق الذكاء من خلال عكس بنية ووظيفة الدماغ البشري. تقوم هذه المنهجية ببناء شبكات تضم العديد من وحدات المعالجة البسيطة المشابهة للخلايا العصبية وتقوم بضبط نقاط قوة الاتصال بين هذه الوحدات، على غرار المشابك العصبية، لتسهيل التعلم. من خلال التركيز على التعلم والتعميم من البيانات، تعتبر الاتصالية مناسبة تمامًا لمهام مثل التعرف على الأنماط والتصنيف ورسم خرائط المدخلات والمخرجات المستمرة. لقد حقق التعلم العميق، وهو تطور للاتصالية، اختراقات في مجالات مثل التعرف على الصور والكلام، وكذلك معالجة اللغة الطبيعية.
وتؤكد السلوكية، المرتبطة ارتباطًا وثيقًا بالروبوتات المحاكاة الحيوية وأبحاث الأنظمة الذكية المستقلة، أن العناصر الذكية يمكنها التعلم من خلال التفاعل البيئي. على عكس الأساليب السابقة، لا تركز السلوكية على محاكاة التمثيلات الداخلية أو العمليات المعرفية ولكنها تحقق السلوك التكيفي من خلال دورة الإدراك والفعل. ويفترض أن الذكاء يظهر من خلال التفاعل البيئي الديناميكي والتعلم، مما يجعله فعالا بشكل خاص للروبوتات المتنقلة وأنظمة التحكم التكيفية التي تعمل في بيئات معقدة وغير متوقعة.
على الرغم من التباينات الأساسية بينهما، يمكن لهذه الاتجاهات البحثية الثلاثة أن تتآزر وتكمل بعضها البعض في أبحاث وتطبيقات الذكاء الاصطناعي العملية، مما يؤدي بشكل جماعي إلى دفع تطوير هذا المجال.
يمثل المجال المزدهر للمحتوى الناتج عن الذكاء الاصطناعي (AIGC) تطورًا وتطبيقًا للاتصالية، مما يسهل توليد محتوى جديد من خلال محاكاة الإبداع البشري. يتم تدريب هذه النماذج باستخدام مجموعات بيانات واسعة وخوارزميات التعلم العميق لتمييز الهياكل والعلاقات والأنماط الأساسية داخل البيانات. بناءً على مدخلات المستخدم، ينتجون مخرجات متنوعة بما في ذلك الصور ومقاطع الفيديو والأكواد والموسيقى والتصميمات والترجمات والإجابات على الأسئلة والنصوص. في الوقت الحاضر، يتكون AIGC بشكل أساسي من ثلاثة عناصر: التعلم العميق (DL)، والبيانات الضخمة، والقوة الحسابية الضخمة.
يستخدم التعلم العميق، وهو مجموعة فرعية من التعلم الآلي (ML)، خوارزميات مصممة على غرار الشبكات العصبية للدماغ البشري. مثلما يتكون الدماغ البشري من خلايا عصبية مترابطة تعالج المعلومات، تتكون الشبكات العصبية للتعلم العميق من طبقات متعددة من الخلايا العصبية الاصطناعية التي تؤدي عمليات حسابية داخل الكمبيوتر. تستفيد هذه الخلايا العصبية الاصطناعية، أو العقد، من العمليات الرياضية لمعالجة البيانات وحل المشكلات المعقدة من خلال خوارزميات التعلم العميق.
تتكون الشبكات العصبية من طبقات: الإدخال، والمخفية، والإخراج، مع معلمات تربط هذه الطبقات.
· طبقة الإدخال: الطبقة الأولى من الشبكة العصبية، تتلقى بيانات الإدخال الخارجية. تتوافق كل خلية عصبية داخل هذه الطبقة مع إحدى ميزات البيانات المدخلة. على سبيل المثال، عند معالجة بيانات الصورة، قد تمثل الخلايا العصبية الفردية قيم البكسل.
· الطبقات المخفية: بعد طبقة الإدخال، تقوم الطبقات المخفية بمعالجة البيانات ونقلها عبر الشبكة. تقوم هذه الطبقات بتحليل المعلومات على مستويات مختلفة، وتكييف سلوكها عندما تتلقى مدخلات جديدة. يمكن أن تحتوي شبكات التعلم العميق على مئات الطبقات المخفية، مما يسمح بتحليل المشكلات متعددة الأوجه. على سبيل المثال، عند تصنيف حيوان غير مألوف من صورة ما، يمكن للشبكة مقارنته بالحيوانات المعروفة من خلال تقييم خصائصه مثل شكل الأذن وعدد الأرجل وحجم حدقة العين. تعمل الطبقات المخفية بشكل مشابه، حيث تعالج كل منها ميزات حيوانية مختلفة للمساعدة في التصنيف الدقيق.
· طبقة الإخراج: الطبقة الأخيرة من الشبكة العصبية، تنتج مخرجات الشبكة. تمثل الخلايا العصبية الموجودة في هذه الطبقة فئات أو قيم المخرجات المحتملة. في مهام التصنيف، قد تتوافق كل خلية عصبية مع فئة ما، بينما في مهام الانحدار، يمكن أن تحتوي طبقة الإخراج على خلية عصبية واحدة تتنبأ قيمتها بالنتيجة.
· المعلمات: في الشبكات العصبية، يتم تمثيل الاتصالات بين الطبقات المختلفة بالأوزان والتحيزات، والتي يتم تحسينها أثناء عملية التدريب لتمكين الشبكة من التعرف بدقة على الأنماط في البيانات وإجراء التنبؤات. يمكن لزيادة المعلمات أن تعزز قدرة نموذج الشبكة العصبية، أي القدرة على التعلم وتمثيل الأنماط المعقدة في البيانات. ومع ذلك، فإن هذا يزيد أيضًا من الطلب على القوة الحسابية.
يتطلب التدريب الفعال على الشبكات العصبية عادةً بيانات واسعة النطاق ومتنوعة وعالية الجودة ومتعددة المصادر. تشكل هذه البيانات حجر الزاوية للتدريب والتحقق من صحة نماذج التعلم الآلي. ومن خلال تحليل البيانات الضخمة، يمكن لنماذج التعلم الآلي تحديد الأنماط والعلاقات داخل البيانات، مما يسهل التنبؤات أو التصنيفات.
البنية المعقدة متعددة الطبقات للشبكات العصبية، والمعلمات العديدة، ومتطلبات معالجة البيانات الضخمة، وأساليب التدريب التكرارية (بما في ذلك حسابات الانتشار الأمامية والخلفية المتكررة، بما في ذلك حسابات وظائف التنشيط والخسارة، وحسابات التدرج، وتحديثات الوزن)، والحوسبة عالية الدقة الاحتياجات، وقدرات الحوسبة المتوازية، وتقنيات التحسين والتنظيم، وتقييم النماذج وعمليات التحقق من صحتها تساهم بشكل جماعي في المتطلبات الحسابية الكبيرة.
يمثل Sora، أحدث نموذج للذكاء الاصطناعي لجيل الفيديو من OpenAI، تقدمًا كبيرًا في قدرة الذكاء الاصطناعي على معالجة وفهم البيانات المرئية المتنوعة. من خلال استخدام شبكات ضغط الفيديو وتقنيات التصحيح الزماني المكاني، يستطيع Sora تحويل كميات هائلة من البيانات المرئية التي تم التقاطها في جميع أنحاء العالم ومن أجهزة مختلفة إلى تمثيل موحد. تتيح هذه القدرة المعالجة الفعالة وفهم المحتوى المرئي المعقد. يستخدم Sora نماذج الانتشار المشروطة بالنص لإنشاء مقاطع فيديو أو صور مرتبطة بشكل كبير بالمطالبات النصية، مما يعرض الإبداع الرائع والقدرة على التكيف.
على الرغم من الإنجازات التي حققها سورا في مجال إنشاء الفيديو ومحاكاة التفاعلات في العالم الحقيقي، إلا أنه يواجه بعض القيود. وتشمل هذه دقة محاكاة العالم المادي، والاتساق في إنشاء مقاطع فيديو طويلة، وفهم التعليمات النصية المعقدة، والكفاءة في التدريب والتوليد. في الأساس، يتبع Sora المسار الفني "للبيانات الضخمة - المحولات - الانتشار - الظهور"، والذي تسهله القوة الحسابية الاحتكارية لشركة OpenAI وميزة المتحرك الأول، مما يؤدي إلى شكل من أشكال جماليات القوة الغاشمة. ومع ذلك، لا تزال شركات الذكاء الاصطناعي الأخرى تمتلك القدرة على تجاوز سورا من خلال الابتكار التكنولوجي.
في حين أن اتصال Sora بـ blockchain لا يزال متواضعًا، فمن المتوقع أنه في العام أو العامين المقبلين، سيؤدي تأثير Sora إلى ظهور أدوات أخرى عالية الجودة لتوليد الذكاء الاصطناعي والتطور السريع. من المتوقع أن تؤثر هذه التطورات على قطاعات Web3 المختلفة مثل GameFi والمنصات الاجتماعية والمنصات الإبداعية وDepin وما إلى ذلك. وبالتالي، يعد اكتساب فهم عام لـ Sora أمرًا ضروريًا، ويصبح التفكير في كيفية تكامل الذكاء الاصطناعي بشكل فعال مع Web3 في المستقبل أحد الاعتبارات الحاسمة. .
كما ناقشنا سابقًا، يمكن تلخيص المكونات الأساسية الضرورية للذكاء الاصطناعي التوليدي في ثلاثة عناصر رئيسية: الخوارزميات، والبيانات، والقدرة الحاسوبية. وعلى العكس من ذلك، فإن الذكاء الاصطناعي، باعتباره أداة عالمية ذات تأثيرات بعيدة المدى على أساليب الإنتاج، يُحدث ثورة في كيفية عمل الصناعات. وفي الوقت نفسه، فإن التأثيرات الكبيرة لتكنولوجيا blockchain ذات شقين: فهي تعيد هيكلة علاقات الإنتاج وتتيح اللامركزية. وبالتالي، فإن التقارب بين هاتين التقنيتين يمكن أن يؤدي إلى أربعة مسارات محتملة:
يهدف هذا القسم إلى تقديم نظرة ثاقبة للمشهد الحالي لقوة الحوسبة. في عالم الذكاء الاصطناعي، تتمتع القوة الحاسوبية بأهمية هائلة. لقد وصل الطلب على القوة الحاسوبية في الذكاء الاصطناعي، وخاصة بعد ظهور سورا، إلى مستويات غير مسبوقة. خلال المنتدى الاقتصادي العالمي في دافوس بسويسرا عام 2024، أكد سام ألتمان، الرئيس التنفيذي لشركة OpenAI، على أن قوة الحوسبة والطاقة تمثل في الوقت الحالي أهم القيود، ملمحًا إلى معادلتها للعملة في المستقبل. وفي وقت لاحق، في العاشر من فبراير، أعلن سام ألتمان عن خطة رائدة عبر تويتر لجمع مبلغ مذهل قدره 7 تريليون دولار أمريكي (أي ما يعادل 40٪ من الناتج المحلي الإجمالي للصين في عام 2023) لإحداث ثورة في صناعة أشباه الموصلات العالمية، بهدف إنشاء إمبراطورية أشباه الموصلات. في السابق، كانت اعتباراتي المتعلقة بقدرة الحوسبة مقتصرة على القيود الوطنية واحتكارات الشركات؛ ومع ذلك، فإن فكرة وجود كيان واحد يطمح إلى السيطرة على قطاع أشباه الموصلات العالمي هي فكرة رائعة حقا.
إن أهمية قوة الحوسبة اللامركزية واضحة. تقدم ميزات Blockchain حلولاً للقضايا السائدة المتمثلة في احتكار قوة الحوسبة والتكاليف الباهظة المرتبطة بالحصول على وحدات معالجة الرسومات المتخصصة. من منظور متطلبات الذكاء الاصطناعي، يمكن تصنيف استخدام الطاقة الحاسوبية إلى جانبين: الاستدلال والتدريب. المشاريع التي تركز في المقام الأول على التدريب نادرة بسبب التكامل المعقد المطلوب للشبكات اللامركزية والمتطلبات الكبيرة للأجهزة، مما يشكل عوائق كبيرة أمام التنفيذ. على العكس من ذلك، تعد مهام الاستدلال أبسط نسبيًا، مع تصميمات شبكات لامركزية أقل تعقيدًا ومتطلبات أقل للأجهزة وعرض النطاق الترددي، مما يمثل وسيلة أكثر سهولة للوصول.
يحمل مشهد قوة الحوسبة المركزية إمكانات هائلة، وغالباً ما ترتبط بواصف "مستوى التريليون"، ويظل موضوعاً مثيراً للغاية في عصر الذكاء الاصطناعي. ومع ذلك، فعند ملاحظة العدد الكبير من المشاريع الأخيرة، يبدو أن الكثير منها عبارة عن مساعي تم تصميمها على عجل بهدف الاستفادة من الاتجاهات السائدة. وفي حين أن هذه المشاريع غالباً ما تؤيد اللامركزية، فإنها تميل إلى تجنب المناقشات حول أوجه القصور في الشبكات اللامركزية. علاوة على ذلك، هناك درجة ملحوظة من التوحيد في التصميم، حيث تتبنى العديد من المشاريع أساليب مماثلة (مثل تصميم L2 بنقرة واحدة بالإضافة إلى تصميم التعدين)، مما قد يؤدي إلى الفشل وتعقيد الجهود للتمييز عن سباق الذكاء الاصطناعي التقليدي.
تم تصميم خوارزميات التعلم الآلي لتعلم الأنماط والقواعد من البيانات، مما يمكنها من إجراء تنبؤات أو قرارات بناءً على هذه الأنماط المستفادة. نظرًا للتعقيد الذي ينطوي عليه تصميمها وتحسينها، فإن الخوارزميات بطبيعتها كثيفة الاستخدام للتكنولوجيا، وتتطلب خبرة عميقة وابتكارًا تكنولوجيًا. إنها بمثابة العمود الفقري لتدريب نماذج الذكاء الاصطناعي، حيث تحدد كيفية معالجة البيانات لاستخلاص رؤى مفيدة أو اتخاذ القرارات. تم تصميم خوارزميات الذكاء الاصطناعي التوليدية البارزة، مثل شبكات الخصومة التوليدية (GANs) وأجهزة التشفير التلقائي المتغيرة (VAEs) والمحولات، لمجالات محددة مثل الرسم أو التعرف على اللغة أو الترجمة أو إنشاء الفيديو، وهي مفيدة في تدريب نماذج الذكاء الاصطناعي المتخصصة.
إن العدد الكبير من الخوارزميات والنماذج ذات نقاط القوة المميزة يثير السؤال: هل يمكن دمجها في نموذج متعدد الاستخدامات؟ ويقود مشروع Bittensor، وهو مشروع بارز مؤخرًا، الجهود في هذا الاتجاه من خلال تحفيز التعاون بين نماذج وخوارزميات الذكاء الاصطناعي المختلفة، وبالتالي تعزيز تطوير نماذج ذكاء اصطناعي أكثر كفاءة وقدرة. وتركز مبادرات أخرى، مثل Commune AI، على تعزيز التعاون في مجال الكود، على الرغم من أن مشاركة الخوارزميات والنماذج لا تزال تمثل تحديًا بسبب طبيعتها الخاصة داخل شركات الذكاء الاصطناعي.
يعد مفهوم النظام البيئي التعاوني للذكاء الاصطناعي مثيرًا للاهتمام، حيث يستفيد من تقنية blockchain للتخفيف من العيوب المرتبطة بخوارزميات الذكاء الاصطناعي المعزولة. ومع ذلك، لم يتم بعد تحديد قدرتها على توليد القيمة المقابلة. تمتلك شركات الذكاء الاصطناعي القائمة، والمجهزة بخوارزميات ونماذج خاصة، قدرات قوية في تحديث تقنياتها وتكرارها ودمجها. على سبيل المثال، تقدمت OpenAI بسرعة من نماذج إنشاء النصوص المبكرة إلى النماذج التوليدية متعددة المجالات في غضون عامين. قد تحتاج مشاريع مثل Bittensor إلى استكشاف مسارات مبتكرة في مجالاتها المستهدفة للتنافس بفعالية.
من وجهة نظر مبسطة، يعد دمج البيانات الخاصة لتغذية الذكاء الاصطناعي والبيانات التوضيحية من السبل التي تتناغم جيدًا مع تقنية blockchain. تدور الاهتمامات الأساسية حول كيفية إحباط البيانات غير المرغوب فيها والأنشطة الضارة. علاوة على ذلك، يمكن أن يكون تخزين البيانات مفيدًا لمشاريع Depin مثل FIL وAR.
وبالنظر إلى الأمر من زاوية أكثر تعقيدًا، فإن الاستفادة من بيانات blockchain للتعلم الآلي (ML) لمعالجة إمكانية الوصول إلى بيانات blockchain يمثل اتجاهًا مقنعًا آخر، كما استكشفته جيزة.
من الناحية النظرية، يمكن الوصول إلى بيانات blockchain في أي وقت وتعكس حالة blockchain بأكملها. ومع ذلك، بالنسبة لأولئك الذين هم خارج النظام البيئي لـ blockchain، فإن الوصول إلى مجموعات البيانات الشاملة هذه ليس بالأمر السهل. يتطلب تخزين blockchain بأكمله خبرة كبيرة وموارد أجهزة متخصصة.
للتغلب على تحديات الوصول إلى بيانات البلوكشين، شهدت الصناعة ظهور العديد من الحلول. على سبيل المثال، يوفر موفرو RPC الوصول إلى العقدة من خلال واجهات برمجة التطبيقات، بينما تسهل خدمات الفهرسة استرجاع البيانات عبر SQL وGraphQL، مما يلعب دورًا محوريًا في تخفيف المشكلة. ومع ذلك، فإن هذه الأساليب لها حدودها. خدمات RPC غير كافية لحالات الاستخدام عالية الكثافة التي تتطلب استعلامات بيانات موسعة وغالبًا ما تفشل في تلبية الطلب. وفي الوقت نفسه، على الرغم من أن خدمات الفهرسة تقدم نهجًا أكثر تنظيمًا لاستعادة البيانات، فإن تعقيد بروتوكولات Web3 يجعل إنشاء استعلامات فعالة أمرًا صعبًا للغاية، مما يستلزم أحيانًا مئات أو حتى آلاف الأسطر من التعليمات البرمجية المعقدة. يشكل هذا التعقيد عائقًا كبيرًا أمام ممارسي البيانات العامة وأولئك الذين لديهم فهم محدود لتعقيدات Web3. ويؤكد التأثير الجماعي لهذه القيود على ضرورة إيجاد طريقة أكثر سهولة وقابلية للاستخدام للحصول على بيانات البلوكشين والاستفادة منها، وهو ما يمكن أن يحفز التطبيق والابتكار على نطاق أوسع في هذا المجال.
وبالتالي، فإن دمج ZKML (التعلم الآلي بدون معرفة، والذي يخفف عبء التعلم الآلي على السلسلة) مع بيانات blockchain عالية الجودة يمكن أن يؤدي إلى مجموعات بيانات تعالج تحديات إمكانية الوصول إلى بيانات blockchain. يتمتع الذكاء الاصطناعي بالقدرة على تقليل العوائق التي تحول دون الوصول إلى بيانات blockchain بشكل كبير. وبمرور الوقت، يمكن للمطورين والباحثين وعشاق تعلم الآلة الوصول إلى المزيد من مجموعات البيانات عالية الجودة وذات الصلة لصياغة حلول فعالة ومبتكرة.
منذ ظهور ChatGPT3 في عام 2023، أصبح تمكين الذكاء الاصطناعي للتطبيقات اللامركزية اتجاهًا شائعًا للغاية. ويمكن دمج الذكاء الاصطناعي التوليدي القابل للتطبيق على نطاق واسع من خلال واجهات برمجة التطبيقات، وبالتالي تبسيط وذكاء منصات البيانات، وروبوتات التداول، وموسوعات blockchain، والتطبيقات الأخرى. ويمكنه أيضًا أن يعمل كروبوتات دردشة (مثل Myshell) أو مرافقين للذكاء الاصطناعي (مثل Sleepless AI)، وحتى إنشاء شخصيات غير قابلة للعب في ألعاب blockchain باستخدام الذكاء الاصطناعي التوليدي. ومع ذلك، نظرًا لانخفاض العوائق التقنية، فإن معظم عمليات التنفيذ هي مجرد تعديلات بعد دمج واجهة برمجة التطبيقات (API)، وغالبًا ما يكون التكامل مع المشاريع نفسها غير كامل، وبالتالي نادرًا ما يتم ذكرها.
مع ظهور Sora، أعتقد شخصيًا أن تمكين الذكاء الاصطناعي لـ GameFi (بما في ذلك metaverse) والمنصات الإبداعية سيكون التركيز الأساسي للمضي قدمًا. نظرًا للطبيعة التصاعدية لمجال Web3، فمن غير المحتمل إنتاج منتجات يمكنها التنافس بشكل مباشر مع الألعاب التقليدية أو الشركات الإبداعية. ومع ذلك، فإن ظهور سورا لديه القدرة على كسر هذا الجمود، ربما في غضون عامين إلى ثلاثة أعوام فقط. من العرض التوضيحي لـ Sora، يبدو أنها قادرة على التنافس مع شركات الدراما الصغيرة. بالإضافة إلى ذلك، يمكن لثقافة المجتمع النشطة لـ Web3 أن تعزز عددًا كبيرًا من الأفكار المثيرة للاهتمام. عندما يكون الحد الوحيد هو الخيال، فإن الحواجز بين الصناعة من أسفل إلى أعلى والصناعة التقليدية من أعلى إلى أسفل سوف تنهار.
مع استمرار تقدم أدوات الذكاء الاصطناعي الإبداعية، فإننا على استعداد لتجربة المزيد من "لحظات iPhone" التحويلية في المستقبل. على الرغم من الشكوك الأولية المحيطة بتكامل الذكاء الاصطناعي مع Web3، فأنا على ثقة من أن المسارات الحالية تسير بشكل عام على المسار الصحيح، وإن كان ذلك مع ثلاث نقاط أساسية تتطلب الاهتمام: الضرورة والكفاءة والتوافق. ورغم أن التقارب بين هذه المجالات يظل استكشافيا، فلا ينبغي له أن يمنعنا من تصور تبنيه على نطاق واسع في السوق الصاعدة المقبلة.
يعد الحفاظ على عقلية الفضول والتقبل للأفكار الجديدة أمرًا بالغ الأهمية. وتؤكد السوابق التاريخية، مثل الانتقال السريع من العربات التي تجرها الخيول إلى السيارات وتطور النقوش في NFTs السابقة، على أهمية تجنب التحيزات المفرطة، والتي غالبا ما تؤدي إلى ضياع الفرص.