من انفجار Miao Duck إلى استعادة الأفلام القديمة ، بدأ النموذج الكبير بالفعل في العمل!

المصدر: فوتون بلانيت

المؤلف: Wen Yehao

المحرر: وانج بان

منذ ظهور طفرة AIGC ، ترك عمالقة التكنولوجيا المتحمسون المجال واحدًا تلو الآخر ، وقادوا مسار النموذج المحلي واسع النطاق طوال الطريق.

ومع ذلك ، من الصعب على التكنولوجيا نفسها أن تخلق قيمة مباشرة ، فتدريب النماذج الكبيرة ليس سوى نقطة انطلاق ، و "معركة المائة نموذج" الساخنة مختلطة إلى حد ما مع تلميح من "التصنيع المتكرر للعجلات".

بالنسبة للنماذج الكبيرة ، فإن تضمين سيناريوهات التطبيق لتحقيق التسويق التجاري الناضج هو نقطة النهاية - وبما أن منطق مسار النموذج الكبير ينتقل من التدريب إلى الهبوط ، فإن تطبيقات AIGC تظهر تدريجياً في مختلف المجالات.

في يوليو ، انفجر تطبيق Miaoya Camera الذي يعمل بالذكاء الاصطناعي خارج الدائرة ، ولم يقتصر الأمر على تمرير الشاشة بجنون على المنصات الاجتماعية فحسب ، بل أثار أيضًا مناقشات مستفيضة في سياق التكنولوجيا. شعر العديد من المستخدمين الذين لم يكونوا على دراية بالسياق التقني من قبل بسحر AIGC حقًا لأول مرة.

في أغسطس ، أطلق Douyin and Volcano Engine "مشروع استعادة الصورة الكلاسيكية". ولأول مرة ، تم تطبيق النموذج المرئي واسع النطاق AIGC على مشهد ترميم الأفلام القديمة. ويخطط لاستعادة 100 فيلم قديم في هونغ كونغ واستعادة أفلام هونج كونج في الذاكرة العامة .. نظرة واضحة.

* الصورة على اليسار قبل الإصلاح ، الصورة على اليمين بعد الإصلاح *

هذا يعني أن النموذج الكبير قد خرج تدريجياً من "المختبر" ودخل مجال رؤية الناس.

** كاميرا مياويا وترميم الفيلم القديم الرد على الموديل الكبير المخفي **

لا شك أن انفجار كاميرا Miaoduck له تأثير تنوير على مسار النموذج واسع النطاق الذي لا يزال عالقًا على الأرض.

في الواقع ، من منظور المسار التقني ، لا تحتوي قدرة إنشاء صورة AIGC خلف Miaoya Camera على حواجز تقنية عالية جدًا ، وهي ليست شاملة مثل التطبيقات السائدة مثل Midjourney و Stable Diffusion.

ومع ذلك ، فإن تطبيقات مثل Midjourney لها عتبة عالية جدًا للبدء ، مما يتطلب من المستخدمين استكشاف الكلمات السريعة باستمرار () ، وستظهر عقبات الاستهلاك حتماً في هذه العملية.

تقوم Miaoya Camera بتغليف وتبسيط الخطوات الشاقة المذكورة أعلاه في عملية بنقرة واحدة. يحتاج المستخدمون فقط إلى تحميل صورة نصف طول أمامية وما لا يقل عن 20 صورة تكميلية ، ويمكنهم إنشاء صور متنوعة وفقًا للقالب المحدد بنقرة واحدة. مثل هذه الصورة ، تم تحسين سهولة الاستخدام بشكل كبير.

ليس من الصعب أن نرى من هذا أنه إذا كانت التقنيات المتطورة تريد تحقيق تنفيذ على نطاق واسع ، فإنها لا تحتاج فقط إلى تحديد سيناريوهات التطبيق ، بل تحتاج أيضًا إلى حل نقاط الألم السابقة والصعوبات في السيناريوهات المقابلة. هذا سبب مهم وراء اقتحام محرك البركان لمشهد "ترميم الفيلم القديم".

لطالما كانت استعادة الأفلام القديمة موضوعًا مهمًا في مجال الفيديو ، فوفقًا لإحصاءات أكثر من 130 فيلمًا من 65 دولة ، فإن متوسط معدل بقاء الأفلام منذ ولادتها هو 10٪ فقط.

المنطق الكامن وراء ذلك هو أن معظم الأفلام المبكرة تم تخزينها على فيلم بعد التصوير ، ولكن الفيلم كوسيط تخزين هش للغاية ، ولا يتطلب فقط درجة حرارة ورطوبة عالية للغاية في بيئة التخزين ، ولكنه يعاني أيضًا بسهولة من أضرار فيزيائية وكيميائية أثناء الاستخدام والمناولة. ، مما يؤدي إلى بهتان اللون ، والتمزق ، والتلطيخ ، والعفن الفطري ، والحمض وغيرها من المشاكل.

مثال بسيط ، درجة اللون في العديد من الأفلام المبكرة اليوم غالبًا ما تكون حمراء أو أرجوانية. وبصرف النظر عن التعبير الفني للمخرج نفسه ، فهو أكثر من مظهر من مظاهر متلازمة حمض الأسيتيك الناتجة عن الحفظ غير المناسب لفيلم الفيلم - يتلاشى الفيلم ويتحول إلى اللون الأحمر ، وفي الوقت نفسه ، ستطلق أيضًا رائحة حامضة نفاذة ، مما يؤدي إلى تفاقم تدهور بيئة الحفظ. بمجرد أن يبدأ التحمض ، من الصعب عكسه تمامًا.

بالإضافة إلى ذلك ، في عملية إنتاج الفيلم وتوزيعه ، غالبًا ما يخضع الفيلم لعمليات إعادة طبع متكررة ، وستؤدي كل عملية إعادة طبع إلى فقدان دقيق لتفاصيل الصورة ، ومع زيادة عدد عمليات إعادة الطباعة ، ستتدهور جودة الصورة أكثر فأكثر. نظرًا لعوامل مختلفة ، فإن أداء الصورة لمعظم أفلام هونج كونج أدنى بكثير من أداء الفيديو عالي الدقة الحالي ، وتجربة مشاهدة المستخدم ليست ودية.

من ناحية أخرى ، تعتمد تقنيات الترميم التقليدية بشكل أساسي على العمل اليدوي - يتم تحويل الفيلم أولاً إلى تنسيق رقمي ، ثم يعالج المرمم بقع العفن والبقع على الشاشة إطارًا بإطار.

ومع ذلك ، يحتوي الفيلم عادة على مئات الآلاف من الإطارات. إذا كنت تعتمد بشكل كامل على الإصلاح اليدوي ، فلن تكون التكلفة مرتفعة فحسب ، ولكن الكفاءة أيضًا غير مرضية. بأخذ فيلم "Evil in the East and Poison in West" كمثال ، ذكر Wong Kar Wai ذات مرة أن الاستعادة استغرقت أربع سنوات لأن الفيلم كان رطبًا. ومع ذلك ، وبسبب الترميم المبكر ، لا يزال عدد قليل جدًا من أجزاء "Evil and West Poison Ultimate Edition" تحتوي على قطع منمقة.

بمعنى آخر ، من الصعب إجراء استعادة على نطاق واسع لتقنيات استعادة الصور التقليدية. وإذا تعذر تحقيق الحجم ، فإن كفاءة استعادة الفيلم بواسطة أرشيفات الأفلام قد لا تكون قادرة على اللحاق بالتلاشي التدريجي لمئات الآلاف من لفات الأفلام بمرور الوقت.

في هذا السياق ، أصبح نموذج AIGC المرئي الكبير ترياقًا لإصلاح "مرض القلب" للأفلام القديمة في مجال السينما والتلفزيون.

** ورقة إجابة نموذجية كبيرة لمحرك البركان **

إن استخدام خوارزمية التعلم العميق للذكاء الاصطناعي لاستعادة الصور ليس بالأمر الجديد. في وقت مبكر منذ بضع سنوات ، في منتديات الفيديو الرأسية المحلية ، استخدم بعض عشاق الفيديو خوارزميات التعلم العميق لتحسين دقة الأفلام القديمة لتحسين مظهر ومظهر الصورة.

ومع ذلك ، على الرغم من أن خوارزميات معالجة الصور في الماضي يمكن أن تحسن جودة الصورة إلى حد معين ، إلا أنها لا تكفي لدعم سيناريوهات التطبيقات التجارية الجادة. خذ النموذج الكبير مفتوح المصدر المستند إلى Stable Diffusion كمثال في هذه المرحلة ، وهو بشكل أساسي لتوليد الصور ، المهام أقل صلة بمشاهد ترميم الأفلام القديمة التي تميل إلى التدهور والاستعادة ، ومن الصعب تطبيقها ببساطة.

بناءً على ذلك ، استنادًا إلى النموذج الكبير الناضج الحالي ، يقوم محرك Volcano Engine بتركيب شبكة إصلاح الأفلام القديمة الخاصة به ، ويقوم بإجراء تحسين مستهدف على مشكلات الإصلاح الشائعة مثل التمويه ، وعدم التركيز ، والصورة ، واللون ، وما إلى ذلك ، حتى يتمكن النموذج الكبير من إدراك مشاهد الأفلام القديمة والتكيف معها بشكل كامل.

مثال بسيط ، الصورة الشخصية التي تنقل الحالة العاطفية والعالم الداخلي للشخصيات لها أهمية خاصة في لغة الفيلم. في هذا الصدد ، يستخدم Volcano Engine بشكل تكيفي حلول صورة مختلفة لمقاطع الفيديو بجودة صورة مختلفة.

بالنسبة للأفلام القديمة التي تم إنتاجها لفترة طويلة وذات جودة صورة رديئة ، يستخدم Volcano Engine وحدة ترميم صورة قائمة على التوليد لإجراء إعادة بناء عالية الدقة للوجه مع الحفاظ على الخصائص الحقيقية للصورة ؛ للحصول على جودة متوسطة وعالية الصور الشخصية ، محرك Volcano يستخدم وحدة البورتريه فائقة الوضوح لتحسين وضوح ملامح الوجه ، ويحقق أقصى قدر من الاستعادة وتحسين ملمس لتفاصيل الوجه مثل الرموش والحواجب والشعر وملمس البشرة.

من الجدير بالذكر أنه بالإضافة إلى التحسين لاستعادة الأفلام القديمة المعممة ، طور محرك Volcano Engine قدرة ترميم أكثر تقسيمًا رأسيًا لخصائص أفلام هونغ كونغ هذه المرة.

بأخذ مشهد فنون الدفاع عن النفس كمثال ، فإنه يختلف عن القتال "المباشر" في الأفلام الخارجية. كرمز فريد طوال العصر الذهبي لأفلام هونج كونج ، مشاهد القتال تشبه إلى حد كبير الرقصات الرائعة ، مع التركيز على كل حركة وكل نمط من المواجهة ، وهو أمر معترف به للغاية.

ومع ذلك ، فإن مشهد فنون الدفاع عن النفس ليس اختبارًا صغيرًا لنموذج AIGC. من ناحية ، غالبًا ما تتسبب الإجراءات المتغيرة بسرعة والحركات السريعة في الصورة في حدوث إزاحة كبيرة بين الإطارات ، مما يؤدي بدوره إلى انخفاض دقة نموذج التدفق البصري ، مما يؤدي إلى تلطيخ ؛ ومن ناحية أخرى ، فنون الدفاع عن النفس المعقدة من المرجح أن تتسبب الإجراءات في الاستيفاء ، حيث ينتج عن تشويه نتيجة الإطار تشوهًا ، مما يؤثر بشكل مباشر على التجربة المرئية للجمهور.

تحقيقا لهذه الغاية ، طور Volcano Engine خوارزمية استيفاء ذكية للإطار.من خلال تقدير التدفق البصري لمحتوى الإطارات الأمامية والخلفية ، يتم تحويل بكسلات الإطارات الأمامية والخلفية إلى الإطار المتوسط وفقًا لمعلومات التدفق البصري ، ثم يتم دمجها لإنشاء الإطار المتوسط وتحسين معدل إطارات الفيديو ؛ من خلال التحسين المستهدف ، يتم تقليل عبء الحساب عند التعامل مع الحركات الكبيرة ، وبالتالي تحسين استقرار وتأثير النموذج.

لطالما كانت عناصر فنون الدفاع عن النفس جزءًا مهمًا من أفلام هونغ كونغ ، ولكن نظرًا لطرق التصوير والإنتاج الفظة نسبيًا للأفلام المبكرة ، غالبًا ما تحتوي بعض مشاهد فنون الدفاع عن النفس على أجزاء من الأسلاك متبقية ، مما يؤدي إلى تدمير سلامة الصورة. في هذا الصدد ، يستخدم محرك Volcano Engine خوارزميات إزالة الضوضاء وإزالة الخدوش لمعالجة عيوب الصورة على دفعات ، كما يعمل على تحسين خوارزمية إزالة الخدش لـ Wia ، والتي تضمن سلامة الشخصيات الرئيسية في الصورة مع التخلص من آثار ويا.

* الصورة على اليسار قبل الإصلاح ، الصورة على اليمين بعد الإصلاح *

وفقًا لـ Zhang Xiaoguang ، نائب أمين أرشيف الأفلام الصينية ، فإن ترميم الفيلم هذا دعا أيضًا المبدعين الرئيسيين للفيلم للمشاركة في عملية الاستعادة ، والتي لا تعيد فقط "شكل" الصورة من خلال التكنولوجيا ، ولكنها أيضًا تعيد الصورة الأصلية. "روح" الفيلم ، مما يجعلها "استعادة القديم مثل القديم".

المنطق وراء ذلك هو أن استعادة الفيلم ليست مجرد محاولة للعثور على مشهد هبوط باستخدام أحدث التقنيات ، ولكن أيضًا سلوك تجاري. و "إصلاح القديم مثل القديم" هو مفتاح الأفلام الكلاسيكية التي تمس مشاعر الجمهور ، وتوقظ الذاكرة الجماعية ، وبالتالي تعزيز القيمة التجارية. ليس من الصعب إلقاء نظرة خاطفة على النظرة الفنية الواقعية لمحرك البركان.

** الطيران إلى منازل الناس العاديين **

على الرغم من أن سياق الإنترنت كان في يوم من الأيام محاصرًا في نقاشات شرسة حول التكنولوجيا والتطبيقات في بداية اندلاع AIGC الأولي ، أثبتت كاميرا Miaoya Camera و Volcano Engine أن الاثنين لا يعارضان في الواقع.

من ناحية أخرى ، يستمر تطور التكنولوجيا المتطورة في توسيع حدود التطبيقات ، بحيث يمكن لعامة الناس رؤية وجوههم المتعددة دون الحاجة إلى دفع الأسعار المرتفعة لاستوديوهات التصوير ؛ وحيوية جديدة.

من ناحية أخرى ، غالبًا ما تحتاج التقنيات المتطورة إلى المرور بدورة طويلة من البحث والتطوير إلى التنفيذ. وفي الماضي ، كانت المزيد من النماذج واسعة النطاق التي تعيش في "المختبرات" وكانت باردة في التسويق تحتاج إلى هذه المحتويات العميقة الجذور من أجل منحهم الحياة. وبهذه الطريقة ، يدخل حقًا في حياة الناس.

في مواجهة قيود تنفيذ التكنولوجيا المتطورة ، فإن الإجابات التي يواصل اللاعبون تسليمها لها بلا شك قيمة مرجعية مهمة للصناعة.

لقد غيرت كاميرا Miaoya ، التي خرجت من الدائرة ، وجه التكنولوجيا المتطورة في الماضي ، ودخلت سوق C-end بموقف أكثر حيوية ونشاطًا من خلال مشاهد قريبة من المستخدمين العاديين وأسهل -استخدام الوظائف.

من قبيل الصدفة ، يستكشف محرك البركان أيضًا مشهد الهبوط باستمرار. في وقت مبكر من عام 2021 ، أعاد محرك Volcano Engine الرسوم المتحركة الكلاسيكية في ذكريات الطفولة مثل Nezha و Calabash و Black Cat Sheriff إلى إصدارات 4K استنادًا إلى تقنية تحسين جودة الصورة ؛ في العام الماضي ، جعلت فرقة Beyond تغني في ملعب Hung Hom. نعم عادت للظهور في أعين الجمهور بعد أكثر من 30 عامًا.

بعبارة أخرى ، من استعادة الرسوم المتحركة الكلاسيكية ، إلى إعادة عرض الحفلات الموسيقية ، ومن ثم إلى استعادة أفلام هونغ كونغ ، فهي تشبه نقاط الارتكاز ، مما يشير إلى أن محرك البركان قد ترسخ في مجال التطبيقات التجارية. اليوم ، طور Volcano Engine قدرات تقنية ممتازة ، وحقق ممارسة واسعة النطاق وتطبيقات إنتاج على نطاق واسع في خطوط الأعمال الداخلية وأسواق خدمات المؤسسات الخارجية.

في التحليل النهائي ، سواء كانت كاميرا Miaoya أو محرك البركان ، فهم يقومون بتفكيك جدران AIGC عالية التقنية من خلال تطبيقات أكثر تنوعًا ومرونة ، بحيث تطورت التكنولوجيا المتطورة التي تعيش في السياق التكنولوجي إلى واقع داخل في متناول المستخدمين. من المتوقع ، مدفوعة بهذه المجموعة من اللاعبين البراغماتيين ، أن AIGC قد تطير إلى منازل الناس العاديين بشكل أكثر ثراءً في المستقبل.

شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • مشاركة
تعليق
لا توجد تعليقات