Miao Duck'ın patlamasından eski filmlerin restorasyonuna kadar, büyük model şimdiden çalışmaya başladı!

Kaynak: Foton Gezegeni

Yazar: Wen Yehao

Editör: Wang Pan

AIGC patlamasının ortaya çıkışından bu yana, keskin teknoloji devleri birbiri ardına sahayı terk ederek yerli büyük ölçekli model yolunu sonuna kadar sürdü.

Bununla birlikte, teknolojinin kendisinin doğrudan değer yaratması zordur. Büyük bir modeli eğitmek yalnızca bir başlangıç noktasıdır. Hararetli "100 modellik savaş", "tekrarlayan tekerlek üretimi" ile az çok karıştırılır.

Büyük modeller için, olgun ticarileştirme elde etmek için uygulama senaryolarının yerleştirilmesi son noktadır ve büyük model yolunun mantığı eğitimden inişe kaydıkça, çeşitli alanlarda AIGC uygulamaları kademeli olarak ortaya çıkmaktadır.

Temmuz ayında AI fotoğraf uygulaması Miaoya Camera, sosyal platformlarda ekranı çılgınca kaydırmakla kalmayıp aynı zamanda teknoloji bağlamında kapsamlı tartışmalara da yol açarak çemberin dışına patladı. Daha önce teknik bağlama aşina olmayan birçok kullanıcı da ilk kez AIGC'nin cazibesini gerçekten hissetti.

Ağustos ayında Douyin ve Volcano Engine, "Klasik Görüntü Restorasyon Projesi"ni başlattı. İlk kez, AIGC büyük ölçekli görsel modeli eski filmlerin restorasyon sahnesine uygulandı. 100 eski Hong Kong filmini restore etmeyi ve Hong Kong'u restore etmeyi planlıyor. Halkın hafızasında Kong filmleri.Net bir görünüm.

Soldaki resim tamir öncesi, sağdaki resim tamir sonrası

Bu, büyük modelin yavaş yavaş "laboratuvardan" çıkıp insanların görüş alanına girdiği anlamına geliyor.

Miaoya kamera ve eski film restorasyonu, gizli büyük modele yanıt

Miaoduck kamerasının patlaması, hala yere yapışmış olan büyük ölçekli model pistinde şüphesiz aydınlatıcı bir etkiye sahip.

Aslında, teknik açıdan bakıldığında, Miaoya Camera'nın arkasındaki AIGC görüntü oluşturma kapasitesi çok yüksek teknik engellere sahip değildir ve Midjourney ve Stable Diffusion gibi ana akım uygulamalar kadar kapsamlı değildir.

Ancak Midjourney gibi uygulamaların başlamak için çok yüksek bir eşiği vardır, bu da kullanıcıların sürekli olarak komut istemi sözcüklerini () keşfetmesini gerektirir ve bu süreçte kaçınılmaz olarak tüketim engelleri ortaya çıkar.

Miaoya Kamera, yukarıda bahsedilen zahmetli adımları tek tıklama işlemiyle özetler ve basitleştirir.Kullanıcıların yalnızca önden yarı uzunlukta bir fotoğraf ve en az 20 ek fotoğraf yüklemesi gerekir ve tek tıklamayla ayarlanan şablona göre çeşitli fotoğraflar oluşturabilir. Böyle bir fotoğraf, kullanım kolaylığı büyük ölçüde geliştirildi.

Buradan şunu görmek zor değil ki, en son teknolojiler büyük ölçekli uygulamaya ulaşmak istiyorsa, sadece uygulama senaryolarını belirlemeleri değil, aynı zamanda ilgili senaryoların geçmişteki sıkıntılı noktalarını ve zorluklarını da çözmeleri gerekiyor. Bu, yanardağ motorunun "eski film restorasyonu" sahnesine girmesinin önemli bir nedenidir.

Eski filmlerin restorasyonu, video alanında her zaman önemli bir konu olmuştur.65 ülkeden 130'dan fazla film arşivinin istatistiklerine göre, filmlerin doğumlarından bu yana ortalama hayatta kalma oranı sadece %10'dur.

Bunun arkasındaki mantık, ilk filmlerin çoğunun çekimden sonra film üzerinde saklanmasıdır, ancak bir depolama ortamı olarak film oldukça kırılgandır, yalnızca depolama ortamında aşırı yüksek sıcaklık ve nem gerektirmez, aynı zamanda depolama sırasında kolayca fiziksel ve kimyasal hasara uğrar. kullanım ve taşıma. , solma, yırtılma, lekelenme, küf, asit ve diğer sorunlara neden olur.

Basit bir örnek olarak, günümüzün birçok eski filminin renk tonu genellikle kırmızımsı veya mordur.Yönetmenin kendisinin sanatsal ifadesinin yanı sıra, bu daha çok filmin uygunsuz şekilde korunmasından kaynaklanan asetik asit sendromunun bir tezahürüdür - film kaybolur. ve kırmızıya döner.Aynı zamanda, muhafaza ortamının bozulmasını ağırlaştıracak keskin ekşi bir koku da salacaktır. Asitleşme bir kez başladığında, onu tamamen tersine çevirmek zordur.

Ek olarak, film üretimi ve dağıtımı sürecinde, film genellikle tekrarlanan yeniden baskılara tabi tutulur ve her yeniden baskı, resim ayrıntılarında ince bir kayıp getirir ve yeniden baskı sayısı arttıkça, görüntü kalitesi giderek daha fazla bozulur. Çeşitli faktörler nedeniyle, çoğu Hong Kong filminin görüntü performansı, mevcut yüksek tanımlı videodan çok daha düşüktür ve kullanıcının izleme deneyimi pek de kolay değildir.

Öte yandan, geleneksel restorasyon teknikleri esas olarak manuel çalışmaya dayanır; film önce dijital bir formata dönüştürülür ve ardından restoratör, ekrandaki küf lekelerini ve lekeleri kare kare ele alır.

Ancak, bir film genellikle yüz binlerce kare içerir. Tamamen manuel onarıma güveniyorsanız, yalnızca maliyet yüksek olmakla kalmaz, aynı zamanda verimlilik de tatmin edici olmaz. "Doğuda Kötülük ve Batıda Zehir"i örnek alan Wong Kar Wai, bir keresinde film nemli olduğu için restorasyonun dört yıl sürdüğünü hatırladı. Buna rağmen, zamansız restorasyon nedeniyle, "Evil and West Poison Ultimate Edition"ın çok az parçasında hâlâ gösterişli sahneler var.

Başka bir deyişle, geleneksel görüntü restorasyon tekniklerinin büyük ölçekli restorasyon gerçekleştirmesi zordur. Ölçek elde edilemezse, film arşivleri tarafından film restorasyonunun verimliliği, zaman içinde yüzbinlerce film rulosunun kademeli olarak solmasını yakalayamayabilir.

Bu bağlamda, AIGC görsel geniş modeli, sinema ve televizyon alanında eski filmlerin "kalp hastalığını" onarmak için bir panzehir haline geldi.

Volkan motorunun büyük model cevap kağıdı

Görüntüleri geri yüklemek için AI derin öğrenme algoritmasını kullanmak aslında yeni bir şey değil. Daha birkaç yıl önce, yerel video dikey forumlarında, bazı video meraklıları, resmin görünüşünü ve hissini iyileştirmek için eski filmlerin çözünürlüğünü iyileştirmek için derin öğrenme algoritmaları kullandı.

Ancak geçmişteki görüntü işleme algoritmaları görüntü kalitesini bir nebze olsun iyileştirebilse de ciddi ticari uygulama senaryolarını desteklemek için yeterli değildir. Görevler, bozulup restore edilme eğiliminde olan eski film restorasyon sahneleriyle daha az ilgilidir ve bunları basitçe uygulamak zordur.

Buna dayanarak, mevcut olgun büyük modeli temel alan Volcano Engine, kendi eski film onarım ağını üst üste bindirir ve bulanıklık, odak dışılık, portre, renk vb. gibi genel onarım sorunları üzerinde hedefli optimizasyon gerçekleştirir. Böylece büyük model eski film sahnelerini tam olarak algılayabilir ve bunlara uyum sağlayabilir.

Basit bir örnek olarak, karakterlerin duygu durumlarını ve iç dünyalarını aktaran portre çekimi özellikle film dili açısından önemlidir. Bu bağlamda Volcano Engine, farklı resim kalitesine sahip videolar için uyarlamalı olarak farklı portre çözümleri kullanır.

Uzun süredir üretilmiş ve düşük görüntü kalitesine sahip eski filmler için Volcano Engine, portrenin gerçek özelliklerini korurken yüksek tanımlı yüz rekonstrüksiyonu gerçekleştirmek için üretken tabanlı bir portre restorasyon modülü kullanır; orta ve yüksek kaliteli filmler için Ultra net portre modülü, yüz özelliklerinin netliğini optimize eder ve kirpikler, kaşlar, saç ve cilt dokusu gibi yüz ayrıntılarının maksimum restorasyonunu ve doku geliştirmesini gerçekleştirir.

Genelleştirilmiş eski filmlerin restorasyonu için optimizasyona ek olarak, Volcano Engine'in bu sefer Hong Kong filmlerinin özellikleri için daha dikey olarak alt bölümlere ayrılmış bir restorasyon yeteneği geliştirdiğini belirtmekte fayda var.

Dövüş sanatları sahnesini örnek alırsak, denizaşırı filmlerdeki "basit" dövüşten farklıdır.Hong Kong filmlerinin altın çağı boyunca benzersiz bir sembol olan dövüş sahneleri, daha çok muhteşem dansları andırır, her hareketi ve her stili vurgular. son derece tanınabilir bir yüzleşme.

Ancak dövüş sanatları sahnesi, AIGC modeli için küçük bir test değil. Bir yandan, resimdeki hızlı değişen hareketler ve hızlı hareketler genellikle büyük kareler arası yer değiştirmelere neden olur ve bu da optik akış modelinin doğruluğunun azalmasına ve lekelenmeye neden olur; diğer yandan karmaşık dövüş sanatları eylemlerin enterpolasyona neden olma olasılığı daha yüksektir.Çerçeve sonucunun bozulması, izleyicinin görsel deneyimini doğrudan etkileyen eserler üretir.

Bu amaçla Volcano Engine akıllı çerçeve enterpolasyon algoritması geliştirmiştir.Ön ve arka çerçeve içeriğinin optik akışını tahmin ederek, ön ve arka çerçeve pikselleri optik akış bilgisine göre ara çerçeveye dönüştürülür, ve ardından ara kareyi oluşturmak ve video kare hızını iyileştirmek için entegre edilir; Hedeflenen optimizasyon sayesinde, büyük hareketlerle uğraşırken hesaplama yükü azaltılır, böylece modelin kararlılığı ve etkisi iyileştirilir.

Dövüş sanatları unsurları her zaman Hong Kong filmlerinin önemli bir parçası olmuştur, ancak ilk filmlerin nispeten kaba çekim ve yapım yöntemleri nedeniyle, bazı dövüş sanatları sahnelerinde genellikle tel parçaları kalmıştır ve bu nedenle resmin bütünlüğü bozulur. Bu bağlamda Volcano Engine, toplu işlerde görüntü kusurlarını işlemek için gürültü giderme ve çizik giderme algoritmaları kullanır ve aynı zamanda resimdeki ana karakterlerin bütünlüğünü sağlarken izlerini ortadan kaldıran Wia için de-scratch algoritmasını optimize eder. Wia.

Soldaki resim tamir öncesi, sağdaki resim tamir sonrası

Çin Film Arşivi'nin küratör yardımcısı Zhang Xiaoguang'a göre, bu film restorasyonu aynı zamanda filmin ana yaratıcılarını, yalnızca görüntünün "biçimini" teknoloji aracılığıyla geri yüklemekle kalmayıp aynı zamanda orijinalini de geri yükleyen restorasyon sürecine katılmaya davet etti. Filmin "ruhu", onu "Eskiyi eskisi gibi geri yükle" yapıyor.

Bunun arkasındaki mantık, film restorasyonunun yalnızca en son teknolojiye sahip bir iniş sahnesi bulma girişimi değil, aynı zamanda ticari bir davranış olmasıdır. Halkın duygularına dokunan, toplumsal hafızayı uyandıran ve böylece ticari değeri artıran klasik filmlerin anahtarı "eskiyi eskisi gibi onarmak"tır. Volkan motorunun pragmatik teknik görünümüne bir göz atmak zor değil.

Sıradan insanların evlerine uçmak

AIGC'nin ilk salgınının başlangıcında İnternet bağlamı bir zamanlar teknoloji ve uygulamalarla ilgili şiddetli tartışmalara hapsolmuş olsa da, Miaoya Camera ve Volcano Engine, ikisinin aslında karşıt olmadığını kanıtladı.

Bir yandan, en son teknolojinin evrimi, uygulamaların sınırlarını genişletmeye devam ediyor, böylece genel halk, fotoğraf stüdyolarının yüksek fiyatlarını ödemek zorunda kalmadan kendi çoklu yüzlerini görebilir; yeni canlılık.

Öte yandan, en son teknolojilerin genellikle araştırma ve geliştirmeden uygulamaya kadar uzun bir döngüden geçmesi gerekir.Geçmişte, "laboratuvarlarda" yaşayan ve ticarileşme konusunda soğuk olan daha büyük ölçekli modellerin, bu köklü içeriklere ihtiyacı vardı. onlara hayat verin.Bu sayede gerçekten insanların hayatlarına giriyor.

Son teknoloji uygulamalarının getirdiği prangalarla karşı karşıya kalan oyuncuların vermeye devam ettiği cevaplar, kuşkusuz sektör için önemli bir referans değeri taşıyor.

Çemberin dışında kalan Miaoya Kamera, geçmişte son teknoloji çehresini değiştirmiş, sıradan kullanıcılara yakın ve daha kolay çekilebilen sahneler sayesinde daha canlı ve tempolu bir tavırla C-end pazarına girmiştir. -işlevleri kullanın.

Tesadüfen, yanardağ motoru da iniş sahnesini sürekli olarak araştırıyor. 2021 gibi erken bir tarihte Volcano Engine, Nezha, Calabash ve Black Cat Sheriff gibi çocukluk anılarındaki klasik animasyonları görüntü kalitesi iyileştirme teknolojisine dayalı 4K versiyonlara geri yükledi ve geçen yıl Beyond grubunun Hung Hom Stadyumu'nda şarkı söylemesini sağladı. Evet , 30 yıldan fazla bir süre sonra halkın gözünde yeniden ortaya çıktı.

Yani klasik animasyonun restorasyonundan, konserlerin yeniden gösterimine ve ardından Hong Kong filmlerinin restorasyonuna kadar birer çıpa noktası gibi olmaları, volkan motorunun ticari uygulamalar alanında kök saldığını gösteriyor. Bugün, Volcano Engine mükemmel teknik yetenekler geliştirdi ve dahili iş kollarında ve harici kurumsal hizmet pazarlarında büyük ölçekli uygulama ve toplu ölçekli üretim uygulamaları gerçekleştirdi.

Son tahlilde, ister Miaoya kamerası ister volkan motoru olsun, AIGC'nin yüksek teknoloji duvarlarını daha çeşitli ve esnek uygulamalarla yıkıyorlar, böylece teknolojik bağlamda yaşayan en son teknoloji, içinde bir gerçeğe dönüştü. kullanıcıların erişimi. . Bu pragmatik oyuncular grubu tarafından yönlendirilen AIGC'nin gelecekte daha zengin bir biçimde sıradan insanların evlerine uçabileceği öngörülebilir.

Orijinali Görüntüle
  • Bahşiş
  • Yorum
  • Paylaş
Yorum
Yorum yok