100年前的北京Vlog火了!AI修复古老纪录片还原逼真场景
點擊上方“邁微電子研發社”,選擇“星標★”公眾號
重磅干貨,第一時間送達
是不是很好奇,百年前的北京是什么樣子?
最近,一位叫大谷Spitzer的微博網友,將人民日報發布的1920年北京黑白影像資料,利用AI技術做了修復工作:上色、修復幀率、擴大分辨率等處理,并加了合適的配音。
這些步驟底層蘊含的技術應該都是生成對抗網絡(GAN),其中第一項用的應該是某種圖像風格轉換技術,第二項是時序“超分辨率”以提升視頻幀率,第三項用的是某種圖像超分辨率技術。
這部100多年前的視頻中的人和物都顯得那么的真實,100年前的人,如今斗轉星移,物似人非。不禁感嘆人生如夢幻泡影,如夢亦如電。我們通過對影像的觀看可以看出修復效果不錯,配音選擇上也很用心,首先為這個工作點贊!
如此工作滿足了大批網友的好奇心,視頻一經發布便得到了大量的關注:分享超過12萬次、評論3萬+、點贊5萬+。
有網友評論到:
視頻里人怎么也想象不到,一百年后會有一個人躺在床上拿著一個神奇的物品能夠觀察到他們當時的一舉一動吧。科學和巫術果然就是一線之隔。
還有網友贊嘆道:
Wow~ 一百年前的vlog。
不是概念的,宏觀的,文字的,被描述的,被審視的。完全打破我的模糊想象,被觸動了。
當然,還有感慨二環不堵了的……
話不多說,一起來體驗下吧。(完整視頻在文末)
時光旅行,體驗100年前的北京生活
1920年的北京,入城出城的“客流”還算較多,有騎馬的、有坐轎子的、有坐人力車的,當然多數人還是步行。
而在城內集市中,也是熙熙攘攘,好不熱鬧。當然,在那個年代,人們應該是對錄影設備感到非常新奇了,圖中的小哥駐足了良久,癡癡的看著鏡頭。
路邊街頭的小吃生意也是不錯(看完想來一屜小籠包了……)
寺廟里燒香拜佛的人們絡繹不絕,當時的香火可比現在要鼎盛啊。
但細心的網友也發現:除了寺廟,在大街上很少看見女人。
再來到巷子里的百姓生活,這一段很好的展示了當時社會的禮俗。
真是百年巨變,沒想到一百年前這么懂禮節。
當然,還有網友表示:100年了,狗狗長得還是一樣的……哈哈哈
最后,讓我們一起來俯瞰百年前的北京城。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
AI修復百年古董老電影
雖然博主大谷Spitzer沒有介紹具體采用了哪些AI技術,但其實修復老電影的工作也有許多。
今年2月,國外網友Denis Shiryaev利用一種增強程序(Gigapixel AI),將1896年的古董電影《火車進站》,轉變成了4K 60fps高清“大電影”。
在修復幀率方面,主要采用的技術是AI插值。
據Shiryaev介紹,他采用的是一種叫做Gigapixel AI的商業圖像編輯軟件(付費)。這款軟件由Topaz實驗室創造,可以讓圖像的質量提升600%。
它利用一種專有的插值算法,對圖像做分析、識別其細節和結構,最后將額外的“信息”填充到圖像中。
這個工作量是什么概念?
普通的高清是1920×1080,總像素為2073600,而4K高清是3840x2160,總像素是8294400。
也就是說,光是要把普通高清提升到4K高清,就需要額外填充600萬個像素。
不僅如此,還需要弄清楚如何顯示這些額外的像素,這就是插值過程的用武之地。
插值估計每個新像素要顯示什么內容,這個過程是基于它們周邊的像素。對于這一點,有許多方法可以來衡量。
最近鄰?(Nearest Neighbor)方法,會簡單地用與其最近鄰相同的顏色填充空白像素。它雖然簡單而有效,但結果是一個鋸齒狀、明顯像素化的圖像。
雙線性插值?(Bilinear Interpolation)方法需要更多的處理能力,但它基于最近的兩個像素來分析空白像素,并在它們之間生成一個梯度,這會讓圖像變得更加清晰。
而雙三次插值?(Bicubic Interpolation)會對其16個最近鄰像素進行了采樣,這樣就會讓著色變得精確,但仍然存在圖像模糊的問題。
通過結合雙線性插值和雙三次插值,就可以生成光學質量損失最小的放大圖像。而這一過程,Gigapixel AI利用深度卷積神經網絡來完成。
解決了像素低的問題,還需要解決視頻卡頓問題。
Gigapixel AI在關鍵幀之間進行“想像”之后,把這些想像出來的幀插進去。而它插入的幀數多到可以讓視頻速率提高到60 FPS。
這就是古董電影也能變得如此清晰、流暢的原因。
至于著色工作,同樣是利用神經網絡,從一堆彩色照片開始,將它們轉換成黑色和白色,然后再重建彩色原圖。
老片修復技術現狀
近幾年,AI在視頻的數字化修復方面成果十分顯著。像《紅樓夢》《三國演義》《開國大典》和《紅巖》這些經典的老電影,因為年代久遠,在今天的影視播放工具上放映時,清晰度太低,有時根本沒法看。
在老片修復領域,人工智能技術的運用可謂是一個從無到有的過程。
愛奇藝高級總監劉俊暉在接受《文匯報》采訪時解釋道,在AI開始“工作”之前,它必須經過大量的學習來搭建模型和推演算法:一方面,對照人工修復前后的影片;另一方面,在清晰的片子上加糊、加噪,人為模擬老片。通過這些基本素材,超分辨率、去噪銳化、修復污跡、色彩增強成為了人工智能技術助力老片修復的“基本技能”。
劃痕修復、畫面調色等仍需人工操作,AI修復電影需要完善技術
仔細的觀眾會在@大谷Spitzer視頻開頭畫面旁的小字留意到這樣一句話:“色彩為AI自我學習結果,不代表歷史原色。”這側面反映了AI修復老片的一項技術瓶頸,即機器本身不具備藝術鑒賞能力,對于調色等主觀的藝術創作,還需要人工來進行把握。
劉俊暉曾公開介紹,愛奇藝團隊最初嘗試通過AI技術修復老片時曾做過一個樣片提交給中國電影資料館的修復專家。高清、去噪、去劃痕……該修復的他們都做了修復,但這段樣本卻直接被專家否定了。對方給出的意見是:AI修復后的視頻畫面整體顏色飽滿,卻丟失了電影本身的年代感。
同樣地,據《中國新聞出版廣電報》報道,電影《開國大典》有24萬幀畫面,修復用了4個多月時間。負責該影片修復工作的技術人員周蘇岳表示:“正片工作量的90%靠AI技術來解決,但是人工部分花了90%的時間?!?/strong>尤其是對于鏡頭不穩定且膠片上有大量臟點、油污、劃痕和變型的資料片,專業修復師可能一天也只能修一秒。
不過技術總是處于進步之中。2019年7月,AI服務提供商deepsense.ai曾用人工智能修復經典佳片《亂世佳人》。對于充滿噪聲和劃痕的原始膠片,他們利用有監督的學習算法,通過神經網絡訓練模型,讓機器學會消除瑕疵。
此外,5G時代的到來也會為經典老片的傳承帶來更多新機遇,因為高速網絡會便利超高清的內容傳輸,激發人們對于移動觀影的巨大需求。
技術也令人充滿遐想,正如網友@知北游原在評論區留言所說:“一百年后,我們會不會也這樣被后人感嘆呢?”
奉上完整視頻,你想穿越嗎?
最后,我們奉上大谷Spitzer的完整視頻,里面還在各個場景中配上了背景音樂。
如此的場景,令不少網友想起老舍先生《想北平》中的一段話:
我所愛的北平不是枝枝節節的一些什么,而是整個兒與我的心靈相黏合的一段歷史,一大塊地方,多少風景名勝,從雨后什剎海的蜻蜓一直到我夢里的玉泉山的塔影,都積湊到一塊,每一小的事件中有個我,我的每一思念中有個北平,這只有說不出而已。
那么,在看到百年前栩栩如生的生活狀態,你會有想穿越回去的沖動嗎?
快來評論區寫下你的感受吧~ (點擊這里留下你的評論吧)
參考鏈接:
https://weibo.com/2395607675/J0ZsQnP6a?filter=hot&root_comment_id=4502616270201172&type=comment
https://arstechnica.com/science/2020/02/someone-used-neural-networks-to-upscale-a-famous-1896-video-to-4k-quality/
?
?
MaiweiE-com|WeChat ID:Yida_Zhang2
?
推薦閱讀
(點擊標題可跳轉閱讀)
-
如何顯著提升小目標檢測精度?深度解讀Stitcher:簡潔實用、高效漲點
-
最新!CCF-A類頂會WWW2020最佳論文出爐!OSU最佳論文
-
Github 3.6k+星,200余行代碼,讓你實時從視頻中隱身
-
すごいね!日本神秘男子用 AI 黑科技破解馬賽克,震驚業界大佬!
-
CVPR2020 | 無監督詞映射視覺基準,Visual Grounding in Video【DeepMind-牛津-CMU】
?
知識星球:社群旨在分享AI算法崗的秋招/春招準備攻略(含刷題)、面經和內推機會、學習路線、知識題庫等。
△掃碼加入「邁微電子研發社」學習輔導群?
?
?
總結
以上是生活随笔為你收集整理的100年前的北京Vlog火了!AI修复古老纪录片还原逼真场景的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Telegram与Wirecard合作开
- 下一篇: python ui bs_期权及 Bla