「接下來我們聽一聽來自矽谷的一個新興ai創業公司bishopflux的ceo斯坦利·康格里夫為我們帶來的解決方案。」
這下楊翰林不樂意了,「我們在網際網路方面的名氣不如亞麻遜和東部資料計算了,這個從來沒有聽過名字的公司,怎麼也比我們還靠前發言,yandex這事辦得不地道啊!」
「沒事,發言的名次罷了,我們不在乎這個。」林奇連忙安慰楊翰林。
很快bishopflux公司的一個年輕的小夥子就走了上去。
「大家好,看了前輩們的解決方案,我很有感觸。我今天也帶來一些我們公司研發的一些新技術。」
「我們都知道影片就是一幀一幀的圖片組成的,只要播放的足夠快,因為我們人類眼睛的特性是看不出來圖片那麼短暫的停留的。可以從最早的膠片放映機就能看出來現在影片的原理。」
「如果一秒有30幀,一幀就是一張圖片,一個圖片假設有1027768個畫素,這個真的不多。每個畫素由rgb組成,每個8位,就是24位。」
「我們可以算一下每秒鐘的影片有多大,30102476824=566,231,040bits=70,778,880bytes。如果一分鐘的影片的呢,那就是4,246,732,800bytes,4個g大小。」
在下面坐的眾人,都點點頭表示贊同這個看法,並且大家也都知道這是不壓縮的情況下,如果壓縮後,影片的大小就會好很多。大家繼續聽了下去。
「我們現在也沒有聽說過哪種影片真的1分鐘就有4個g大小的,如果真是那麼大根本沒有辦法儲存和傳輸,如果真的這麼大,除了量子通訊,其他什麼網路都不行。不過也正是因為有了量子通訊,所以今天我們才可以不討論網路的問題,只討論儲存。」
「所以影片領域才有另一中技術——編碼,其實編碼就是一個壓縮的過程。這個編碼過程其實就是利用了圖片和影片的一些特點,空間冗餘、時間冗餘、視覺冗餘、編碼冗餘,因為這些特性所以編碼的演算法非常複雜,並且多種多樣,但是編碼過程其實都是類似的。」
「編碼的演算法無非都是通過幀內預測(去除空間冗餘),幀間預測(去除時間冗餘),變換(去除空間冗餘),量化(去除視覺冗餘,通過降低影像質量提高壓縮比),熵編碼(去除編碼冗餘,變長編碼)。」
「如果完整的儲存所有的圖片,那麼影片就太大了,所以編碼演算法會將影片序列分成三種幀,i幀(關鍵幀),p幀(前向預測編碼幀)和b幀(雙向預測內插編碼幀),每一種幀都有各自的的用途,關鍵幀是儲存了完整的圖片,前向預測編碼幀表示的是這一幀跟之前的一個關鍵幀的差別,這樣解碼的時候就能使用關鍵幀,解出來這一幀的最終畫面,還有雙向預測內插編碼幀,記錄的是本幀於前後幀的差別。」
「也正是通過這種壓縮方式在使得現在的影片沒有那麼大的儲存量,方便了傳輸。我們公司是研發了一種基於ai的高效率的編碼方式,能在保留清晰度的情況下,讓影片的大小隻有現在影片的一半大小。」
等到這句話說完,下面的在做的大佬們紛紛議論。
以前沒有聽過bishopflux公司的名字,現在看來還挺厲害的,不知道能不能收購了他們。伊利亞·沃羅茲首先想到的是就是收購了這個公司。
「這也不失為一個好的想法,看來深度學習已經給人們帶來了很多方面的變革。」林奇也覺的這個想法挺好的。