08 實驗驗證

experimentation

在imagenet的幫助下,alexnet煥發生機,它貪婪地吸收著imagenet的內容,在imagenet規模和多樣性的土壤中生根發芽,茁壯成長。

秋色已盡染日本京都。午後的陽光明媚,從子彈頭列車的車窗向外望去,綠色、橙色和紅色飛掠而過,如同一幅幅生動的畫作。列車以每小時320千米的速度飛馳著,窗外的鄉村樹木蔥鬱,景色絢麗。然而,美景當前,我卻無心欣賞。這段旅程漫長而艱辛,焦慮如影隨形。在之前的計算機視覺與模式識別大會上,imagenet三流水準的初次亮相令人失望,此後的幾個月更是連遭挫敗。我們的批評者依然對這個資料集不屑一顧,其他研究實驗室也對其興趣寥寥,imagenet走向無人問津似乎已經不可避免。為了力挽頹勢,我臨時決定去儘可能多的大學做現場講解,儘管聽眾席上坐的往往是持懷疑態度的研究生和博士後。我能做的不多,但僅僅是讓這個不可避免的結局推遲出現,也感覺像是一場小小的勝利。

現在,提高我們知名度的又一個大好機會就在眼前,今年的國際計算機視覺會議即將在京都召開。與我同行的是亞歷克斯·伯格(alexberg),他是紐約州立大學石溪分校的助理教授,也是跟我志同道合的計算機視覺研究者,他的研究生導師是吉滕德拉。亞歷克斯極具天賦,他本著與我和彼得羅協作時相似的精神,致力於探索「物體識別」的挑戰。他在博士論文中使用了caltech101,對資料集的價值非常認同,也成為imagenet為數不多的支援者之一。能與同道中人共勉固然讓人振奮,但也凸顯了前路之孤寂和艱辛。

眼下的一切與我們剛搬到斯坦福大學的實驗室時的興奮之情形成了鮮明對比。彼時的我們堅定地認為,我們所掌握的不僅僅是一個資料集,更是一個測試平臺,可以把我們的想法與整個視覺世界聯絡起來,拓寬我們演算法的感知能力,同時用比以往更嚴格的方式對演算法進行測試。如果說可以把影像資料集視為計算機視覺研究的語言(也就是演算法及其開發人員可以探索的概念集合),那麼imagenet就是詞彙量的突然爆發性增長。

我們實驗室所做的每一件事都充滿了活力。有一次,我們利用imagenet快速訓練了數百個影像分類演算法的例項,讓它們識別一組日常事物,然後將所有例項應用在一張照片上。實驗目的並不是簡單地檢測單個物體的存在,而是通過尋找物體組合來詮釋整個場景。例如,如果檢測演算法發現了一個人、一艘船、一隻槳和一片水域,它就會將照片作為一個整體歸類為「划船」。這是一種更深層次的理解,可以說接近於原始的視覺推理。

就像我們那個時代的許多實驗一樣,我們使用的演算法準確性很不穩定,還有很大的改善空間。畢竟,就連簡單的影像識別也仍處於起步階段。但困難只會進一步激發我們的冒險精神。我們的研究大膽且具有前瞻性,雖然並不完備,但能引發思考,其中很多在概念上也很簡單。但直到imagenet出現,一切才變得切實可行起來。

與此同時,鄧嘉也開始在學術領域嶄露頭角。在imagenet釋出後一年左右,他發表了題為《對超過10000個影像進行分類能告訴我們什麼》的論文,總結了imagenet出現後影像識別領域發生的根本性變化。儘管論文技術性很強,但其中所蘊含的哲學思想使它有別於一般的學術論文。這篇論文宛如一個預言,甚至觸及了存在的本質。鄧嘉認為,imagenet不僅代表了規模的擴大,還代表了分類邏輯的轉變,類似於物理學領域的「相變」,在這種轉變中,甚至現象的最基本屬性也會發生變化。imagenet極大地拓寬了演算法面臨的可能性,但因為規模太大,也給演算法造成了挑戰(相比而言,小型資料集就不會有這個問題)。

說得更專業一些,imagenet所提供的「語義空間」在不斷擴大的同時,也變得更加密集,導致正確答案與錯誤答案之間的差距越來越小。在實際應用中,這通常意味著那些在區分少量差異較大的類別時執行出色的技術,在處理imagenet的上萬個類別時會表現不佳,因為很多類別之間的差別都非常細微。有些技術甚至會完全失效。這種現象剛開始時令人羞愧,但最終會催人振奮,因為它表明未來的演算法不僅是當前演算法的改進,而且會以一種我們預料不到的方式,從根本上發生變化。

「你知道我最喜歡caltech101哪一點嗎?」亞歷克斯的話把我拉回了現實,「除了裡面的訓練資料,它還讓我有機會用完全相同的影像,把我的研究結果和你的進行比較,做同類對比。」

「相當於一個基準。」我回答道。

「沒錯,這樣就很容易衡量進展。還有什麼比這更能激勵研究人員呢?就像是發起了一個挑戰,就像打賭一樣。」

就像打賭一樣,我喜歡這個說法。

「那麼……如果我們用imagenet做同樣的事呢?」我問道,邊思考邊說,「或者,乾脆我們就用imagenet搞一個完整的競賽怎麼樣?」

「你是說像pascal那樣的嗎?」

pascal視覺物件類別資料集(通常稱為pascalvoc)是一個歐洲研究團隊彙編的資料集,包含大約1萬張圖片,分為20個類別。pascalvoc與caltech101類似,但有一個重要區別:pascalvoc是年度計算機視覺大賽的基礎資料集。該大賽始於2005年,每年都有來自世界各地的參賽者提交經過pascalvoc訓練的演算法,然後用這些演算法去識別一組以前沒有見過的新圖片,最後根據分類的準確度對演算法進行排名,錯誤率最低的即為獲勝演算法。比賽既具有協作性,又具有競爭性,吸引了各方對計算機視覺領域最新進展的關注。而參賽者所使用的資料集僅有imagenet的千分之一大小。

「那就有意思了。」亞歷克斯回答道,「我都可以想象研究人員在互相交流新想法的時候問:‘它在imagenet上的表現怎麼樣?’」

這樣一來,imagenet也成了計算機視覺領域的北極星了,我想。

如果鄧嘉論文的核心思想是正確的,如果imagenet真的會引起一場大洗牌,帶來新的規則、新的直覺,甚至全新的範式,那麼還有什麼比通過比賽來探索這個資料集更好的方式呢?激烈的競爭壓力可以激發合作的集體力量。比賽要遵循一定的規則,但又要有探索性。即使經過多年的努力建立了imagenet,僅僅是想像著把它做成比賽,也為它注入了新的生機。

這也意味著將imagenet推向世界的工作尚未結束。

一回到美國,我就開始了比賽的籌備工作。乍看之下,比賽規程似乎簡單明瞭:使用imagenet來訓練演算法,用一組演算法從未見過的影像對其進行測試,評估演算法對影像標註的準確率,以此計算排名,總錯誤率最低的演算法勝出。然而,從實際操作上看,將資料集轉化為競賽本身就是一項科學挑戰。

在象棋、撲克或籃球等比賽中,勝負的概念簡單明瞭。然而,在科學競賽中宣佈獲勝者類似於做出了一項承諾:承諾不僅參賽演算法在某些方面表現優異,而且演算法設計對整個領域做出了貢獻;承諾獲勝演算法能給我們帶來全新的啟示、深刻的見解,甚至變革性的成就;承諾比賽結果就是邁向北極星的下一步。這是一個重要而莊嚴的宣告,發表的時候必須充滿信心。

在這種情況下,競賽的嚴謹性和透明度都至關重要。為了實現這兩大目標,我們起草了大量檔案,詳細解釋演算法的分析方法,解讀對演算法效能進行量化的精確公式。除此之外,靈活性也很重要。畢竟,當給照片分配標籤時,就算是人類,也可能會對哪個物體最相關產生分歧。例如,想象在一張水果擺盤的圖片裡,草莓和蘋果都非常顯眼,因此都可以被視為照片的核心特徵。如果給這張圖片標註「草莓」而不是「蘋果」,算「錯誤」嗎?

為了避免誤判表現優異的演算法,我們允許演算法給每個條目新增五個標籤,標籤以相關性排序。比如,在上面的例子中,「草莓」和「蘋果」這兩個標籤都算正確答案。我們把這種評估標準叫作「五大標籤錯誤率」。這種標準可以鼓勵參賽者明智地分散識別風險,確保他們的能力得到最充分、最公正的展現。

就像imagenet本身的建立過程一樣,比賽帶來了一連串意料之外的挑戰。我們花了數週時間研究與參賽者共享資料集的統籌問題,最終選擇分發一個精簡的子集:比賽所用資料庫約佔imagenet影像總量的十分之一、總類別數的二十分之一,共包含約140萬張圖片,涵蓋1000種日常物品、植物和動物。為了確保為演算法提供新穎的測試,我們再現了imagenet的大部分開發過程——我們重新下載並標註了數十萬張新圖片,又進行了一輪眾包標註。總之,我們花了幾個月的時間來籌備比賽。

在籌備過程中,鄧嘉的支援團隊不斷壯大,其中就有像奧爾佳·魯薩科夫斯基(olgarussakovsky)這樣的新人。奧爾佳是一位聰明且充滿活力的研究生,一直在尋找有意思的專案來貢獻自己的力量。她雙眼有神,捲髮及肩,說起話來很有感染力,在人群中非常顯眼。從我們第一次見面開始,我就很喜歡她,尤其讓我印象深刻的是她身上那種不著痕跡的反差:她性格活潑,很容易被誤認為是土生土長的加州人,但事實上,她出生在烏克蘭,經常談起她還住在哈爾科夫的祖母。她不僅智商高,也是我們系裡少有的社交能手。我知道她有足夠的才智在幕後為專案做出貢獻,但我也暗自揣測,也許有一天,她可以利用自己天生的才智成為代表專案的公眾人物。

「激動嗎?」奧爾佳問道。

我確實很激動。網站第二天就要正式上線了,競賽訊息也會同時公佈。團隊正在實驗室裡熬夜做收尾工作。

「告訴我,」鄧嘉說,「你在這裡的終極目標是什麼?」

imagenet專案進入最黑暗的日子以來,我幾乎再也沒有思考過其他問題。考慮到我們所做的一切工作,我發現僅僅將imagenet視為一個資料集就過於狹隘了。即使到了現在——尤其是現在,在比賽近在眼前的時刻——imagenet仍然只是一個假設、一個賭注,賭的是計算機視覺領域最需要的東西,是獲得長久以來哺育著人類感知能力的多樣性和變化性。

我樂觀地認為突破就在眼前,但又擔心通往突破的道路崎嶇難行,畢竟imagenet體量龐大,對任何一種演算法來說都是難以駕馭的。我們討論了目前流行的各種演算法,如支援向量機(supportvectormachine,svm)、隨機森林(randomforest)、自適應提升(boosting),甚至是我和彼得羅在單樣本學習論文中使用的貝葉斯網路,都會不堪重負,這迫使我們去創造一些真正的新演算法。

「我不認為imagenet會把現有的演算法變得更好。」我說,「我認為它會讓它們過時。」

比賽的正式名稱為「imagenet大型視覺識別挑戰賽」(imagenetlargescalevisualrecognitionchallenge,ilsvrc),對所有人開放,獲勝者會即刻獲得認可。首屆比賽將於2010年舉行,5月開放報名,9月統計結果,同年晚些時候,會在克里特島舉行的歐洲計算機視覺大會(europeanconferenceoncomputervision,eccv)研討會上公佈獲勝者。在研究界看來,賽事的準備工作似乎進行得天衣無縫,但其實這多虧了幕後一些外界力量的幫助。

考慮到我們缺乏辦賽經驗,再加上imagenet的知名度還很低,我們聯絡了pascalvoc的創始組織者馬克·埃弗林厄姆(markeveringham)。馬克是牛津大學的研究員,也是計算機視覺領域冉冉升起的新星。當時pascalvoc已經進入第六個年頭,而imagenet才剛剛起步。馬克非常熱心,同意把imagenet作為pascalvoc競賽的一個新賽道。這一舉動非常慷慨,讓我們有機會在已經建立起來的框架中學習相關技巧。

當時與計算機視覺相關的競賽相對較少,因此創辦新競賽足以激起不小的水花,吸引一些早期的關注。我們一開始就收到了150份報名表,最終共有11個團隊提交了35個參賽作品。雖然參賽演算法不是很多,但我們終於邁出了第一步。

在某種程度上,在首屆imagenet挑戰賽前夕,我們的心情甚至比一年前imagenet釋出的時候還要激動。釋出產品是我們向世界展示自己創造的東西;而現在,世界將向我們展示他們用imagenet創造的東西。我們整個專案都是以生物視覺原理為基礎,而挑戰賽就是對相關生物影響的有力延續。imagenet的基本理念是演算法需要直面其所處環境的全部複雜性和不可預測性,也就是真實世界的本質。競賽將使演算法面對的環境充滿真正的競爭壓力。

就像我們的三葉蟲祖先漂流在古老海洋中一樣,現代世界的計算機視覺演算法即將墜入自己的進化熔爐,接受嚴峻的考驗。提交的作品代表了使用imagenet完成的第一代研究成果。手握這些作品,我不禁想,這是否就是答案了?我們即將瞥見某個新的前沿了嗎?

然而,現實卻與我們的期望背道而馳。

獲勝演算法來自一個由nec實驗室、羅格斯大學和伊利諾伊大學的研究人員組成的聯合團隊。他們採用的是支援向量機演算法,這也是我此前認為無法駕馭imagenet的一種演算法。支援向量機這個名字聽上去相當晦澀,取自該演算法利用的高維幾何的一個特徵,象徵著其抽象本質。支援向量機在過去幾年非常流行,到2010年,它似乎已經成為物體識別的實際標準。這個參賽演算法的表現確實可圈可點,我們對每位參賽者的努力表示讚賞。不過,與計算機視覺領域其他方面的前沿工作相比,這些演算法只能算略有改進,很難說開啟了新的時代。

在imagenet的發展歷程中,有很多令人洩氣的時刻,這次就是其中之一。如果說2010年的比賽虎頭蛇尾的話,那麼2011年的比賽則給人一種末日之感。2011年的獲勝演算法來自法國施樂研究中心,也是一種支援向量機演算法,識別表現雖然比前一年有所提高,但也只是將準確率提高了2個百分點左右。

我開始意識到自己可能誤判了。正如我猜測的那樣,大多數演算法都難以應對imagenet,但支援向量機比我想象的要強大,它為參賽者提供了安全的避風港,阻礙了我夢寐以求的激進創新。連續兩年,司空見慣的演算法都只是在能力上略有提升,幾乎沒有任何真正的進步。最糟糕的是,參賽人數也出現急劇下降:第二年的報名人數從150人減少到96人,參賽演算法也從35個減少到15個。願意為此付出努力的人似乎越來越少,也許這並不奇怪。

說這種經歷「讓人羞愧」已經遠遠不足以描述我們的心情了。為了推動imagenet的發展,我們傾注了多年的心血,蒐集的圖片數量遠遠超過以往的任何資料集,還精心策劃了一場國際競賽來探索它的能力,但結果卻只是簡單地重複了現狀。如果說imagenet是一場賭注,是時候開始思考我們是不是已經輸了。

「西爾維奧!快看!我剛才就想給你看!」

我聽到父親在走廊那頭得意地喊道,讓西爾維奧過去看他在車庫市場中的最新收穫。我們居住的加州郊區面積大,全年氣候宜人,尤其適合進行車庫市場。搬到這裡後,父親依然對他最大的愛好充滿熱情。他還是對那些帶有一絲義大利血統的物品情有獨鍾,尤其引以為豪的是最近買的一條腰帶,上面蓋著他最喜歡的印章:「義大利製造」。我不禁想,這麼多年過去了,他是否意識到,他的女兒其實比他更勝一籌:不僅找到了義大利製造的稀世珍品——一個好男人,還跟他成了夫妻。父親正拿著一條腰帶給這個男人看。

「啊。」我聽到西爾維奧回應道。我暗自發笑,他的漢語詞彙量屈指可數,這個音節就是其中之一。

現在,我和父母住在校外教工區的一棟聯排別墅裡。這裡非常舒適,我們心懷感激,但我覺得自己的生活依然七零八落。我和西爾維奧還是兩地分居,一有時間就去探望彼此,所以很少跟身邊人打交道。跨國飛行仍是家常便飯,大部分時間都用來打包行李、往返機場、協調通勤。我們感覺自己就像是空中居民,並沒有生活在陸地上。

儘管如此,在喧囂的背後,仍能找到一種異常的平靜。母親的病情相對穩定。儘管異地婚姻帶來了很多麻煩,但西爾維奧經常過來看我,跟我父母的關係也日漸緊密。每次過來,他都會親自下廚,想用美食俘虜我父母的胃;而他們也報之以李,每次西爾維奧來到後的第一頓晚餐,他們都會親手準備豐盛的家常菜。這總會讓我想起小時候在成都的日子,每逢週末都會到外祖父母家,品嚐他們精心準備的燉肉、炒菜、涼拌菜、米飯和湯。

作為晚飯現場的唯一翻譯,我的任務就是幫助他們交流,主要的聊天內容就是中國美食。在西爾維奧眼裡,中國美食文化博大精深,讓他深感好奇。他的欽佩之情發自內心,並不是為了討岳父母歡心。父母做的中餐非常地道,並沒有照顧西方人的口味,反而讓西爾維奧更加喜歡。吃晚飯的四個人都是移民,但在這張餐桌上,國界似乎消失了。

一切都很美好,只可惜,這種美好太過短暫。

僅僅幾個月後,我就動彈不得了,無形的疲憊感深入骨髓。我步伐沉重,抬不起胳膊,睜不開眼睛,好像有千鈞重負壓在身上。我和西爾維奧非但沒有解決異地婚姻的任何問題,反而做出了一個極其理性的決定,讓問題變得更加複雜:我們決定要孩子了。我的孕期反應非常大。

特別是到了孕晚期,我感覺度日如年。除了常見的孕期反應,我還出現了一些找不到原因的症狀,醫生告誡我,在分娩之前,不可以再出行。但是,世界並沒有放慢腳步,時代的洪流繼續沖刷著我——學生、研究、教職員工和正在進行的imagenet專案。我每天都盯著電腦辦公,手機震動個不停。

有一次,手機突然在半夜震動起來。我拿起手機,發現是瓊·薩貝拉打來的。我覺得有些不對勁。

「瓊,怎麼了?」

電話那邊停頓了片刻。「飛飛,鮑勃摔倒了。」

「什麼?什麼意思?他受傷了嗎?」

「不是,不是。我的意思是,問題挺嚴重的,他好像失去平衡能力了,感覺很不正常。」

我還是沒明白。瓊聽起來像是在描述別人的祖父,而不是鮑勃。鮑勃還年輕,不可能發生這種事。

「你帶他去醫院了嗎?」

「我現在就是在醫院給你打的電話。醫生做了快速腦部掃描,我們還在等詳細結果,但是……」她慢慢地嘆了口氣,「飛飛,情況看起來很不好。」

我使勁嚥了咽口水,坐直了身子。我說想跟鮑勃通話。我聽到瓊把電話遞了過去,用我幾乎聽不清的聲音說:「是飛飛的電話。」

「喂?」

這不是鮑勃的語氣。

「是鮑勃嗎?呃……瓊說你摔倒了。你還好嗎?現在感覺怎麼樣?」

我本來想跟他說說話,確認他沒事,但他的聲音聽起來很遙遠,似乎說話很費力氣。

「鮑勃,」我意識到問題的嚴重性,聲音越來越輕,「你想讓我飛過去嗎?我可以馬上過去。」

鮑勃在電話那頭沉默了片刻,這時我才意識到,我的話讓他始料未及。他知道我的預產期還有幾個月就到了,也知道醫生禁止我出行。在這種情況下,我還提議去看他,已經能夠說明事情的嚴重性了——直到把話說出口,我自己才意識到這一點。

沉默。然後是一陣急促的呼吸聲。微弱、嘶啞、顫抖。不可能是我想的那樣。他……在哭嗎?鮑勃從來沒有在我面前哭過。我聽到了激動的摸索聲,瓊又拿回了電話。

「怎麼了?飛飛,你對他說了什麼?!」

在接下來的24小時裡,我坐立不安,焦急地等待著瓊的訊息。

終於有信兒了——膠質母細胞瘤。晚期。無法手術。

鮑勃要死了。

我不敢相信。我開始給我認識的每個人打電話,迫切地尋找可以提供幫助的人。在我家多次出現健康危機時,他一直是我們的救命恩人,我也一定要盡全力幫他。一個偶然的機會,我通過一個獎學金專案聯絡上了附近一所大學醫院的神經生物學部門。第二天,他被轉到最先進的護理病房。

鮑勃對我太重要了,我盡了自己最大的努力,卻無法控制病情的發展。他的身體狀況急劇惡化,在發現腫瘤短短幾天後就完全失去了意識。醫生們竭盡所能,但他再也沒有醒過來。不到三週,那個從高中起就一直是我的第三位家長、如同我家人一樣的人,就這樣與世長辭了。

我們全家人都沉浸在極大的悲痛之中。父親一聽到這個訊息就淚流滿面。母親依舊沉默寡言,但我知道她和父親的心情是一樣的。他們也和這位「大鬍子數學老師」有著特殊的情誼,多年來,他們一起幫助我這個容易陷入痴迷的移民女孩度過了艱難的青春期。就連西爾維奧也受到了影響,他只見過鮑勃幾次,但已經逐漸明白他在我生命中獨一無二的重要性。此外,鮑勃的家人跟西爾維奧一樣來自義大利那不勒斯。西爾維奧知道依照醫囑,我不能去參加葬禮,但他擔心我會因此遺憾終身,於是他放下手頭的一切,從西海岸到東海岸,飛越整個美國,代表我參加了葬禮。

我仍然記得鮑勃在帕西帕尼高中的辦公室「數學實驗室」,牆上的書脊如彩虹一般。我還記得,我們的談話為我提供了每日的避風港。我還記得,如果我考試成績不好,他會嚴肅地批評我。在加州理工學院讀書的時候,他告訴我研究生宿舍房間應該怎麼選,對各種大小事情,他都像慈父一樣給我建議。我還記得,我們每週都會打電話,這些通話在我的生活中勾勒出一條連續的軌跡。我還記得,他慷慨解囊,借錢幫我家開乾洗店,把我們從絕境邊緣拉了回來。我還記得,不到一年前,我最後一次去新澤西是參加鮑勃的退休聚會;他站起來發表演講,毫不隱晦地說,他為「他的兩個兒子……和他的女兒」感到驕傲,聽到這樣的話,我一時不能自已。

斯人已去,但足跡不滅,思想不朽。鮑勃的夢想是出版自己的科幻作品,雖然這個夢想沒能實現,但他始終筆耕不輟,也總會在每個月底把自己的日記通過電子郵件傳送給我。我們成了數字筆友,像往昔年代的人一樣通過長篇通訊保持聯絡。這些郵件成為我所認識的那個人的最後遺存:每一個黑白網頁都記錄著他的所思所感,有的深刻,有的平淡。時至今日,這些文字仍讓我時而莞爾,時而捧腹,偶爾還會翻白眼,但總能引發我的思考。我的職業生涯致力於理解人類心靈的本質,而我此生最大的榮耀之一就是有機會更好地瞭解鮑勃的本性。

生活的腳步並沒有放慢的跡象。我緬懷著鮑勃,忍受著讓我動彈不得的大肚子,也無時無刻不在惦記著imagenet。這三重思緒構成了生活的主旋律,因此每當西爾維奧過來看我,我都特別感恩。

有一次晚餐時,氛圍異常安靜。他問道:「你在想什麼?是鮑勃嗎?」