我看見的世界：李飛飛自傳 03 鴻溝漸窄

anarrowinggulf

移居美國的決定讓我們陷入貧困，全家都在艱難地跨越新環境帶來的巨大鴻溝，但好在，我們都看到它正在縮小。

我們乘坐的波音747飛機艙門關閉，引擎轟鳴，在跑道上緩緩滑行。我和母親還不知道，千里之外的終點是一個新生領域的發源地。雖然這個領域尚未建立起傳統學科所享有的合法性，但註定要在幾十年後掀起一場革命。不過，革命時刻的到來已是幾十年後的事，對當時的我來說，更是遠在千里之外。我的人生始於東方，與我日後走進科學殿堂的地方相距半個地球之遙。這是世界上最大的鴻溝，至少從地理距離上來說是如此。此時此刻，隨著我們腳下的第一陣升力湧動，鴻溝開始縮小了。

20世紀最偉大的兩次變革都發生在此行的目的地。當中國經歷痛苦而漫長的文化和經濟轉型時，美國出現了一場不同的革命：數字革命。在外祖父母陷入戰時顛沛流離的動盪之中時，在父母承受著"文化大革命"的衝擊時，一群來自美國和英國的科學家和工程師----從劍橋到波士頓再到北加州----已經進行了一場長達幾十年的科學探索。有朝一日，這場探索將躋身人類歷史上最深遠的變革之列。

正如牛頓敏銳地看到了物質和能量世界背後的運轉原理，愛因斯坦更進一步重新構想了時間和空間的關係，20世紀中葉，在電腦科學領域也出現了一批具有遠見卓識的人。他們是真正的夢想家，與前人一樣，在科學探索領域放任不羈，勇往直前。他們洞察到隱匿於眾人眼前的新前沿，邁出了揭示新發展的第一步。

曾幾何時，使用先進技術進行算術運算所需的硬體可以佔滿整個房間。早在那個年代，阿蘭·圖靈（alanturing，英國密碼破譯專家，因幫助結束了第二次世界大戰而聞名於世）等先驅科學家就已經發現了機器和人腦的相似之處，其所展現的突破性想象力與引領前人科學革命的物理學家相比毫不遜色。與愛因斯坦、玻爾和薛定諤一樣，圖靈和他同時代的人提出的問題直到今天仍能引發激烈的爭論。智慧到底是什麼？可以用定量的機械方式解構智慧嗎？最大膽的問題也許是，我們有能力製造可以體現智慧的機器嗎？

圖靈的設想得到了美國電腦科學家同行的呼應。1956年，他們將好奇心編撰成文，提出了現在廣為人知的《達特茅斯人工智慧夏季研究專案提案》，"人工智慧"一詞就是在這份提案中誕生的。提案呼籲舉辦一次非正式研討會，探討如何通過計算機程式設計來完成類似人類的推理、感知和知識概括等活動。專案主要由約翰·麥卡錫（johnmccarthy）和馬文·明斯基（marvinminsky）主導，他們二位都是長期對大腦保持好奇心的數學家；此外還有ibm701計算機的設計者納撒尼爾·羅切斯特（nathanielrochester），以及被譽為"資訊理論之父"的克勞德·夏農（claudeshannon）。

就像愛因斯坦在結束了專利局一天漫長的工作後打磨自己的想法，這些早期的思想家也是在繁忙職業生涯的間隙邁出了通往新世界的第一步，以名副其實的冒險精神進行早期的人工智慧探索。事實上，人工智慧與物理學不僅僅是主題上存在聯絡，還有更深層次的連線：人工智慧的許多奠基人都相容幷蓄，涉足包括心理學和認知科學在內的各種領域，但他們的背景主要集中在數學、電子工程和物理學領域。這種背景是一把雙刃劍。雖然他們能力出眾，思維嚴謹，深刻理解第一性原理，但他們的探索往往侷限在近乎純理論的層面。在他們看來，人類的推理能力可以完美類比計算機程式：不過是邏輯規則的產物而已。他們設想，一旦對相關規則的理解趨於完善，任何一臺遵循這些規則的機器都能夠自然識別照片內容、理解人類語言、探索抽象概念，甚至創造性地解決新問題。這是非常勇敢的嘗試，在當時的時代背景下尤其如此。他們的自信令人欽佩，但其想法還是過於簡單化了。

達特茅斯研究小組很快發現，儘管我們行為的方方面面確實可以用簡單的術語來描述，但人類思想的深度和多變卻無法簡單歸納為一套規則或標準，至少在實際操作中是不可行的。然而，令人難以置信的是，提案卻認真地將這項工作描述為幾個研究生花上幾個月時間就能搞定的"暑期專案"。原文是這樣寫的：

我們提議在1956年夏天，在新罕布什爾州漢諾威的達特茅斯學院開展為期兩個月、10人參加的人工智慧研究專案。專案將基於以下設想：從理論上看，學習的任何一個方面或智慧的任何其他特徵，都可以被精確描述，可以通過建造相應的機器進行模擬。團隊將努力探索如何讓機器使用語言、形成抽象表述和概念，解決目前只有人類才能解決的各類問題，並不斷自我完善。我們認為，通過精心挑選的科學家在一個夏天的共同努力，可以在一個或多個問題上取得重大進展。

然而，團隊最終意識到，要在複製人類認知稟賦的深度和廣度方面取得"重大進展"，八週時間可能不夠。之前穩操勝券的心態逐漸消失。研究人員懷抱著更大的耐心，邁出了從最初異想天開的學術研究走向實踐探索的第一步。經過半個多世紀的時間，探索仍遠未完成，但在此過程中卻湧現出一些具有變革性的成果。

儘管事實很快證明，開發人工智慧的挑戰遠遠超出了創始團隊最初的預期，但相關思考仍然讓人沉迷，也吸引了越來越多學者參與其中。1959年，麥卡錫和明斯基在麻省理工學院推出非正式的人工智慧研究計劃，後來發展成為麻省理工學院人工智慧實驗室。1963年，麥卡錫遷居斯坦福大學，將人工智慧探索帶到美國西海岸。他在這裡成立了斯坦福大學人工智慧實驗室（stanfordailab，簡稱sail）。到20世紀60年代末，這兩個實驗室已經成為全球公認的人工智慧領域的活動中心，覆蓋硬體、軟體和機器人技術等多個領域，持續推動相關理論研究、實驗探索、激烈辯論和創造性開發。

研究人員也從人工智慧領域早期的好高騖遠中吸取了教訓，尤其是在斯坦福大學人工智慧實驗室。到20世紀60年代，研究人員開始對小型抽象虛擬世界的數字化表示（digitalrepresentation）產生興趣。虛擬世界通常由方塊等簡單物體構成，這樣研究人員就可以專注於智慧的基本要素，而不會被日常現實的細節所淹沒。最著名的例子是麻省理工學院博士生特里·威諾格拉德（terrywinograd）開發的一個程式，使用者可以用簡單的英語命令來操控一組虛擬的彩色方塊。有段對話格外令人難忘，以下是部分摘錄：

使用者：找一塊比你手中的方塊更高的方塊，把它放進盒子裡。

計算機：我想，你說的"它"是指比我手中的方塊更高的方塊。

計算機：好的。

使用者：盒子裡裝了什麼？

計算機：藍色三角錐和藍色方塊。

使用者：三角錐是由什麼支撐的？

計算機：盒子。

使用者：有多少個方塊不在盒子裡？

計算機：四個。

即便在人工智慧對話模型已經與真人極其接近的今天，上述對話也會讓人覺得使用者是在跟一個思維健全的物件聊天。毫無意外，威諾格拉德的專案被譽為一項突破性成就。許多觀察家相信，人工智慧革命近在眼前。然而，事情並沒有這麼簡單。具有諷刺意味的是，程式的流暢性和靈活性恰恰是自身限制條件的產物。雖然程式可以就方塊話題高談闊論，但也僅此而已，它能回答的問題數量有限，提問稍有偏離，程式就可能失效，輸出荒謬的答案。不過，將程式侷限在狹窄的領域確實有成效；程式能完成的任務不多，但表現非常出色。

20世紀70年代，另一位斯坦福大學教授愛德華·費根鮑姆（edwardfeigenbaum）對相關理念進行了更深入的探索。他是斯坦福大學人工智慧實驗室研究員，經常與約翰·麥卡錫合作。早期人工智慧試圖從零開始打造通用智慧；為了避免重蹈覆轍，費根鮑姆並沒有選擇拓寬威諾格拉德的程式或類似程式的應用範圍，而是直接將其轉移到另一個領域。畢竟，誰說計算機強大的語言識別和推理能力不能應用到現實世界呢？誰說計算機不能用來協助體檢或金融分析呢？如果不讓計算機回答關於幾何形狀的問題，而是給它一些疾病症狀、患者特徵資料庫、交易記錄和季度報告，讓它據此回答問題，會產生什麼結果？

費根鮑姆的創新開啟了後來被稱為"知識工程"（knowledgeengineering）的全新子領域。在這個子領域中，有關特定領域（醫學、製藥、金融或幾乎其他任何領域）的事實被整理成資料庫。機器可以讀取相關資料，像威諾格拉德的幾何形狀一樣進行分析，並以自然流暢的書面問答形式提供答案，實現了媲美諮詢人類專家的自動化體驗。

這些程式被稱為"專家系統"（expertsystems）。多年來，它們一直是人工智慧在現實世界中執行實用任務的最有力證據，也表明人工智慧可以成為企業甚至整個行業的基礎。由於人工智慧展現出顯而易見的商業應用場景，加上計算成本出現歷史性下降，在整個20世紀70年代和80年代，湧現出了一批致力於把知識工程的力量進行商業化的公司。

在早期的專家系統中，有個叫"內科醫生-i"（internist-i）的程式非常有名，其資料庫中包含500種疾病描述和3000種疾病表現。早期的實驗結果令人鼓舞，程式能夠根據使用者（一名真人內科醫生）提供的症狀觀察記錄，正確診斷出患者病情，即使在面對複雜的病例時，也能提供有用的資訊。其他早期的程式還包括molgen，可以幫助分子遺傳學家設計dna相關實驗；還有vm呼吸機管理程式，可以為依賴呼吸機的患者提供臨床醫生建議；還有secs化學合成模擬與評估程式，讓我們在早期就窺見了人工智慧在藥物研發方面的應用潛力。

儘管專家系統曾經令人興奮，但由於起始階段海量資訊的組織難度太大，後續開發經常陷入困境。在整合醫學教科書、研究論文、醫藥文獻甚至從業者訪談內容時，開發人員遇到的困難越來越多。更糟糕的是，即使這些系統看起來已經擁有足夠多的資料，其表現也往往無法與真實的人類專家相媲美。儘管系統掌握了大量資訊，檢索和處理速度也超人一等，但它們的推理依然呆板而膚淺，過於拘泥於明確定義的規則，缺乏常識，經常被意料之外的盲點所迷惑。

隨著商業興趣的減弱和資金的蒸發，許多人得出結論：智慧機器的想法固然有趣，但再一次難以成真。無論人工智慧未來如何（會是什麼形態？未來何時到來？我們如何抵達？），有一點越來越明確：這條道路不會一帆風順。

彷彿是為了把我從白日夢中搖醒，飛機在肯尼迪機場降落，輪子在跑道上一陣顛簸起伏。漫長而擁擠的飛行結束了，我鬆了口氣。在之前的14個小時裡，我大部分時間都在讀書，在那些長久以來安慰我的故事裡尋找最後的港灣。現在，嶄新的世界就在眼前，無論我多麼抗拒，它都要奪去我的注意力。機艙裡傳來悅耳又陌生的聲音，提醒著我，我已身處陌生之地。這不是什麼度假，也不是一場冒險；突然間，我唯一能理解的生活莫名其妙地結束了，我無法想象的新生活即將開始。下飛機的時候，我沒有感到一絲興奮。

取行李的時候，我的心情更加緊張了，唯一開心的事，就是終於可以在出口處跟父親團聚了。但幾個小時過去了，他還沒有出現。夕陽西下，一群群陌生人從我們身旁側身而過，我們的不解逐漸變成了恐懼。當深愛之人消失太久，人難免會胡思亂想，而我們的處境讓我們更加心急如焚：母親口袋裡只有20美元，我們沒有返程機票，而且我很快就發現，我在學校學了幾年的基礎英語在實際生活中一點兒用都沒有。

後來我們才知道，父親的車壞了，而且壞在了隧道里（對我們這個依靠破舊二手車出行的移民家庭來說，車子拋錨很快就會成為家常便飯）。如果放在以前，我們可能會對這種倒霉事一笑置之，但那天情況不同。當父親氣喘吁吁地奪門而入時，我和母親已經精疲力竭，一點兒歡聚的心情也沒有了。

我們行駛在陌生的高速公路上，經過一個又一個很難讀懂的路標。我開始意識到，我將要在這裡住下去了。不管這感覺多麼荒謬，不管我對新環境有多少疑惑和不解，這一點已經成為不可改變的事實。我只能勉強接受：就這樣吧，我到美國了。

我們的目的地是新澤西州一個叫帕西帕尼的小鎮。父親之所以選擇帕西帕尼，是因為這裡移民眾多，而且靠近高速公路。在地球另一端長大的我第一次接觸美國郊區的概念，立刻就感受到了差異。中國的城市市區人口密度很大，每一寸空間都被利用到極致：道路上擠滿了汽車和腳踏車，人行道上人流如織，建築物直插雲霄，連高樓之間的空間也被無限壓縮。中國是熱鬧匆忙的，是喧囂繁華的，沒有一刻停歇，城市由此被賦予了獨特的個性。

相比之下，帕西帕尼空曠而寂靜：空蕩蕩的人行道，悠閒駕車的司機，一切都顯得那麼寬敞。草坪環繞著只有一兩層樓高的獨棟住宅。小企業也擁有巨大的停車場，空車位比比皆是。這裡樹木葳蕤，花園隨處可見。就連空氣都彷彿更加清新，沒有我記憶中的工業氣息。

然而，留給我沉思的時間並不長，在車開進新家的那一刻，我的思緒就被強行拉了回來。為了順利開啟在美國的生活，我們還有很多事要做。第一件事就是適應大幅縮減的居住空間。我們的新家在一棟紅磚公寓樓內，與一路上經過的美麗街區相去甚遠；一家三口就要擠在二樓一套狹小的一居室裡。空間極其逼仄，我們只能湊合：我的床被放在了廚房和用餐區之間，我就睡在這個窄道里，直到後來搬家。為了佈置小家，我們會格外留心別人丟棄在車道和路邊的傢俱。落地還不到48小時，我又迎來了下一個任務：入學。

對一個在成都長大的中國學生來說，在帕西帕尼高中的最初幾天對我的感官造成了巨大沖擊。整個學校的氣氛躁動不安，周圍的一切都比我之前生活的世界更鮮豔、更快速、更沉重、更喧鬧。無論我朝哪個方向看，都沒有哪一樣在我的大腦裡有過印記，彷彿光線和聲音的本質在這裡都發生了改變。

光是顏色就讓人應接不暇。學生和老師們穿的衣服比我以往見過的任何衣服都要醒目，色調從大地色系到原色系，再到熒光色系，有純色的，也有帶條紋和圖案的，衣服上裝飾著字母、插圖、抽象圖案和品牌標識。除了衣服，還有帽子、太陽鏡、耳環、皮包和名牌背包，更不用說女孩們的妝容了----我從來沒見過十幾歲的孩子化妝。

當我拿到新課本時，才明白了背包的必要性----這些課本比中國的平裝課本要大得多。雖然大多數課本的邊緣都參差不齊，但質量卻出奇地好；每門課都配有一本裝訂精美的教科書，封面設計生動鮮豔，成百上千頁內容都是全綵印刷，拿在手裡極有分量。

更具衝擊力的是學生的行動方式。在中國，學生都有自己固定的座位，在課間也比較安靜。而在美國，下課鈴聲一響，學生便從一個教室蜂擁而出，大呼小叫著奔向下一個教室，青春期的活力如山洪般暴發，其中的緊迫感讓我不知所措。

最後就是這裡的人本身。美國孩子似乎普遍比較吵鬧粗暴，對老師似乎也缺乏尊重。雖然聽不懂美國學生跟老師在說什麼，但我從來沒見過誰會跟老師那樣說話。最讓我驚訝的是，不拘禮節似乎是雙向的。師生之間的互動常常是對抗性的，但也充滿了俏皮和溫暖。在這原本令我生畏的第一天，我立刻確定了一件事：我會喜歡美國的老師。

家裡的節奏相對熟悉，但同樣讓人身心疲憊。我突然進入了英語世界，即便是最簡單的家庭作業也要花上幾個小時，因為幾乎每一步都需要求助於兩本大詞典，一本是中英詞典，一本是英中詞典。這讓我感到非常沮喪。看來，我不得不把在中國上學時的遊刃有餘擱置一邊（更不用說我日漸萌發的對物理學的熱愛了），謙卑地回到起點。在可預見的未來，重新獲得自我表達能力將是我智力生活的中心任務。

幸好，我們的生活很有規律，因為父母跟我一樣忙碌。剛到美國不久，父親就遇到了一位臺灣商人，他利用自己的工程技能在這位商人的店裡找了份修理相機的工作。雖然工資微薄，工作也很辛苦，但掙的錢剛好夠我們維持生計。母親也找到了工作，她在臺灣人妻子經營的紐瓦克禮品店裡當收銀員。有了額外的收入固然可喜，但看到母親這樣有抱負的知識分子從事完全無法讓她施展才能的工作，我感到非常難過。父母下班都很晚，我們也沒錢點外賣，所以每天回到家後，不管有多麼累，父親都要趕緊準備晚飯。

過去三年，父親經常給家裡寫信，我現在也一樣。一有空暇時間，我就會給國內的家人和朋友寫信。每封信都是一個懇求。我希望他們能告訴我，雖然我已經離開了，但我愛的人和事，尤其是外祖母的廚藝，依然還在。他們總會回信告訴我我想聽的話，每次收到回信，我都既興奮又傷感。有生以來第一次，我夢中那個遙遠的世界不是神秘的異域，也不是未被發現的科學前沿，而是我最熟悉的地方。

現在回頭看，我還忍不住想，如果我當時意識到自己比以往任何時候都更接近現代科學革命（即使只是在地理位置層面），我的思鄉之情會不會得到紓解？來到美國，我的出身和未來之間的鴻溝縮小了，而在帕西帕尼安家，我和未來的距離被大大拉近了。我會在這裡度過青春期的剩餘時光，我還不知道，在距離新家不到一小時車程（沿著花園州公園大道僅有幾千米遠）的地方，歷史正在被翻篇。

在未來的某一天，楊立昆（yannlecun）會成為臉書的人工智慧首席科學家，但在我們到達美國時，他在新澤西州霍姆德爾的貝爾實驗室的研究生涯才剛剛起步。他為人謙遜但雄心勃勃，近些年引發了不小的轟動，因為他展示了"神經網路"（neuralnetwork）演算法在準確識別人類筆跡方面的能力。儘管這項技術仍然相對較新，遠未達到日後的普及程度，但與之前數十年的人工智慧傳統已經截然不同。神經網路演算法的目標不是用離散的規則來描述筆跡（1是直的，2是彎的，3是對稱的，諸如此類），而是從資料中推斷出模式。

楊立昆從美國郵政署拿到了7200多個手寫郵編的掃描件，涵蓋各種風格、質地，甚至包括常見的錯誤。他向神經網路演算法展示這幾千個真實的人類筆跡，讓機器也能像人類一樣學習相關模式，形成內化的直覺。這套直覺很難用傳統計算機程式的形式表達，但它使得演算法能夠以前所未有的方式理解真實世界的複雜混亂。

楊立昆的研究取得了巨大的成功。演算法的識別非常精準，在短短幾年內，它就被廣泛應用於全美的自動提款機上，用來讀取支票上的數字。在距離達特茅斯研究提案中首次提出人工智慧概念幾十年後，人工智慧領域終於取得了極具實用性的成就。

此前的幾代人試圖用規則詳盡描述智慧，演算法相對僵化，這種人工智慧通常被稱為"符號人工智慧"（symbolicai）；20世紀80年代末到90年代初，潮流開始轉向更自然的方法。楊立昆的成果就預示著一個大膽的未來。隨著時間的推移，行業研究重點從"通過明確程式設計來解決問題"轉變為"從示例中發現模式"。換言之，演算法不是被告知該做什麼，而是去學習該做什麼。研究人員給它起了一個貼切的名字："機器學習"（machinelearning）。

在科學的發展程式中，思想孕育的過程相對富有詩意。沒有任何一條自然法則規定洞察只有在能夠付諸實踐的前提下才會出現。很多靈感的火花都領先自己所處的時代幾年、幾十年，甚至幾個世紀，歷史上的例子比比皆是。而真正鼓舞人心的是，這些早期的思想家對於自己的發現抱有堅定的信念：無論前進的道路看起來多麼不切實際，無論實驗成功的前景多麼渺茫，偉大的科學家都被與生俱來的探索欲所驅使，再艱難的環境也澆不滅他們孜孜以求的熱情。機器學習幾十年的發展歷程即是如此。

機器學習的歷史可以說是人工智慧發展歷史中不太為人所知的章節。儘管圖靈本人很早就認可過機器學習，但這一概念相對來說仍然比較小眾。1950年，圖靈發表了一篇題為《計算機器與智慧》的論文，簡要對比了"基於規則的人工智慧"（rule-basedai）和機器學習。基於規則的人工智慧是指從零開始構建具有智慧行為能力的完整體，而機器學習指的是允許智慧體自主發展。圖靈問道："與其努力打造程式來模擬成人的思維，為何不嘗試用程式模擬兒童的思維呢？"事實上，機器學習自誕生之初就從人類認知中汲取了一定的靈感，這在很大程度上得益於神經科學等領域的同步發展。

早在19世紀，人們就對大腦的運作模式有了一些模糊的瞭解，但直到20世紀，我們今天所熟知的神經科學才開始逐漸形成。即便在那時，我們對大腦的認知也非常初級。就像第一批天文學家努力理解天空中天體的執行軌跡一樣，當時的科學家對大腦的瞭解也僅限於他們能觀察到的現象：電脈衝和化學訊號的洪流，在一層層潮溼又神秘的褶皺組織里穿梭。

在科學處於混沌期、世界對科學探索閉關自守之際，如果還能看到一線希望，那就是那些充滿好奇心的人正處在自己創造力的巔峰。他們從近乎虛無的狀態中提出各種假設。即使是微不足道的進步，也能帶來巨大的變革。隨之而來的滾雪球效應可能會讓人眼花繚亂。隨著20世紀中葉的臨近，神經科學即將確定該領域的基本概念，從而逐層建立真正的理論。這個時代與現代物理學的黎明期並無二致：當人類首次覺察到物理世界基本性質的蛛絲馬跡，即粒子和力是我們所看到的一切事物的基石時，我們對自然的理解就徹底改變了。

1943年，研究人員沃倫·麥卡洛克（warrens.mcculloch）和沃爾特·皮茨（walterpitts）共同發表文章，介紹了一項關於大腦基本單位"神經元"的新探索，把其中的生物學原理簡化為數學的本質概念，從而推動了神經科學的重要進展。他們的方法的關鍵在於抽象化：通過剔除真實大腦中變幻莫測的電化學過程，將神經元簡化為相對簡單的訊號交換。這種純粹的交換性分析----輸入什麼、輸出什麼，以及兩者之間如何相互關聯----產生了深遠的影響。不同於身體的其他部位，也不同於任何已知的自然結構，大腦似乎是唯一適合處理資訊的器官。

從某種意義上說，這個發現相當於神經科學領域的原子裂變，它揭示了在整個大腦中重複出現的根本模式，展現出驚人的一致性和穩定性：大腦可以被看作由簡單元素組成的大型網路，元素之間的聯絡可以隨著時間的推移而改變；通過將複雜的行為分佈於網路中，我們幾乎可以完成無限的任務，並且可以不斷學習新的任務，即使到了晚年也可以。

人類大腦的複雜性遠遠超越已知宇宙中的任何其他事物，但其構造又極其優雅，幾乎把複雜性全部掩藏。汽車或手機都是由清晰區分的零件組裝而成，這是人類設計師認為直觀的形式。但大腦的構造與此不同，它是由近1000億個神經元構成的巨大網路，其中的神經元就是一個個互相連線的微小單元，可以在電化學傳輸中精細聚焦。儘管整個大腦中的神經元行為受到類似概念的支配（至少在麥卡洛克和皮茨的模型層面上是如此），但神經元可以形成不同的網路，其排列和位置各不相同，可以應對各類挑戰，如視覺、聽覺、運動，甚至進行抽象思考。此外，大腦在最初在子宮內形成後的很長時間裡，才通過學習形成了（或者至少是逐漸完善了）這些網路結構。這就是為什麼儘管我們的灰質在解剖學上看起來並無二致，但每個人的個性、技能和記憶都是獨一無二的。

有了這樣清晰的模型，技術進步遲早會趕上研究界的好奇心。1958年就迎來了這樣一個時刻。康奈爾航空實驗室的心理學研究員弗蘭克·羅森布拉特（frankrosenblatt）發明了一種機械神經元，他稱之為"感知機"（perceptron）。雖然羅森布拉特的創意在概念上非常簡單，但當時的技術還沒有數字化，因此操作難度很大。他將自己的心理學背景與對電氣和機械工程的理解相結合，經過數月的辛勤努力，終於將數學模型轉化為一個實用的實際裝置。

更大膽的是，羅森布拉特的研究工作不僅實現了麥卡洛克和皮茨的想法，還結合了哈佛大學心理學家斯金納（b.f.skinner）提出的補充假設，對神經元的基本模型進行了擴充套件。斯金納認為，有些輸入對神經元行為的影響更大，這就好比不同的讀者可能會對閱讀的內容產生不同程度的信任和懷疑。如果允許這些影響隨著時間的推移而變化，隨著任務的成功或失敗而增強或減弱，那麼從本質上看，神經元網路本質上就可以進行學習了。

羅森布拉特運用相關原理，設計了一個由400個光感測器組成的畫素為20的攝像頭。他把每個感測器的輸出連線到感知機上，讓感知機學會識別視覺模式，比如識別面前的索引卡上繪製的形狀。由於每個感測器的初始影響權重是隨機設定的，因此係統對所見影像的分類也是隨機的。而羅森布拉特就是感知機的老師，他會用開關來告訴感知機哪些行為是正確的，哪些是錯誤的。通過這種方式，系統就能確定每個感測器的輸入對答案的影響，並相應地增強或減弱這一影響。隨著這個過程的重複進行，感知機就逐漸獲得了形狀識別的可靠能力。

在通過機器重現認知基礎方面，羅森布拉特的感知機被譽為重大進步，研究界對他的工作成果進行了熱切探索。然而，隨著感知機的侷限性逐漸凸顯，人們的興奮之情逐漸消退。研究人員開始質疑感知機能夠解決的問題的範圍，甚至包括理論層面能解決的問題，而當時技術條件有限，只能進行最簡單的實施，無法進行更復雜的實驗。

有意思的是，1969年，達特茅斯暑期專案發起人之一馬文·明斯基與電腦科學先驅西摩·佩珀特（seymourpapert）合著的《感知機》（perceptrons）一書出版，明斯基成為感知機最知名的批評者之一。這本書在肯定感知機優雅之處的同時，也對其進行了猛烈的抨擊，指出感知機的設計缺乏嚴謹的理論基礎，並列舉了許多導致感知機應用範圍極窄的弱點。儘管明斯基的觀點沒有被普遍視為這個問題的最終結論，許多同時代的人也提出了反駁意見，但是感知機的聲譽已經受到了損害。在接下來的十幾年裡，整個機器學習領域（特別是感知機）都將被置於人工智慧的一隅。

在廚房裡幾乎無法交流。這裡的噪聲很大，有時候即使大聲喊叫，也聽不清對方在說什麼。雖然聘用我的經理會說普通話，但廚師大多隻說廣東話----我既不會說，也聽不懂。新來的我笨手笨腳，又容易礙事，所以儘量縮在角落裡，不去理會那些近乎戲劇化的混亂場景：風扇的轟鳴聲、炒鍋發出的吱吱聲，還有各種金屬邊緣碰撞和刮擦的聲音。明火從炒鍋裡躥出來，照亮了整個廚房，水柱從鍋碗瓢盆上濺射而過。一個廚師發出低沉的"嘿"聲，並向我示意，然後急匆匆地把一份做好的菜放在我面前。開始工作吧，我想。我以最快的速度把盒子裝進外帶袋，又放入餐巾紙、餐具，還有一些籤語餅和醬油包，然後繫緊提袋的提手。我雙臂抱著袋子，深吸一口氣，溜出廚房，進入用餐區。隨著焦慮的情緒在體內蔓延，我匆忙的腳步開始加快，不禁小跑起來。

"飛飛！"我聽到經理低聲呵斥。

我意識到自己的錯誤，立刻停了下來，嘆了口氣。

"我跟你說過多少次了？不要在用餐區跑來跑去。你的任務是把訂單送到前臺，而不是讓顧客覺得煩心。別逼我再說一遍。"可惡。我點了點頭，結結巴巴地道了歉，然後小心翼翼地提著外賣包走完了剩下的路。

最能寬慰我思鄉之情的就是每個月給外祖父母打電話。他們兩個是我最掛念的人，聽到他們的聲音，我就會立刻把所有煩惱拋到九霄雲外。但長途電話費貴得嚇人，每次通話都匆忙到殘忍。連跟最愛的人說說話都要爭分奪秒，這種感覺實在荒謬。每當快到掛電話的時候，母親的語速就會越來越快，讓我聞之心碎。幾個月後，我受夠了。有些屈辱是我拒絕接受的。如果錢是唯一能擺脫束縛的方法，我決定自己去賺錢。

我通過報紙上的分類廣告找到了第一份工作，在商業街上一家狹小昏暗的中餐館裡當服務生。這並不是正式的工作，所以不受勞動法和新澤西州最低工資標準的約束，僱用條款也反映了這一點：在學校沒課的時候，我要從上午11點工作到晚上11點，每天12個小時，每小時2美元的工資。當地人警告我說周圍的街區不太安全，到了晚上我會害怕的。他們強烈建議我每晚都要搭車回家，我照辦了，從沒有過例外。

因為兼職工作不穩定，所以我也同時在尋找其他工作。分類廣告不斷為我提供新的工作機會。在整個高中階段，除了在中餐廳打工，我還每週去給人做家務，這份工作薪水更高但時數少；我還遛過狗，這可能是我賺得最少但最享受的工作，也是父親格外感興趣的一份工作。

只要我按時上下班，就能搭車來往於城裡危險的區域。雖然工資一直很低，但我之前沒有工作經歷，所以也無從比較。不過，即便是如此微薄的收入，也能大大改善我們的生活，這讓我感覺很棒。我也可以忍受工作時長----畢竟工作時間越長，為家裡賺的錢就越多。

這些工作讓人感到疲倦的地方在於移民經歷籠罩的不確定性。我周圍都是勤奮自律的人，有著跟我相似的故事，但我們似乎註定要陷入貧乏和卑微勞動的迴圈中，沒人可以擺脫。我們來到這個國家，希望尋求其他地方沒有的機會，但我卻看不到任何通往這些機會的路徑。

我們的處境已經夠令人沮喪了，然而移民群體內缺乏鼓勵更加讓人情緒低落。這一點在工作中體現得尤為明顯----為了勉強維持生計，我們都承受了巨大的壓力，因此對任何偏離常規的行為都持粗暴的懷疑態度。我在餐廳親身體會到了這一點。每天下午，我都會利用唯一的休息時間重溫母親與我分享的西方經典著作的中文譯本。即便在那個時候，或者說，尤其是在那個時候，我仍然會被那些充滿內涵的散文深深吸引，因為我正在英語方面苦苦掙扎，極其渴望重拾自信、表達自己。每翻一頁都會把我帶回過去----那個能確定自己在世界上的位置、不像現在這樣飄搖的年代。

直到有一天，經理直截了當地告訴我看書是在浪費時間，還不如利用這個時間去打掃衛生間。回想起來，我覺得同為移民的他絕不是在居高臨下地對我指手畫腳，只是這件事再次提醒我，對我們這樣的人來說，想象力在新生活裡是多餘的。這實在令人沮喪。

不管怎麼說，努力還是得到了回報。我們開了一個銀行賬戶，開始了每週一次的例行儀式，就是把我的收入（當然都是現金）存進銀行。錢雖然不多，但我們家終於有一筆可以自由支配的資金了，大家都很開心。從那時開始，我們終於可以每個月都存下一些錢，去商店買東西也不用那麼在意價格了。最重要的是，母親給家裡打電話時也恢復了一些鬆弛。她的語氣就是對我的獎勵----她和外祖父母的交談雖然仍然簡短，但口吻卻跟我記憶中在成都餐桌上的一樣不緊不慢。

科學史往往是曲折、諷刺而又殘酷的。新的思想被發現，然後被丟棄，接著又有新的思想被發現。被幾代人視為基石的範式有時會在一夜之間被推翻，而推翻這一切的常常是顯而易見的觀察結果。恰恰因為這些觀察太過簡單，反而更容易被領域內最傑出的人物所忽視，從而為局外人發起革命創造了條件。正是這種既和諧又衝突的搖擺節奏，才使得科學追求如此戲劇化。

正如前文所述，就在羅森布拉特研發感知機的時候，出現了一項研究成果，可以解釋感知機為何從未達到預期效果，以及以後類似機器如何才能成功。然而，這項研究成果來自另外一個領域。1959年，神經生理學家戴維·休伯爾（davidhubel）和託斯登·威塞爾（torstenwiesel）在哈佛大學進行了一項開創性的研究，研究了哺乳動物的大腦，特別是貓的視覺皮質。實驗在暗室裡進行，研究人員將基本形狀的圖畫投射到牆壁上，精確控制貓所看到的東西，包括線條、縫隙和其他簡單的細節，並仔細觀察其神經元的反應方式。

休伯爾和威塞爾的研究發現，感知不是發生在單個神經元層次上，而是通過由多層神經元組成的層次結構進行的。這個層次結構從對錶面細節的識別開始，最終到達複雜的高階意識。例如，第一層神經元可能會注意到一些細微的視覺特徵，如特定角度的邊緣、獨特的紋理，或一抹絢麗的色彩。每一層神經元都聚焦在整體場景中的一個狹窄區域，稱為"感受野"（receptivefield）。這些視覺細節單獨來看並沒有太大意義，但當它們傳遞到下一層時，就會整合成為更復雜的形狀和特徵，覆蓋更廣闊的感受野，就像是拼圖拼接在一起，展現出更大的影像片段。

最終，當這些逐步整合的細節被傳遞到最後一層時，我們就能感知到面孔、物體、地點等有意義的事物。由於大腦的網路結構允許無數步驟同時進行，我們的感知體驗是連續不斷、充滿活力的。休伯爾和威塞爾的研究成果改變了我們對感官知覺的理解，二人因此獲得了1981年的諾貝爾生理學或醫學獎。

早期對人工智慧滿懷希望的研究人員一直在尋找可以遵循的模式。儘管休伯爾和威塞爾的發現似乎是為他們量身定做的，但這一研究成果幾年以後才為世界所熟知。在此期間，羅森布拉特因一次划船事故不幸去世，年僅43歲。但在1980年，這一研究成果的運用帶來了變革。福島邦彥是一位日本研究員，在東京nhk廣播科學研究實驗室工作。他開發了一種由多個感知機組成的演算法（現在已經通過軟體實現），將感知機堆疊成一個連線的層次結構。由於每一層對複雜模式的敏感度都超過下一層，因此整個演算法可以識別出多層次的細節以及它們之間的關係。

福島邦彥將這一成果稱為"新認知機"（neocognitron）。新認知機對輸入資料的異常具有很高的復原力和容忍度，因此在準確辨認筆跡方面取得了突破性的進展。由於筆跡極不規則且風格多樣，筆跡辨認一直是個棘手的問題。

然而，新認知機的成功只是揭示了一個新的障礙----這是科學界常見的現象。雖然這一演算法功能強大、用途廣泛，但由於它的架構過於複雜，在實際訓練中，針對更為簡單的前代演算法所開發的方法並不適用，因為它們沒有新認知機密集的連線內層。進展再次陷入停滯。直到幾年後，機器學習的下一塊拼圖才終於浮出水面。

1986年，由加州大學聖迭戈分校教授大衛·魯梅爾哈特（davide.rumelhart）領導的一個研究人員小組在科學雜誌《自然》（nature）上發表短篇研究報告，介紹了一種能讓新認知機等演算法有效學習的技術。他們將其稱為"反向傳播"（backpropagation），名字來源於這一技術最顯著的特徵：在這種級聯效應中，每個訓練例項（具體來說，是網路對給定刺激的反應與正確答案之間的差異）通過網路的一端傳遞到另一端，並逐層進行誤差的遞減調整。

然而，真正使反向傳播大放異彩的，是網路結構隨著時間的推移出現的變化。隨著網路接觸到越來越多的例項（如照片或音訊波形集），神經元之間的連線就會因所見所聞而被重塑，留下越來越詳細的印記。就像流淌幾百年的河水雕刻出的峽谷壁一樣，在經過一定的訓練後，神經網路會逐漸呈現出特定的特徵。經過多年的努力，神經網路突然開始以前所未有的規模進行學習，並達到了前所未有的精確度，這預示著真正的轉折點即將到來。

雖然魯梅爾哈特是首席研究員，但他的兩位合著者之一傑弗裡·辛頓（geoffreyhinton）才是與反向傳播聯絡最緊密的人物。辛頓當時是卡內基梅隆大學的教授，從小就被智慧之謎所吸引，其職業生涯致力於探索重現智慧的新方法。他孜孜不倦地探索各種新穎的機器學習方法，為這一領域的早期復興做出了巨大貢獻。那是一個神經網路穩步發展的時代，網路層數越來越多，神經元連線越來越複雜，訓練技術也越來越完善。楊立昆是辛頓的第一批學生，他把這些研究成果應用到了識別手寫郵編這一極具實用性的場景，引起廣泛關注。在不到十年的時間裡，機器學習這樣一個曾經遙不可及的夢想終於在現實世界中開花結果。