第197章 語音識別

無他,只是因為現實生活中沒有惡龍來給他殺。一個殺雞的可能都比他在現實生活中,更容易生存下去。

最後林奇決定還是自己來搞這個模型,不僅僅語音識別是需要大量的資料,現在所有的涉及到深度學習的都是需要大量的資料來進行訓練。

林奇並不覺得這是絕對正確,就像我們人類一樣,比如一個新奇的物種,並沒有見過,然後你給他了一張照片,說這是神獸饕餮,然後等他再次看到的時候,他很容易就能認出來,那個是不是神獸饕餮。

林奇想做的是能通過少量的樣本就能訓練出來一個不錯的模型,這樣就可以解放語音的大資料。

同時一個人上手的時間更短,想想即使一個人口音很重,用了智慧語音軟體說了幾十句話,或者十幾句話之後,準確率大大提高,可以堪比用標準的新聞聯播主持人那樣的普通話說出來的識別率。

其實在自然語言方面,林奇之前有一些經驗,是在創造自然語言程式設計的時候。

但是裡面設計到的多是語義的一些解析,沒有涉及到語音識別。

林奇相信只要自己能通過第一關卡,那麼後面的應該都很簡單。

為了這個目的,林奇瘋狂的投入到了開發中。

林奇把每一個的漢字讀音都收集了起來,然後有語料資料的時候,林奇把這個語料做了一個分類。

一個是標準讀音串起來的語音,一個是真實的語音。

林奇先處理了真實語音,把真實語音分成了環境音和人聲。

接著又拿出來人聲和原來的標準讀音進行對比,找出來了兩者的差異。

經過不懈的努力,還真的找出來了同一個人在說不同話的時候有一些相同的東西。

就像不同地方的人有不同地方的口音一樣,一個人說話的時候,與標準的普通話有固定的「偏差」。

找出來了這個「偏差」,林奇非常興奮,他覺得這個可能是他最近一段時間研究,最大的成果了。

有那個處於地下四層之下的量子生物計算機的強大後盾,林奇研究出來了這個「偏差」,又基於這個做出來了一套新的語音模型。

這種新的模型,與市面上的模型都不一樣,市面上的模型都是一個固定的,比如使用者和b使用者安裝後得到的都是一樣的模型。

而這個不一樣,開始安裝的時候都是一樣的,但是人們說的話越多,他得到的資料越多,就越精確,並且模型會根據這個人的語音輸入而變化,以至於可以達到千人千面,甚至億人億面。

這也是因為第二智慧科技有生物計算機在後面作保證的,如果沒有這些功能和儲存都很厲害的生物計算機,這是不可能實現的。

第二智慧科技也有一支團隊在做語音識別,不過他們就是按照常規的深度學習來做的建模。

最近他們遇到了一個問題,找到了林奇這裡。