黑科技超級輔助第197章語音識別

無他，只是因為現實生活中沒有惡龍來給他殺。一個殺雞的可能都比他在現實生活中，更容易生存下去。

最後林奇決定還是自己來搞這個模型，不僅僅語音識別是需要大量的資料，現在所有的涉及到深度學習的都是需要大量的資料來進行訓練。

林奇並不覺得這是絕對正確，就像我們人類一樣，比如一個新奇的物種，並沒有見過，然後你給他了一張照片，說這是神獸饕餮，然後等他再次看到的時候，他很容易就能認出來，那個是不是神獸饕餮。

林奇想做的是能通過少量的樣本就能訓練出來一個不錯的模型，這樣就可以解放語音的大資料。

同時一個人上手的時間更短，想想即使一個人口音很重，用了智慧語音軟體說了幾十句話，或者十幾句話之後，準確率大大提高，可以堪比用標準的新聞聯播主持人那樣的普通話說出來的識別率。

其實在自然語言方面，林奇之前有一些經驗，是在創造自然語言程式設計的時候。

但是裡面設計到的多是語義的一些解析，沒有涉及到語音識別。

林奇相信只要自己能通過第一關卡，那麼後面的應該都很簡單。

為了這個目的，林奇瘋狂的投入到了開發中。

林奇把每一個的漢字讀音都收集了起來，然後有語料資料的時候，林奇把這個語料做了一個分類。

一個是標準讀音串起來的語音，一個是真實的語音。

林奇先處理了真實語音，把真實語音分成了環境音和人聲。

接著又拿出來人聲和原來的標準讀音進行對比，找出來了兩者的差異。

經過不懈的努力，還真的找出來了同一個人在說不同話的時候有一些相同的東西。

就像不同地方的人有不同地方的口音一樣，一個人說話的時候，與標準的普通話有固定的「偏差」。

找出來了這個「偏差」，林奇非常興奮，他覺得這個可能是他最近一段時間研究，最大的成果了。

有那個處於地下四層之下的量子生物計算機的強大後盾，林奇研究出來了這個「偏差」，又基於這個做出來了一套新的語音模型。

這種新的模型，與市面上的模型都不一樣，市面上的模型都是一個固定的，比如使用者和b使用者安裝後得到的都是一樣的模型。

而這個不一樣，開始安裝的時候都是一樣的，但是人們說的話越多，他得到的資料越多，就越精確，並且模型會根據這個人的語音輸入而變化，以至於可以達到千人千面，甚至億人億面。

這也是因為第二智慧科技有生物計算機在後面作保證的，如果沒有這些功能和儲存都很厲害的生物計算機，這是不可能實現的。

第二智慧科技也有一支團隊在做語音識別，不過他們就是按照常規的深度學習來做的建模。

最近他們遇到了一個問題，找到了林奇這裡。

第197章 語音識別