為了能夠更好地和林小星進行溝通,林鴻最近在研究tts技術,即文字語音轉換技術。
在此之前,他和林小星進行溝通,只能通過文本進行,雖然他有超腦系統,可以通過視網膜屏檢視,但是有時候還是有些不習慣,並且,林小星如果要取代他對公司進行管理,肯定必須能夠說話才行。
按照林鴻的想法,他將會一步一步讓林小星朝著人類的方向發展。
不但是軟體方面,還包括硬體。
現在條件還不允許,只能先將軟體方面的工作做好,然後再慢慢發展硬體,基本上,只要等3d列印技術成熟之後,他就有把握,給林小星製作一個完美的軀體,讓其從大猩猩的大腦中轉移出來,畢竟老是呆在大猩猩體內,感覺挺怪的。
技術設計到聲學語言學數字訊號處理技術多媒體技術等多個學科技術,在目前還屬於一種非常前沿的技術,很多it巨頭如ibm微軟和蘋果公司都投入了巨大的人力和物力在進行這方面的研究,並且取得了一定的成果。
技術,進行文字和聲音訊率的對應是非常簡單的,最能體現技術的地方在於其轉換時間的長短語音音律之間是否流暢發音是否自然等等。
簡單地將音訊和文字對應,雖然可以讓文字發聲,但是在上下文過程中的切換在人耳聽來,會顯得格外的生澀,一聽就知道是機器人在發聲,這也是很多影視作品中,區別機器人和人類的一個重要特徵。
很顯然,林鴻要做的語音發聲引擎,並不是這麼簡單,他必須讓林小星發聲之後,別人根本聽不出什麼生澀感,就好像是真人在說話一樣。
原本要做到這一點,短時間內肯定是無法完成的,畢竟這方面所涉及到的技術不少,林鴻必須著手去建立相應的語音資料庫習慣語法庫之類的庫,而這部分工作是非常消耗時間的。
不過現在有了林小星,並且其他大公司也做了很大一部分這方面的工作,林鴻現在要做就變得非常簡單了。
林小星幫他蒐集了很多有關這方面的資料,他可以直接利用那些公司很多現成的東西,然後有針對xg地進行改進。
文字轉語音比較簡單,只要在之前設定好標準的語音庫,以及語調方面的東西就可以了,林小星再靈活地調整運用一下,最終建立一個適合她自己風格習慣的資料庫,就可以讓人根本難辨真假。
關鍵的難點在於語音轉文字,或者說林小星對語言的理解。
每個人的發音習慣都不同,並且還有可能帶有方言,發音不準等因素。這可不是簡單的一一對應就行了,要是這樣,需要建立的資料庫就太為龐大了。
好在林小星本身並不是單純的邏輯xg人工智慧,她是在基於三進位制和神經網路的基礎上誕生的,擁有一部分情感和模糊處理能力,對語音的變聲變調,經過一段時間的訓練之後,她便可以自然而然地在腦盤當中建立一種模糊處理機制,最終理解語音中的資訊。
林鴻一個人對她進行訓練效率太慢,最終她直接入侵到了電話公司接收廣播電臺訊號甚至是某些zhèng機構的監聽網路中,主動進行學習和訓練。
這個過程持續了將近一週的時間,她才真正掌握了模糊語音處理機制,成為了一個語言大師,掌握了超過三百種主流語言,一百多種世界各地的方言。
當林鴻得知這個訊息之後,不由非常羨慕她的這個能力。這就是人工智慧的強大之處,要是人類本身,掌握這門多種語言幾乎是不存在的,就算是存在這種人,也必須花費極大的經歷和時間去學習,根本不可能在短時間內就掌握這門多種語言。
計算機的優勢就在於這裡,處理一個單位和多個單位的相同工作,所花費的成本基本相差不大,很多東西都可以量化,並且穩定,不像人腦,不確定的因素太多,也無法批次化進行,沒有可重複xg。
林鴻使用幾種不同的語言對林小星進行了測試,結果證明,她的確完全掌握了這些語言,使用起來非常熟練,並且極其地道,使用本地的習語或者典故,都沒有任何障礙,猶如一個博學的語言學家一般。
林鴻開玩笑道:小星,有了這個本領,你下半輩子都不用愁了,去當翻譯絕對可以賺大錢。
林小星道:還用得著我去當翻譯嗎,只要編寫一個翻譯語言軟體不就行了
林鴻對此啞然失笑。
林小星雖然已經非常人xg化了,但是還是缺少點幽默感,做什麼事情都一本正經的。
不過她的話倒是提醒了林鴻,公司似乎又有了一個新的產品,並且有著非常廣闊的應用前景。
作者「瘋狂小強」的其他小說
《修仙高手再戰都市》