AI機器人喊出“中國臺灣省” 語音識別揭秘其愛國本源!
如果從機器人口中蹦出你從未聽過的句子,驚不驚喜?意不意外?
本文引用地址:http://butianyuan.cn/article/201804/378110.htm最近,中國臺灣的一款AI機器人在回答問話的過程中,就爆了金口,說出中國臺灣省,這是不是很愛國?
前不久,在臺南科學園區(qū)日前舉辦AI機器人展會,由華碩開發(fā)的家居智能機器人“Zenbo”在展會上問到“這里是不是臺灣?”“Zenbo”當場回答“中國臺灣省臺南市。”會后,“獨派”基進黨會后發(fā)布聲明表達“抗議”。
據(jù)了解,這款機器人Zenbo由華碩開發(fā),屬于家居智能機器人,擁有許多生活應用與智慧功能連結(jié),號稱可以說故事以及與人智能互動。去年11月以中文名稱“小布”在大陸亮相,在軟件方面導入騰訊“云小微平臺”,提供包含QQ音樂、騰訊視頻、小微百科、企鵝FM、新聞、氣象等在地化的服務及應用。“小布”的市場行銷規(guī)劃除了兩岸之外,今年也要進軍美、日市場。
事實上,機器人在大陸這邊說出“中國臺灣省”,并不會讓人感到驚奇,因為在所有國人的心中,臺灣是中國神圣領土不可分割的一部分,稱其為省也是理所當然。然而,對于那些一心想獨立的臺獨分子來說,機器人說出“中國臺灣省”就有些掛不住面子了。
機器人語言詞匯來自哪里?
那么,機器人為何會出現(xiàn)這種不經(jīng)意間說出意想不到的詞匯的這種情況呢?
這還要從機器人的語音識別系統(tǒng)說起,每一臺機器人都有一個語音庫,語音庫中的詞匯會根據(jù)實際應用中的情況不斷更新,實際中交流時的詞匯是怎樣的,呈現(xiàn)在機器人的語言里就是怎樣的。也就是說,現(xiàn)階段的機器人還遠遠達不到自我創(chuàng)造語言的程度,而更像是反映人類自身行為的鏡子。
正是因為在大多數(shù)人的認知里,臺灣是中國領土不可分割的一部分,甚至很多人把臺灣當做中國的一個省,這樣的語言交流成為絕大多數(shù)時,AI機器人的語音識別就會把這類語言現(xiàn)象當做一個事實。因此,再從機器人的口中說出來也就再正常不過了。
由此看來,AI機器人“Zenbo”比臺獨分子更能了解社情民意,因為其代表大多數(shù)的語音識別數(shù)據(jù)庫已經(jīng)證實了臺灣是中國一個省的事實。
語義識別是聊天機器人的下一步
如果是臺灣的這款AI機器人說出“中國臺灣省”不過是基于語音庫作出的自然選擇,只能證明是聊天機器人在語音識別的階段的基本表現(xiàn)。那么,達到語義識別的聊天機器人又會有哪些表現(xiàn)呢?
在聊天機器人的背后,其實是一套復雜的系統(tǒng),主要包括5個功能模塊:語音識別模塊、自然語言理解模塊、對話管理模塊、自然語言生成模塊、語音合成模塊。
首先,語音識別模塊負責接收用戶輸入的語音并將其轉(zhuǎn)換成文字形式。
然后,自然語言理解模塊在理解了用戶輸入的語義之后將特定的語義表達式輸入到對話管理模塊中。
接著,對話管理模塊負責協(xié)調(diào)各個模塊的調(diào)用及維護當前對話狀態(tài),選擇特定的回復方式并交由自然語言生成模塊進行處理。
最后,自然語言生成模塊生成回復文本輸入給語音合成模塊將文字轉(zhuǎn)換成語音輸出給用戶。
通常來說,聊天機器人系統(tǒng)中的自然語言理解功能包括用戶意圖識別、用戶情感識別、指代消解、省略恢復、回復確認及拒識判斷等技術(shù)。
對話管理功能主要協(xié)調(diào)聊天機器人的各個部分,并維護對話的結(jié)構(gòu)和狀態(tài)。對話管理功能中涉及到的關鍵技術(shù)主要有對話行為識別、對話狀態(tài)識別、對話策略學習及對話獎勵等。
自然語言生成通常根據(jù)對話管理部分產(chǎn)生的非語言信息,自動生成面向用戶的自然語言反饋。
目前來看,人類不過剛剛邁過了語音識別的門檻,甚至科大訊飛等公司中文的識別的準確率提升到97%以上,但是機器人作出的反饋則是基于語音庫的自然連接,和被動輸出已經(jīng)形成的答案。聊天機器人在現(xiàn)階段還做不到自己對聊天內(nèi)容理解基礎上的回答。曾經(jīng)因接受采訪而聲名鵲起的索菲亞機器人,后來被證明不過是通過后臺控制只能背誦標準答案的騙子。
點評:聊天機器人不神秘也不神話,它不過是語音識別在智能機器人身上的一個應用罷了。目前語音識別還難以突破語義理解的門檻,哪天人類在語義理解上突破了語義理解的瓶頸,讓機器人能真正聽懂人話,真正的AI機器人時代才會到來。
評論