科大訊飛的人工智能之路
今年,李世石與Alpha Go的人機(jī)圍棋大戰(zhàn)吸睛無(wú)數(shù),人工智能的話題始料未及地席卷了世界每處。今年也恰逢人工智能學(xué)科誕生一甲子,歷經(jīng)波折的人工智能發(fā)展終于掀起全球熱潮,各國(guó)政府紛紛提出人工智能發(fā)展研究相關(guān)計(jì)劃,蘋(píng)果、谷歌等國(guó)際IT產(chǎn)業(yè)巨頭也相繼推出一系列人工智能應(yīng)用,希望在新一輪人工智能技術(shù)競(jìng)爭(zhēng)中取得先機(jī)。
本文引用地址:http://butianyuan.cn/article/201611/339519.htm科大訊飛作為亞太地區(qū)最大的智能語(yǔ)音和人工智能上市公司,也是中國(guó)智能語(yǔ)音與人工智能產(chǎn)業(yè)的領(lǐng)導(dǎo)者,在語(yǔ)音合成、語(yǔ)音識(shí)別、口語(yǔ)評(píng)測(cè)、自然語(yǔ)言處理等多項(xiàng)技術(shù)上擁有國(guó)際領(lǐng)先成果。目前,科大訊飛已經(jīng)占有中文語(yǔ)音技術(shù)市場(chǎng)70%以上的市場(chǎng)份額。
在人工智能技術(shù)鉆研與產(chǎn)業(yè)布局上,科大訊飛也較早提出了明確的思路與方向。2014年,“訊飛超腦”計(jì)劃應(yīng)運(yùn)而生,目標(biāo)是讓機(jī)器實(shí)現(xiàn)從“能聽(tīng)會(huì)說(shuō)”到“能理解會(huì)思考”;2015年,科大訊飛發(fā)布的具有里程碑意義的人機(jī)交互界面AIUI現(xiàn)在聚合了超過(guò)18萬(wàn)的開(kāi)發(fā)伙伴和8億的終端用戶,以科大訊飛為中心的人工智能產(chǎn)業(yè)生態(tài)已經(jīng)逐步構(gòu)建??拼笥嶏w力求在人工智能時(shí)代真正到來(lái)時(shí)全面開(kāi)花,搶占人工智能產(chǎn)業(yè)高點(diǎn)。
科大訊飛是如何發(fā)展的?
1999年,還在中國(guó)科學(xué)技術(shù)大學(xué)就讀的劉慶峰面對(duì)當(dāng)時(shí)中文語(yǔ)音市場(chǎng)由國(guó)際巨頭把持的現(xiàn)狀,懷揣“中文語(yǔ)音技術(shù)必須由中國(guó)人做到全球最好,中文語(yǔ)音產(chǎn)業(yè)必須掌握在自己手上”的信念,毅然創(chuàng)立了科大訊飛。
從6個(gè)人的團(tuán)隊(duì)到后來(lái)18個(gè)人創(chuàng)業(yè),一度并沒(méi)有人相信這個(gè)“草臺(tái)班子”能夠與國(guó)際巨頭抗衡。初期的科大訊飛遭逢創(chuàng)業(yè)的種種艱難,直至5年后,公司才終于實(shí)現(xiàn)盈虧平衡。在盈利的博弈與權(quán)衡中,語(yǔ)音技術(shù)與產(chǎn)業(yè)當(dāng)時(shí)被牢牢確立為公司的發(fā)展目標(biāo)和方向。巨大的壓力之下,磨礪出的是堅(jiān)持創(chuàng)新和堅(jiān)忍不拔的寶貴品質(zhì),這也成為科大訊飛一貫堅(jiān)守和傳承的核心精神。
創(chuàng)立近10年后,科大訊飛迎來(lái)了一個(gè)發(fā)展拐點(diǎn):上市。2008年的中國(guó)風(fēng)云變幻,科大訊飛上市猶如浪潮中的一簇小水花,卻激起了自身的滔天巨浪。技術(shù)仍然是核心,產(chǎn)品和市場(chǎng)意識(shí)逐漸走上舞臺(tái)。劉慶峰帶領(lǐng)團(tuán)隊(duì)進(jìn)一步梳理了公司的愿景和使命,立志要讓事業(yè)影響中國(guó)未來(lái),影響到每一個(gè)普通人的生活中。
功夫不負(fù)有心人。憑借核心技術(shù)的絕對(duì)優(yōu)勢(shì),科大訊飛在歷次的國(guó)內(nèi)外語(yǔ)音合成評(píng)測(cè)中,各項(xiàng)關(guān)鍵指標(biāo)均名列第一,2008年至今連續(xù)在國(guó)際語(yǔ)種識(shí)別評(píng)測(cè)大賽中名列前茅,2003年和2011年兩次榮獲“國(guó)家科技進(jìn)步獎(jiǎng)”,2005年和2011年兩次獲得中國(guó)信息產(chǎn)業(yè)自主創(chuàng)新最高榮譽(yù)“信息產(chǎn)業(yè)重大技術(shù)發(fā)明獎(jiǎng)”。
2010年,科大訊飛發(fā)布了語(yǔ)音云平臺(tái)和輸入法,云平臺(tái)面向所有創(chuàng)業(yè)者免費(fèi)開(kāi)放,為海量用戶提供服務(wù)。數(shù)據(jù)的抓取、資源的整合,顯示的是科大訊飛決策未來(lái)的戰(zhàn)略決心。在此基礎(chǔ)上,隨著人工智能時(shí)代的來(lái)臨,科大訊飛連續(xù)發(fā)力:2014年發(fā)布“訊飛超腦”計(jì)劃,核心就是讓機(jī)器從“能聽(tīng)會(huì)說(shuō)”到“能理解會(huì)思考”;2015年發(fā)布對(duì)人工智能產(chǎn)業(yè)具有里程碑意義的人機(jī)交互界面——AIUI。在教育、家居、客服、車載、醫(yī)療等細(xì)分領(lǐng)域,科大訊飛依托人工智能技術(shù)達(dá)成廣泛合作,推出品類豐富的產(chǎn)品體系覆蓋市場(chǎng)。
2016年5月,ResearchMarkets最新發(fā)布的報(bào)告稱在全球語(yǔ)音市場(chǎng),谷歌、微軟、蘋(píng)果和科大訊飛獲得了迅速增長(zhǎng),全球市場(chǎng)份額分別為20.7%、13.4%、12.9%和6.7%,科大訊飛已經(jīng)代表中國(guó)民族創(chuàng)新企業(yè)站上了國(guó)際舞臺(tái),在全球競(jìng)爭(zhēng)中占據(jù)一席之地。放眼未來(lái),科大訊飛將繼續(xù)推動(dòng)萬(wàn)物互聯(lián),并推動(dòng)整個(gè)IT產(chǎn)業(yè)第六次浪潮的到來(lái)。
“訊飛超腦”——科大訊飛的人工智能布局
美國(guó)、歐盟等發(fā)達(dá)國(guó)家分別提出了“Brain Initiative”和“Human Brain Project”等人腦研究計(jì)劃,投入巨資并將其提升到與“人類基因圖譜”重大工程并重的高度。蘋(píng)果、谷歌等國(guó)際IT產(chǎn)業(yè)巨頭亦相繼推出了Siri、Google Now語(yǔ)音搜索等一系列人工智能應(yīng)用。全球政府、企業(yè)都已將目光投向人工智能行業(yè),各顯神通。
人工智能的突破與“認(rèn)知革命”緊密相關(guān)。七萬(wàn)年前,人類發(fā)生了“認(rèn)知革命”,核心是智人擁有豐富的語(yǔ)言,可以更好的描述自然世界、執(zhí)行更加復(fù)雜的計(jì)劃,關(guān)鍵是可以描述夢(mèng)中和想象的東西,從而產(chǎn)生虛構(gòu)、宗教和各種概念。正因如此,目前很多正在做人工智能研究的專家,包括Michael Jordan和Yann Lecun等都已經(jīng)意識(shí)到,自然語(yǔ)言理解對(duì)于人工智能來(lái)說(shuō)是一個(gè)突破口。
科大訊飛目前正在執(zhí)行的“訊飛超腦計(jì)劃”,就是希望實(shí)現(xiàn)包括感知智能和認(rèn)知智能在內(nèi)的全面突破,也是在人工智能領(lǐng)域的核心布局內(nèi)容。在感知智能領(lǐng)域,語(yǔ)音識(shí)別、手寫(xiě)識(shí)別方面每年保證30%-50%的錯(cuò)誤率的下降;在識(shí)別普通話的基礎(chǔ)之上,進(jìn)一步識(shí)別方言;不僅能夠理解人類和機(jī)器的對(duì)話,還能理解人和人之間的對(duì)話;不僅能夠識(shí)別聯(lián)機(jī)手寫(xiě)的字符,還能識(shí)別離線手寫(xiě)的字符。在認(rèn)知智能上的研究目標(biāo),關(guān)鍵是讓機(jī)器能理解會(huì)思考,這必須要突破語(yǔ)言理解、知識(shí)表示、聯(lián)想推理,自主學(xué)習(xí)等多個(gè)方面。
目前,科大訊飛的“訊飛超腦”已取得了階段性的進(jìn)展。作為計(jì)劃的重要組成部分,科大訊飛正牽頭進(jìn)行國(guó)家科技部863重大專項(xiàng)——“類人答題機(jī)器人項(xiàng)目”,未來(lái)要讓機(jī)器人參加高考并考上一本,甚至是清華、北大、科大這樣水平的高校。而在口語(yǔ)翻譯和評(píng)測(cè)方面,目前科大訊飛口語(yǔ)翻譯技術(shù)已達(dá)到英語(yǔ)六級(jí)水平,在國(guó)際機(jī)器翻譯評(píng)測(cè)(IWSLT2014,NIST2015)等大賽中奪得冠軍,口語(yǔ)作文評(píng)測(cè)機(jī)器已可替代老師進(jìn)行自動(dòng)評(píng)測(cè),在廣東高考英語(yǔ)口語(yǔ)作文考試中得以全面應(yīng)用。在主觀題閱卷上,科大訊飛將業(yè)界獨(dú)家的人工智能核心技術(shù)應(yīng)用于考試以及傳統(tǒng)線下作業(yè)的自動(dòng)批閱,不論是手寫(xiě)識(shí)別的還是選擇題涂抹,都可以先通過(guò)OCR轉(zhuǎn)變成計(jì)算機(jī)可以理解的文本和圖像,再讓計(jì)算機(jī)自動(dòng)對(duì)答案的正確程度進(jìn)行評(píng)判,這其實(shí)是感知智能和認(rèn)知智能的結(jié)合?,F(xiàn)在安徽省合肥市和安慶市的會(huì)考中,英文和中文的考試已經(jīng)全部使用了整套感知智能和認(rèn)知智能技術(shù)進(jìn)行自動(dòng)評(píng)分,取得了非常好的效果,以后此技術(shù)將會(huì)被全面推廣到包括文科和理科的所有課程。
在產(chǎn)品應(yīng)用之外,基于多年積累,目前科大訊飛在各項(xiàng)大賽中都取得了優(yōu)異的成果。以今年為例,在年初舉行的國(guó)際語(yǔ)音合成大賽上,科大訊飛通過(guò)承建的語(yǔ)音及語(yǔ)言信息處理國(guó)家工程實(shí)驗(yàn)室報(bào)送的參賽系統(tǒng),不僅繼續(xù)在自然度、相似度、可懂度等傳統(tǒng)指標(biāo)上保持國(guó)際領(lǐng)先,還在語(yǔ)篇段落表現(xiàn)測(cè)試中所有7項(xiàng)測(cè)試指標(biāo)位列第一。這是科大訊飛自2006年首次參賽以來(lái),第十一次參與該項(xiàng)賽事,持續(xù)鞏固了在智能語(yǔ)音技術(shù)的全球領(lǐng)先地位。
隨后,在今年的全球人工智能比賽Winograd Schema Challenge中,科大訊飛再次榮獲第一。Winograd Schema Challenge作為意圖取代圖靈測(cè)試(Turingtest)的人工智能測(cè)試項(xiàng)目,著重考察認(rèn)知、推理和常識(shí)判斷能力。
此外在美國(guó)當(dāng)?shù)貢r(shí)間9月13日,科大訊飛領(lǐng)銜的中國(guó)技術(shù)團(tuán)隊(duì)又在國(guó)際多通道語(yǔ)音分離和識(shí)別大賽(CHiME)中包攬了賽事全部三個(gè)項(xiàng)目的冠軍。據(jù)介紹,CHiME比賽重點(diǎn)解決的是真實(shí)、復(fù)雜場(chǎng)景下的語(yǔ)音識(shí)別,因此是語(yǔ)音識(shí)別領(lǐng)域最高難度的比賽之一。參賽的各個(gè)語(yǔ)音系統(tǒng)需要克服高噪聲、混響等干擾,在咖啡廳、公交車、街道等日常生活場(chǎng)景中,準(zhǔn)確地識(shí)別和處理英文語(yǔ)音。
以各項(xiàng)賽事成績(jī)名列前茅的技術(shù)為保障,“訊飛超腦計(jì)劃”的目標(biāo)就是讓各類智能終端實(shí)現(xiàn)從“能聽(tīng)會(huì)說(shuō)”到“能理解會(huì)思考”的演進(jìn),進(jìn)而實(shí)現(xiàn)全球第一個(gè)中文認(rèn)知智能計(jì)算引擎,在語(yǔ)音合成、識(shí)別和人工智能等各項(xiàng)領(lǐng)域引領(lǐng)智能應(yīng)用潮流的發(fā)展。
評(píng)論