新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 微軟亞洲研究院:NLP將迎來黃金十年

微軟亞洲研究院:NLP將迎來黃金十年

作者: 時(shí)間:2018-12-05 來源:億歐網(wǎng) 收藏

  面向任務(wù)的對話系統(tǒng)比如的小娜通過手機(jī)和智能設(shè)備讓人與電腦進(jìn)行交流,由人發(fā)布命令,小娜理解并完成任務(wù)。同時(shí),小娜理解你的習(xí)慣,可主動(dòng)給你一些貼心提示。而聊天機(jī)器人,比如的小冰負(fù)責(zé)聊天。無論是小娜這種注重任務(wù)執(zhí)行的技術(shù),還是小冰這種聊天系統(tǒng),其實(shí)背后單元處理引擎無外乎三層技術(shù):第一層,通用聊天機(jī)器人;第二層,搜索和問答(Infobot);第三層,面向特定任務(wù)對話系統(tǒng)(Bot)。

本文引用地址:http://butianyuan.cn/article/201812/395252.htm

  3、聊天系統(tǒng)的架構(gòu)

  機(jī)器閱讀理解

  自然語言理解的一個(gè)重要研究課題是閱讀理解。

  閱讀理解就是讓電腦看一遍文章,針對這些文章問一些問題,看電腦能不能回答出來。機(jī)器閱讀理解技術(shù)有著廣闊的應(yīng)用前景。例如,在搜索引擎中,機(jī)器閱讀理解技術(shù)可以用來為用戶的搜索(尤其是問題型的查詢)提供更為智能的答案。我們通過對整個(gè)互聯(lián)網(wǎng)的文檔進(jìn)行閱讀理解,從而直接為用戶提供精確的答案。同時(shí),這在移動(dòng)場景的個(gè)人助理,如小娜(Cortana)里也有直接的應(yīng)用:智能客服中可使用機(jī)器閱讀文本文檔(如用戶手冊、商品描述等)來自動(dòng)或輔助客服來回答用戶的問題;在辦公領(lǐng)域可使用機(jī)器閱讀理解技術(shù)處理個(gè)人的郵件或者文檔,然后用自然語言查詢獲取相關(guān)的信息;在教育領(lǐng)域用來可以用來輔助出題;在法律領(lǐng)域可用來理解法律條款,輔助律師或者法官判案;在金融領(lǐng)域里從非結(jié)構(gòu)化的文本(比如新聞中)抽取金融相關(guān)的信息等。機(jī)器閱讀理解技術(shù)可形成一個(gè)通用能力,第三方可以基于它構(gòu)建更多的應(yīng)用。

  斯坦福大學(xué)在 2016 年 7 月發(fā)布了一個(gè)大規(guī)模的用于評測閱讀理解技術(shù)的數(shù)據(jù)集(SQuAD),包含 10 萬個(gè)由人工標(biāo)注的問題和答案。SQuAD 數(shù)據(jù)集中,文章片段(passage)來自維基百科的文章,每個(gè)文章片段(passage)由眾包方式,標(biāo)注人員提 5 個(gè)問題,并且要求問題的答案是 passage 中的一個(gè)子片段。標(biāo)注的數(shù)據(jù)被分成訓(xùn)練集和測試集。訓(xùn)練集公開發(fā)布用來訓(xùn)練閱讀理解系統(tǒng),而測試集不公開。參賽者需要把開發(fā)的算法和模型提交到斯坦福由其運(yùn)行后把結(jié)果報(bào)在網(wǎng)站上。

  一開始,以 100 分為例,人的水平是 82.3 左右,機(jī)器的水平只有 74 分,機(jī)器相差甚遠(yuǎn)。后來通過不斷改進(jìn),機(jī)器閱讀理解性能得以逐步地提高。2018 年 1 月,微軟亞洲研究院提交的 R-Net 系統(tǒng)首次在 SQuAD 數(shù)據(jù)集上以 82.65 的精準(zhǔn)匹配的成績首次超越人類在這一指標(biāo)上的成績。隨后阿里巴巴、科大訊飛和哈工大的系統(tǒng)也在這一指標(biāo)上超越人類水平。標(biāo)志著閱讀理解技術(shù)進(jìn)入了一個(gè)新的階段。最近微軟亞洲研究院的 NL-Net 和谷歌的 BERT 系統(tǒng)又先后在模糊匹配指標(biāo)上突破人類水平。對于閱讀理解技術(shù)的推動(dòng),除了 SQuAD 數(shù)據(jù)集起到了關(guān)鍵作用之外,還有如下三個(gè)方的因素:首先,是端到端的深度神經(jīng)網(wǎng)絡(luò)。其次,是預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò);最后,是系統(tǒng)和網(wǎng)絡(luò)結(jié)構(gòu)上的不斷創(chuàng)新。

  4、機(jī)器創(chuàng)作

  機(jī)器可以做很多理性的東西,也可以做出一些創(chuàng)造性的東西。

  早在 2005 年,微軟亞洲研究院在時(shí)任院長沈向洋的提議和支持下成功研發(fā)了《微軟對聯(lián)》系統(tǒng)。用戶出上聯(lián),電腦對出下聯(lián)和橫批,語句非常工整。

  在此基礎(chǔ)上,我們又先后開發(fā)了格律詩和猜字謎的智能系統(tǒng)。在字謎游戲里,用戶給出謎面,讓系統(tǒng)猜出字,或系統(tǒng)給出謎面讓用戶猜出字。2017 年微軟研究院開發(fā)了電腦寫自由體詩系統(tǒng)、作詞譜曲系統(tǒng)。中央電視臺《機(jī)智過人》節(jié)目就曾播放過微軟的電腦作詞譜曲與人類選手進(jìn)行詞曲創(chuàng)作比拼的內(nèi)容。這件事說明如果有大數(shù)據(jù),那么深度學(xué)習(xí)就可以模擬人類的創(chuàng)造智能,也可以幫助專家產(chǎn)生更好的想法。

  就作詞來說,寫一首歌詞首先要決定主題。比如想寫一首與“秋”,“歲月”,“滄?!?,“感嘆”相關(guān)的歌,利用詞向量表示技術(shù),可知“秋風(fēng)”、“流年”、“歲月”、“變遷”等詞語比較相關(guān),通過擴(kuò)展主題可以約束生成的結(jié)果偏向人們想要的歌詞,接著在主題模型的約束下用序列到序列的神經(jīng)網(wǎng)絡(luò),用歌詞的上一句去生成下一句,如果是第一句,則用一個(gè)特殊的序列作為輸入去生成第一句歌詞,這樣循環(huán)生成歌詞的每一句。

  下面也簡介一下譜曲。為一首詞譜曲不單要考慮旋律是否好聽,也要考慮曲與詞是否對應(yīng)。這類似于一個(gè)翻譯過程。不過這個(gè)翻譯中的對應(yīng)關(guān)系比自然語言翻譯更為嚴(yán)格。它需嚴(yán)格規(guī)定每一個(gè)音符對應(yīng)到歌詞中的每一個(gè)字。例如每一句有 N 個(gè)字,那么就需要將這句話對應(yīng)的曲切分成 N 個(gè)部分,然后順序完成對應(yīng)關(guān)系。這樣在“翻譯”過程中要“翻譯”出合理的曲譜,還要給出曲與詞之間的對應(yīng)關(guān)系。我們利用了一個(gè)改進(jìn)的序列到序列的神經(jīng)網(wǎng)絡(luò)模型,完成從歌詞“翻譯”到曲譜的生成過程。



關(guān)鍵詞: 微軟 NLP

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉