新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 國內(nèi)人工智能的互聯(lián)網(wǎng)引領(lǐng):百度的人工智能布局

國內(nèi)人工智能的互聯(lián)網(wǎng)引領(lǐng):百度的人工智能布局

作者: 時間:2020-06-29 來源:騰訊網(wǎng) 收藏

稱得上是國內(nèi)應(yīng)用深度學(xué)習(xí)的先鋒,早在2012年初,就在語音識別上開始規(guī)模應(yīng)用深度學(xué)習(xí)算法并取得了非常好的效果。當(dāng)年年底,CEO李彥宏宣布成立公司的第一個研究院:百度深度學(xué)習(xí)研究院。當(dāng)時,世界上只有谷歌、微軟等少數(shù)幾個公司公開宣布在深度學(xué)習(xí)、領(lǐng)域進(jìn)行戰(zhàn)略性的資金投入。

本文引用地址:http://www.butianyuan.cn/article/202006/414858.htm

經(jīng)過四年的發(fā)展,百度深度學(xué)習(xí)技術(shù)已經(jīng)滲透到百度的各個產(chǎn)品中,如網(wǎng)頁搜索、廣告點(diǎn)擊率預(yù)估模型、百度殺毒等。深度學(xué)習(xí)技術(shù)極大地提高了百度產(chǎn)品的用戶體驗(yàn)。例如百度的語音識別,經(jīng)過四年的磨練,其識別準(zhǔn)確率從當(dāng)初的80%提高到今天的96%。

除了率先在各個產(chǎn)品線引入前沿的深度學(xué)習(xí)算法外,百度在應(yīng)用方面還有更長遠(yuǎn)的布局:

1. 建立百度研究院,下設(shè)硅谷實(shí)驗(yàn)室、北京深度學(xué)習(xí)實(shí)驗(yàn)室、北京大數(shù)據(jù)實(shí)驗(yàn)室等三大前沿實(shí)驗(yàn)室。

2. 2014年,人工智能領(lǐng)域最負(fù)盛名的權(quán)威學(xué)者吳恩達(dá)加入百度。

3. 同年,在百度技術(shù)開放日發(fā)布了大數(shù)據(jù)引擎,對外開放大數(shù)據(jù)及人工智能能力。

4. 在百度技術(shù)節(jié)上,百度高級副總裁王勁描繪了“萬物智能”的愿景,展示了百度為迎接萬物智能時代所做的技術(shù)布局。

5. 2015年在百度世界大會上推出了“度秘”。度秘是萬物皆智能的一個集中體現(xiàn),可成為人們生活中的智能秘書,通過語音對話或者圖像可以自然地和人進(jìn)行交流,甚至都不需要事先的交互,僅憑借歷史信息、傳感器信息、周圍環(huán)境變化就能判斷一個人的需求。如果你餓了,它可以幫你訂餐;你生病了,可以告訴你吃什么藥;如果明天下雨,會提醒你帶上傘;若你需要出行,會幫你訂好酒店、機(jī)票等等。不過,這些看似平常的“秘書”服務(wù),如果要真正達(dá)到好用的狀態(tài),還需要有非常先進(jìn)的人工智能技術(shù)做支撐。

1593417319228780.png

人工智能對計算機(jī)系統(tǒng)及體系結(jié)構(gòu)的挑戰(zhàn):

人工智能的應(yīng)用包括云(數(shù)據(jù)中心)和端(智能設(shè)備)兩部分。云端除了訓(xùn)練(離線訓(xùn)練),還有在線服務(wù)。訓(xùn)練是指利用訓(xùn)練數(shù)據(jù),選擇合適的訓(xùn)練方法,訓(xùn)練出一個模型。在線服務(wù)是指利用訓(xùn)練出來的模型在線響應(yīng)用戶的請求。端部分也是人工智能的一個強(qiáng)需求,按照“萬物智能”的愿望,很多終端設(shè)備,如智能輔助駕駛、無人車、智能攝像頭、工業(yè)物聯(lián)網(wǎng) (Internet of Things,IoT)等等,都能運(yùn)行人工智能的算法,智能地響應(yīng)外部請求。

深度學(xué)習(xí)的離線訓(xùn)練是工業(yè)界和學(xué)術(shù)界研究最多、關(guān)注最多的領(lǐng)域。自深度學(xué)習(xí)熱潮席卷而來,無論是學(xué)術(shù)界還是工業(yè)界,涌現(xiàn)了很多新的、面向深度學(xué)習(xí)算法和應(yīng)用設(shè)計的系統(tǒng),如谷歌提出的參數(shù)服務(wù)器(parameter server),其他人通過借鑒這一思想,根據(jù)不同的應(yīng)用場景,設(shè)計了各種不同的系統(tǒng)。

在體系結(jié)構(gòu)方面,深度學(xué)習(xí)訓(xùn)練大多是基于圖形處理單元(GPU)及無限帶寬(infiniband)的高速互聯(lián)網(wǎng)絡(luò)。使用圖形處理單元來做大規(guī)模的矩陣計算,再用無線帶寬高速網(wǎng)絡(luò)進(jìn)行分布式參數(shù)更新。這種架構(gòu)在工業(yè)界應(yīng)用非常普遍,很多專有的服務(wù)器里通常帶有8個圖形處理單元,服務(wù)器之間則通過無線帶寬互聯(lián)。很多論文都在研究如何利用服務(wù)器內(nèi)8個圖形處理單元的局部性、無限帶寬的遠(yuǎn)程直接數(shù)據(jù)存取(Remote Direct Memory Acces,RDMA)以及圖形處理單元的計算能力來完成完整的分布式深度學(xué)習(xí)訓(xùn)練任務(wù)。圖形處理單元加無限帶寬的硬件架構(gòu)目前比較適用于深度學(xué)習(xí)的訓(xùn)練以及工業(yè)界的規(guī)模應(yīng)用。這是因?yàn)檫@兩種硬件的性能都不錯,而供應(yīng)商眾多,容易獲得產(chǎn)品及技術(shù)支持。

在線服務(wù)方面,無論是工業(yè)界還是學(xué)術(shù)界,公開的信息都比較少。能有機(jī)會進(jìn)行大規(guī)模部署人工智能服務(wù)的,只有像百度這樣技術(shù)驅(qū)動的大型互聯(lián)網(wǎng)公司,而這些公司一般出于保密考慮,會延后發(fā)布自己的核心技術(shù)。至于人工智能的終端設(shè)備,雖然媒體一直在勾畫這個領(lǐng)域的宏偉藍(lán)圖,但實(shí)際上能成功進(jìn)行規(guī)模應(yīng)用的并不多,所以工業(yè)界和學(xué)術(shù)界對這部分內(nèi)容公開得也比較少。

其實(shí),無論是離線訓(xùn)練、在線服務(wù)還是智能設(shè)備,內(nèi)部運(yùn)行的都是一些常用的深度學(xué)習(xí)算法,如深層神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)、遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)/長短時神經(jīng)網(wǎng)絡(luò)(Long Short Term Memory,LSTM)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)。這些算法存在一些共性,比如(1)都是計算和訪存密集型;(2)主要的計算算子是矩陣操作、卷積、激活函數(shù)等;(3)對于離線訓(xùn)練,考慮到分布式實(shí)現(xiàn),對節(jié)點(diǎn)間的通信帶寬和延時要求很高。

從大規(guī)模部署應(yīng)用的角度看,無論是哪種類型的應(yīng)用,衡量體系結(jié)構(gòu)好壞的最終標(biāo)準(zhǔn)是效率,包括能耗效率和成本效率。只有這兩個效率足夠高,體系結(jié)構(gòu)才有生命力。例如對于嵌入式終端,往往需要考慮極致的能耗效率和成本效率,有時候甚至需要對算法做些剪枝和模型規(guī)模限制。對于數(shù)據(jù)中心而言,成本和功耗也是規(guī)模部署要考慮的第一要素。

如今,人們一提到深度學(xué)習(xí)的硬件架構(gòu),首先就會想到圖形處理單元。這主要是因?yàn)?,在便于采購的硬件里,圖形處理單元確實(shí)能提供較好的數(shù)學(xué)計算能力和訪存帶寬。但對于能耗和成本效率,即使應(yīng)用在數(shù)據(jù)中心,圖形處理單元離我們的目標(biāo)也還有很大的改進(jìn)空間。所以我們需要重新思考,如何面向人工智能的典型應(yīng)用和算法,設(shè)計一種新的、通用的體系結(jié)構(gòu)。這種體系結(jié)構(gòu)既能實(shí)現(xiàn)極致的能耗和成本效率,也能靈活延伸擴(kuò)展,易于支持離線訓(xùn)練、在線服務(wù)和智能終端三種場景。



關(guān)鍵詞: 人工智能 百度

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉