【深度】谷歌人工智能10年之路
盡管迦南德里不相信“機(jī)器會(huì)殺死我們”這樣的預(yù)言,但他認(rèn)為機(jī)器學(xué)習(xí)系統(tǒng)將成為革命性技術(shù),從醫(yī)療診斷到無人駕駛汽車,各行各業(yè)都將利用這種技術(shù)。雖然機(jī)器學(xué)習(xí)不會(huì)取代人類,但它卻會(huì)改變?nèi)祟悺?/p>本文引用地址:http://butianyuan.cn/article/201612/341843.htm
迦南德里以Google Photos為例進(jìn)行了解釋。這款產(chǎn)品的標(biāo)志性功能是能夠在圖片中識(shí)別出用戶指定的物品,這令人感覺頗為神秘,甚至有些不安。通過學(xué)習(xí),電腦可“知道”邊境牧羊犬的樣子,而且可以識(shí)別出不同年齡和毛長的邊境牧羊犬。
對(duì)于人類來說,這可能十分容易,但沒人能夠從數(shù)百萬張圖片中篩選出來這些照片,同時(shí)還能識(shí)別出不同的犬種,而機(jī)器學(xué)習(xí)系統(tǒng)就可以做到。如果它了解了一個(gè)犬種,便可使用相同的技術(shù)識(shí)別出另外9999個(gè)犬種。迦南德里說:“這才是真正令人感到新奇的地方。在這樣狹小的領(lǐng)域,你甚至可以看到機(jī)器學(xué)習(xí)系統(tǒng)具備超人能力。”
進(jìn)入熱門產(chǎn)品
谷歌早已了解機(jī)器學(xué)習(xí)的概念,該公司的創(chuàng)始人就是強(qiáng)大人工智能的堅(jiān)定信奉者。機(jī)器學(xué)習(xí)已經(jīng)被應(yīng)用到谷歌很多產(chǎn)品中,盡管并非總是采用最近熱門的神經(jīng)網(wǎng)絡(luò)技術(shù)。
事實(shí)上,谷歌10年前就開始通過內(nèi)部培訓(xùn),向公司工程師傳授機(jī)器學(xué)習(xí)技術(shù)。2005年初,當(dāng)時(shí)負(fù)責(zé)谷歌搜索業(yè)務(wù)的彼得·諾維格(Peter Norvig)向研究科學(xué)家大衛(wèi)·帕布洛·科恩(David Pablo Cohn)提議,希望知道谷歌能否采用卡內(nèi)基-梅隆大學(xué)組織的相關(guān)課程。
而科恩表示,只有谷歌自己才能教授這種內(nèi)部課程,因?yàn)楣雀璧倪\(yùn)營規(guī)模與其他公司都大不相同。所以他改造了谷歌總部43號(hào)樓一個(gè)大房間,每周三在那里開設(shè)兩小時(shí)的課程。就連迪恩也參加過幾次。
科恩說:“那是全世界最好的課程。作為工程師,他們都比我優(yōu)秀得多!”這門課程非常受歡迎,幾乎座無虛席。就連班加羅爾辦事處的員工都會(huì)特意等到午夜之后,以便接入遠(yuǎn)程教學(xué)系統(tǒng)。
幾年后,部分谷歌員工把授課內(nèi)容制作成了短片,從而結(jié)束了直播授課的歷史。但科恩認(rèn)為,這門課程算得上是MOOC(大規(guī)模開放在線課程)的先驅(qū)。在隨后幾年,谷歌還針對(duì)機(jī)器學(xué)習(xí)培訓(xùn)展開了其他嘗試,但這些嘗試缺乏條理性和連續(xù)性??贫?013年離開谷歌后,機(jī)器學(xué)習(xí)突然間成為谷歌關(guān)注的重點(diǎn)領(lǐng)域。
但在2012年以前,機(jī)器學(xué)習(xí)課程的重要性還未獲得充分認(rèn)識(shí),直到迦南德里決定“吸收大量從事這項(xiàng)工作的人”,并將他們安排到同樣的辦公樓之后。始于Google X部門的“谷歌大腦”也加入進(jìn)來。
迦南德里說:“我們吸收了很多團(tuán)隊(duì),將他們安排到同一棟辦公樓內(nèi),還提供了全新的咖啡機(jī)。有些人之前只接觸過所謂的感知計(jì)算,即聲音和語音識(shí)別等技術(shù),而現(xiàn)在他們可以與那些從事語言研究的人共同探討。”
越來越多地,這些工程師們開發(fā)的機(jī)器學(xué)習(xí)技術(shù)開始出現(xiàn)在谷歌的熱門產(chǎn)品中。由于視覺、語音識(shí)別以及翻譯是機(jī)器學(xué)習(xí)的主要領(lǐng)域,因此無需感到驚訝,這項(xiàng)技術(shù)成為谷歌語音搜索、翻譯和Photos等服務(wù)的重要組成部分。更重要的是,機(jī)器學(xué)習(xí)技術(shù)將被應(yīng)用到所有產(chǎn)品中。
迪恩表示,隨著他和他的團(tuán)隊(duì)對(duì)機(jī)器學(xué)習(xí)的理解逐步深入,他們開始以更具野心的方式探索這項(xiàng)技術(shù)。
他說:“我們之前或許會(huì)在系統(tǒng)的組件中使用機(jī)器學(xué)習(xí)技術(shù),現(xiàn)在則會(huì)使用這項(xiàng)技術(shù)替代整套系統(tǒng),而非為每個(gè)組件設(shè)計(jì)更好的機(jī)器學(xué)習(xí)模式。”迪恩表示,如果現(xiàn)在讓他重新編寫谷歌的基礎(chǔ)架構(gòu),其中的很多內(nèi)容都不再是預(yù)先編好的代碼,而是后期學(xué)習(xí)而來的。
格雷格·考拉多,谷歌大腦項(xiàng)目聯(lián)合創(chuàng)始人,正在和多個(gè)團(tuán)隊(duì)協(xié)作,將人工智能應(yīng)用到谷歌產(chǎn)品中。
機(jī)器學(xué)習(xí)還能夠?qū)⒃緹o法想象的功能植入到產(chǎn)品中,比如2015年11月推出的Gmail自動(dòng)回復(fù)功能。這個(gè)功能源自“谷歌大腦”項(xiàng)目聯(lián)合創(chuàng)始人格雷格·考拉多(Greg Corrado)與Gmail工程師巴林特·米克洛斯(Bálint Miklós)之間的對(duì)話。
考拉多之前曾經(jīng)與Gmail團(tuán)隊(duì)合作使用機(jī)器學(xué)習(xí)算法探測垃圾信息、歸類郵件,但米克洛斯提出了更激進(jìn)的建議:能否利用機(jī)器學(xué)習(xí)技術(shù)自動(dòng)生成回復(fù)郵件,省去移動(dòng)用戶在狹小的鍵盤上輸入文字的麻煩。
考拉多說:“當(dāng)初我?guī)缀躞@呆了,因?yàn)檫@個(gè)建議太瘋狂了。但我后來覺得,借助我們始終都在研究的預(yù)測性神經(jīng)網(wǎng)絡(luò)技術(shù),或許可能實(shí)現(xiàn)。而在意識(shí)到這是一個(gè)機(jī)會(huì)的時(shí)候,我們就必須去嘗試。”
為了提高成功概率,谷歌讓考拉多及其團(tuán)隊(duì)與Gmail部門展開了密切合作,這種派遣機(jī)器學(xué)習(xí)專家進(jìn)駐產(chǎn)品部門的做法如今已經(jīng)越來越普遍??祭嗾f:“機(jī)器學(xué)習(xí)既是科學(xué)又是藝術(shù),這就像烹飪。雖然烹飪過程發(fā)生了化學(xué)反應(yīng),但對(duì)于真正對(duì)烹飪感興趣的人來說,必須要學(xué)習(xí)如何搭配手中的食材。”
傳統(tǒng)的人工智能技術(shù)在理解語言時(shí),需要將語音規(guī)則嵌入系統(tǒng)。但在這個(gè)項(xiàng)目中,系統(tǒng)可以利用現(xiàn)代化的機(jī)器學(xué)習(xí)技術(shù),借助足夠的數(shù)據(jù)自主學(xué)習(xí),就像兒童自學(xué)那樣。
考拉多說:“我并不是跟著語言學(xué)家學(xué)會(huì)說話的,而是通過聽別人說話學(xué)來的。”。但真正令智能回復(fù)變得切實(shí)可行的,是它的成功很容易定義——他們的目的不是創(chuàng)造一個(gè)妖艷的虛擬斯嘉麗·約翰遜(Scarlett Johansson,電影《她》中的智能操作系統(tǒng)),而是希望它能回復(fù)真正的電子郵件。
考拉多說:“這項(xiàng)服務(wù)的成功標(biāo)志是,用戶覺得機(jī)器生成的備選回復(fù)有用,可被當(dāng)作自己的真正回復(fù)使用。”因此,只需要知道用戶是否點(diǎn)擊了系統(tǒng)推薦的回復(fù)內(nèi)容,便可對(duì)其進(jìn)行訓(xùn)練。
然而,在開始測試智能回復(fù)功能時(shí),用戶卻注意到了怪異事情:系統(tǒng)經(jīng)常會(huì)推薦一些不合時(shí)宜的浪漫回應(yīng)??祭嗾f:“其中一種失敗模式是:只要系統(tǒng)感覺困惑,它就會(huì)說‘我愛你’。這并不是軟件漏洞,而是我們的錯(cuò)誤引導(dǎo)它如此做。”這個(gè)程序已經(jīng)了解人類行為的某些微妙之處:“比如你感到擔(dān)憂是說一句‘我愛你’,其實(shí)是一種很好的防御策略。”考拉多幫助該團(tuán)隊(duì)壓制了系統(tǒng)的熱情。
去年11月發(fā)布的智能回復(fù)功能取得了巨大成功,Gmail Inbox應(yīng)用的用戶現(xiàn)在可以直接從系統(tǒng)提供的三條備選內(nèi)容中選擇一條,輕輕碰觸即可進(jìn)行回復(fù)。由于系統(tǒng)提供的回復(fù)內(nèi)容非常切題,用戶經(jīng)常感到不可思議。在通過該應(yīng)用發(fā)送的回復(fù)信息中,有1/10都是由機(jī)器學(xué)習(xí)系統(tǒng)生成的??祭嘈χf:“這個(gè)項(xiàng)目能夠成功還是令我感到有些驚訝。”
評(píng)論