史無前例!蘋果開誠布公談機器學(xué)習(xí)
即使是如此重視保密的蘋果,現(xiàn)在隨著時勢的改變,一些東西也和過去不一樣了,最明顯的莫過于它對人工智能和機器學(xué)習(xí)技術(shù)的態(tài)度。我們已經(jīng)看到了一個更加開放的蘋果,它在機器學(xué)習(xí)這個領(lǐng)域的進展如何呢?今天大家已經(jīng)可以清楚地了解了。
本文引用地址:http://www.butianyuan.cn/article/201707/362056.htm![蘋果開博客 為你解說它的人工智能](http://editerupload.eepw.com.cn/201707/84791500777541.png)
![蘋果開博客 為你解說它的人工智能](http://editerupload.eepw.com.cn/201707/88351500777542.jpg)
我們都知道蘋果是一家特別注重保密文化的公司,基本上只有在新產(chǎn)品公開的那一刻,你才會真正從官方的口中了解到它是什么樣的,而它又使用了些什么材料和什么技術(shù)。這樣的文化曾經(jīng)為我們帶來無數(shù)驚喜,但時過境遷,堅持這種作風(fēng)的蘋果似乎遇到了新的困境。
所以近兩年來,我們看到了一個和過去不太一樣的蘋果。它比起以往,似乎更加愿意和外界分享自己的科技成果。當(dāng)然了,保密策略肯定是主旋律,但好歹是有了例外 —— 比如說機器學(xué)習(xí)。
在這一段時間里,我們看到了蘋果高管們更多地拋頭露面,向媒體談及他們對人工智能和機器學(xué)習(xí)的看法。在蘋果的發(fā)布會中,“機器學(xué)習(xí)”成為了一個高頻詞匯。前一陣子,高管們還集體在訪談中放聲“我們的機器學(xué)習(xí)技術(shù)也很先進”,并透露了公司一直以來對該技術(shù)的應(yīng)用實例。
在這之后,蘋果宣布旗下的人工智能團隊可以參與相關(guān)的學(xué)術(shù)討論,并允許研究者發(fā)表論文。不久前蘋果的人工智能專家湯姆·格魯伯還在 TED 大會上,闡述了蘋果如何看待這種技術(shù)。對粉絲們來說,蘋果這么做在過去幾乎是不可想象的。
似乎是為了證明它之前的那些承諾真的不是空話,蘋果就在剛剛開放了一個博客,專門刊載公司的機器學(xué)習(xí)進度。這前所未有的決定,將讓我們看到蘋果怎樣的機器學(xué)習(xí)成就呢?
蘋果的技術(shù)進展
我們都知道,人工智能有一項很重要的應(yīng)用就是圖像識別,而這也是蘋果在最近幾次系統(tǒng)升級中著重強調(diào)的,通過照片的自動整理分類,事實上我們也已經(jīng)用上了這些技術(shù)。
那么要如何讓設(shè)備能夠準(zhǔn)確判斷圖片上的東西究竟是什么呢?那就需要訓(xùn)練了。人類首先要找好大量被手動標(biāo)注是某樣物體的,確定無誤的圖片,比如最簡單的“貓”、“狗”、“眼睛”這些,然后讓機器去學(xué)習(xí)和辨認(rèn),這樣它才能開始嘗試自己識別類似的圖片。
蘋果表示,這樣的過程成本實在是太高,因為要提高機器識別的準(zhǔn)確率,圖片數(shù)量必須非常龐大,據(jù)了解目前是 100 萬張起步,如果還要再多人工標(biāo)注就幾乎不可能。而且,這些圖片還得擁有足夠的多樣性,畢竟可以被標(biāo)注為“貓”、“狗”、“眼睛”的圖片種類太多了,太過單一,機器如果遇到更復(fù)雜的情況就可能會認(rèn)不出了。
當(dāng)然還有一種辦法:既然人工標(biāo)注圖片數(shù)量越多越難實現(xiàn),那么可以使用模擬的手段,自動生成海量自動被標(biāo)注好的圖片,讓機器去不斷進行識別。然而這種解決方案也有一個大問題,那就是自動生成的圖片往往不夠真實,這樣會極大影響到人工智能識別圖片的準(zhǔn)確性。蘋果的第一篇博文,就是嘗試去解決這個難題的。
其實蘋果的思路很簡單:如果模擬器生成的圖片不夠真實,那就讓它變得更真實就好了。有趣的是,研究者們?yōu)榇擞衷O(shè)計了一套學(xué)習(xí)網(wǎng)絡(luò)。
![蘋果開博客 為你解說它的人工智能](http://editerupload.eepw.com.cn/201707/83621500777542.png)
根據(jù)博文所說,蘋果為達(dá)到這個目的,開發(fā)出了所謂的精制器(Refiner R)和辨別器(Discriminator D)。當(dāng)模擬器生成圖片后,精制器 R 負(fù)責(zé)讓它變得更加真實,以通過辨別器的考驗。辨別器的數(shù)據(jù)庫中有大量的真實圖片(有趣的是,蘋果表示這些圖片可以是未標(biāo)注的 —— 又省一筆人工費),它負(fù)責(zé)根據(jù)這些真實圖片,辨別精制器給它的圖片是否為真。
![](http://editerupload.eepw.com.cn/201707/87791500777543.gif)
精制器千方百計要騙過辨別器,而后者則要努力認(rèn)清前者的“鬼把戲”。兩個機制在不斷地“斗法”中提升著自己的能力,直到辨別器再也分不清,學(xué)習(xí)過程就算完成了。這樣,就能夠在不需要人工標(biāo)注的情況下,生成海量接近真實的圖片讓人工智能不斷去學(xué)習(xí)了,如此就可以大量減少成本。
還有一點很重要,那就是蘋果必須要保證整個學(xué)習(xí)過程不“跑偏”。因為在精制器和辨別器不停較量和升級的過程中,難保會因為各種各樣的因素,讓精制器修改的圖片和辨別器認(rèn)定的標(biāo)準(zhǔn)開始走極端,讓最終得到的圖片直接變形。所以蘋果加入了一些規(guī)范機制。
首先蘋果將一幅圖片分成許多部分,然后根據(jù)這些部分中的像素特征,對較量中出現(xiàn)的失真進行統(tǒng)計,失真偏差越大,判定損失就越大。除了局部的判定外,還有一個整體的自我規(guī)范損失機制,建立一個生成圖片修改前后的差異對比。局部和整體結(jié)合,保證了圖片不會在這個過程中發(fā)生很大的異變。除此之外辨別器本身也有記憶功能,能夠記住那些之前已經(jīng)被判定為假的圖片。
![蘋果開博客 為你解說它的人工智能](http://editerupload.eepw.com.cn/201707/33611500777543.png)
還有一點很有趣,那就是蘋果暫時還沒有找到讓系統(tǒng)自動判定學(xué)習(xí)中止的辦法,目前只能是保存學(xué)習(xí)過程中的所有圖片,人工目測生成圖像已經(jīng)和真實非常接近時中止學(xué)習(xí)。
采用了這樣的解決方案,據(jù)說效果還是非常不錯的。蘋果曾邀請志愿者接受測試,10 位志愿者看了 1000 組圖片,分別有真實圖片和經(jīng)過精制器修改的生成圖片。成功分辨出真實圖片的有 517 組,概率上接近 50%,說明人們無法確定圖片真假,更多是 2 選 1 的概率。而當(dāng)志愿者們?nèi)タ凑鎸崍D片和原始生成圖片時,200 組圖片他們成功分辨出了多達(dá) 162 組。
好戲還在后頭
從蘋果的這第一篇博文中,我們可以清楚地看到它在機器學(xué)習(xí)領(lǐng)域的進展和思路,可以說是史無前例的開誠布公。它這么做,自然是為了表明自己在人工智能領(lǐng)域并沒有落后,希望能夠因此吸引更多人才。
人工智能和機器學(xué)習(xí)作為蘋果未來技術(shù)發(fā)展和產(chǎn)品功能開發(fā)的重頭戲,我們會在越來越多的發(fā)布會上看到它們的身影。如果你對此曾經(jīng)也有疑慮,那么蘋果現(xiàn)在就是在不斷表明自己的態(tài)度,讓人們放心。
博客開了,這也只是第一篇博文而已。可想而知,未來蘋果還會公布更多它的技術(shù)進展。在解決了圖像識別的問題后,接下來它還會用機器學(xué)習(xí)來實現(xiàn)什么呢?這實在是讓人期待啊。
![蘋果開博客 為你解說它的人工智能](http://editerupload.eepw.com.cn/201707/76101500777544.jpg)
評論