史無前例！蘋果開誠布公談機器學(xué)習(xí)

作者：時間：2017-07-23 來源：威鋒網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

編者按：從蘋果的這第一篇博文中，我們可以清楚地看到它在機器學(xué)習(xí)領(lǐng)域的進展和思路，可以說是史無前例的開誠布公。它這么做，自然是為了表明自己在人工智能領(lǐng)域并沒有落后，希望能夠因此吸引更多人才。

　　即使是如此重視保密的蘋果，現(xiàn)在隨著時勢的改變，一些東西也和過去不一樣了，最明顯的莫過于它對人工智能和機器學(xué)習(xí)技術(shù)的態(tài)度。我們已經(jīng)看到了一個更加開放的蘋果，它在機器學(xué)習(xí)這個領(lǐng)域的進展如何呢?今天大家已經(jīng)可以清楚地了解了。

本文引用地址：http://www.butianyuan.cn/article/201707/362056.htm

　　蘋果的特殊待遇

　　我們都知道蘋果是一家特別注重保密文化的公司，基本上只有在新產(chǎn)品公開的那一刻，你才會真正從官方的口中了解到它是什么樣的，而它又使用了些什么材料和什么技術(shù)。這樣的文化曾經(jīng)為我們帶來無數(shù)驚喜，但時過境遷，堅持這種作風(fēng)的蘋果似乎遇到了新的困境。

　　所以近兩年來，我們看到了一個和過去不太一樣的蘋果。它比起以往，似乎更加愿意和外界分享自己的科技成果。當(dāng)然了，保密策略肯定是主旋律，但好歹是有了例外 —— 比如說機器學(xué)習(xí)。

　　在這一段時間里，我們看到了蘋果高管們更多地拋頭露面，向媒體談及他們對人工智能和機器學(xué)習(xí)的看法。在蘋果的發(fā)布會中，“機器學(xué)習(xí)”成為了一個高頻詞匯。前一陣子，高管們還集體在訪談中放聲“我們的機器學(xué)習(xí)技術(shù)也很先進”，并透露了公司一直以來對該技術(shù)的應(yīng)用實例。

　　在這之后，蘋果宣布旗下的人工智能團隊可以參與相關(guān)的學(xué)術(shù)討論，并允許研究者發(fā)表論文。不久前蘋果的人工智能專家湯姆·格魯伯還在 TED 大會上，闡述了蘋果如何看待這種技術(shù)。對粉絲們來說，蘋果這么做在過去幾乎是不可想象的。

　　似乎是為了證明它之前的那些承諾真的不是空話，蘋果就在剛剛開放了一個博客，專門刊載公司的機器學(xué)習(xí)進度。這前所未有的決定，將讓我們看到蘋果怎樣的機器學(xué)習(xí)成就呢?

　　蘋果的技術(shù)進展

　　我們都知道，人工智能有一項很重要的應(yīng)用就是圖像識別，而這也是蘋果在最近幾次系統(tǒng)升級中著重強調(diào)的，通過照片的自動整理分類，事實上我們也已經(jīng)用上了這些技術(shù)。

　　那么要如何讓設(shè)備能夠準(zhǔn)確判斷圖片上的東西究竟是什么呢?那就需要訓(xùn)練了。人類首先要找好大量被手動標(biāo)注是某樣物體的，確定無誤的圖片，比如最簡單的“貓”、“狗”、“眼睛”這些，然后讓機器去學(xué)習(xí)和辨認(rèn)，這樣它才能開始嘗試自己識別類似的圖片。

　　蘋果表示，這樣的過程成本實在是太高，因為要提高機器識別的準(zhǔn)確率，圖片數(shù)量必須非常龐大，據(jù)了解目前是 100 萬張起步，如果還要再多人工標(biāo)注就幾乎不可能。而且，這些圖片還得擁有足夠的多樣性，畢竟可以被標(biāo)注為“貓”、“狗”、“眼睛”的圖片種類太多了，太過單一，機器如果遇到更復(fù)雜的情況就可能會認(rèn)不出了。

　　當(dāng)然還有一種辦法：既然人工標(biāo)注圖片數(shù)量越多越難實現(xiàn)，那么可以使用模擬的手段，自動生成海量自動被標(biāo)注好的圖片，讓機器去不斷進行識別。然而這種解決方案也有一個大問題，那就是自動生成的圖片往往不夠真實，這樣會極大影響到人工智能識別圖片的準(zhǔn)確性。蘋果的第一篇博文，就是嘗試去解決這個難題的。

　　其實蘋果的思路很簡單：如果模擬器生成的圖片不夠真實，那就讓它變得更真實就好了。有趣的是，研究者們?yōu)榇擞衷O(shè)計了一套學(xué)習(xí)網(wǎng)絡(luò)。

　　根據(jù)博文所說，蘋果為達(dá)到這個目的，開發(fā)出了所謂的精制器(Refiner R)和辨別器(Discriminator D)。當(dāng)模擬器生成圖片后，精制器 R 負(fù)責(zé)讓它變得更加真實，以通過辨別器的考驗。辨別器的數(shù)據(jù)庫中有大量的真實圖片(有趣的是，蘋果表示這些圖片可以是未標(biāo)注的 —— 又省一筆人工費)，它負(fù)責(zé)根據(jù)這些真實圖片，辨別精制器給它的圖片是否為真。

　　精制器千方百計要騙過辨別器，而后者則要努力認(rèn)清前者的“鬼把戲”。兩個機制在不斷地“斗法”中提升著自己的能力，直到辨別器再也分不清，學(xué)習(xí)過程就算完成了。這樣，就能夠在不需要人工標(biāo)注的情況下，生成海量接近真實的圖片讓人工智能不斷去學(xué)習(xí)了，如此就可以大量減少成本。

　　還有一點很重要，那就是蘋果必須要保證整個學(xué)習(xí)過程不“跑偏”。因為在精制器和辨別器不停較量和升級的過程中，難保會因為各種各樣的因素，讓精制器修改的圖片和辨別器認(rèn)定的標(biāo)準(zhǔn)開始走極端，讓最終得到的圖片直接變形。所以蘋果加入了一些規(guī)范機制。

　　首先蘋果將一幅圖片分成許多部分，然后根據(jù)這些部分中的像素特征，對較量中出現(xiàn)的失真進行統(tǒng)計，失真偏差越大，判定損失就越大。除了局部的判定外，還有一個整體的自我規(guī)范損失機制，建立一個生成圖片修改前后的差異對比。局部和整體結(jié)合，保證了圖片不會在這個過程中發(fā)生很大的異變。除此之外辨別器本身也有記憶功能，能夠記住那些之前已經(jīng)被判定為假的圖片。

　　還有一點很有趣，那就是蘋果暫時還沒有找到讓系統(tǒng)自動判定學(xué)習(xí)中止的辦法，目前只能是保存學(xué)習(xí)過程中的所有圖片，人工目測生成圖像已經(jīng)和真實非常接近時中止學(xué)習(xí)。

　　采用了這樣的解決方案，據(jù)說效果還是非常不錯的。蘋果曾邀請志愿者接受測試，10 位志愿者看了 1000 組圖片，分別有真實圖片和經(jīng)過精制器修改的生成圖片。成功分辨出真實圖片的有 517 組，概率上接近 50%，說明人們無法確定圖片真假，更多是 2 選 1 的概率。而當(dāng)志愿者們?nèi)タ凑鎸崍D片和原始生成圖片時，200 組圖片他們成功分辨出了多達(dá) 162 組。

　　好戲還在后頭

　　從蘋果的這第一篇博文中，我們可以清楚地看到它在機器學(xué)習(xí)領(lǐng)域的進展和思路，可以說是史無前例的開誠布公。它這么做，自然是為了表明自己在人工智能領(lǐng)域并沒有落后，希望能夠因此吸引更多人才。

　　人工智能和機器學(xué)習(xí)作為蘋果未來技術(shù)發(fā)展和產(chǎn)品功能開發(fā)的重頭戲，我們會在越來越多的發(fā)布會上看到它們的身影。如果你對此曾經(jīng)也有疑慮，那么蘋果現(xiàn)在就是在不斷表明自己的態(tài)度，讓人們放心。

　　博客開了，這也只是第一篇博文而已。可想而知，未來蘋果還會公布更多它的技術(shù)進展。在解決了圖像識別的問題后，接下來它還會用機器學(xué)習(xí)來實現(xiàn)什么呢?這實在是讓人期待啊。