將門沈強:智能芯片是人工智能算力創(chuàng)新的基石
“今天是一個半導體行業(yè)的盛會,正好將人工智能的軟件要素、硬件要素交融在一起。”將門CTO、將門創(chuàng)投創(chuàng)始合伙人沈強在集微半導體峰會上從算法、算力和數(shù)據(jù)的角度談了人工智能的不同創(chuàng)新模式。
本文引用地址:http://butianyuan.cn/article/201709/364721.htm2017年9月15日,由集微網(wǎng)、手機中國聯(lián)盟主辦,廈門半導體投資集團公司承辦的“集微半導體峰會”在廈門海滄舉行。此次峰會以“‘芯’聯(lián)產(chǎn)業(yè),積微成著 ”為主題,同期舉辦的人工智能論壇專場,來自將門創(chuàng)投、碼隆科技、偉景智能、悅享趨勢科技和元鼎音訊的企業(yè)高層、人工智能產(chǎn)業(yè)界的優(yōu)秀人才等圍繞當前熱點話題、核心技術以及大家共同關注的市場動向,重塑熱點話題,解析趨勢變化,洞悉行業(yè)變革。
沈強作為此次人工智能論壇的主持,開場介紹將門這家專注于發(fā)掘、加速及投資技術驅(qū)動型創(chuàng)業(yè)公司的創(chuàng)業(yè)服務和投資機構,其旗下還設有將門企業(yè)用戶對接、將門技術社群以及將門投資基金。
據(jù)悉,將門投資基金專注于投資通過技術創(chuàng)新激活商業(yè)場景,實現(xiàn)商業(yè)價值的初創(chuàng)企業(yè)。關注領域包括機器智能、物聯(lián)網(wǎng)、自然人機交互、企業(yè)計算。在一年時間里,將門投資基金已經(jīng)投資了包括量化派、碼隆科技、偉景智能、禾賽科技等超過10家具有高成長潛力的技術型創(chuàng)業(yè)公司。
據(jù)沈強介紹,將門聚焦在“MINE”四個主要領域,其中M是機器智能,I是物聯(lián)網(wǎng)相關,從物聯(lián)網(wǎng)通訊、傳感器、數(shù)據(jù)處理、物聯(lián)網(wǎng)應用。N是自然人機交互,E網(wǎng)是企業(yè)計算,包括云計算,企業(yè)應用,信息安全等。
Gartner數(shù)據(jù)顯示,未來兩年到三年的時間內(nèi),人工智能將會進入一個泛應用的時間點。沈強進一步指出,從人工智能的技術成熟度的曲線來看,現(xiàn)在這個時間點剛剛好。目前,人工智能主要是數(shù)據(jù)驅(qū)動型的方式,深度學習在里面起了很關鍵的作用。然而,從創(chuàng)新角度來講,可以從人工智能的三要素,算法、算力和數(shù)據(jù)三個角度出發(fā),尋找合適的應用場景落地,再將其轉(zhuǎn)化成商業(yè)價值。場景的創(chuàng)新等于商業(yè)價值的創(chuàng)新,算力的創(chuàng)新可以理解為硬件創(chuàng)新,算法的創(chuàng)新理解為軟件創(chuàng)新,結合起來從是軟硬結合的方式共創(chuàng)人工智能的新精彩。
從創(chuàng)新場景來看,除了規(guī)模宏大的交通、運輸?shù)确矫?,人工智能的商業(yè)價值無處不在,需要我們?nèi)ド钔凇I驈娡ㄟ^一個消費實例來告訴現(xiàn)場的嘉賓,即使一個微小的應用場景,當結合上人工智能的時候,便能夠激活一個創(chuàng)新的場景,實現(xiàn)商業(yè)價值。他講道,有一段時間經(jīng)常在外面出差,家里的貓無人照料,便選用了一款自動喂貓的機器,每天定時喂養(yǎng)家里的貓,這是一個極其細分極其細小的市場。在使用過程中遇到一些問題,便聯(lián)系到做寵物喂養(yǎng)、自動喂食器公司的老總聊了一下,詢問未來在這一領域想做的創(chuàng)新,發(fā)現(xiàn)其實跟人工智能有很大的關系。在喂食器上面添加一個攝像頭,既可以給主人做遠程監(jiān)控使用,還能夠做貓臉識別,為不同年齡階段的貓、不同健康狀況的貓做個性化的喂養(yǎng)服務。“這對我來說是一個教育,如此微小的市場,通過與人工智能的結合便能夠激活一個創(chuàng)新的應用場景。”
從算法來看,人工智能的發(fā)展離不開深度學習模型,而深度神經(jīng)網(wǎng)絡更是其中最重要的一部分。過去十幾年來,從2012年DiagonalLineNode開始,神經(jīng)網(wǎng)絡的結構一直在持續(xù)的發(fā)展中。2015年其實是一個關鍵節(jié)點,微軟研究院提出的深度高達152層的神經(jīng)網(wǎng)絡,視覺計算組的系統(tǒng)錯誤率已經(jīng)低至3.57%,首次實現(xiàn)了對人類視覺能力的突破,這意味著在商業(yè)可行性上,它可以在某些特定場景下取代人發(fā)揮作用。神經(jīng)網(wǎng)絡的層數(shù)逐漸增多,由此帶來了巨大問題,軟件方面的改進對硬件也提出了需求。如此復雜的網(wǎng)絡,無論在服務器端還是設備端,都對其計算能力提出了更高的要求,如此才能夠讓高精度的識別能力重現(xiàn)。
一直以來,深度學習的算法都用來處理圖像、識別聲音,集中在識別圖片中的一只貓或者一個只狗,再進一步分類+定位,標注出其在圖中的區(qū)域和位置。隨著深度學習算法與自然語言的 結合處理,可以用于對象的檢測,把多只貓、多只狗、多個人分開,進一步做實際分割,逐步應用在安防、機器人應用。沈強表示,其實在固體識別的檢測方面,過去用R-CNN算法可以達到53.3%,而現(xiàn)在用FasterR-CNN可以達到83.8%。從圖像分割延伸至視頻處理,目前越來越多的深度學習算法可以很好的做視頻分割操作,以識別出視頻中哪一幀哪一個像素屬于哪一個對象,可以用于人臉識別、刷臉識別等應用。
深度學習的發(fā)展方向就是算法的創(chuàng)新,沈強指出從監(jiān)督學習到半監(jiān)督學習/無監(jiān)督學習的演化過程,從依賴于大數(shù)據(jù)到只需要小數(shù)據(jù),One-Shot Learning。我們知道,監(jiān)督學習是依賴于標簽過的數(shù)據(jù),今天我們講說那些人臉識別精度達到多少,以及我們在ImageNet里面,這個紅線上展示的都是標簽過的數(shù)據(jù),它使我們了解到從數(shù)據(jù)挖掘智能、挖掘知識的年代。但站在我們的角度來看,這并不應該成為固守的一個方向。為什么呢?大量的數(shù)據(jù)都未標簽過,這都是成本,而成本將阻礙進一步創(chuàng)新,擁有數(shù)據(jù)的大型企業(yè)在人工智能的發(fā)展過程中會占據(jù)有利地勢,我們怎么樣讓那些創(chuàng)新的想法更快的涌現(xiàn)出來呢?
如果說人工智能的下一步是算法,能夠不依賴于大量數(shù)據(jù)或者不依賴于標簽過的數(shù)據(jù),可以用廣泛的無標簽的這些數(shù)據(jù),這將大大降低我們數(shù)據(jù)處理的成本,本質(zhì)上使人工智能變得更加民主,無論大企業(yè)或小企業(yè)都能自主的參與到這一競爭中。為什么ImageNet今年之后將成為絕唱?沈強表示,因為他們的組織者認為在標簽法數(shù)據(jù)的學習上面已經(jīng)獲得一定成績,如果再往下做探索的話,會比現(xiàn)階段更有意義的途徑。我們要相對成熟的看問題,往前跳一步去解決那些無標簽的數(shù)據(jù),WebVISION競賽就應運而生,它取代了ImageNet的競賽,其主要特點便是采用的數(shù)據(jù)都是無人工標注的??上驳氖菬o論ImageNet或是WebVISION,中國參賽者都獲得了世界領先的成績,其中碼隆科技便在WebVISION獲得第一名的傲人成績。
當深度無監(jiān)督的學習被應用起來時,通過不同的算法計算出不同的內(nèi)容,根據(jù)條件生成的自動網(wǎng)絡,或是對抗式的神經(jīng)網(wǎng)絡。我們不必在意兩種算法的區(qū)別,因為都會指出一條道路,人工智能不僅可以用于認知事情,還可以創(chuàng)新更有意義的內(nèi)容。從波音公司利用對抗式神經(jīng)網(wǎng)絡設計機翼,利用算法以解決生活中的具體問題;從視頻預測利用對抗式神經(jīng)網(wǎng)絡觀察未來發(fā)展,預測危險的可能性,預防更多危險的情況發(fā)生;Deepmind通過算法的創(chuàng)新強化學習的創(chuàng)新,以尋找規(guī)律、建立模型,這種通用人工智能的創(chuàng)新對半導體產(chǎn)業(yè)的發(fā)展非常有意義。“算法的創(chuàng)新提供無限的可能性,這將為未來更多的應用場景落地提供槍支彈藥。”沈強補充道。
在算力方面,智能芯片是人工智能的基石,機器學習很大程度上依賴于一個強大計算的基礎設施。沈強指出,深度學習的計算量太大,目前有兩種類型的計算,基于訓練或基于推理的。訓練可以讓系統(tǒng)學習數(shù)據(jù)、獲得模式,而推理是以訓練好的模型或意境學到的知識,去應用判斷未來的過程。這也是為什么Nvidia股票去年漲了四倍,巨大的計算量催生對更高速的計算架構的需求。包括微軟、亞馬遜等公司都已開始構建相應的云服務,華為與寒武紀在麒麟970在終端上的合作,提供深度計算加速的設施,英特爾耗費100多億美元去購買人工智能的企業(yè),實際上就是其背后所提供的計算架構更適合人工智能對算力的需求。
從CPU、到GPU、FPGA深知專用電路應用于不同的場景,我們可以看到演進還在持續(xù)不斷的發(fā)生,適合于不同的應用場景下面,甚至于最夸張的,像Google Brain項目利用超并行的方法,在一個芯片上有16000多個核,16個芯片作為一個組,再裝載到機器里面,所以它一臺服務器里面有256萬個內(nèi)核。沈強表示,類似這樣的創(chuàng)新,包括GoogleTPU的創(chuàng)新,我們在行業(yè)里面也看到很多不停的涌現(xiàn)出來,包括專門做視覺的,也有一些不是通用的,而是做一些專用領域的。從蘋果iPhone X,這個每秒6500億次計算的小的超小型計算機,到華為Mate 10,這一高達1.92萬億次的計算能力的計算機,未來要處理的場景還需要無數(shù)的模型加載,需要更多深層設施,有不同的神經(jīng)網(wǎng)絡在里面,以滿足各種各樣的應用場景對巨大計算量的需求。
最后沈強總結道,從場景創(chuàng)新、軟件創(chuàng)新和硬件創(chuàng)新,越來越多的創(chuàng)新技術出現(xiàn),人工智能逐步走入包括消費電子、健康、金融、零售等的各行各業(yè)。人工智能正滲透到行業(yè),成為重塑每一個行業(yè)的關鍵力量。如何將創(chuàng)新技術轉(zhuǎn)換成商業(yè)價值,人工智能的業(yè)務價值將從2B、2C的方面體現(xiàn)出現(xiàn),無論哪一層的實現(xiàn)都離不開軟硬的結合。無論是安防、無人機、甚至未來數(shù)萬億市場的自動駕駛,以及由亞馬遜Echo所引領的智能語音交互,都需要硬件上的感知執(zhí)行系統(tǒng),軟件上優(yōu)異的用戶服務體現(xiàn),背后更需要先進的人工智能技術、相應的算法和基礎設置,正是需要技術的相互結合,為人工智能行業(yè)和半導體行業(yè)的結合提供很好的合作契機。
評論