新聞中心

EEPW首頁 > 手機與無線通信 > 業(yè)界動態(tài) > 商湯科技徐立:人臉識別比指紋識別更準確

商湯科技徐立:人臉識別比指紋識別更準確

作者: 時間:2017-09-28 來源:鳳凰科技 收藏

  刷臉支付的出現(xiàn)讓“靠臉吃飯”不再只是句玩笑,攝像頭識別人臉讓不法分子無處遁形……這背后所用到的視覺識別技術,就是人工智能創(chuàng)業(yè)公司商湯科技所擅長的領域。

本文引用地址:http://butianyuan.cn/article/201709/364966.htm

  公司成立不到3年,已經(jīng)受到多家投資機構追捧。在今年7月,商湯科技宣布完成4.1億美元B輪融資,有投資人判斷這“可能成為這一波人工智能投資潮的巔峰”。

  9月26日,在GPU技術大會間隙,商湯科技聯(lián)合創(chuàng)始人、CEO徐立與包括鳳凰科技在內(nèi)的多家媒體談到時下熱門的人臉解鎖、刷臉支付等問題,并分享了商湯科技面對新行業(yè)如何做選擇,以及人才管理與培養(yǎng)計劃。

  商湯科技是典型的、在技術浪潮中誕生于高校的創(chuàng)業(yè)公司,它的搖籃是香港中文大學的多媒體實驗室。實驗室在湯曉鷗教授的指導下,誕生了多篇知名論文,在2014年LFW檢測中的準確率首次超過人眼。

  這些成果吸引了IDG合伙人??獾淖⒁饬?,資本主動找上門,討論成立公司的可能性。于是在2014年10月,幾個香港中文大學的畢業(yè)生、微軟前員工加上一些清華畢業(yè)的研究人員,成立了這一公司。

  學術研究貫穿了整個公司的發(fā)展。眼下團隊已從30多人擴展到700多人,其中有18名教授,120多名博士。并與香港中文大學、浙江大學、清華大學等高校都建有聯(lián)合培養(yǎng)實驗室。在去年和前年,香港中文大學-商湯科技聯(lián)合實驗室共發(fā)了76篇論文。這對尚在學校的“未來人才”來說,就是一個不小的誘惑。“壟斷”人才,也是商湯的野心。

  如何做好底層人工智能模塊,去應用于有潛力的行業(yè)?人臉解鎖與刷臉支付是否安全?在以下內(nèi)容中都能找到答案,內(nèi)容整理自對徐立的采訪。

  談手機上的人臉解鎖:技術早已成熟,商湯和主流手機廠商都有合作

  蘋果在手機行業(yè)有這一領先的創(chuàng)舉,不在于技術領先,而是在他之前別人都不太敢去做大規(guī)模的嘗試。做解鎖,之前就已經(jīng)成熟了,一年前就已經(jīng)能商用了。另外,這一變化可能和全面屏相關,指紋移到后面去,比較麻煩,人臉解鎖就變成了一個自然的選擇。

  商湯科技在這一方面進行了較長期的儲備,最早在互聯(lián)網(wǎng)金融方面做解鎖,跟手機人臉解鎖是完全一樣的。我們每天有一百萬調(diào)用,20萬次是攻擊,任何一個新的東西都要接受大量的攻擊。在攻防當中,大部分的企業(yè)可能沒有這樣一個前期準備。我們在互聯(lián)網(wǎng)金融行業(yè)里面,積累了大量的攻擊實例,我們在活體檢測上是有一定的優(yōu)勢。

  準確率其實跟很多環(huán)境相關,比如超遠光等情況下。在大規(guī)模測試的情況下,人臉比對比指紋比對要準確。指紋某種意義上特征沒有那么豐富,人臉特征維度就高很多。所以從生物特征來說,人臉是一個更好的生物特征。

  我們現(xiàn)在跟很多主流手機廠商都有做解鎖的合作。量大了,大家都做,自然可以帶來一些行業(yè)的標準。

  在刷臉支付領域,現(xiàn)在1:1的成熟度很高,1:N的就要看庫有多大,要是存全中國14億人的庫,你跑來刷一次,做14億次的比例,可能每刷一次這個人就可能出錯,關鍵要看庫的大小。假設有一個APP的用戶達到了數(shù)億級別的,可能就會有風險,現(xiàn)在百萬級別,千萬級別,1:N的準確率還是很高的。

  談發(fā)展階段與業(yè)務擴展:判斷一年內(nèi)技術能超過人的行業(yè),我們就會進入

  2015年9月,我們開始真正商業(yè)化,當時與銀行和P2P公司合作,簽到千萬級別的合同,之后才進入安防領域。目前的情況是每一個工作日簽一個合同。

  我們在選擇進入一個新行業(yè)時,首先會拿市場上各種信息來形成一個市場反饋,有了這些反饋之后,我們找出公共點,定義一個新的研究問題。第二,我們看技術能不能超過人,一年之內(nèi)我們能夠把技術做到人的準確率,過了那條紅線,我們就會投入去做這個行業(yè)。第三,看它的市場空間有多大,如果能替代人,這個行業(yè)本身有多少人,有多少市場空間,既有的空間有多大,如果這個市場能夠擴展,會有多大的份額。

  我們不可能把所有場景走完,所以我們采用的是1+1+X的模式。1+1是產(chǎn)和研,+X就是說我在一些垂直行業(yè)里面,我本身不去把這個行業(yè)做穿,一定是要跟我的合作伙伴來快速結合去做。

  智慧商業(yè)這些行業(yè)比較分散,我們會找這個行業(yè)背后的集成商。把我的東西包在他們的解決方案里,這是很多細分行業(yè)的打法。比如有一百多家銀行,地方都不一樣,跑到這些地方是很難服務的,你通過集成商的方法,1+1+X,X就起到了很大的作用。

  為什么我們有一些行業(yè)不會進去,原因是有可能是太細分,你是人海戰(zhàn)術,每個省必須得有人,每個地方得有支持,只能跟合作伙伴來做,找到最好的合作伙伴。

  商湯科技某種意義上是賣人工智能的樂高玩具,我要針對這個場景,去搭建一個樂高的車,才能賣給這個行業(yè)的甲方,甲方根據(jù)我搭了這個車,可以直接用,也可以改造一下,用這個東西去搭其他的東西,某種意義上是賣底層人工智能模塊,賦能這些行業(yè)。

  這個賦能未來能夠形成核心競爭力。第一是你模塊越來越多時,就形成了聚集優(yōu)勢,平臺上你可能有更多的流量,數(shù)據(jù)和場景,你用這些場景搭這個模塊,別人不具備。第二,這些模塊和應用系統(tǒng)是耦合的。希望商湯成為這個軟的AI平臺的提供者。

  談人才與管理:人工智能這本賬背后是人才的賬

  驅(qū)動這一波人工智能興起的是核心引擎和算法,你要真正掌握核心能力,要有5-7年的積累。

  有一個故事,當年谷歌收購DeepMind,DeepMind是12個博士,價值4億英鎊。一個沒有產(chǎn)品的公司,12個人價值4億英鎊。當時全球真正懂深度學習這個大腦的人,大概只有50個。意思就是說你其實買的是核心的運算能力,買的是未來,不是這12個人值不值這個錢。果然一年之后,有了AlphaGo。

  我們招人沒有設任何博士的門檻,博士和碩士沒有太大的差別,但是發(fā)現(xiàn)能做這件事情基本上都是博士。

  第二,我們當時前期融資只融了2千萬美金,人工智能這本賬背后是人才的賬。我們把那些真正能做大腦設計、底層算法研究的這批人壟斷,行業(yè)再培養(yǎng)一批人還有5年時間,你就有足夠的時間窗口用行業(yè)領先的人。

  第三,一群科學家坐在桌面去討論算法和想法,會有指數(shù)級的發(fā)現(xiàn)。你把一群聰明的人聚集在一起時,演進的速度是非??斓摹?/p>

  我們的企業(yè)文化和團隊的技術背景是相關的,我們想要堅持做一些原創(chuàng)事情。當時我們在學習這個方向時,明明感覺研究能在某個階段突破所謂的工業(yè)紅線,但是行業(yè)里沒人起頭,把這個場景落地,所以我們做了這樣的事。我們也會借鑒各種管理經(jīng)驗,很多高管來自于成熟大型公司。

  在去年和前年,香港中文大學-商湯科技聯(lián)合實驗室共發(fā)了76篇論文,在行業(yè)里面要遠遠領先于谷歌,facebook,僅次于微軟。在這個過程當中,學生們也會有成就感,我們有比較好的員工培養(yǎng)體系。

  談當下困惑與未來發(fā)展:看好視頻和交互

  我們面臨的困難有當團隊從30人擴到700多人,如何更有效地利用資源。第二,選擇垂直行業(yè)時,考慮如何選擇能帶來最大商業(yè)價值與社會價值。

  整個行業(yè)的困惑點在于技術的大眾化。我們一直講智能手機,人工智能+手機還不如一個手機的價錢,人工智能的錢誰收呢?人工智能加了人臉解鎖,加了50元,這個錢向誰收?這是行業(yè)的困惑,怎樣讓普羅大眾真正給技術買單。大眾對帶來的價值要有足夠的認可度,這個行業(yè)的發(fā)展就會變得更好。

  未來我們看好的兩塊,一塊是視頻,現(xiàn)在互聯(lián)網(wǎng)上真正帶來很大商業(yè)價值是搜索、電商、社交游戲,這些都很賺錢。這些完全都可以被視頻顛覆,如果視頻整個識別理解做得很好,未來就是谷歌搜索可以新做一個谷歌,視頻領域的谷歌。視頻都可以連接到背后的電商,你就是淘寶。我覺得視頻未來可以帶來很大的爆發(fā)力。

  還有就是交互,現(xiàn)在整個互聯(lián)網(wǎng)的發(fā)展路徑,從傳統(tǒng)PC到移動互聯(lián)網(wǎng),其實核心的點是交互模式發(fā)生了核心的變化,未來我們看到手勢、肢體,可能就會帶來下一波新的入口。人工智能已經(jīng)賦能了這樣一個交互的行業(yè),誰把這些交互變成真正的產(chǎn)品入口,會帶來下一步的變化。我覺得不遠,可能五年之后,手機里面的APP,要么被顛覆,要么被轉(zhuǎn)型。



評論


相關推薦

技術專區(qū)

關閉