王海峰的履歷上,又多了個「第一」
中國社會力量設(shè)立的中國工程界最高獎項——「光華工程科技獎」,終于有了產(chǎn)業(yè)界 AI 從業(yè)者的身影。
11 月 8 日,北京會議中心,百度 CTO 王海峰被授予「光華工程科技獎」,成為 AI 產(chǎn)業(yè)界首位獲此殊榮的科技工作者。這一情景酷似三年前的全國創(chuàng)新爭先獎頒獎現(xiàn)場,當時,王海峰是互聯(lián)網(wǎng)行業(yè)的唯一獲獎人。
「光華工程科技獎」創(chuàng)立于 1996 年,是中國工程院主管、兩院院士朱光亞等人捐資發(fā)起的工程科技類獎項,也是中國社會力量設(shè)立的中國工程界的最高獎項。
該獎項每兩年頒發(fā)一次,包括「光華工程科技成就獎」、「光華工程科技特別貢獻獎」、「光華工程科技獎」三大獎項,旨在對工程科技及管理領(lǐng)域取得突出成績和重要貢獻的中國工程師、科學家給予獎勵,激勵他們從事工程科技研究、發(fā)展、應(yīng)用的積極性和創(chuàng)造性。在此之前,中國工程院院士鐘南山、李蘭娟等多個領(lǐng)域的泰斗級人物也曾站上過這一領(lǐng)獎臺。
今年 6 月份,光華工程科技獎辦公室公布了第十三屆光華工程科技獎候選人員名單。經(jīng)中國工程院九個學部及港澳臺地區(qū)評審委員會的評審,從 296 位有效候選人中產(chǎn)生了進入理事會終評的 39 位候選人,王海峰便是其中之一。
11 月 8 日,獲獎人員名單揭曉,王海峰因在人工智能領(lǐng)域、尤其是自然語言處理領(lǐng)域的卓越貢獻榮獲上述三大獎項中的「光華工程科技獎」。
截至目前,光華工程科技獎共評選了十三屆,有機械、運載、信息、電子、化工、冶金、材料、能源、礦業(yè)、土木、水利、建筑、環(huán)境、輕紡、農(nóng)業(yè)、醫(yī)****、衛(wèi)生、工程管理等十幾個不同工程學科的 304 位科學家及一個團體獲獎。其中,王海峰是第一位,也是唯一一位 AI 產(chǎn)業(yè)界的代表。
為什么是王海峰?
為什么是王海峰?很多人可能有這樣一個疑問。
王海峰本、碩、博都畢業(yè)于哈爾濱工業(yè)大學,師從 ACL 終身成就獎獲得者、哈工大教育部語言語音重點實驗室主任李生,中國工程院院士、北大信息科學技術(shù)學院院長高文等研究者。畢業(yè)之后,他先后在微軟中國研究院、東芝等國際頂級科技公司任職,并于 2010 年加入百度。
在 2017 年接連被任命為百度 AI 技術(shù)平臺體系(AIG)總負責人、百度研究院院長之前,王海峰很少出現(xiàn)在聚光燈下。甚至有人評價說他帶領(lǐng)的是一支「****部隊」。而如今,隨著百度在 AI 領(lǐng)域的技術(shù)實力不斷彰顯,這支「****部隊」早已不再****,王海峰也越來越多地出現(xiàn)在臺前,向大家介紹百度的各項 AI 研究、應(yīng)用成果。
如果從學生時代接觸 AI 開始算,王海峰已經(jīng)在這一領(lǐng)域工作了近三十年。在這三十年的時間里,他創(chuàng)造了很多個「第一」與「唯一」。
全球首個互聯(lián)網(wǎng)神經(jīng)網(wǎng)絡(luò)機器翻譯系統(tǒng)
王海峰 1989 年考入哈工大,1993 年進入李生教授的實驗室開始做機器翻譯研究。在碩士期間,王海峰參與了兩個重要的機器翻譯項目——CEMT-Ⅲ 和 BT863。其中,BT863 漢英雙向機器翻譯系統(tǒng)是「863 計劃」的一個重要項目,王海峰負責漢譯英方向的規(guī)則知識庫建構(gòu)以及計算機軟件等方面的準備。在比賽階段,王海峰組的系統(tǒng)在漢譯英部分獲得了全國第一。
在參與這兩個項目的過程中,王海峰對基于規(guī)則和統(tǒng)計的機器翻譯技術(shù)都有所涉獵。當時,這兩個方向的機器翻譯系統(tǒng)已經(jīng)開始投入商業(yè)化應(yīng)用,很多人都在努力擴大詞典庫、積累句法規(guī)則數(shù)據(jù),在既有方向繼續(xù)深挖下去。但是,王海峰的視野沒有局限于此。
在本科和碩士期間,他就已經(jīng)開始認識到神經(jīng)網(wǎng)絡(luò)這種參照人腦認知模式的計算方法。在博士期間,他開始思考,自己能否去嘗試一些更新的東西。當時,王海峰發(fā)現(xiàn),在海外(例如卡內(nèi)基梅隆大學),已經(jīng)開始有人將神經(jīng)網(wǎng)絡(luò)應(yīng)用到語音處理之中。但是,當時應(yīng)用更廣的是多層前饋神經(jīng)網(wǎng)絡(luò)(BP 神經(jīng)網(wǎng)絡(luò)),不能對上下文進行有效建模。針對這個問題,王海峰開始尋求突破。他將循環(huán)神經(jīng)網(wǎng)絡(luò)的方法引入了機器翻譯領(lǐng)域來反映上下文關(guān)系,而且取得了很好的效果。
在王海峰讀博的 90 年代,即使在世界范圍內(nèi),將循環(huán)神經(jīng)網(wǎng)絡(luò)引入機器翻譯領(lǐng)域也不算常見,在國內(nèi)更是首創(chuàng)。
在王海峰等人的努力下,中國機器翻譯從規(guī)則、統(tǒng)計方法時期的一路跟隨,發(fā)展到在神經(jīng)網(wǎng)絡(luò)時期向無人之地邁出了第一步。而后來的發(fā)展也證明,王海峰選擇的方向是正確的。
2010 年,王海峰開啟了自己在百度的職業(yè)生涯。初入百度時,他做的第一件事就是成立了「自然語言處理部」,以服務(wù)搜索引擎中產(chǎn)生的相關(guān)需求。在此之前,百度在 NLP 方面的研發(fā)工作一直在業(yè)務(wù)需求下進行,并沒有構(gòu)成體系?!缸匀徽Z言處理部」的成立改變了這種「指哪兒打哪兒」的局面,對原有的工作進行了重新梳理與規(guī)劃,除分詞、專名識別、query 需求分析、query 改寫等傳統(tǒng)方向得到加強外,也逐步建設(shè)了機器翻譯、機器學習、語義理解、智能交互、深度問答、篇章理解等新的技術(shù)方向。
2011 年,王海峰等人預(yù)判出深度學習在產(chǎn)業(yè)界將大有可為。于是,2013 年,王海峰作為執(zhí)行負責人協(xié)助李彥宏創(chuàng)建了世界上第一家企業(yè)深度學習研究院(IDL)。
這些工作的平穩(wěn)推進為百度成為全球 AI 頭部企業(yè)埋下了伏筆。2015 年,王海峰帶領(lǐng)的百度 NLP 團隊研發(fā)了全球首個基于神經(jīng)網(wǎng)絡(luò)的互聯(lián)網(wǎng)翻譯系統(tǒng),領(lǐng)先國內(nèi)外其它科技巨頭公司 1 年多時間。2016 年初,中國舉辦國家科學技術(shù)獎勵大會,百度的機器翻譯項目獲得了國家科技進步二等獎。當時,新華社發(fā)文評價稱:「中國最高級別的科技獎項花落互聯(lián)網(wǎng)企業(yè)實屬罕見?!?/p>
在王海峰的帶領(lǐng)下,百度在知識圖譜和多模態(tài)語義理解等重要方向也很早就開始了布局,這些早期工作構(gòu)成了今天百度大腦的重要基礎(chǔ)。如今,百度擁有全球最大的知識圖譜,其中包含超過 50 億實體、5500 億事實。而且,這些成果并非百度的「私產(chǎn)」,以此為基礎(chǔ)構(gòu)建的百度知識中臺現(xiàn)在向企業(yè)提供了面向知識應(yīng)用全生命周期的一站式解決方案,其知識圖譜產(chǎn)品目前已覆蓋 100 多個行業(yè)場景。
ACL 五十多年歷史上首位華人主席
在李生教授剛開始 NLP 研究的時代,中國的 AI 研究還是一個獨立而貧瘠的孤島。中國的研究者很難獲取國際 AI 研究的一手資料,國外的研究者也對中國的 AI 研究知之甚少。
到了王海峰的時代,情況有所好轉(zhuǎn),中國的研究者逐漸走向世界舞臺,在世界頂級期刊上發(fā)表論文,但學術(shù)影響力還稍遜一籌。2000 年 ACL 在中國香港舉辦時,只有微軟中國研究院的論文來自內(nèi)地;到了 2005 年,來自內(nèi)地的論文也只有三篇。
于是,王海峰想到一個方法:競選 ACL 主席。
ACL 是自然語言處理領(lǐng)域影響力最大、最具活力的國際學術(shù)組織。NLP 領(lǐng)域最有影響力的幾個國際學術(shù)會議,包括 ACL 年會、EMNLP、NAACL 等,都是 ACL 旗下會議。從 2004 年在 ACL 上發(fā)表論文并參會后,王海峰就再也沒缺席過這一會議。
王海峰在競選時向 ACL 做出了幾項保證:1)推動 ACL 在中國的發(fā)展;2)提升亞洲 NLP 社群對 ACL 的貢獻率;3)加強 ACL 同產(chǎn)業(yè)界的聯(lián)系。從王海峰自身的學術(shù)成就、影響力以及他「中國科技企業(yè)代表」這一獨特身份來看,這些承諾都是很有說服力的。最終,王海峰在全球會員投****中成功當選。
在 ACL 任職期間,王海峰提名了眾多優(yōu)秀的中國學者進入 ACL 承擔職務(wù),包括周明、趙世奇、吳華、劉洋等一大批中國 NLP 人才。
2015 年,隨著中國 NLP 方面的學術(shù)成果越來越引人矚目,當年的 ACL 年會在北京舉辦。這也是國際 NLP 領(lǐng)域的學術(shù)盛會第一次來到中國大陸。
2016 年,王海峰當選為 ACL 會士,成為首位獲此榮譽的中國大陸科學家。ACL 授予王海峰會士稱號的評價是「在機器翻譯、自然語言處理和搜索引擎技術(shù)領(lǐng)域,在學術(shù)界和工業(yè)界都做出了重大貢獻」。
2018 年,在第 56 屆 ACL 年會開幕式上,時任 ACL 主席 Marti Hearst 宣布創(chuàng)建亞太區(qū)域分會(AACL)并計劃在 2020 年舉行首次會議。之后每兩年舉行一次會議,會議地點將設(shè)置在亞太地區(qū)(今年受疫情影響已改為線上),由王海峰擔任 AACL 創(chuàng)始主席。在 AACL 成立之前,ACL 還在歐洲和北美兩個地區(qū)設(shè)有分會,而距離在 1999 年成立北美分會,已經(jīng)過去了二十年。
可以說,在中國 AI 走向世界的過程中,王海峰起到了重要的推動作用。
王海峰在人工智能領(lǐng)域的辛勤耕耘在國內(nèi)外廣受贊譽。2018 年,在第八屆吳文俊人工智能科學技術(shù)獎頒獎禮中,吳文俊人工智能獎頒發(fā)了首個「人工智能杰出貢獻獎」,而獲得這一榮譽的,正是王海峰。
在新基建的背景下,以王海峰為代表的工程研究人員構(gòu)成了中國 AI 的中堅力量。與此同時,他們也在積極地培養(yǎng)下一代人才。
在剛剛落幕的 2020 百度國際大數(shù)據(jù)競賽上,王海峰表示,目前百度已與社會各界展開合作,未來 5 年幫助社會培養(yǎng) 500 萬 AI 人才,推動整個社會智能化升級。此外,他們還發(fā)起了面向青少年 AI 科普教育的「晨曦計劃」,希望依托百度在 AI 技術(shù)上的經(jīng)驗積累,借助百度的 AI 學習資源,幫助青少年了解人工智能發(fā)展現(xiàn)狀、前沿研究和應(yīng)用,使更多青少年能夠喜歡 AI,在未來的工作和生活中應(yīng)用 AI。
參考資料:
《AI 已來:讓中國 AI 走向世界的王海峰》
https://tech.ifeng.com/c/80fftk9Lski
http://www.xinhuanet.com/politics/2016-01/16/c_128634682.htm
https://xw.qq.com/cmsid/20201029A0GH0000
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。