博客專欄

EEPW首頁 > 博客 > 朱晨光:一個從不通宵的AI研究員(1)

朱晨光:一個從不通宵的AI研究員(1)

發(fā)布人:數(shù)據(jù)派THU 時間:2021-05-16 來源:工程師 發(fā)布文章

[ 導(dǎo)語 ]從斯坦福計算機系博士畢業(yè)后第4年,朱晨光便已升為微軟的首席研究經(jīng)理,管理認(rèn)知服務(wù)研究部門下的知識與語言研究組。而在讀博期間,他的研究方向并不是自然語言處理。

學(xué)習(xí)、競賽、打乒乓、搞科研、寫書、工作……朱晨光的生活總是同時被其中至少3件事情占據(jù),給人一種很活躍的印象,所以,在聽到他曾與趙薇同臺參加1994年安徽省蕪湖市的春節(jié)聯(lián)歡晚會時,筆者也沒有太吃驚:

“那一年是狗年,我演狗,是我們幼兒園的領(lǐng)舞,而她是她們學(xué)校(蕪湖師范學(xué)校)的領(lǐng)舞?!闭勂鸺亦l(xiāng)蕪湖,朱晨光首先想到的不是三只松鼠,而是蕪湖老鄉(xiāng)、《還珠格格》里的小燕子。

緊接著是出于興趣,他從8歲就開始學(xué)習(xí)LOGO語言。這是一門面向兒童的編程語言,由3位知名計算機科學(xué)家(Wally Feurzeig、Seymour Papert與Cynthia Solomon)在1967年設(shè)計而成。

最開始他是用LOGO在電腦上畫圖,敲鍵盤就能畫出一個正方形或圓形,讓他覺得很有趣,于是小學(xué)就參加競賽,拿了市區(qū)第一名。自然而然地,小升初進(jìn)入蕪湖一中時,他被選入學(xué)校的信息學(xué)競賽隊伍,一路打到市賽、省賽、全國賽,初三就進(jìn)入NOI國家集訓(xùn)隊,獲得清華大學(xué)預(yù)錄取的資格。

朱晨光是一名80后。在他8歲那年(1996年),許多人的家里都還沒有安裝電腦,而他的父親就已堅定地認(rèn)為計算機在未來一定會有非常大的發(fā)展。果不其然,隨著互聯(lián)網(wǎng)浪潮的興起,計算機成為信息時代的技術(shù)奠基,“碼農(nóng)”成為21世紀(jì)收入最高的行業(yè)之一。

但朱晨光沒有成為一名“碼農(nóng)”,而是成了一名“NLPer”,進(jìn)入了人工智能領(lǐng)域,在Windows的老東家微軟研究自然語言處理(NLP)。但實際上,他在斯坦福大學(xué)讀博期間的研究方向并不是NLP,而是交通優(yōu)化。

2016年博士畢業(yè)后,朱晨光入職微軟,先是做自然語言理解(NLU),出了一本NLU相關(guān)的入門書籍,叫《機器閱讀理解:算法與實踐》。2019年,他又從NLU轉(zhuǎn)向研究文本總結(jié)與知識圖譜。

“如果你問我未來5年的研究方向是否還會轉(zhuǎn)變,我的答案是肯定的?!敝斐抗獯鸬?。在他看來,在企業(yè)做研究與在高校做研究的一個區(qū)別就在于:你需要根據(jù)公司的業(yè)務(wù)來調(diào)整自己的研究方向,而市場是瞬息萬變的。

1 源于競賽的自學(xué)能力

從交通優(yōu)化到自然語言處理,再到知識圖譜與文本總結(jié),朱晨光認(rèn)為,自己能夠快速上手新的研究內(nèi)容,主要歸功于他從小參加信息學(xué)競賽所鍛煉出來的自學(xué)能力。

“當(dāng)時上競賽訓(xùn)練課時,我們并不是老老實實地坐在底下聽老師講課,而是需要自己找學(xué)習(xí)資料,發(fā)現(xiàn)問題,主動與老師、學(xué)生討論。”他談及,在這個過程中,競賽選手往往很早就鍛煉了自己主動學(xué)習(xí)的能力。

比如,進(jìn)入微軟后,面對人工智能領(lǐng)域的迅速發(fā)展,他很自覺就養(yǎng)成了一個習(xí)慣:每天至少閱讀一篇論文,以此來掌握NLP領(lǐng)域的最新知識與研究動態(tài)。既是為了能夠及時調(diào)整自己的研究內(nèi)容、以適應(yīng)產(chǎn)品的需求,也是為了緊跟潮流、不被時代淘汰。

朱晨光從初一開始就參加信息學(xué)競賽。競賽是他在中學(xué)時代的主旋律:初中那會是一邊學(xué)習(xí)一邊搞競賽;到了高中,他直接脫產(chǎn)搞競賽,“我一共就在班里待了半年,上完高一上學(xué)期的課我就把所有時間放在競賽上了。但其實我文化課的成績也不錯,在班上待的那半年也拿了一個全班第一名?!?/p>

初三那年(2003年),他第一次參加NOI就獲得銀牌,進(jìn)入前20名選手組成的國家集訓(xùn)隊。之后,他又連續(xù)兩年參賽,分別獲得一枚金牌與一枚銀牌。然而,盡管朱晨光連續(xù)3年進(jìn)入國家集訓(xùn)隊,卻沒有一次進(jìn)入IOI國家隊4人名單:2004年NOI,他考了477分,拿了全國第8名;2005年NOI,“前期成績是第一名,但最后一次大考沒有發(fā)揮好,非常遺憾與國家隊擦肩而過?!被貞洰?dāng)年,朱晨光感慨道。

盡管如此,朱晨光也覺得自己非常幸運有機會參加3次集訓(xùn),得以認(rèn)識3批優(yōu)秀的競賽選手。他們中的許多人都被引以為NOI競賽的榜樣,比如樓天城、胡偉棟、鬲融、朱澤園、唐文斌等人。他們至今仍保持緊密聯(lián)系,而其中與他關(guān)系最好的,要數(shù)同屆的朱澤園與唐文斌。

朱澤園來自南京外國語學(xué)校,與朱晨光的參賽節(jié)奏完全一致,都是2003年至2005年的信息學(xué)國家集訓(xùn)隊成員。他們同時去了清華,本科時一起組隊參加過ACM/ICPC;大三那會,兩個人都去了微軟亞洲研究院實習(xí),一起發(fā)表了5篇頂會論文;大四申請學(xué)校時,兩個人都拿到了去斯坦福讀博的offer,但朱澤園最終選擇了MIT。如今,他們兩個又都在位于美國西雅圖的微軟總部工作。

唐文斌來自紹興市第一中學(xué),高中畢業(yè)那年,朱晨光與他曾一起給NOI出題;上了清華后,他們一起組隊參加了兩岸清華程序設(shè)計競賽,代表北京與來自臺灣、香港的隊伍一起比賽,并獲得了第一名。如今,唐文斌在曠視科技擔(dān)任聯(lián)合創(chuàng)始人與CTO。

1.jpg

圖注:2007年,朱晨光(最左)與唐文斌(中間)、劉賀組隊參加兩岸清華編程競賽

除了自學(xué)能力的鍛煉,朱晨光認(rèn)為,NOI競賽對歷屆選手的影響還體現(xiàn)在計算機基礎(chǔ)與英語學(xué)習(xí)上。就他個人的經(jīng)歷來說,NOI競賽內(nèi)容涉及到數(shù)據(jù)結(jié)構(gòu)、算法等大學(xué)階段才有的計算機課程,所以后來他在清華讀計算機專業(yè)時,覺得學(xué)習(xí)很輕松,因為“有些課程在高中時已經(jīng)學(xué)過了”。

此外,當(dāng)時他們備考NOI時,90%以上的題目都是英文的,這對他的英語閱讀與理解能力有很大提升。剛上大一時,他參加GRE考試,滿分1600,他考了1520分;托福滿分120,他考了115。朱晨光因此談道:“我們搞競賽的,英語都不差?!?/p>

但在參加競賽的過程中,對朱晨光產(chǎn)生最大影響的,并不是知識的增長,而是他的競賽教練江濤老師,以及行萬里路所形成的開闊眼界。

朱晨光從初一開始就跟著江濤學(xué)習(xí),一直到高三畢業(yè)。“他教了我很多,不僅僅是信息競賽方面的知識,在意志品質(zhì)、為人處世方面,我也從江濤老師那受益彌久?!彪m然遠(yuǎn)在西雅圖,但朱晨光仍與老師保持聯(lián)系,逢年過節(jié)都會送上祝福與問候。

江濤是信息學(xué)競賽界一號響當(dāng)當(dāng)?shù)娜宋铩?5歲那年,他在一次造火箭的實驗事故中失去了雙手,但是他非常堅毅,靠自己的努力上了大學(xué)、學(xué)了計算機,畢業(yè)后分配到蕪湖一中任教。

在他的組織下,蕪湖一中成為歷年IOI國家隊最能打的中學(xué)之一。他的學(xué)生一共進(jìn)入國家集訓(xùn)隊29次,7人代表中國參加IOI比賽、獲得7枚國際獎牌。

江濤老師對科學(xué)的熱愛,對自我的要求,以及堅毅的精神,一直影響著朱晨光在知識的道路上不斷求索。從江老師的身上,他認(rèn)識到,人生路上所遇到的小磨小難,似乎是不值一提的。

而行萬里路,則是競賽地點散布在全國不同城市,因為參賽,他不僅結(jié)識了來自五湖四海的朋友,還去了省內(nèi)省外的許多地方,甚至因為一次偶然的機會,遠(yuǎn)赴美國科羅拉多州參加信息學(xué)奧林匹克競賽的集訓(xùn)。

2005年,17歲的朱晨光在網(wǎng)上報名參加了美國信息學(xué)奧林匹克競賽,名列前茅,作為國際學(xué)生,被主辦方邀請去科羅拉多州的一所大學(xué)里與美國的學(xué)生一起參加集訓(xùn)。在這次集訓(xùn)中,他最終獲得了第二名,達(dá)到了進(jìn)入美國國家隊的水平,但由于他是中國人,所以并未入隊。

“與國內(nèi)相比,我覺得美國的選拔比較科學(xué),考6次,算綜合成績,萬一哪次發(fā)揮不好,后面還可以再趕上來。國內(nèi)是一錘定音,有很多偶然性。而且美國的題目比較有趣,可能比國內(nèi)的要容易些?!?/p>

這次集訓(xùn)經(jīng)歷對朱晨光的影響很大。在之前,他對美國沒有感性的認(rèn)識,以為發(fā)達(dá)的美國到處都是高樓大廈、鱗次櫛比;去了美國科羅拉多州之后,他發(fā)現(xiàn),到處都很干凈,建筑都不高,很開闊,與國內(nèi)的氛圍很不一樣,這激發(fā)了他以后想到美國學(xué)習(xí)的念頭。

2 發(fā)表8篇論文的姚班學(xué)生

2006年,朱晨光從安徽蕪湖來到首都北京上學(xué),成為清華大學(xué)計算機系的一名新生。那一年,與朱晨光一同來到清華園的NOI選手,還有朱澤園、唐文斌、龍凡等10人。

大二那年,久仰于圖靈獎得主姚期智的風(fēng)采,朱晨光又通過考試選拔,考入了當(dāng)時由姚期智發(fā)起、成立還不到三年的軟件科學(xué)實驗班,也就是傳說中的“姚班”。那一屆,姚班一共有27名同學(xué),除了朱晨光,還有包括唐文斌在內(nèi)的4名NOI集訓(xùn)隊成員。

當(dāng)時,交叉信息研究院還未成立,姚班仍屬于計算機系,朱晨光等人的上課內(nèi)容一半由姚班老師授予,一半是計算機系的其他課程。在姚班的10門核心課程中,姚期智教授其中的2門,其余課程則由來自微軟亞洲研究院的高級研究人員負(fù)責(zé)。這對朱晨光起到了很大的影響。

“姚先生在我心中就是大神,成就高山仰止,我非常榮幸能夠做他的學(xué)生。”朱晨光感慨。直到現(xiàn)在,他仍然每年都會與姚先生聯(lián)系,每當(dāng)取得好成績時都會與恩師匯報。

朱晨光談到,姚先生非常重視對姚班學(xué)生的培養(yǎng),雖然他有很多繁雜事務(wù),但還是堅持每周都親自給姚班的學(xué)生上課。在姚先生教授的兩門課(《理論計算機》上下)中,朱晨光考得特別好,第一門滿分100,第二門99分,兩門課都是全班第一。

此外,姚先生一直鼓勵姚班學(xué)生盡早接觸科研,與領(lǐng)域里的大師多交流。姚先生每年都會舉辦幾次高級別的計算機會議,邀請國內(nèi)外知名的學(xué)者來交流,并讓姚班的本科生也參加。在“中國計算機科學(xué)2020”的論壇現(xiàn)場,朱晨光便有幸與1985年圖靈獎得主、UC Berkeley的教授Richard Karp進(jìn)行了交流。

2.jpg

圖注:2010年臨近畢業(yè)之際,朱晨光與姚期智合影

除了北京的學(xué)術(shù)交流活動,姚班還會組織與港澳大學(xué)進(jìn)行交流的冬令營活動。大三那年寒假,朱晨光便與姚班的同學(xué)一起去了香港科技大學(xué),待了一個星期,與港科大的學(xué)生一起上課、交流,開闊眼界。

姚班的授課教材幾乎是全英文,課程內(nèi)容前沿,難度也比較高。因為很早就萌發(fā)出國讀書的念頭,出國申請要求高績點,所以朱晨光從大一開始就很用功,在專業(yè)課與英語學(xué)習(xí)上投入了大量的時間與精力,希望每門課都能拿高分。

最后,功夫不負(fù)有心人,他的平均分達(dá)到92.2/100,排名全班第2、全級第4,榮獲清華大學(xué)優(yōu)秀學(xué)術(shù)獎學(xué)金(授予排名前2%的學(xué)生),成為當(dāng)年清華計算機系唯一拿到斯坦福博士offer的學(xué)生。

*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉