人工智能科學(xué)家李飛飛的逆襲之路
這個自從來到美國以后,就飽受經(jīng)濟(jì)壓力的乖乖女,卻少見地叛逆了一回。她決定去西藏研究一年藏藥,之后去加州理工學(xué)院攻讀PhD。
本文引用地址:http://www.butianyuan.cn/article/201701/343232.htm
當(dāng)我們今天縱觀李飛飛的人生時,會發(fā)現(xiàn),這種追隨內(nèi)心的熱情和強(qiáng)硬堅韌的作風(fēng),始終貫穿著她的行為軌跡。正如博士畢業(yè)后,她選擇了當(dāng)時還不太流行的圖像識別作為研究方向一樣。
圖像識別技術(shù),是人工智能發(fā)展道路上的一座高峰。簡單來說,它就是要教會計算機(jī)看圖說話。要知道,“看到”和“懂得”是不一樣的。比如,你可以告訴計算機(jī),“貓”就是有著圓臉、胖身子、 兩個尖尖的耳朵,還有一條長尾巴的東西。

可是,如果圖片是這樣的呢?

一個3歲小孩都能從圖片中識別出“貓”,可是計算機(jī)卻做不到。
李飛飛研究了很長時間,始終沒有突破。交好的教授都勸她換個方向,以便拿到tenure(終生教職:在西方高校,有了tenure就相當(dāng)于終生的職業(yè)生涯都有了保障)。
她當(dāng)然沒有同意。有一天,李飛飛突然意識到,由于人眼每200毫秒就能獲取一幅圖像,一個3歲兒童可能已經(jīng)獲得了上億次的圖像識別訓(xùn)練,是計算機(jī)的幾何級倍數(shù)。
也就是,關(guān)鍵在于自主訓(xùn)練量。
李飛飛馬上開始著手,從twitter上抓取海量照片,將它們統(tǒng)統(tǒng)打上標(biāo)簽后,訓(xùn)練計算機(jī)進(jìn)行機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)(machine learning),就是給出一定算法,讓計算機(jī)自己學(xué)習(xí)。
這個過程是艱苦的。如今,機(jī)器學(xué)習(xí)已經(jīng)是熱門概念,可在2007年,李飛飛的實驗室缺少人手,又申請不到經(jīng)費。最困難的時候,她一度想重開洗衣店,籌集實驗資金。
她從亞馬遜的眾包平臺中找到了解決辦法,讓全世界的網(wǎng)友一起給圖片打標(biāo)簽。當(dāng)時,李飛飛的研究項目,一度是該眾包平臺全球最大的雇主。

一個前所未有的龐大數(shù)據(jù)庫建成了,這就是大名鼎鼎的ImageNet。李飛飛沒有敝帚自珍,而是將ImageNet數(shù)據(jù)庫開源,供學(xué)術(shù)和商業(yè)界的每一個實驗室調(diào)取。圖片識別技術(shù)從此飛速發(fā)展,如今已經(jīng)能辨識出大部分照片中的物體,還能用高度擬合的人類語言,將它們描述出來。
由于學(xué)術(shù)成就卓著,李飛飛收到了很多社會活動的邀請。她曾經(jīng)接受過 New York Times的訪談,也曾登上 TED的舞臺,講述圖形識別技術(shù)發(fā)展的背后故事。

評論