火爆“智能”下的慘淡“人工”
從人工智能發(fā)展高地北京到代河南鄭州只需要兩個(gè)小時(shí)的高鐵,那里有中國(guó)最大的代工廠富士康。再?gòu)泥嵵莼疖囌境霭l(fā),半小時(shí)車程,到達(dá) 一棟不起眼的寫字樓,打開一間沒有任何標(biāo)志的大門,就是目前河南最大的人工智能數(shù)據(jù)標(biāo)注工廠翊澳數(shù)據(jù)的總部。
本文引用地址:http://butianyuan.cn/article/201810/393156.htm聚集在北京的人工智能公司里,隨處可見人臉識(shí)別機(jī)器以及實(shí)時(shí)的大數(shù)據(jù)熱點(diǎn)圖。但這家數(shù)據(jù)工廠里,并沒有任何智能的樣子,也沒有普通工廠里的流水線,更像是一間網(wǎng)吧——裝修簡(jiǎn)單,幾十臺(tái)電腦依次排開。
正值午休時(shí)間,一半的電腦前面空空如也,還有數(shù)十名員工坐在電腦前,或是吃著打包來(lái)的午飯,或是掏出手機(jī)打游戲,也有部分標(biāo)注員還在處理一張張模糊或清晰的照片。
數(shù)據(jù)標(biāo)注行業(yè)流行的一句話,“有多少智能,就有多少人工”。目前AI算法能學(xué)習(xí)的數(shù)據(jù),必須通過(guò)人力逐一標(biāo)注,這些人力為AI產(chǎn)業(yè)提供養(yǎng)料,這是AI金字塔的基礎(chǔ),處于最底層。
此前,一些數(shù)據(jù)標(biāo)注工廠被冠以“血汗工廠”的名號(hào),為了應(yīng)對(duì)龐大的數(shù)據(jù)標(biāo)注需求,標(biāo)注員們必須加班加點(diǎn)的盯著電腦屏幕,夜以繼日的重復(fù)枯燥的工作,但眼前的這個(gè)工廠里,似乎有些清閑。
“聽說(shuō)北京AI很火,我們也想?yún)⑴c進(jìn)來(lái)?!瘪窗臄?shù)據(jù)總經(jīng)理靳建偉對(duì)《財(cái)經(jīng)》記者說(shuō)。
靳建偉經(jīng)歷豐富,善于追逐潮流。微信最火的時(shí)候他做過(guò)微信推廣,拼多多起來(lái)后在上面賣過(guò)襪子,還在關(guān)注短視頻營(yíng)銷行業(yè),“你知道抖音推廣吧?就是一個(gè)后臺(tái)可以操縱一百個(gè)賬號(hào)那種,據(jù)說(shuō)很賺錢?!?/p>
大多數(shù)AI初創(chuàng)公司還處于依靠融資發(fā)展的階段,但數(shù)據(jù)標(biāo)注產(chǎn)業(yè)更像傳統(tǒng)行業(yè),拿一單數(shù)據(jù)結(jié)一單錢,江湖中流傳的傳說(shuō)是,這個(gè)領(lǐng)域已經(jīng)創(chuàng)造了不少“一夜暴富”的故事。
被這樣的故事吸引,不少像靳建偉一樣的人們加入了這場(chǎng)淘金游戲,但現(xiàn)實(shí)給了他們當(dāng)頭一棒。
2018年,河南省的數(shù)據(jù)標(biāo)注公司死掉了一大半,剩下幾乎都在艱難求生,接受《財(cái)經(jīng)》記者采訪時(shí),靳建偉已經(jīng)2個(gè)多月沒有接到新的訂單,工廠員工從600人,銳減至200人,他覺得自己恐怕需要開始找下一個(gè)風(fēng)口了。
撞進(jìn)了AI圈
靳建偉今年28歲,2017年以前,他甚至沒聽說(shuō)過(guò)“數(shù)據(jù)標(biāo)注”這個(gè)詞。
他并不懂AI算法和技術(shù),也不太清楚AI到底能解決哪些問(wèn)題,2017年,他偶然聽說(shuō)做數(shù)據(jù)標(biāo)注能賺錢,當(dāng)時(shí)他正從事證券銷售業(yè)務(wù),由于沒有資質(zhì),公司被關(guān)停,他找到一個(gè)賣保健品的朋友,共同成立了這家數(shù)據(jù)標(biāo)注公司。
2017年,中國(guó)AI創(chuàng)業(yè)開始達(dá)到頂點(diǎn)。對(duì)數(shù)據(jù)標(biāo)注的需求也迅速爆棚。河南是人口大省,數(shù)百家數(shù)據(jù)標(biāo)注公司在此誕生。靳建偉算了一筆賬,一個(gè)成熟的標(biāo)注員,月產(chǎn)值能做到7000元,除去3000元的工資和質(zhì)檢、場(chǎng)地設(shè)備等費(fèi)用,公司能賺1500元。
“那我不斷招人就行,如果招100個(gè)人,一個(gè)月就賺15萬(wàn)?!苯▊フf(shuō)道,“怎么看都覺得這個(gè)生意靠譜。”
有電腦,有場(chǎng)地,再迅速招一批沒有學(xué)歷、工作經(jīng)驗(yàn)要求的數(shù)據(jù)標(biāo)注員,就可以迅速上手。
深度學(xué)習(xí)的關(guān)鍵在于大量的數(shù)據(jù)訓(xùn)練,數(shù)據(jù)訓(xùn)練之前,必須對(duì)這些數(shù)據(jù)進(jìn)行明確的標(biāo)注。例如,機(jī)器需要識(shí)別斑馬線,就必須提供大量標(biāo)注了斑馬線的數(shù)據(jù)來(lái)進(jìn)行學(xué)習(xí),數(shù)據(jù)量足夠大時(shí),機(jī)器就可以識(shí)別出任何角度的斑馬線。
這意味著,在某種程度上,AI算法的優(yōu)化,取決于數(shù)據(jù)標(biāo)注的質(zhì)量,而把控這些質(zhì)量的,是完全不懂AI技術(shù)的一群人。
一名沒有任何經(jīng)驗(yàn)的標(biāo)注員,通過(guò)半天的培訓(xùn)即可開工, 1-2個(gè)月之后可變成熟練工,一天就可以完成1500-2000張圖片的標(biāo)注。
需要標(biāo)注的圖片數(shù)據(jù)從客戶提供的數(shù)據(jù)處理平臺(tái)上打包下載,根據(jù)不同的需求進(jìn)行標(biāo)注,常見的包括物體識(shí)別和人臉識(shí)別,物體識(shí)別主要是“畫框”,人臉識(shí)別則是“打點(diǎn)”。完成后會(huì)進(jìn)行一到兩道的質(zhì)量檢測(cè)程序,來(lái)確保標(biāo)識(shí)準(zhǔn)確率,合格后會(huì)重新傳送到客戶的數(shù)據(jù)平臺(tái)上。
然后,這些數(shù)據(jù)會(huì)被應(yīng)用到自動(dòng)駕駛、AI安防、智能身份認(rèn)證等新興應(yīng)用領(lǐng)域。
依靠這些應(yīng)用,人工智能公司在資本市場(chǎng)頗受追捧,投中研究院發(fā)布的數(shù)據(jù)顯示,2018年上半年,進(jìn)入商業(yè)化階段的中國(guó)人工智能行業(yè)已經(jīng)獲得超過(guò)400億人民幣的融資。
這400億的資金,僅有極少部分流入了數(shù)據(jù)標(biāo)注行業(yè)。企名片收錄的標(biāo)簽為“數(shù)據(jù)標(biāo)注”的公司共有15家,2018年,這15家公司共完成6筆融資,單筆融資金額約為1000萬(wàn)人民幣左右,總計(jì)不超過(guò)1億人民幣。
靳建偉還沒考慮過(guò)融資這件事,他聽說(shuō)北京的AI公司都在以億為單位進(jìn)行融資,但他的思維和之前的數(shù)次創(chuàng)業(yè)沒有區(qū)別,找客戶,做業(yè)務(wù),能賺錢,才是應(yīng)該做的事情。
單打獨(dú)斗在當(dāng)下的AI圈很難混得開。由于完全沒有相關(guān)行業(yè)經(jīng)驗(yàn),也沒有資本加持,一開始靳建偉只能接二手,甚至三手訂單,也即外包服務(wù)。“一些有渠道的公司接了訂單,自己不做,或者自己做不過(guò)來(lái),就分發(fā)給我們做,他們?cè)購(gòu)闹虚g收取差價(jià)?!?/p>
與很多行業(yè)一樣,渠道是核心競(jìng)爭(zhēng)力,中間商們不需要耗費(fèi)太多的人力物力,就能賺取可觀的利潤(rùn),底層的工廠們,加班加點(diǎn),只能勉強(qiáng)維持經(jīng)營(yíng)。
這樣下去可不行。在熟悉了行業(yè)之后,靳建偉開始主動(dòng)出擊,拓展渠道,試圖繞過(guò)中間商。從知名的頭部AI公司開始,到所有他能找到聯(lián)系方式的中小AI企業(yè),他問(wèn)了個(gè)遍。得到的回應(yīng)要么是“不需要”,要么是“我們已經(jīng)有了自己的數(shù)據(jù)標(biāo)注團(tuán)隊(duì)”,更多的是石沉大海,沒有回音。
“人家上來(lái)就問(wèn)你,以前做過(guò)哪些項(xiàng)目,我說(shuō)不上來(lái)?!彼軣o(wú)奈。
類似商湯科技、科大訊飛這樣的頭部AI公司,都會(huì)自建數(shù)據(jù)標(biāo)注團(tuán)隊(duì),既能方便管理,也能更好的理解需求。
但確實(shí)也有大量AI公司,由于團(tuán)隊(duì)人數(shù)、資金成本有限,有外包數(shù)據(jù)標(biāo)注的需求,但大部分都會(huì)通過(guò)熟悉的渠道尋找標(biāo)注團(tuán)隊(duì),或者和大平臺(tái)合作,例如百度眾測(cè)平臺(tái)。
百度眾測(cè)是百度旗下的一個(gè)類似眾包模式的數(shù)據(jù)平臺(tái),2014年在百度世界大會(huì)上正式推出,平臺(tái)上會(huì)分發(fā)各類任務(wù),在行業(yè)內(nèi)稱為“放題”,包括數(shù)據(jù)采集、圖片標(biāo)注、文本標(biāo)注等。
百度在中國(guó)人工智能領(lǐng)域起步早,渠道輻射廣,眾測(cè)平臺(tái)上每天都有大量的數(shù)據(jù)標(biāo)注需求,并且開放注冊(cè),這讓靳建偉看到了機(jī)會(huì)。
飽一頓,饑一頓
距離鄭州車程兩個(gè)小時(shí)的河南新鄉(xiāng)輝縣,甚至找不到一棟商用寫字樓。從馬路邊一個(gè)毫不起眼的門洞上樓,就是翊澳在輝縣的工廠,也是該公司目前規(guī)模最大的一個(gè)廠。
兩層樓,近500平方米的空間里,劃分出了三片工作區(qū)域,但目前僅有一片區(qū)域開工運(yùn)轉(zhuǎn)。
翊澳下面類似這樣的分廠有十幾個(gè),分布在河南省內(nèi)各個(gè)縣市里。
由于百度眾測(cè)平臺(tái)提供了訂單來(lái)源,翊澳幾乎是在一夜之間發(fā)展成這樣的規(guī)模,靳建偉拉來(lái)以前一起做證券銷售的同事們,讓他們回到各自的老家成立分工廠,并擔(dān)任負(fù)責(zé)人,“之前一起做過(guò)事,已經(jīng)有信任關(guān)系,下面這些地方場(chǎng)地租金更便宜,員工工資也低,更省成本?!?/p>
評(píng)論