新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 低學(xué)歷的印度數(shù)據(jù)標(biāo)簽工,正成為全球AI功臣

低學(xué)歷的印度數(shù)據(jù)標(biāo)簽工,正成為全球AI功臣

作者: 時(shí)間:2019-03-25 來源: 獵云網(wǎng) 收藏

  印度人工智能后臺(tái)

本文引用地址:http://www.butianyuan.cn/article/201903/398787.htm

  亞馬遜的MTurk在開始限制非美國(guó)員工之前,曾是印度人尋找數(shù)據(jù)和注釋工作的熱門平臺(tái)。盡管后來取消了限制,但隨著企業(yè)客戶開始更加重視數(shù)據(jù)安全,MTurk在數(shù)據(jù)商中的受歡迎程度有所下降。此外,包括Spare5、Cloudfactory和Figure Eight在內(nèi)的新眾包平臺(tái)也已經(jīng)進(jìn)入市場(chǎng),它們則更加關(guān)注注釋和市場(chǎng)。

  Kolasseri說:“在創(chuàng)辦公司之前,我曾于2015年至2016年期間在MTurk平臺(tái)上工作過,如今,仍然不斷有新的平臺(tái)出現(xiàn)。但是,由于企業(yè)客戶非常關(guān)注數(shù)據(jù)安全,尤其是考慮到許多數(shù)據(jù)集都是專有的,因此信任這些平臺(tái)上的工作人員成為他們面臨的更大挑戰(zhàn)?!?/p>

  由前Flipkart員工Mall、Ajinkya Malasane和Akshay Kumar Lal所創(chuàng)立的Playment,則以一種略有不同的方式對(duì)待注釋和標(biāo)簽行業(yè)。

  該公司為各種用例開發(fā)了一系列注釋工具,并開發(fā)了一個(gè)由受過這些工具培訓(xùn)的標(biāo)簽工和注釋工組成的眾包平臺(tái)。該公司直接與客戶或相關(guān)的信息技術(shù)服務(wù)公司進(jìn)行合作。

  “要將原始數(shù)據(jù)轉(zhuǎn)換為帶注釋的結(jié)構(gòu)化數(shù)據(jù),你需要前端注釋工具、熟練且經(jīng)濟(jì)高效的人力資源。此外,由于處理數(shù)據(jù)的規(guī)?;氵€需要有合適的中間件來支持不同的工作流并管理遠(yuǎn)程人力資源,”Mall說。

  Playment的眾包平臺(tái)擁有30多萬(wàn)標(biāo)簽工和注釋工。其中,該公司認(rèn)為約有2.5萬(wàn)人是“高技能頂級(jí)玩家”。據(jù)Mall稱,這些人幾乎整天都在平臺(tái)上,平均月收入為2萬(wàn)至3萬(wàn)盧比。

  Playment的大部分工作也來自國(guó)際客戶,其中包括三星、滴滴出行、阿里巴巴、Drive.ai和Continental AG,其中大部分都屬于自動(dòng)駕駛車輛領(lǐng)域。

  iMerit的戰(zhàn)略則以員工為中心。其2000多名勞動(dòng)力中,約80%來自月收入低于100美元的家庭;其中大約一半是女性?!拔覀兊纳鐣?huì)使命是在貧困社區(qū)和公司或工業(yè)較少的地區(qū)創(chuàng)造技術(shù)就業(yè)機(jī)會(huì)。我們?cè)诳萍籍a(chǎn)業(yè)稍低、科技就業(yè)機(jī)會(huì)較少的城市開展業(yè)務(wù),” Natarajan說道。

  所謂的利他主義也有很好的商業(yè)意義。Natarajan表示:“我們的合作伙伴和辦公地點(diǎn),允許我們以非常經(jīng)濟(jì)高效的方式擴(kuò)大數(shù)據(jù)注釋和標(biāo)簽團(tuán)隊(duì),并為客戶提供高質(zhì)量的工作?!?/p>

  盡管iMerit的大部分業(yè)務(wù)都來自美國(guó)——客戶包括微軟、易趣和Tripadvisor——但其90%的數(shù)據(jù)注釋和標(biāo)簽工作是在印度完成的。

  注釋自動(dòng)化

  雖然各大公司正在開發(fā)用于注釋的自動(dòng)化工具,但由于許多工作需要更為細(xì)致的定制注釋或標(biāo)簽工作,要想讓自動(dòng)化工具達(dá)到高精度還需要一段時(shí)間。

  Natarajan說,與五年前人工智能還在區(qū)分貓和狗的不同相比,現(xiàn)在的人工智能需要處理更高級(jí)的工作。“機(jī)器學(xué)習(xí)已經(jīng)向前發(fā)展,所以不再有人要求我們?yōu)楣泛拓堖M(jìn)行標(biāo)記。如今,每家公司都有定制的需求和非常細(xì)微的需求,所以不可能自動(dòng)實(shí)現(xiàn)這一點(diǎn),也不可能自動(dòng)給出數(shù)據(jù)并由一群匿名人士貼上標(biāo)簽?!?/p>

  他說,基于人工智能的自動(dòng)化注釋工具是不可避免會(huì)出現(xiàn)的,但它并不是一個(gè)威脅?!白詣?dòng)化注釋工具本身就是經(jīng)過良好注釋訓(xùn)練出來的結(jié)果。當(dāng)你試圖解決一個(gè)問題時(shí),這些工具只能把你帶到一定的水平,但是要超越這個(gè)水平,你還需要自定義注釋,”Natarajan說。

  當(dāng)然,加以一段時(shí)間,自動(dòng)化工具會(huì)變的足夠有效,從而能夠創(chuàng)建更好地?cái)?shù)據(jù)集。“從更長(zhǎng)遠(yuǎn)的角度來看,我們確實(shí)認(rèn)識(shí)到這個(gè)行業(yè)并不能永久存在。當(dāng)客戶成功時(shí),我們的任務(wù)就結(jié)束了,”Natarajan說。“但我們也發(fā)現(xiàn),這也并不是一個(gè)100%肯定的事情,因?yàn)樗偸且粋€(gè)持續(xù)不斷的學(xué)習(xí)和改進(jìn)的過程。此外,當(dāng)客戶轉(zhuǎn)向下一個(gè)問題時(shí),一切又都從零開始了。”

  換句話說,印度的數(shù)據(jù)標(biāo)簽和注釋公司尚未見頂,這一行業(yè)可能需要很長(zhǎng)時(shí)間才會(huì)走上業(yè)務(wù)流程外包的老路。


上一頁(yè) 1 2 下一頁(yè)

關(guān)鍵詞: AI 標(biāo)簽

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉