IBM未經(jīng)許可將用戶照片用于AI訓(xùn)練

作者：時(shí)間：2019-03-15 來(lái)源：鎂客網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

　　當(dāng)面部識(shí)別成為越來(lái)越廣泛應(yīng)用的技術(shù)，隨之而來(lái)的是關(guān)于個(gè)人數(shù)據(jù)隱私泄露的擔(dān)憂。IBM這次就撞在了槍口上。近日，外媒報(bào)道曝光IBM未經(jīng)許可，利用網(wǎng)絡(luò)相冊(cè)Flickr上近100萬(wàn)張個(gè)人照片，訓(xùn)練它們面部識(shí)別系統(tǒng)，同時(shí)與外部研究人員共享這些照片。

本文引用地址：http://butianyuan.cn/article/201903/398510.htm

　　眾所周知，機(jī)器學(xué)習(xí)的關(guān)鍵就是大量的數(shù)據(jù)訓(xùn)練，人臉識(shí)別算法亦然。為了提高算法的精確度，需要標(biāo)注上百萬(wàn)的照片來(lái)訓(xùn)練AI。

　　據(jù)了解，在Flickr上傳照片的用戶并不同意IBM將其照片用于開(kāi)發(fā)面部識(shí)別系統(tǒng)，因?yàn)檫@些可能最終會(huì)被用來(lái)監(jiān)視和識(shí)別他們。一位攝影師透露：“我拍攝的人中沒(méi)有一個(gè)人知道他們的照片是以這種方式使用的?！?/p>

　　這些照片被IBM統(tǒng)稱之為訓(xùn)練數(shù)據(jù)集，他們已經(jīng)對(duì)照片上人物的膚色、性別、面部輪廓等做了詳細(xì)的標(biāo)注。

　　盡管IBM保證Flickr用戶可以選擇退出數(shù)據(jù)庫(kù)，但報(bào)道該事件的媒體NBC新聞發(fā)現(xiàn)，刪除照片幾乎是不可能的。IBM要求攝影師通過(guò)電子郵件發(fā)送他們想要?jiǎng)h除的照片的鏈接，但該公司尚未公開(kāi)分享數(shù)據(jù)集中包含的Flickr用戶和照片列表，因此沒(méi)有簡(jiǎn)單的方法可以找到包含哪些照片。

　　這幾年隨著面部識(shí)別的大規(guī)模應(yīng)用，不少科技公司都和IBM一樣，抓取網(wǎng)絡(luò)上公開(kāi)、非商業(yè)性質(zhì)的圖片、視頻來(lái)訓(xùn)練AI程序。

　　此次被曝光的IBM數(shù)據(jù)訓(xùn)練集就是YFCC100M照片庫(kù)的一部分，YFCC100M是Flickr前東家雅虎為進(jìn)行研究而收集的照片數(shù)據(jù)庫(kù)。所有照片都是在CreativeCommonsLicense版權(quán)協(xié)議下共享的，這種版權(quán)協(xié)議表明照片可以自由使用，但存在一些限制。

　　面對(duì)質(zhì)疑，IBM表示數(shù)據(jù)集不會(huì)將人臉的照片與其姓名相關(guān)聯(lián)，而且他們的目標(biāo)是為了解決算法的偏差，以防可能出現(xiàn)的種族歧視。但是，公民自由倡導(dǎo)者和技術(shù)倫理研究人員仍然質(zhì)疑IBM的動(dòng)機(jī)，因?yàn)镮BM也在銷(xiāo)售人臉識(shí)別系統(tǒng)，這些工具因侵犯公民自由一直受到批評(píng)。

　　有業(yè)內(nèi)人士指出，IBM和Facebook等公司的研究機(jī)構(gòu)和商業(yè)運(yùn)營(yíng)之間的區(qū)別是模糊的。即使算法由學(xué)術(shù)研究人員使用非商業(yè)數(shù)據(jù)集開(kāi)發(fā)，它們通常也會(huì)被企業(yè)使用。

新聞中心

IBM未經(jīng)許可將用戶照片用于AI訓(xùn)練

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)