谷歌推機器學習標注圖片中物體界面整體速度提高3倍

作者：時間：2018-10-25 來源：新浪科技

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

　　10月24日上午消息，據(jù)中國臺灣地區(qū)媒體iThome.com.tw報道，Google在2018 ACM多媒體會議上，推出一種使用機器學習來標注圖片界面，讓使用者快速為圖片中物體標記出輪廓以及標簽，提高整體標記速度達三倍。

本文引用地址：http://www.butianyuan.cn/article/201810/393356.htm

　　由于現(xiàn)代基于深度學習電腦視覺模型的性能，取決標簽訓練資料的多少，越大的資料庫將能讓機器學習有更好的表現(xiàn)。Google在許多深度學習的研究都一再提到，高品質(zhì)的訓練資料取得并不容易，而這個問題已經(jīng)成為發(fā)展電腦視覺的主要瓶頸，對于諸如自動駕駛、機器人或是圖片搜尋等這類以像素為辨識基礎的工作更是如此。

　　傳統(tǒng)的方法需要使用者手動以標記工具，圈出圖片中物體的邊界，Google提到，使用COCO加Stuff資料集，標記一個圖片需要19分鐘，標記完整個資料集需要53000個小時，太過耗時沒效率。因此Google探索了全新的訓練資料標記方法-流體標注(Fluid Annotation)，能以機器學習幫助使用者快速找出圖片物體輪廓上標簽。

　　流體標注從強語義分割模型的輸出開始，使用者能以自然的使用者界面，借由機器學習輔助進行編輯和修改，界面提供使用者需要修正的物體以及順序，讓人們能夠專心于那些機器尚無法辨識清楚的部分。為了標注圖片，Google預先以約一千張具有分類標簽和信任分數(shù)的圖片訓練了語意分割模型(Mask-RCNN)，具有最高信心的片段(Segment)能被用于初始標簽中。

　　流體標注能夠為使用者產(chǎn)生一個短清單，透過點擊就能快速為物體上標簽，而使用者也可以增加范圍標記，來覆蓋沒被偵測出來的物體，并透過滾動選擇最佳的形狀。另外，除了能夠增加，也能刪除既有的物體標記或是變更物體深度順序。

　　目前這一階段的流體標注的目標是讓圖像更快更容易，提高整體資料集標記速度達三倍。接下來Google要改進物體邊界標記，并以更多的人工智能加速界面操作，擴展界面以處理現(xiàn)在無法辨識的類別。

新聞中心

谷歌推機器學習標注圖片中物體界面整體速度提高3倍

評論

相關推薦

技術專區(qū)

新聞中心

谷歌推機器學習標注圖片中物體界面 整體速度提高3倍

評論

相關推薦

技術專區(qū)

谷歌推機器學習標注圖片中物體界面整體速度提高3倍