圖像識別技術(shù)在內(nèi)容審核領(lǐng)域的應(yīng)用研究

作者：時間：2016-12-22 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

互聯(lián)網(wǎng)內(nèi)容發(fā)展與圖像識別技術(shù)

本文引用地址：http://butianyuan.cn/article/201612/332879.htm

早在2013年，全世界每天會上傳超過5億張圖片、上傳20萬小時長的視頻到互聯(lián)網(wǎng)。但是人們每天在Instagram分享近6000萬張照片，在Facebook分享近3億張——當然，還沒算上Snapchat、 Google 、 Twitter等大量產(chǎn)圖的應(yīng)用。據(jù)估計，一年后就可達到18億，所以在三年后的今天，這個數(shù)值必然遠超乎我們的想象。確實，人們相比過去，互聯(lián)網(wǎng)的數(shù)據(jù)每年都在爆炸式增長。IBM 的研究稱,整個人類文明所獲得的全部數(shù)據(jù)中, 有 90%是過去兩年內(nèi)產(chǎn)生的，等到了 2020 年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達到今天的 44 倍。

可以看得出，圖片和視頻內(nèi)容已成為用戶表達、事件記錄分析中不可或缺的部分,在多方面發(fā)揮越來越重要的價值。但隨著互聯(lián)網(wǎng)的發(fā)展，內(nèi)容安全成為互聯(lián)網(wǎng)不得不面臨的嚴峻挑戰(zhàn)。因此，面對互聯(lián)網(wǎng)的基礎(chǔ)需求——內(nèi)容審核，圖像識別技術(shù)可以以此為契機，為互聯(lián)網(wǎng)圖像內(nèi)容穩(wěn)定高效的發(fā)展保駕護航。

圖像識別技術(shù)與人工智能

說起圖像識別，我們知道，人的圖像識別能力是非常強大的。圖像距離的改變或圖像在感覺器官上作用位置的改變，都會造成圖像在視網(wǎng)膜上的大小和形狀的改變。即使在這種情況下，人們?nèi)匀豢梢哉J出他們過去知覺過的圖像。甚至圖像識別可以不受感覺通道的限制。例如，人眼可以看字，當別人在他手上寫字時，他也可以認出這個字。

而計算機圖像識別技術(shù)是計算機對圖像進行處理、分析和理解，以識別各種不同模式的目標和對象的技術(shù)。識別過程包括圖像預(yù)處理、圖像分割、特征提取和判斷匹配。

圖像識別技術(shù)是人工智能的一個重要領(lǐng)域。簡單來說，圖像識別就是計算機如何像人一樣讀懂圖片的內(nèi)容。而圖像識別所研究的問題，是如何用計算機代替人類去自動處理大量的物理信息，解決人類所無法識別或者識別過于耗費資源的問題，從而很大程度上解放人類的勞動力。

圖像識別技術(shù)與內(nèi)容審核技術(shù)的融合

因此，對于互聯(lián)網(wǎng)如此大量的圖像內(nèi)容審核需求，圖像識別技術(shù)如何實現(xiàn)其中的融合與發(fā)展，從而解放大量每日做著簡單重復(fù)的工作的內(nèi)容審核人員是非常值得我們期待。

傳統(tǒng)的圖像審核方式主要有三種：1、純?nèi)斯徍耍浩髽I(yè)員工“三班倒”工作，人眼鑒別該圖片或視頻是否違規(guī)；2、建立MD5數(shù)據(jù)庫：DNA是人類唯一的身份識別碼，而圖片、視頻的DNA無疑是MD5，網(wǎng)監(jiān)建立了存儲違規(guī)圖片、視頻的MD5數(shù)據(jù)庫，用戶上傳后自動分析MD5是否合法，則可避免涉黃內(nèi)容重復(fù)分享。3、傳統(tǒng)的智能審核：如識別色情圖像,基本是通過圖片 RGB 值識別膚色比例、通過建模識別異常動作、敏感部位等。

但是三個審核方式都存在較大的漏洞，“三班倒”的人工容易導致審核效率低、誤判漏判多等主觀性問題；MD5則非常容易被篡改，在視頻中加入文字或者修改任意一幀就能實現(xiàn)；傳統(tǒng)智能識別色情圖片準確率低、經(jīng)常誤報等。而且這三種審核方式對近兩年熱門的視頻直播審核需求更難以滿足。

但以圖普科技為代表的互聯(lián)網(wǎng)圖像內(nèi)容審核專家，基于人工智能與圖像識別技術(shù)領(lǐng)域最新的算法：深度學習算法，通過模擬人腦神經(jīng)網(wǎng)絡(luò),構(gòu)建具有高層次表現(xiàn)力的模型,能夠?qū)Ω邚?fù)雜度數(shù)據(jù)形成良好的解讀。通過大數(shù)據(jù)持續(xù)訓練、頻繁的迭代，圖普科技的圖像識別云平臺的內(nèi)容審核產(chǎn)品的精確度達到 99.5%,有效節(jié)省超過 90%的人工復(fù)審工作。

目前，圖普科技基于圖像識別技術(shù)的主要的內(nèi)容審核產(chǎn)品有：

色情識別

智能識別圖片和視頻內(nèi)容，并對色情程度進行打分，方便用戶對涉黃內(nèi)容進行快速處理，幫助用戶減少審核人力，有效降低涉黃風險。

暴恐識別

識別ISIS、基地組織、東突等各類國家命令禁止的暴恐圖片及視頻內(nèi)容。

時政敏感內(nèi)容識別

建立敏感數(shù)據(jù)庫，提供定制化的解決方案，如識別國家領(lǐng)導人、政治運動場景等時政敏感性內(nèi)容。

OCR

主要針對廣告內(nèi)容過濾，自動識別圖像內(nèi)容是屬于正常、二維碼或者帶文字的廣告等圖片內(nèi)容。

圖普科技通過圖像識別技術(shù)，將圖片與樣本庫中的海量樣本圖進行對比判斷，根據(jù)判斷返回圖片的狀態(tài)，可判斷一張圖片是否為正常、色情、暴恐、廣告或其他的敏感內(nèi)容等。

并且，圖普科技的圖像識別云平臺還可以幫助企業(yè)定制自己的圖像識別引擎，使用機器來代替人工對需要審核圖片和視頻進行鑒別。就無需聘請人工智能識別的專家組建研發(fā)團隊，通過接入API調(diào)用識別服務(wù)即可。這在極大程度上降低了互聯(lián)網(wǎng)行業(yè)應(yīng)用圖像識別服務(wù)的門檻，從而為更多互聯(lián)網(wǎng)企業(yè)使用人工智能圖像識別技術(shù)提供了更大的機會。

內(nèi)容審核對于互聯(lián)網(wǎng)圖像內(nèi)容發(fā)展來說是一項艱巨而又關(guān)鍵的任務(wù)，是后續(xù)的圖像內(nèi)容運營與發(fā)展的最基礎(chǔ)保障。圖普科技深知將要將圖像識別技術(shù)更好地融合到內(nèi)容審核領(lǐng)域，實現(xiàn)更高的準確率，是非常值得重視的，因此，盡管在業(yè)界已經(jīng)擁有一定的知名度，圖普科技仍然深耕于內(nèi)容審核與圖像識別技術(shù)領(lǐng)域，把圖像識別技術(shù)視為內(nèi)容審核及互聯(lián)網(wǎng)圖像內(nèi)容發(fā)展領(lǐng)域的未來，在將圖像識別技術(shù)更好地應(yīng)用于具體的行業(yè)需求方面，為其他的人工智能應(yīng)用提供了一條有價值的參考途徑。

新聞中心

圖像識別技術(shù)在內(nèi)容審核領(lǐng)域的應(yīng)用研究

評論

相關(guān)推薦

技術(shù)專區(qū)