圖像識別技術(shù)在內(nèi)容審核領(lǐng)域的應(yīng)用研究
互聯(lián)網(wǎng)內(nèi)容發(fā)展與圖像識別技術(shù)
本文引用地址:http://butianyuan.cn/article/201612/332879.htm早在2013年,全世界每天會上傳超過5億張圖片、上傳20萬小時長的視頻到互聯(lián)網(wǎng)。但是人們每天在Instagram分享近6000萬張照片,在Facebook分享近3億張——當然,還沒算上Snapchat、 Google 、 Twitter等大量產(chǎn)圖的應(yīng)用。據(jù)估計,一年后就可達到18億,所以在三年后的今天,這個數(shù)值必然遠超乎我們的想象。確實,人們相比過去,互聯(lián)網(wǎng)的數(shù)據(jù)每年都在爆炸式增長。IBM 的研究稱,整個人類文明所獲得的全部數(shù)據(jù)中, 有 90%是過去兩年內(nèi)產(chǎn)生的,等到了 2020 年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達到今天的 44 倍。
可以看得出,圖片和視頻內(nèi)容已成為用戶表達、事件記錄分析中 不可或缺的部分,在多方面發(fā)揮越來越重要的價值。但隨著互聯(lián)網(wǎng)的發(fā)展,內(nèi)容安全成為互聯(lián)網(wǎng)不得不面臨的嚴峻挑戰(zhàn)。因此,面對互聯(lián)網(wǎng)的基礎(chǔ)需求——內(nèi)容審核,圖像識別技術(shù)可以以此為契機,為互聯(lián)網(wǎng)圖像內(nèi)容穩(wěn)定高效的發(fā)展保駕護航。
圖像識別技術(shù)與人工智能
說起圖像識別,我們知道,人的圖像識別能力是非常強大的。圖像距離的改變或圖像在感覺器官上作用位置的改變,都會造成圖像在視網(wǎng)膜上的大小和形狀的改變。即使在這種情況下,人們?nèi)匀豢梢哉J出他們過去知覺過的圖像。甚至圖像識別可以不受感覺通道的限制。例如,人眼可以看字,當別人在他手上寫字時,他也可以認出這個字。
而計算機圖像識別技術(shù)是計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對象的技術(shù)。識別過程包括圖像預(yù)處理、圖像分割、特征提取和判斷匹配。
圖像識別技術(shù)是人工智能的一個重要領(lǐng)域。簡單來說,圖像識別就是計算機如何像人一樣讀懂圖片的內(nèi)容。而圖像識別所研究的問題,是如何用計算機代替人類去自動處理大量的物理信息,解決人類所無法識別或者識別過于耗費資源的問題,從而很大程度上解放人類的勞動力。
圖像識別技術(shù)與內(nèi)容審核技術(shù)的融合
因此,對于互聯(lián)網(wǎng)如此大量的圖像內(nèi)容審核需求,圖像識別技術(shù)如何實現(xiàn)其中的融合與發(fā)展,從而解放大量每日做著簡單重復(fù)的工作的內(nèi)容審核人員是非常值得我們期待。
傳統(tǒng)的圖像審核方式主要有三種:1、純?nèi)斯徍耍浩髽I(yè)員工“三班倒”工作,人眼鑒別該圖片或視頻是否違規(guī);2、建立MD5數(shù)據(jù)庫:DNA是人類唯一的身份識別碼,而圖片、視頻的DNA無疑是MD5,網(wǎng)監(jiān)建立了存儲違規(guī)圖片、視頻的MD5數(shù)據(jù)庫,用戶上傳后自動分析MD5是否合法,則可避免涉黃內(nèi)容重復(fù)分享。3、傳統(tǒng)的智能審核:如識別色情圖像,基本是通過圖片 RGB 值識別膚色比例、通過建模識別異常動作、敏感部位等。
但是三個審核方式都存在較大的漏洞,“三班倒”的人工容易導致審核效率低、誤判漏判多等主觀性問題;MD5則非常容易被篡改,在視頻中加入文字或者修改任意一幀就能實現(xiàn);傳統(tǒng)智能識別色情圖片準確率低、經(jīng)常誤報等。而且這三種審核方式對近兩年熱門的視頻直播審核需求更難以滿足。
但以圖普科技為代表的互聯(lián)網(wǎng)圖像內(nèi)容審核專家,基于人工智能與圖像識別技術(shù)領(lǐng)域最新的算法:深度學習算法,通過模擬人腦神經(jīng)網(wǎng)絡(luò),構(gòu)建具有高層次表現(xiàn)力的模型,能夠?qū)Ω邚?fù)雜度數(shù)據(jù)形成良好的解讀。通過大數(shù)據(jù)持續(xù)訓練、頻繁的迭代,圖普科技的圖像識別云平臺的內(nèi)容審核產(chǎn)品的精確度達到 99.5%,有效節(jié)省超過 90%的人工復(fù)審工作。
目前,圖普科技基于圖像識別技術(shù)的主要的內(nèi)容審核產(chǎn)品有:
色情識別
智能識別圖片和視頻內(nèi)容,并對色情程度進行打分,方便用戶對涉黃內(nèi)容進行快速處理,幫助用戶減少審核人力,有效降低涉黃風險。
暴恐識別
識別ISIS、基地組織、東突等各類國家命令禁止的暴恐圖片及視頻內(nèi)容。
時政敏感內(nèi)容識別
建立敏感數(shù)據(jù)庫,提供定制化的解決方案,如識別國家領(lǐng)導人、政治運動場景等時政敏感性內(nèi)容。
OCR
主要針對廣告內(nèi)容過濾,自動識別圖像內(nèi)容是屬于正常、二維碼或者帶文字的廣告等圖片內(nèi)容。
圖普科技通過圖像識別技術(shù),將圖片與樣本庫中的海量樣本圖進行對比判斷,根據(jù)判斷返回圖片的狀態(tài),可判斷一張圖片是否為正常、色情、暴恐、廣告或其他的敏感內(nèi)容等。
并且,圖普科技的圖像識別云平臺還可以幫助企業(yè)定制自己的圖像識別引擎,使用機器來代替人工對需要審核圖片和視頻進行鑒別。就無需聘請人工智能識別的專家組建研發(fā)團隊,通過接入API調(diào)用識別服務(wù)即可。這在極大程度上降低了互聯(lián)網(wǎng)行業(yè)應(yīng)用圖像識別服務(wù)的門檻,從而為更多互聯(lián)網(wǎng)企業(yè)使用人工智能圖像識別技術(shù)提供了更大的機會。
內(nèi)容審核對于互聯(lián)網(wǎng)圖像內(nèi)容發(fā)展來說是一項艱巨而又關(guān)鍵的任務(wù),是后續(xù)的圖像內(nèi)容運營與發(fā)展的最基礎(chǔ)保障。圖普科技深知將要將圖像識別技術(shù)更好地融合到內(nèi)容審核領(lǐng)域,實現(xiàn)更高的準確率,是非常值得重視的,因此,盡管在業(yè)界已經(jīng)擁有一定的知名度,圖普科技仍然深耕于內(nèi)容審核與圖像識別技術(shù)領(lǐng)域,把圖像識別技術(shù)視為內(nèi)容審核及互聯(lián)網(wǎng)圖像內(nèi)容發(fā)展領(lǐng)域的未來,在將圖像識別技術(shù)更好地應(yīng)用于具體的行業(yè)需求方面,為其他的人工智能應(yīng)用提供了一條有價值的參考途徑。
評論