新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 全球OCR文字識別測試最新結果公布:中國軍團霸屏

全球OCR文字識別測試最新結果公布:中國軍團霸屏

作者: 時間:2018-11-21 來源:網絡 收藏

  近年來,自然場景下的文字識別()引起了計算機視覺和機器學習界的極大關注。在照片翻譯和圖像內容識別等許多基于內容的圖像應用推動下,它已成為學術界和工業(yè)界一個充滿希望和挑戰(zhàn)的研究領域。

本文引用地址:http://www.butianyuan.cn/article/201811/394618.htm

  11月20日,有領域奧斯卡之稱的國際文檔分析與識別大會(ICDAR)數(shù)據(jù)集最新結果公布,中國高校及企業(yè)包攬排行榜前五。中國人工智能“國家隊”云從科技提出的Pixel-Anchor框架在多個ICDAR測試子集(ICDAR2015以及ICDAR2017 MLT)上均獲得了第一名的好成績,特別是在東亞語言(包括中文)部分表現(xiàn)亮眼。


全球OCR文字識別測試最新結果公布:中國軍團霸屏


  ICDAR2015數(shù)據(jù)集前五名及框架名稱分別是:云從科技(Pixel-Anchor)、南京大學與南京理工大學(PSENet)、曠視科技(Mask Text)、商湯科技(FOTS)、阿里巴巴(IncepText)。


全球OCR文字識別測試最新結果公布:中國軍團霸屏


  ICDAR2017 MLT數(shù)據(jù)集前五名及框架名稱分別是云從科技(Pixel-Anchor)、阿里巴巴(ATL-cangjie)、商湯科技(FOTS、曠視科技(EAST++)、南京大學(PSENet_NJU)

  國際文檔分析與識別大會(ICDAR)專注于文本領域的識別與應用,自2003年大會設立“Robust Reading Competitions”以來,該競賽就成了評測和檢驗自然場景/網絡圖片/復雜視頻文本自動提取與智能識別最新技術研究進展的最為重要的國際賽事及標準,競賽中的諸多方法對技術的發(fā)展具有強大推動力。高技術難度、強大實際應用性,也使該盛會受到科研院校、科技公司等的關注,至今已有全球89個國家的3500多支隊伍參與。

  截至目前,全球頂級的高校、科研機構及企業(yè)都參加過這項測試,包括Google、Microsoft、Amazon、Facebook,以及中國的騰訊、搜狗、北京大學、中國科學技術大學等。

  云從科技、阿里巴巴、南京大學、南京理工大學、商湯科技、曠視科技在榜單中體現(xiàn)出良好的成績,表明中國繼續(xù)在國際上引領OCR領域的研究。

  計算機視覺基礎技術應用前景廣泛

  OCR(Optical Character Recognition)是指對輸入圖像進行分析識別處理,獲取圖像中文字信息的過程,具有廣泛的應用場景。而自然場景中的OCR 技術不需要針對特殊場景進行定制,可以識別任意場景圖片中的文字。


全球OCR文字識別測試最新結果公布:中國軍團霸屏


  和面對高質量文檔圖像的傳統(tǒng)OCR相比,自然場景OCR跳出了對輸入圖像的質量和場景束縛,能夠在更寬泛的領域中獲取應用,引起了學術界以及工業(yè)界的極大關注。

  但相較于傳統(tǒng)OCR,自然場景OCR中的各種商品、布景或自然場景圖片中的文本檢測與識別面臨著復雜背景干擾、文字的模糊與退化、不可預測的光照、字體的多樣性、垂直文本、傾斜文本等眾多挑戰(zhàn)。

  OCR是計算機視覺領域的經典問題,長久以來,一直受到學術界和工業(yè)界的持續(xù)關注。在工業(yè)界,Google、Microsoft、Amazon等大型互聯(lián)網公司,以及云從科技等人工智能創(chuàng)業(yè)公司,都在OCR技術上耕耘多年。隨著技術不斷成熟,OCR也開始在互聯(lián)網及其他行業(yè)逐步上線使用,應用范圍也從文檔識別擴展到車牌識別,圖片廣告過濾,場景理解,商品識別,街景定位,票據(jù)識別等廣泛的領域。

  據(jù)悉,目前Pixel-Anchor框架已在云從科技的證件票據(jù)識別系統(tǒng)和圖片廣告過濾系統(tǒng)中上線,每天處理圖片近千萬張,自動反饋疑似違規(guī)圖片準確率達96%以上;同時將證件處理和圖文審核風險發(fā)現(xiàn)時間從“小時”降低到“秒”級。數(shù)據(jù)顯示,2018年云從科技累計處理25億證件數(shù)據(jù)、屏蔽400萬條惡意推廣,有效提高業(yè)務流程效率及凈化營銷環(huán)境。

  除OCR以外,包含人體姿態(tài)、跨鏡追蹤、車輛結構化、語音識別等智能感知的核心技術閉環(huán)已經在云從科技內部獲得建立,比如安防大數(shù)據(jù)系統(tǒng)與智能商業(yè)運營平臺應用“跨鏡追蹤(ReID)”技術,無需人臉也可以追蹤目標?!疤臃缚诵恰睆垖W友的部分成果,就有“跨鏡追蹤”技術的參與。另外,云從科技也在浸入式大數(shù)據(jù)風控系統(tǒng)、AI-IoT物聯(lián)網應用等場景中引入了智能感知技術。



關鍵詞: OCR

評論


技術專區(qū)

關閉