新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 一種文檔圖像檢索算法設(shè)計(jì)和實(shí)現(xiàn)

一種文檔圖像檢索算法設(shè)計(jì)和實(shí)現(xiàn)

作者: 時(shí)間:2011-07-04 來(lái)源:網(wǎng)絡(luò) 收藏

摘 要: 介紹了一種基于版面結(jié)構(gòu)距離的,使用版面特征作為的特征。先將圖像進(jìn)行梯度和最大梯度差(MGD)計(jì)算,然后使用MGD值作為一個(gè)窗口對(duì)文本區(qū)域進(jìn)行融合,將文檔圖像以行線的形式標(biāo)示出來(lái)。同時(shí)給出了的匹配方法,并對(duì)匹配方法進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,該檢索方法具有較高的查準(zhǔn)率,具有很好的抗傾斜和抗縮放效果。

本文引用地址:http://butianyuan.cn/article/150529.htm

  文檔圖像一般意為含有文字信息的圖像,目前大多數(shù)信息是以數(shù)字化形式存在的,并以文檔的形式組織起來(lái)存放在數(shù)據(jù)庫(kù)中。在這樣的數(shù)據(jù)庫(kù)中查找有關(guān)資料其技術(shù)是關(guān)鍵。常見(jiàn)的文檔圖像檢索方法是基于內(nèi)容的文檔圖像檢索(CBIR)。它是利用圖像本身的信息,通常以圖像特征(顏色、紋理、形狀、結(jié)構(gòu)布局和語(yǔ)義特征等)的相似性為檢索依據(jù),根據(jù)每幅圖像都有的可比較特征進(jìn)行檢索。

  近年來(lái),數(shù)字化文檔被廣泛應(yīng)用于辦公自動(dòng)化、數(shù)字化圖書(shū)館、工業(yè)自動(dòng)化等領(lǐng)域。隨著科技的發(fā)展,傳統(tǒng)掃描儀體積大、效率低、攜帶不方便等不足之處日益突出,而數(shù)字照相機(jī)體積小、價(jià)位低,可以很容易地?cái)y帶并結(jié)合到手機(jī)、 手提電腦以及各種網(wǎng)絡(luò)設(shè)備中去,它還可以遠(yuǎn)距離地對(duì)背景文字及脆弱的珍貴文檔拍照, 更適用于無(wú)約束環(huán)境下的數(shù)字化操作。因此,將數(shù)字照相機(jī)引入文檔圖像分析已經(jīng)引起越來(lái)越多人的關(guān)注。

  Newman的調(diào)查表明,從報(bào)紙上提取段落時(shí),基于PC攝像頭的OCR操作比基于掃描儀的OCR操作效率高得多;Fisher等調(diào)查了在戰(zhàn)場(chǎng)上用數(shù)字?jǐn)z像機(jī)替換士兵攜帶sheet-fed掃描儀的可能性。經(jīng)證實(shí),數(shù)字?jǐn)z像機(jī)能夠以200dpi拍攝整張A4文檔紙,已經(jīng)達(dá)到OCR所要求的分辨率。

  BEUSEKOM J V.等人提出了一種基于版面分析的文檔圖像檢索的距離度量方法,將文本區(qū)域分為不同的矩形塊,然后找到塊的中心點(diǎn),利用角點(diǎn)的曼哈頓距離來(lái)計(jì)算塊之間的距離,再利用三種不同的方法進(jìn)行匹配[1];WONG K Y.使用游程平滑進(jìn)行版面信息提取的方法[2];BREUEL T M.提出了使用Whitespace來(lái)提取版面信息[3]。

  圖像匹配是指通過(guò)一定的匹配算法在兩幅或多幅圖像之間識(shí)別同名點(diǎn),如二維圖像匹配中通過(guò)比較目標(biāo)區(qū)和搜索區(qū)中相同大小的窗口的相關(guān)系數(shù),取搜索區(qū)中相關(guān)系數(shù)最大所對(duì)應(yīng)的窗口中心點(diǎn)作為同名點(diǎn)。其實(shí)質(zhì)是在基元相似性的條件下,運(yùn)用匹配準(zhǔn)則的最佳搜索問(wèn)題。

  灰度匹配的基本思想:以統(tǒng)計(jì)的觀點(diǎn)將圖像看成是二維信號(hào),采用統(tǒng)計(jì)相關(guān)的方法尋找信號(hào)間的相關(guān)匹配。利用兩個(gè)信號(hào)的相關(guān)函數(shù),評(píng)價(jià)它們的相似性以確定同名點(diǎn)。

  灰度匹配通過(guò)利用某種相似性度量,如相關(guān)函數(shù)、協(xié)方差函數(shù)、差平方和、差絕對(duì)值和等測(cè)度極值,判定兩幅圖像中的對(duì)應(yīng)關(guān)系。

  最經(jīng)典的灰度匹配法是歸一化的灰度匹配 法,其基本原理是逐像素的把一個(gè)以一定大小的實(shí)時(shí)圖像窗口的灰度矩陣,與參考圖像的所有可能的窗口灰度陣列,按某種相似性度量方法進(jìn)行搜索比較的匹配方法,從理論上說(shuō)就是采用圖像相關(guān)技術(shù)。

  利用灰度信息匹配方法的主要缺陷是計(jì)算量太大,因?yàn)槭褂脠?chǎng)合一般都有一定的速度要求,所以這些方法很少被使用?,F(xiàn)在已經(jīng)提出了一些相關(guān)的快速算法,如幅度排序相關(guān)算法,F(xiàn)FT相關(guān)算法和分層搜索的序列判斷算法等。

  1 相關(guān)工作

  1.1 文本行標(biāo)記

  將得到的文檔圖像進(jìn)行預(yù)處理,具體的處理方法是:使用文本行標(biāo)記算法文字區(qū)域的行定位。本文使用[-1,0,1]對(duì)圖像進(jìn)行處理計(jì)算其梯度,然后計(jì)算其MGD。MGD計(jì)算方法如下:在一個(gè)大小為n的窗口內(nèi),用它的最大梯度差來(lái)進(jìn)行填充,以達(dá)到文本融合的目的。因?yàn)橛⑽暮椭形牡淖址麑挾炔煌?,根?jù)具體的情況選擇n,大于字符間距即可。將計(jì)算出來(lái)的梯度求它的最大值和最小值,然后相減,即為最大梯度差。將得到的MGD圖像使用最大類間方差方法[5](OTSU)求出閾值得到二值圖像[2]。圖1為使用上述方法對(duì)行塊進(jìn)行標(biāo)記的圖像。

  1.2 消除階躍跳變

  對(duì)于手寫體或者英文的文檔,會(huì)出現(xiàn)字符高低不一、筆畫(huà)不連續(xù)等情況。線特征產(chǎn)生的斷點(diǎn)可采用形態(tài)學(xué)方法、凸凹點(diǎn)處理和噪聲處理三種基本策略提高直線的連續(xù)性,然后采用階梯插補(bǔ)算法來(lái)消除階躍跳變,算法的復(fù)雜度相對(duì)較低。

  在像素級(jí)上進(jìn)行處理是:當(dāng)出現(xiàn)行階躍跳變的情況時(shí),使用如圖2的模板來(lái)對(duì)其進(jìn)行填充。因?yàn)槲臋n圖像的行塊在4個(gè)方向上都有可能出現(xiàn)這種階躍,所以采用一個(gè)3×3的模板,以位置5為中心點(diǎn),如圖3所示,4種情況都包含其中:1和4為非文本像素,對(duì)4進(jìn)行填充;3和6為非文本像素,對(duì)6進(jìn)行填充;4和7為非文本像素,對(duì)4進(jìn)行填充;6和9為非文本像素,對(duì)6進(jìn)行填充。如果填充之后依然有符合結(jié)構(gòu)的像素,則繼續(xù)填充,即把需要填充的區(qū)域都填充完整。填充前后的圖像如圖4所示。

絕對(duì)值編碼器相關(guān)文章:絕對(duì)值編碼器原理
三維掃描儀相關(guān)文章:三維掃描儀原理

上一頁(yè) 1 2 3 下一頁(yè)

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉