基于ARM和Linux的字符采集與識(shí)別系統(tǒng)
2 圖像識(shí)別模塊
本文的目的是構(gòu)建一個(gè)通用的字符識(shí)別系統(tǒng),圖像采集模塊實(shí)現(xiàn)了對(duì)掃描件圖像數(shù)據(jù)的獲取。由于系統(tǒng)基于嵌入式Linux,使得后續(xù)的圖像處理與字符識(shí)別軟件設(shè)計(jì)可以脫離硬件系統(tǒng)獨(dú)立進(jìn)行,具有較高的通用性,可以根據(jù)實(shí)際應(yīng)用場(chǎng)合開(kāi)發(fā)和擴(kuò)展不同的識(shí)別軟件,本文僅探討手寫(xiě)體數(shù)字識(shí)別的應(yīng)用。
識(shí)別算法:
線性判別分析(Linearity Distinction Analysis,LDA)是有效的特征抽取方法之一,廣泛用于人臉識(shí)別和字符識(shí)別等領(lǐng)域。其基本思想是選擇使Fisher準(zhǔn)則函數(shù)達(dá)到極值的一組矢量作為最佳投影方向,樣本在該矢量集上投影后,達(dá)到最大的類(lèi)間離散度和最小的類(lèi)內(nèi)離散度。為找到投影軸,應(yīng)最大化類(lèi)間離散矩陣Sb和類(lèi)內(nèi)離散矩陣Sw的比值
其中,c表示為模式的類(lèi)別數(shù);μj表示為第j類(lèi)的均值(其概率為Pj);μ0為全部樣本均值;*****為第j類(lèi)模式i的h維向量;n是第j類(lèi)的樣本數(shù);N是所有樣本數(shù)。μj和μ0定義為
最優(yōu)化問(wèn)題可以通過(guò)Sb和Sw的特征值的求解而獲得。如果在樣本離散矩陣中非目標(biāo)樣本占有比重較大,LDA并不能保證找到最優(yōu)子空間。LDA的最優(yōu)分類(lèi)標(biāo)準(zhǔn)并不一定對(duì)分類(lèi)準(zhǔn)確性最優(yōu),有可能使得已經(jīng)分開(kāi)的鄰近類(lèi)引起不必要的重迭。本文采用一種新的加權(quán)LDA方法(ILDA),其計(jì)算方法如下
顯然,如果σ(△)是個(gè)常數(shù),在投影方向上,分別等同Sb和Sw。如果每一類(lèi)的σ(△)是不同的,這將對(duì)臨近類(lèi)的重迭樣本的分類(lèi)產(chǎn)生影響??梢钥闯?,如果△ij較大,則σ(△)較小。
實(shí)驗(yàn)樣本取自手寫(xiě)體通用數(shù)據(jù)庫(kù)UCI,在Bhattacharyya距離(BD)分類(lèi)器下對(duì)加權(quán)線性判別分析與相應(yīng)的算法進(jìn)行實(shí)驗(yàn)比較和分析,取得較好的識(shí)別性能,證實(shí)了該方法提取的特征的有效性。
3 結(jié)束語(yǔ)
本文采用嵌入式Linux和ARM處理器軟硬件平臺(tái),利用CIS傳感器配合運(yùn)動(dòng)平臺(tái)實(shí)現(xiàn)了圖像的采集和存儲(chǔ),為嵌入式字符識(shí)別系統(tǒng)構(gòu)建了一個(gè)圖像采集平臺(tái)。在字符識(shí)別的應(yīng)用方面,探討了廣泛應(yīng)用的手寫(xiě)數(shù)字識(shí)別算法,在已有的線性判別分析算法基礎(chǔ)上,提出了一種改進(jìn)的加權(quán)線性判別分析算法,并對(duì)該算法進(jìn)行了實(shí)驗(yàn)驗(yàn)證,獲得了較好的識(shí)別率。本文引用地址:http://butianyuan.cn/article/151002.htm
評(píng)論