基于A(yíng)RM 和Linux的字符采集與識(shí)別系統(tǒng)
識(shí)別算法:
線(xiàn)性判別分析( L inearity D istinct ion Analysis,LDA)是有效的特征抽取方法之一, 廣泛用于人臉識(shí)別和字符識(shí)別等領(lǐng)域[ 6] 。其基本思想是選擇使F isher準(zhǔn)則函數(shù)達(dá)到極值的一組矢量作為最佳投影方向, 樣本在該矢量集上投影后, 達(dá)到最大的類(lèi)間離散度和最小的類(lèi)內(nèi)離散度。為找到投影軸, 應(yīng)最大化類(lèi)間離散矩陣Sb 和類(lèi)內(nèi)離散矩陣Sw 的比值:
類(lèi)間離散矩陣Sb 和類(lèi)內(nèi)離散矩陣Sw 的定義為
其中, c表示為模式的類(lèi)別數(shù); j 表示為第j 類(lèi)的均值(其概率為pj ); 0 為全部樣本均值; xji 為第j 類(lèi)模式i的h維向量; nj 是第j 類(lèi)的樣本數(shù); N 是所有樣本數(shù)。j 和0 定義為:
最優(yōu)化問(wèn)題可以通過(guò)Sb 和Sw 的特征值的求解而獲得。如果在樣本離散矩陣中非目標(biāo)樣本占有比重較大, LDA 并不能保證找到最優(yōu)子空間。LDA 的最優(yōu)分類(lèi)標(biāo)準(zhǔn)并不一定對(duì)分類(lèi)準(zhǔn)確性最優(yōu), 有可能使得已經(jīng)分開(kāi)的鄰近類(lèi)引起不必要的重迭。本文采用一種新的加權(quán)LDA 方法( ILDA ), 其計(jì)算S^b 和S^w 方法如下:
顯然, 如果( )是個(gè)常數(shù), 在投影方向上, S^b和S^w 分別等同Sb 和Sw。如果每一類(lèi)的( )是不同的, 這將對(duì)臨近類(lèi)的重迭樣本的分類(lèi)產(chǎn)生影響。可以看出, 如果 ij較大, 則( )較小。
實(shí)驗(yàn)樣本取自手寫(xiě)體通用數(shù)據(jù)庫(kù)UC I, 在Bhattacharyya距離( BD)分類(lèi)器下對(duì)加權(quán)線(xiàn)性判別分析與相應(yīng)的算法進(jìn)行實(shí)驗(yàn)比較和分析, 取得較好的識(shí)別性能, 證實(shí)了該方法提取的特征的有效性。
3.結(jié)束語(yǔ)
本文采用嵌入式Linux 和ARM 處理器軟硬件平臺(tái), 利用C IS傳感器配合運(yùn)動(dòng)平臺(tái)實(shí)現(xiàn)了圖像的采集和存儲(chǔ), 為嵌入式字符識(shí)別系統(tǒng)構(gòu)建了一個(gè)圖像采集平臺(tái)。在字符識(shí)別的應(yīng)用方面, 探討了廣泛應(yīng)用的手寫(xiě)數(shù)字識(shí)別算法, 在已有的線(xiàn)性判別分析算法基礎(chǔ)上, 提出了一種改進(jìn)的加權(quán)線(xiàn)性判別分析算法, 并對(duì)該算法進(jìn)行了實(shí)驗(yàn)驗(yàn)證, 獲得了較好的識(shí)別率。
評(píng)論