新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 基于ARM和Linux的字符采集與識別系統(tǒng)

基于ARM和Linux的字符采集與識別系統(tǒng)

作者: 時(shí)間:2011-02-24 來源:網(wǎng)絡(luò) 收藏


2 圖像識別模塊
本文的目的是構(gòu)建一個(gè)通用的字符識別系統(tǒng),圖像采集模塊實(shí)現(xiàn)了對掃描件圖像數(shù)據(jù)的獲取。由于系統(tǒng)基于嵌入式Linux,使得后續(xù)的圖像處理與字符識別軟件設(shè)計(jì)可以脫離硬件系統(tǒng)獨(dú)立進(jìn)行,具有較高的通用性,可以根據(jù)實(shí)際應(yīng)用場合開發(fā)和擴(kuò)展不同的識別軟件,本文僅探討手寫體數(shù)字識別的應(yīng)用。
識別算法:
線性判別分析(Linearity Distinction Analysis,LDA)是有效的特征抽取方法之一,廣泛用于人臉識別和字符識別等領(lǐng)域。其基本思想是選擇使Fisher準(zhǔn)則函數(shù)達(dá)到極值的一組矢量作為最佳投影方向,樣本在該矢量集上投影后,達(dá)到最大的類間離散度和最小的類內(nèi)離散度。為找到投影軸,應(yīng)最大化類間離散矩陣Sb和類內(nèi)離散矩陣Sw的比值

其中,c表示為模式的類別數(shù);μj表示為第j類的均值(其概率為Pj);μ0為全部樣本均值;*****為第j類模式i的h維向量;n是第j類的樣本數(shù);N是所有樣本數(shù)。μj和μ0定義為

最優(yōu)化問題可以通過Sb和Sw的特征值的求解而獲得。如果在樣本離散矩陣中非目標(biāo)樣本占有比重較大,LDA并不能保證找到最優(yōu)子空間。LDA的最優(yōu)分類標(biāo)準(zhǔn)并不一定對分類準(zhǔn)確性最優(yōu),有可能使得已經(jīng)分開的鄰近類引起不必要的重迭。本文采用一種新的加權(quán)LDA方法(ILDA),其計(jì)算方法如下

顯然,如果σ(△)是個(gè)常數(shù),在投影方向上,分別等同Sb和Sw。如果每一類的σ(△)是不同的,這將對臨近類的重迭樣本的分類產(chǎn)生影響??梢钥闯?,如果△ij較大,則σ(△)較小。
實(shí)驗(yàn)樣本取自手寫體通用數(shù)據(jù)庫UCI,在Bhattacharyya距離(BD)分類器下對加權(quán)線性判別分析與相應(yīng)的算法進(jìn)行實(shí)驗(yàn)比較和分析,取得較好的識別性能,證實(shí)了該方法提取的特征的有效性。

3 結(jié)束語
本文采用嵌入式Linux和ARM處理器軟硬件平臺,利用CIS傳感器配合運(yùn)動平臺實(shí)現(xiàn)了圖像的采集和存儲,為嵌入式字符識別系統(tǒng)構(gòu)建了一個(gè)圖像采集平臺。在字符識別的應(yīng)用方面,探討了廣泛應(yīng)用的手寫數(shù)字識別算法,在已有的線性判別分析算法基礎(chǔ)上,提出了一種改進(jìn)的加權(quán)線性判別分析算法,并對該算法進(jìn)行了實(shí)驗(yàn)驗(yàn)證,獲得了較好的識別率。

本文引用地址:http://butianyuan.cn/article/151002.htm

上一頁 1 2 3 下一頁

關(guān)鍵詞:

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉