基于ARM和Linux的字符采集與識(shí)別系統(tǒng)

作者：時(shí)間：2011-02-24 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

2 圖像識(shí)別模塊
本文的目的是構(gòu)建一個(gè)通用的字符識(shí)別系統(tǒng)，圖像采集模塊實(shí)現(xiàn)了對(duì)掃描件圖像數(shù)據(jù)的獲取。由于系統(tǒng)基于嵌入式Linux，使得后續(xù)的圖像處理與字符識(shí)別軟件設(shè)計(jì)可以脫離硬件系統(tǒng)獨(dú)立進(jìn)行，具有較高的通用性，可以根據(jù)實(shí)際應(yīng)用場(chǎng)合開(kāi)發(fā)和擴(kuò)展不同的識(shí)別軟件，本文僅探討手寫(xiě)體數(shù)字識(shí)別的應(yīng)用。
識(shí)別算法：
線性判別分析(Linearity Distinction Analysis，LDA)是有效的特征抽取方法之一，廣泛用于人臉識(shí)別和字符識(shí)別等領(lǐng)域。其基本思想是選擇使Fisher準(zhǔn)則函數(shù)達(dá)到極值的一組矢量作為最佳投影方向，樣本在該矢量集上投影后，達(dá)到最大的類(lèi)間離散度和最小的類(lèi)內(nèi)離散度。為找到投影軸，應(yīng)最大化類(lèi)間離散矩陣Sb和類(lèi)內(nèi)離散矩陣Sw的比值

其中，c表示為模式的類(lèi)別數(shù)；μj表示為第j類(lèi)的均值(其概率為Pj)；μ0為全部樣本均值；*****為第j類(lèi)模式i的h維向量；n是第j類(lèi)的樣本數(shù)；N是所有樣本數(shù)。μj和μ0定義為

最優(yōu)化問(wèn)題可以通過(guò)Sb和Sw的特征值的求解而獲得。如果在樣本離散矩陣中非目標(biāo)樣本占有比重較大，LDA并不能保證找到最優(yōu)子空間。LDA的最優(yōu)分類(lèi)標(biāo)準(zhǔn)并不一定對(duì)分類(lèi)準(zhǔn)確性最優(yōu)，有可能使得已經(jīng)分開(kāi)的鄰近類(lèi)引起不必要的重迭。本文采用一種新的加權(quán)LDA方法(ILDA)，其計(jì)算

方法如下

顯然，如果σ(△)是個(gè)常數(shù)，在投影方向上，

分別等同Sb和Sw。如果每一類(lèi)的σ(△)是不同的，這將對(duì)臨近類(lèi)的重迭樣本的分類(lèi)產(chǎn)生影響?？梢钥闯?，如果△ij較大，則σ(△)較小。
實(shí)驗(yàn)樣本取自手寫(xiě)體通用數(shù)據(jù)庫(kù)UCI，在Bhattacharyya距離(BD)分類(lèi)器下對(duì)加權(quán)線性判別分析與相應(yīng)的算法進(jìn)行實(shí)驗(yàn)比較和分析，取得較好的識(shí)別性能，證實(shí)了該方法提取的特征的有效性。

3 結(jié)束語(yǔ)
本文采用嵌入式Linux和ARM處理器軟硬件平臺(tái)，利用CIS傳感器配合運(yùn)動(dòng)平臺(tái)實(shí)現(xiàn)了圖像的采集和存儲(chǔ)，為嵌入式字符識(shí)別系統(tǒng)構(gòu)建了一個(gè)圖像采集平臺(tái)。在字符識(shí)別的應(yīng)用方面，探討了廣泛應(yīng)用的手寫(xiě)數(shù)字識(shí)別算法，在已有的線性判別分析算法基礎(chǔ)上，提出了一種改進(jìn)的加權(quán)線性判別分析算法，并對(duì)該算法進(jìn)行了實(shí)驗(yàn)驗(yàn)證，獲得了較好的識(shí)別率。

本文引用地址：http://butianyuan.cn/article/151002.htm

上一頁(yè) 1 2 3 下一頁(yè)

新聞中心

基于ARM和Linux的字符采集與識(shí)別系統(tǒng)

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)