新聞中心

EEPW首頁(yè) > 測(cè)試測(cè)量 > 設(shè)計(jì)應(yīng)用 > 基于優(yōu)化GDTW-SVM算法的聯(lián)機(jī)手寫識(shí)別

基于優(yōu)化GDTW-SVM算法的聯(lián)機(jī)手寫識(shí)別

作者: 時(shí)間:2012-05-15 來(lái)源:網(wǎng)絡(luò) 收藏


3 優(yōu)化
盡管獲得了較高的率,但是其計(jì)算復(fù)雜度高。DTW的計(jì)算復(fù)雜度是O(NT,NR),而SVM在訓(xùn)練和過(guò)程中需要反復(fù)使用GDTW核函數(shù),對(duì)于嵌入式設(shè)備的計(jì)算能力要求較高。因此,需要對(duì)GDTW核函數(shù)進(jìn)行優(yōu)化。
分析圖1中的最優(yōu)對(duì)齊路徑,當(dāng)兩個(gè)樣本完全相同時(shí),最優(yōu)對(duì)齊路徑和對(duì)角線重合;當(dāng)兩個(gè)樣本有所差別時(shí),最優(yōu)對(duì)齊路徑偏離對(duì)角線,且差別(DTW距離)越大最優(yōu)路徑越偏離對(duì)角線。下面以字母m和n為例,進(jìn)一步分析以上結(jié)論。
(1)依次從字母n的所有訓(xùn)練樣本中選擇一個(gè)樣本,計(jì)算其到字母n的所有訓(xùn)練樣本最優(yōu)對(duì)齊路徑,并規(guī)整到80’80矩陣;
(2)將所有計(jì)算結(jié)果疊加后得到n-n最優(yōu)對(duì)齊路徑疊加圖;
(3)繪制疊加圖,即圖2的第一幅圖,圖中像素點(diǎn)灰度越高,代表越多最優(yōu)對(duì)齊路徑經(jīng)過(guò)此點(diǎn)。同理,繪制n-m最優(yōu)對(duì)齊路徑疊加圖和m-m最優(yōu)對(duì)齊路徑疊加圖,分別為圖2的第二和第三幅圖所示。

本文引用地址:http://butianyuan.cn/article/193871.htm

f.jpg


從圖2可以看到,兩個(gè)相同或相似字符的最優(yōu)對(duì)齊路徑集中在對(duì)角區(qū)域:由于n的不同樣本、m的不同樣本的起筆寫法比收筆寫法隨意,第一和第三幅圖的對(duì)角區(qū)域的左下角比較寬;n和m的最優(yōu)對(duì)齊路徑在對(duì)角區(qū)域中分布較均勻,且第二幅圖顯示對(duì)角區(qū)域的中部有明顯的低灰度區(qū)域。
假設(shè)訓(xùn)練樣本可以代表手寫字符的特征,則可以通過(guò)僅計(jì)算對(duì)角區(qū)域中的最優(yōu)對(duì)齊路徑來(lái)優(yōu)化GDTW核函數(shù)。計(jì)算兩個(gè)樣本T=(t1,…,tNT)和R=(r1,…,rNR)的GDTW核函數(shù)時(shí),假定二者屬于相同的字符類,那么二者的差別不大,因此,在GDTW核函數(shù)計(jì)算中引入?yún)?shù)k和τ
g.jpg
式(9)中l(wèi)bottom,ltop,lleft,lright如圖3所示。引入?yún)?shù)k和τ之后,不在NT×NR的矩陣中求解式(8),而是在k和τ約束的區(qū)域(即圖3中兩條虛線所夾的對(duì)角區(qū)域)中求解,計(jì)算最優(yōu)對(duì)齊路徑。

7.jpg


從直觀的角度看,參數(shù)k和τ減少了最優(yōu)對(duì)齊路徑的計(jì)算空間,因此,修改后的GDTW核函數(shù)的計(jì)算時(shí)間減少。而另外一方面,如果參數(shù)τ保持不變(如τ=0.6),參數(shù)k越小,最優(yōu)對(duì)齊路徑的前端的計(jì)算被約束在越小的空間,迫使其“最優(yōu)”對(duì)齊路徑的計(jì)算選擇非最優(yōu)對(duì)齊路徑,即參數(shù)k是兩個(gè)字符樣本頭部的相識(shí)程度的權(quán)重;類似地,參數(shù)τ是兩個(gè)字符樣本尾部的相識(shí)程度的權(quán)重。參數(shù)k和τ的權(quán)重作用對(duì)于如數(shù)字“0”和“6”等相似字符的分類有重要意義。



評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉