基于優(yōu)化GDTW-SVM算法的聯(lián)機(jī)手寫識(shí)別
3 優(yōu)化GDTW-SVM算法
盡管GDTW-SVM獲得了較高的識(shí)別率,但是其計(jì)算復(fù)雜度高。DTW算法的計(jì)算復(fù)雜度是O(NT,NR),而SVM算法在訓(xùn)練和識(shí)別過(guò)程中需要反復(fù)使用GDTW核函數(shù),對(duì)于嵌入式設(shè)備的計(jì)算能力要求較高。因此,需要對(duì)GDTW核函數(shù)進(jìn)行優(yōu)化。
分析圖1中的最優(yōu)對(duì)齊路徑,當(dāng)兩個(gè)樣本完全相同時(shí),最優(yōu)對(duì)齊路徑和對(duì)角線重合;當(dāng)兩個(gè)樣本有所差別時(shí),最優(yōu)對(duì)齊路徑偏離對(duì)角線,且差別(DTW距離)越大最優(yōu)路徑越偏離對(duì)角線。下面以字母m和n為例,進(jìn)一步分析以上結(jié)論。
(1)依次從字母n的所有訓(xùn)練樣本中選擇一個(gè)樣本,計(jì)算其到字母n的所有訓(xùn)練樣本最優(yōu)對(duì)齊路徑,并規(guī)整到80’80矩陣;
(2)將所有計(jì)算結(jié)果疊加后得到n-n最優(yōu)對(duì)齊路徑疊加圖;
(3)繪制疊加圖,即圖2的第一幅圖,圖中像素點(diǎn)灰度越高,代表越多最優(yōu)對(duì)齊路徑經(jīng)過(guò)此點(diǎn)。同理,繪制n-m最優(yōu)對(duì)齊路徑疊加圖和m-m最優(yōu)對(duì)齊路徑疊加圖,分別為圖2的第二和第三幅圖所示。本文引用地址:http://butianyuan.cn/article/193871.htm
從圖2可以看到,兩個(gè)相同或相似字符的最優(yōu)對(duì)齊路徑集中在對(duì)角區(qū)域:由于n的不同樣本、m的不同樣本的起筆寫法比收筆寫法隨意,第一和第三幅圖的對(duì)角區(qū)域的左下角比較寬;n和m的最優(yōu)對(duì)齊路徑在對(duì)角區(qū)域中分布較均勻,且第二幅圖顯示對(duì)角區(qū)域的中部有明顯的低灰度區(qū)域。
假設(shè)訓(xùn)練樣本可以代表聯(lián)機(jī)手寫字符的特征,則可以通過(guò)僅計(jì)算對(duì)角區(qū)域中的最優(yōu)對(duì)齊路徑來(lái)優(yōu)化GDTW核函數(shù)。計(jì)算兩個(gè)樣本T=(t1,…,tNT)和R=(r1,…,rNR)的GDTW核函數(shù)時(shí),假定二者屬于相同的字符類,那么二者的差別不大,因此,在GDTW核函數(shù)計(jì)算中引入?yún)?shù)k和τ
式(9)中l(wèi)bottom,ltop,lleft,lright如圖3所示。引入?yún)?shù)k和τ之后,不在NT×NR的矩陣中求解式(8),而是在k和τ約束的區(qū)域(即圖3中兩條虛線所夾的對(duì)角區(qū)域)中求解,計(jì)算最優(yōu)對(duì)齊路徑。
從直觀的角度看,參數(shù)k和τ減少了最優(yōu)對(duì)齊路徑的計(jì)算空間,因此,修改后的GDTW核函數(shù)的計(jì)算時(shí)間減少。而另外一方面,如果參數(shù)τ保持不變(如τ=0.6),參數(shù)k越小,最優(yōu)對(duì)齊路徑的前端的計(jì)算被約束在越小的空間,迫使其“最優(yōu)”對(duì)齊路徑的計(jì)算選擇非最優(yōu)對(duì)齊路徑,即參數(shù)k是兩個(gè)字符樣本頭部的相識(shí)程度的權(quán)重;類似地,參數(shù)τ是兩個(gè)字符樣本尾部的相識(shí)程度的權(quán)重。參數(shù)k和τ的權(quán)重作用對(duì)于如數(shù)字“0”和“6”等相似字符的分類有重要意義。
評(píng)論