基于優(yōu)化GDTW-SVM算法的聯(lián)機手寫識別
3 優(yōu)化GDTW-SVM算法
盡管GDTW-SVM獲得了較高的識別率,但是其計算復雜度高。DTW算法的計算復雜度是O(NT,NR),而SVM算法在訓練和識別過程中需要反復使用GDTW核函數(shù),對于嵌入式設備的計算能力要求較高。因此,需要對GDTW核函數(shù)進行優(yōu)化。
分析圖1中的最優(yōu)對齊路徑,當兩個樣本完全相同時,最優(yōu)對齊路徑和對角線重合;當兩個樣本有所差別時,最優(yōu)對齊路徑偏離對角線,且差別(DTW距離)越大最優(yōu)路徑越偏離對角線。下面以字母m和n為例,進一步分析以上結論。
(1)依次從字母n的所有訓練樣本中選擇一個樣本,計算其到字母n的所有訓練樣本最優(yōu)對齊路徑,并規(guī)整到80’80矩陣;
(2)將所有計算結果疊加后得到n-n最優(yōu)對齊路徑疊加圖;
(3)繪制疊加圖,即圖2的第一幅圖,圖中像素點灰度越高,代表越多最優(yōu)對齊路徑經(jīng)過此點。同理,繪制n-m最優(yōu)對齊路徑疊加圖和m-m最優(yōu)對齊路徑疊加圖,分別為圖2的第二和第三幅圖所示。本文引用地址:http://butianyuan.cn/article/193871.htm
從圖2可以看到,兩個相同或相似字符的最優(yōu)對齊路徑集中在對角區(qū)域:由于n的不同樣本、m的不同樣本的起筆寫法比收筆寫法隨意,第一和第三幅圖的對角區(qū)域的左下角比較寬;n和m的最優(yōu)對齊路徑在對角區(qū)域中分布較均勻,且第二幅圖顯示對角區(qū)域的中部有明顯的低灰度區(qū)域。
假設訓練樣本可以代表聯(lián)機手寫字符的特征,則可以通過僅計算對角區(qū)域中的最優(yōu)對齊路徑來優(yōu)化GDTW核函數(shù)。計算兩個樣本T=(t1,…,tNT)和R=(r1,…,rNR)的GDTW核函數(shù)時,假定二者屬于相同的字符類,那么二者的差別不大,因此,在GDTW核函數(shù)計算中引入?yún)?shù)k和τ
式(9)中l(wèi)bottom,ltop,lleft,lright如圖3所示。引入?yún)?shù)k和τ之后,不在NT×NR的矩陣中求解式(8),而是在k和τ約束的區(qū)域(即圖3中兩條虛線所夾的對角區(qū)域)中求解,計算最優(yōu)對齊路徑。
從直觀的角度看,參數(shù)k和τ減少了最優(yōu)對齊路徑的計算空間,因此,修改后的GDTW核函數(shù)的計算時間減少。而另外一方面,如果參數(shù)τ保持不變(如τ=0.6),參數(shù)k越小,最優(yōu)對齊路徑的前端的計算被約束在越小的空間,迫使其“最優(yōu)”對齊路徑的計算選擇非最優(yōu)對齊路徑,即參數(shù)k是兩個字符樣本頭部的相識程度的權重;類似地,參數(shù)τ是兩個字符樣本尾部的相識程度的權重。參數(shù)k和τ的權重作用對于如數(shù)字“0”和“6”等相似字符的分類有重要意義。
評論