新聞中心

EEPW首頁 > 測試測量 > 設計應用 > 基于優(yōu)化GDTW-SVM算法的聯(lián)機手寫識別

基于優(yōu)化GDTW-SVM算法的聯(lián)機手寫識別

作者: 時間:2012-05-15 來源:網(wǎng)絡 收藏


3 優(yōu)化
盡管獲得了較高的率,但是其計算復雜度高。DTW的計算復雜度是O(NT,NR),而SVM在訓練和過程中需要反復使用GDTW核函數(shù),對于嵌入式設備的計算能力要求較高。因此,需要對GDTW核函數(shù)進行優(yōu)化。
分析圖1中的最優(yōu)對齊路徑,當兩個樣本完全相同時,最優(yōu)對齊路徑和對角線重合;當兩個樣本有所差別時,最優(yōu)對齊路徑偏離對角線,且差別(DTW距離)越大最優(yōu)路徑越偏離對角線。下面以字母m和n為例,進一步分析以上結論。
(1)依次從字母n的所有訓練樣本中選擇一個樣本,計算其到字母n的所有訓練樣本最優(yōu)對齊路徑,并規(guī)整到80’80矩陣;
(2)將所有計算結果疊加后得到n-n最優(yōu)對齊路徑疊加圖;
(3)繪制疊加圖,即圖2的第一幅圖,圖中像素點灰度越高,代表越多最優(yōu)對齊路徑經(jīng)過此點。同理,繪制n-m最優(yōu)對齊路徑疊加圖和m-m最優(yōu)對齊路徑疊加圖,分別為圖2的第二和第三幅圖所示。

本文引用地址:http://butianyuan.cn/article/193871.htm

f.jpg


從圖2可以看到,兩個相同或相似字符的最優(yōu)對齊路徑集中在對角區(qū)域:由于n的不同樣本、m的不同樣本的起筆寫法比收筆寫法隨意,第一和第三幅圖的對角區(qū)域的左下角比較寬;n和m的最優(yōu)對齊路徑在對角區(qū)域中分布較均勻,且第二幅圖顯示對角區(qū)域的中部有明顯的低灰度區(qū)域。
假設訓練樣本可以代表手寫字符的特征,則可以通過僅計算對角區(qū)域中的最優(yōu)對齊路徑來優(yōu)化GDTW核函數(shù)。計算兩個樣本T=(t1,…,tNT)和R=(r1,…,rNR)的GDTW核函數(shù)時,假定二者屬于相同的字符類,那么二者的差別不大,因此,在GDTW核函數(shù)計算中引入?yún)?shù)k和τ
g.jpg
式(9)中l(wèi)bottom,ltop,lleft,lright如圖3所示。引入?yún)?shù)k和τ之后,不在NT×NR的矩陣中求解式(8),而是在k和τ約束的區(qū)域(即圖3中兩條虛線所夾的對角區(qū)域)中求解,計算最優(yōu)對齊路徑。

7.jpg


從直觀的角度看,參數(shù)k和τ減少了最優(yōu)對齊路徑的計算空間,因此,修改后的GDTW核函數(shù)的計算時間減少。而另外一方面,如果參數(shù)τ保持不變(如τ=0.6),參數(shù)k越小,最優(yōu)對齊路徑的前端的計算被約束在越小的空間,迫使其“最優(yōu)”對齊路徑的計算選擇非最優(yōu)對齊路徑,即參數(shù)k是兩個字符樣本頭部的相識程度的權重;類似地,參數(shù)τ是兩個字符樣本尾部的相識程度的權重。參數(shù)k和τ的權重作用對于如數(shù)字“0”和“6”等相似字符的分類有重要意義。



評論


相關推薦

技術專區(qū)

關閉