基于優(yōu)化GDTW-SVM算法的聯(lián)機手寫識別
摘要:基于高斯動態(tài)時間規(guī)整核函數(shù)(Gaussian Dynamic Time Warping kernel)的支持向量機(GDTW-SVM)在聯(lián)機手寫識別中有較高的識別率,但是存在計算復雜度高的問題。結合聯(lián)機手寫識別中特征向量的特點,提出了通過引入控制參數(shù)來約束GDTW最優(yōu)對齊路徑計算空間的方法,優(yōu)化了GDTW核函數(shù)。然后,使用聯(lián)機手寫識別數(shù)據(jù)庫UJIpenchar2進行實驗。實驗結果表明,該優(yōu)化方法不僅可以減少支持向量的數(shù)目,而且提高了GDTW-SVM算法運行的效率。
關鍵詞:手寫識別;動態(tài)時間規(guī)整;支持向量機;核方法
0 前言
隨著智能手機和平板電腦等無輸入鍵盤電子設備的流行,聯(lián)機手寫識別的研究吸引了越來越多的關注。而手寫簽名驗證和基于3D加速度傳感器的姿態(tài)識別、手寫識別等新應用形式的出現(xiàn),也為聯(lián)機手寫識別的研究注入了新的活力。
支持向量機(Support Vector Machine,SVM)是在統(tǒng)計學習理論的基礎上發(fā)展起來的新一代分類識別算法,使用核函數(shù)方法將非線性可分的特征向量映射到高維空間,計算最大化分類間隔的最優(yōu)分類超平面。在文本分類、語音識別、手寫識別、曲線擬合等領域,SVM已經(jīng)有比較成熟的應用。但是,一般的核函數(shù)要求不同樣本的特征向量的維數(shù)相同,限制了SVM在語音識別和聯(lián)機手寫識別領域的進一步發(fā)展。為此,Bahlmann等人使用彈性距離計算算法--DTW算法--構造了GDTW核函數(shù),進而提出GDTW-SVM算法。GDTW-SVM的聯(lián)機手寫識別實驗結果表明,GDT W-SVM取得了可媲美隱馬爾科夫模型、神經(jīng)網(wǎng)絡等分類算法的識別率,并且與使用后來提出的基于其它彈性距離計算構造的核函數(shù)的SVM相比,性能不相伯仲。
本文結合GDTW核函數(shù)和聯(lián)機手寫識別樣本的特征向量的特點,引入新的控制參數(shù)優(yōu)化GDTW核函數(shù)的計算。實驗結果表明,本文提出的優(yōu)化方法不僅減少了支持向量的數(shù)目,而且提高了GDTW-SVM運行效率。
1 聯(lián)機手寫識別過程
1.1 聯(lián)機手寫識別流程介紹
聯(lián)機手寫識別的過程與通用模式識別的過程基本相同,由數(shù)據(jù)采集和預處理、特征提取、分類識別、后處理四個步驟組成。
在數(shù)據(jù)采集和預處理階段,首先使用傳感器采集原始物理信息,比較常見的是加速度、速度、位移、起筆和落筆;然后,對原始信息進行傳感器矯正、去噪等預處理。
特征提取是手寫識別的重要步驟之一,對分類器的設計和分類結果有著重要的影響,選擇合適的特征不僅可以提高識別率,也可以節(jié)省計算存儲空間、運算時間、特征提取費用。聯(lián)機手寫識別中比較常見特征提取方法有加速度、位移、DCT變換等。
分類識別是手寫識別的核心階段,大多數(shù)分類器在實際分類應用之前,需要使用訓練樣本對分類器進行訓練,不斷地修正特征提取方法和方案、分類器的判決規(guī)則和參數(shù)。目前,分類識別的訓練階段需要人工干預以達到最佳的識別率。
一些識別系統(tǒng)在分類識別之后使用后處理進一步提高識別率。例如,數(shù)字“1”和小寫字母“1”在很多情況下難以分辨,但是在后處理階段結合上下文信息,決定當前字符是數(shù)字“1”還是小寫字母“1”。
1.2 聯(lián)機手寫識別實驗
本文聯(lián)機手寫識別實驗采用了Bahlmann等人和Bothe等人使用的方法。所使用的樣本數(shù)據(jù)庫是免費的聯(lián)機手寫數(shù)據(jù)庫UJIpenchars2。它采用Toshiba M400 Tablet PC收集,包含60個書寫者的共11640個手寫樣本。這些樣本包含ASCII字符、拉丁字符和西班牙字符,而每個字符包含80個訓練樣本和140個測試樣本。每個樣本由一劃或多劃組成,數(shù)據(jù)庫提供每個筆劃的坐標序列。
坐標序列由等時間間隔采集的筆尖的水平坐標xi和垂直坐標yi組成。而在本文實驗中,樣本的坐標序列不經(jīng)過任何去噪等預處理,直接對每個坐標點,使用字符的重心(μx,μy)和垂直坐標的方差σy計算列向量
式(1)中,ang是求虛數(shù)相角的函數(shù)。每個字符樣本的特征向量是T=(t1,…,tNT),其中,NT是采集的坐標點數(shù)目,即特征向量的維數(shù),每個字符樣本的NT可以不相同。
本文的聯(lián)機手寫識別實驗假設每個字符不需要分析其上下文即可完成識別,所以,特征提取之后使用本文所述的分類算法進行分類識別,并且將其輸出結果作為最終識別結果,不經(jīng)過任何后處理。
評論