基于支持向量機(jī)方法的車(chē)型分類(lèi)技術(shù)
2.2核函數(shù)及模型參數(shù)選擇
本文引用地址:http://butianyuan.cn/article/87263.htm 應(yīng)用SVM方法分類(lèi)車(chē)型,輸入空間通過(guò)非線(xiàn)性映射到高維特征空間的分布結(jié)構(gòu)由核函數(shù)決定,同時(shí),最優(yōu)超平面與最近的樣本之間的距離最大和分類(lèi)錯(cuò)誤率最小通過(guò)懲罰參數(shù)C進(jìn)行折衷。因此,核函數(shù)設(shè)計(jì)和懲罰參數(shù)C的選擇將直接影響到車(chē)型分類(lèi)的效果。目前常用的核函數(shù)有:
線(xiàn)性核 ,多項(xiàng)式核以及高斯徑向核 ,其中,d為多項(xiàng)式的階數(shù),σ為高斯分布的寬度。
在參數(shù)C、d及σ的選擇中,本文采用5-折交叉驗(yàn)證法,將2 000個(gè)訓(xùn)練樣本分為5個(gè)子集,每次將4個(gè)子集用于訓(xùn)練,剩下的一個(gè)子集用于分類(lèi)測(cè)試,重復(fù)上述過(guò)程,直到所有子集都參加了測(cè)試,計(jì)算5次平均分類(lèi)錯(cuò)誤率,選取平均分類(lèi)錯(cuò)誤率最小的參數(shù)為模型參數(shù)。
表1為不同的核函數(shù)、各種模型參數(shù)下分類(lèi)錯(cuò)誤率的比較結(jié)果。從表中可以看出,在不同的模型參數(shù)下,線(xiàn)性核函數(shù)的泛化誤差最大,多項(xiàng)式核函數(shù)次之,徑向基核函數(shù)最小。這主要是因?yàn)檐?chē)型種類(lèi)多、特征差異較小,低VC維的分類(lèi)器很難很好地將它們分開(kāi)。另外,對(duì)徑向基核函數(shù),一方面,當(dāng)σ2恒定時(shí),泛化誤差隨著C增大而減小,其原因主要是隨著C增大,訓(xùn)練錯(cuò)分樣本數(shù)減小,從而使泛化誤差減?。涣硪环矫?,當(dāng)C恒定時(shí),泛化誤差隨著σ2增大而基本上呈現(xiàn)出由大變小再變大的趨勢(shì),其原因主要是當(dāng)σ2較小時(shí),分類(lèi)器的VC維較大,出現(xiàn)了過(guò)學(xué)習(xí)而使泛化誤差變大。當(dāng)σ2較大時(shí),分類(lèi)器的VC維較小,出現(xiàn)了欠學(xué)習(xí)而使泛化誤差變大。在有限的實(shí)驗(yàn)參數(shù)范圍中,徑向基核函數(shù)在σ2=0.50、G=1 000時(shí)獲得14.47%的最小泛化誤差,可將其選作為車(chē)型分類(lèi)的最佳模型。
2.3車(chē)型分類(lèi)實(shí)驗(yàn)
在模型訓(xùn)練階段,從一段視頻中人工選取1 500個(gè)包含7種車(chē)型的訓(xùn)練樣本進(jìn)行訓(xùn)練。在測(cè)試階段,采用訓(xùn)練階段得到的模型對(duì)600個(gè)測(cè)試樣本進(jìn)行分類(lèi)。SVM方法分類(lèi)性能結(jié)果如表2所示。
圖2是前面介紹的14個(gè)特征值作為支持向量機(jī)的輸入矢量,選擇高斯徑向核(σ2=0.50)、C=1 000來(lái)訓(xùn)練SVM后進(jìn)行分類(lèi)的結(jié)果實(shí)例。
3結(jié)束語(yǔ)
本文采用SVM方法對(duì)車(chē)型分類(lèi)進(jìn)行了研究。實(shí)驗(yàn)表明:核函數(shù)及模型參數(shù)對(duì)SVM方法的分類(lèi)性能有較大的影響;對(duì)基于視頻的車(chē)型分類(lèi),SVM方法是一種很有前景的技術(shù)。
評(píng)論