基于改進(jìn)遺傳算法的支持向量機(jī)特征選擇
基于敏感度信息量的交叉、變異操作
本文引用地址:http://butianyuan.cn/article/105942.htm獨(dú)立敏感度信息量Q(i)指的是對(duì)在所有特征都被選中時(shí)計(jì)算所得到的適應(yīng)度值A(chǔ)llfitness以及只有特征i未被選中時(shí)計(jì)算得到的適應(yīng)度值Wfitness(i)按式(2)進(jìn)行計(jì)算得到的數(shù)值。獨(dú)立敏感度信息量刻畫了適應(yīng)度對(duì)特征i是否被選擇的敏感程度。
互敏感度信息量R(i,j)由(3)式可得,互敏感度信息量體現(xiàn)了特征i與特征j之間對(duì)適應(yīng)度的近似影響程度。
交叉操作的作用是通過交換兩個(gè)染色體之間的若干位從而生成含有部分原始優(yōu)良基因的新個(gè)體。由式(3)可知互敏感度信息量可作為不同特征之間含有相似分類信息的一種度量,所以可以將互敏感度信息量代入式(4)計(jì)算出染色體在第位發(fā)生交叉的幾率b(i),在式(4)中i和j分別代表特征i和特征j,是染色體的長(zhǎng)度。b(i)是特征i相對(duì)于其他所有特征在互敏感度信息量上的歸一量,反映了特征與其余特征在相似信息量上的總和。由此對(duì)應(yīng)到染色體上,b(i)就可以認(rèn)為是染色體的第i位與整個(gè)染色體在基因信息上的相關(guān)性,b(i)越小則說(shuō)明相關(guān)性越大,第i位與整個(gè)染色體所含的基因信息越接近,此位為分裂點(diǎn)的幾率越小。由于b(i)是歸一化量,故可采用輪盤算法來(lái)選擇一個(gè)交叉點(diǎn)。
變異操作是引入新物種的重要手段,可以有效地增加種群個(gè)體的多樣性。本文中的變異率Pm采用相鄰兩代之間的最優(yōu)適應(yīng)度增幅比作為自變量進(jìn)行自適應(yīng)調(diào)節(jié),如式(5)所示。當(dāng)適應(yīng)度增幅比正向增大時(shí),較小的增幅比可以使變異率維持在中等水平,并且變異率隨著增幅比的增大而緩慢降低,這樣既能夠擁有一定數(shù)量的新個(gè)體也可以抑制過多不良染色體的產(chǎn)生,保證優(yōu)秀染色體的進(jìn)化足夠穩(wěn)定;而當(dāng)適應(yīng)度增幅比反向增大時(shí),由較小增幅比則可以獲得較高的變異率,并且變異率也伴隨增幅比同比緩慢升高,確保有足夠的染色體發(fā)生變異,穩(wěn)定地加快進(jìn)化速度。
評(píng)論