基于Alpha-NMF的AD樣本分類及特異性基因選擇方法
由于NMF算法受初值和維數(shù)r的影響,因此對每組實(shí)驗(yàn)分別取r=2,3,4,5時(shí)運(yùn)行NMF算法20次。為了衡量由于r值選取不同導(dǎo)致的聚類的穩(wěn)定性問題,定義了一個(gè)共表型相關(guān)系數(shù)(圖3分類穩(wěn)定性比較),共表型相關(guān)系數(shù)越接近于1,分類越穩(wěn)定。本文引用地址:http://butianyuan.cn/article/193834.htm
觀察圖3和圖4的結(jié)果,通過比較可以發(fā)現(xiàn),隨著r的增加,其相關(guān)系數(shù)和分類正確率普遍降低,當(dāng)r=2時(shí),其分類穩(wěn)定性和識(shí)別正確率明顯高于r=3,4,5時(shí)的情況。此時(shí),Alpha-NMF算法相比標(biāo)準(zhǔn)NMF算法具有較高的分類準(zhǔn)確性和穩(wěn)定性。尤其當(dāng)α=0.5時(shí),效果最佳。因此,選擇Alpha-NMF算法α=0.5,r=2處理后的集合基因,如圖2所示,選擇某一閾值(此處閾值為50),可以分別提煉出268個(gè)(HIP)、172(EC)個(gè)探針表達(dá)變化具有顯著差異。
4 討論
4.1 特異性基因及其功能分類
將上節(jié)提煉出的探針號(hào)與AD基因組進(jìn)行比對,共確定有320個(gè)基因?yàn)樘禺愋曰?。這些基因主要于細(xì)胞信號(hào)傳導(dǎo)、物質(zhì)代謝、物質(zhì)傳輸?shù)壬镞^程有關(guān)。
MiMI(Michigan Molecular Interactions)是國家衛(wèi)生研究所疾病預(yù)防控制綜合生物情報(bào)中心中的一部分。它可以提供蛋白質(zhì)間的相互作用,并且利用這些數(shù)據(jù)進(jìn)行融合,集合成一個(gè)復(fù)雜的網(wǎng)絡(luò);還能檢索大量基因的生物功能。
使用MiMI對上上述特異性基因進(jìn)行功能分類,其中有88基爵在GO(Gene Ontology)上沒有注釋,因此沒有對其分類,僅對其余的232個(gè)基因進(jìn)行分類,根據(jù)分類結(jié)果,主要分為以下幾類:1)物質(zhì)代謝過程;包括蛋白質(zhì)代謝、細(xì)胞氮化合物代謝、核苷酸代謝;2)細(xì)胞周期過程,包括細(xì)胞形態(tài)發(fā)生和發(fā)展、細(xì)胞自動(dòng)調(diào)節(jié)機(jī)能、生殖細(xì)胞形成;3)定位過程,包括蛋白質(zhì)定位、細(xì)胞定位、大分子定位;4)細(xì)胞成分組織,包括細(xì)胞內(nèi)大分子聚集、細(xì)胞膜組織以及細(xì)胞內(nèi)各器官組織;5)生物合成過程,包括核苷酸合成、小分子合成;6)基因表達(dá)、轉(zhuǎn)錄、翻譯;7)神經(jīng)系統(tǒng)調(diào)節(jié),包括神經(jīng)元的形成、神經(jīng)突觸傳導(dǎo)、神經(jīng)元變異、神經(jīng)傳導(dǎo)素生成及傳輸;8)細(xì)胞凋亡;9)物質(zhì)運(yùn)輸,包括ATP水解耦合質(zhì)子運(yùn)輸、陽離子運(yùn)輸、胞內(nèi)蛋白質(zhì)運(yùn)輸、離子跨膜運(yùn)輸。上述基因功能分類如表1所示。
評論