新冠病毒破解有了巨大突破,達(dá)摩院做了什么?
阿里巴巴達(dá)摩院正在用AI算法抗擊新型冠狀病毒肺炎疫情。2月1日,浙江省疾控中心上線自動(dòng)化的全基因組檢測(cè)分析平臺(tái)。利用阿里達(dá)摩院研發(fā)的AI算法,可將原來(lái)數(shù)小時(shí)的疑似病例基因分析縮短至半小時(shí),大幅縮短確診時(shí)間,并能精準(zhǔn)檢測(cè)出病毒的變異情況。
本文引用地址:http://butianyuan.cn/article/202002/409530.htm當(dāng)前,全國(guó)新型冠狀病毒肺炎疫情依然嚴(yán)峻,快速、精確診斷對(duì)于疫情控制尤其重要。公開信息顯示,該病毒是基因組序列最長(zhǎng)的病毒之一,全基因組序列全長(zhǎng)29847bp,臨床診斷需要將患者樣本與該病毒基因序列進(jìn)行比對(duì)才能確定診斷結(jié)果。
目前醫(yī)院普遍采用核酸檢測(cè)方法,其只能檢測(cè)到病毒基因的局部。由于病毒存在變異的可能性,對(duì)于整個(gè)基因序列來(lái)說(shuō)這種檢測(cè)方法猶如盲人摸象,一旦病毒發(fā)生變異,就可能出現(xiàn)漏檢的情況。
不同于傳統(tǒng)核酸檢測(cè)方法,全基因組檢測(cè)技術(shù)可以對(duì)疑似病例的病毒樣本進(jìn)行全基因組序列分析比對(duì),能夠有效防止病毒變異產(chǎn)生的漏檢。此次阿里巴巴達(dá)摩院與杰毅生物技術(shù)公司聯(lián)合研發(fā)的平臺(tái)采用的就是全基因組檢測(cè)方法,其突破之處在于大幅縮短了檢測(cè)時(shí)間。
在基因分析階段,阿里巴巴達(dá)摩院和阿里云彈性計(jì)算團(tuán)隊(duì)提供的系統(tǒng)還能提供病毒快速拼接能力,將快速精準(zhǔn)捕捉變異后的病毒序列,二級(jí)結(jié)構(gòu)及三維結(jié)構(gòu),為病毒疫苗和藥物提供了基礎(chǔ)。
診斷效率的提升得益于算法的創(chuàng)新。達(dá)摩院團(tuán)隊(duì)針對(duì)新型冠狀病毒基因進(jìn)行特征分析,并推出多個(gè)算法模型。在序列比對(duì)過程中,達(dá)摩院對(duì)算法增加了分布式設(shè)計(jì),提升了比對(duì)效率;在病毒序列拼接階段使用分布式設(shè)計(jì)的de Bruijn圖算法,變異病毒也能精準(zhǔn)檢測(cè)。
浙江省疾控中心基因測(cè)序負(fù)責(zé)人孫逸博士表示:“該平臺(tái)基于阿里云的強(qiáng)大算力與達(dá)摩院新算法可以為病毒的解析提供支撐,基于該平臺(tái),未來(lái)還可以在短時(shí)間內(nèi)將檢測(cè)范圍覆蓋整個(gè)確診病例,也為后續(xù)疫苗與藥物研發(fā)打下了堅(jiān)實(shí)基礎(chǔ)?!?/p>
以下是達(dá)摩院算法專家對(duì)該平臺(tái)的解讀:
Q:這一平臺(tái)有何特點(diǎn)?
A:此次研發(fā)的自動(dòng)化全基因組檢測(cè)分析平臺(tái)屬于高通量測(cè)序,平臺(tái)由阿里巴巴達(dá)摩院聯(lián)合杰毅生物共同研發(fā),可以給浙江省疾控在新型冠狀病毒疫情防控上提供了全自動(dòng)建庫(kù)和分布式計(jì)算分析能力。杰毅生物開發(fā)了全自動(dòng)高通量測(cè)序建庫(kù)儀,把整體常規(guī)人工需要12小時(shí)的工作縮短到2個(gè)小時(shí)。每次測(cè)序過程會(huì)產(chǎn)生海量的數(shù)據(jù),達(dá)摩院采用分布式設(shè)計(jì)的分析算法,樣本基因分析的速度由數(shù)小時(shí)縮短到半小時(shí);同時(shí),由于采用分布式算法,病毒拼接的速度由30分鐘-1小時(shí)縮短到15-30分鐘。除此之外,不同于傳統(tǒng)核算檢測(cè)方法,這一平臺(tái)還可以檢測(cè)到病毒的全貌,避免因?yàn)椴《咀儺愒斐傻穆z情況。
Q:達(dá)摩院團(tuán)隊(duì)提供的算法有哪些價(jià)值?
A:達(dá)摩院針對(duì)新冠病毒基因的特征進(jìn)行了分析,基于pdb等公共數(shù)據(jù)集的數(shù)據(jù)進(jìn)行算法的優(yōu)化訓(xùn)練。本次分析病毒檢測(cè)和病毒變異部分主要基于開源算法,設(shè)計(jì)分布式算法以加速分析流程。病毒序列拼接完成后,通過設(shè)計(jì)BiLSTM+DNN的方式訓(xùn)練模型預(yù)測(cè)病毒蛋白二級(jí)結(jié)構(gòu)。同時(shí),達(dá)摩院還在研究基于序列的蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)模型以及藥物篩選模型。
評(píng)論