博客專欄

EEPW首頁 > 博客 > 葡萄風(fēng)味有奧秘,農(nóng)科院用機(jī)器學(xué)習(xí)揭示基因漸滲過程

葡萄風(fēng)味有奧秘,農(nóng)科院用機(jī)器學(xué)習(xí)揭示基因漸滲過程

發(fā)布人:數(shù)據(jù)派THU 時(shí)間:2023-07-09 來源:工程師 發(fā)布文章

內(nèi)容一覽:基因漸滲與葡萄的馴化、遺傳改良密切相關(guān)。先前研究揭示了歐洲栽培葡萄中,野生葡萄基因漸滲的基因組信號(hào),但尚未深入研究這些漸滲事件發(fā)生的時(shí)間、方式、基因組模式和生物學(xué)效應(yīng)。本文中,中國(guó)農(nóng)業(yè)科學(xué)院深圳農(nóng)業(yè)基因組研究所的研究人員,使用機(jī)器學(xué)習(xí)的種群遺傳分析方法,對(duì)栽培葡萄以及野生葡萄進(jìn)行了重測(cè)序數(shù)據(jù)分析,這對(duì)于葡萄育種具有重要意義。


關(guān)鍵詞:基因漸滲  葡萄馴化 機(jī)器學(xué)習(xí)


基因漸滲是指基因從一種物種或種群,滲入到另一種物種或種群的過程。它通常發(fā)生在不同物種之間的雜交和回交過程中。在基因漸滲中,外源基因通過雜交進(jìn)入目標(biāo)物種的基因池,與目標(biāo)物種的本地基因發(fā)生混合。這種漸滲可以導(dǎo)致目標(biāo)物種的基因組發(fā)生改變,獲得新的遺傳變異和多樣性。


葡萄的基因漸滲是指野生葡萄 (Vitis vinifera ssp. sylvestris) 與栽培葡萄 (V. vinifera ssp. vinifera) 之間基因交流和基因流動(dòng)的過程。在自然界和人工選擇的影響下,野生葡萄與栽培葡萄之間發(fā)生基因交換,導(dǎo)致栽培葡萄中出現(xiàn)野生葡萄的遺傳特征。


近期,中國(guó)農(nóng)業(yè)科學(xué)院深圳農(nóng)業(yè)基因組的研究人員,研究了馴化葡萄與其歐洲野生近緣種之間的漸滲歷史,他們使用基于機(jī)器學(xué)習(xí)的群體遺傳方法,揭示了葡萄風(fēng)味的形成機(jī)制,對(duì)其基因特征及其對(duì)葡萄育種的影響提供了深入的見解。目前,該研究成果已發(fā)表在《Proceedings of the National Academy of Sciences》期刊上,標(biāo)題為《Adaptive and maladaptive introgression in grapevine domestication》。


圖片

該研究成果已發(fā)表在《Proceedings of the National Academy of Sciences》期刊上


論文地址:https://www.pnas.org/doi/abs/10.1073/pnas.2222041120


數(shù)據(jù)集


研究人員對(duì)一組 345 個(gè)測(cè)序樣本進(jìn)行了分析,這些樣本包括釀酒葡萄和食用葡萄,涵蓋了野生葡萄的廣泛地理分布范圍,其中包括來自歐洲的 72 種野生葡萄 (V. vinifera ssp. sylvestris)、來自中東和高加索地區(qū)的 36 種野生葡萄和 231 種馴化葡萄 (V. vinifera ssp. vinifera),以及代表北美外群物種的 Vitis californica (n = 3) 和 Muscadinia rotundifolia (n = 3)。此外,研究人員還對(duì)歐洲野生葡萄進(jìn)行了采樣以覆蓋歐洲和近東的預(yù)測(cè)分布區(qū)域。


數(shù)據(jù) (基因組序列;script) 已存放在 GitHub 中:https://github.com/zhouyflab/Grapevine_Adaptive_Maladaptive_Introgression


 實(shí)驗(yàn)結(jié)果


基因漸滲歷史 


首先,研究人員評(píng)估了歐洲野生葡萄、釀酒葡萄和食用葡萄之間的差異,以深入了解種群和馴化歷史。值得注意的是,歐洲野生葡萄 (EU sylvestris) 形成了一個(gè)獨(dú)特的群體,與釀酒葡萄共享少數(shù)混合成分。


圖片

圖1. 不同葡萄品種對(duì)比


A:混合分析的系統(tǒng)發(fā)生樹。

在系統(tǒng)發(fā)生中,分支的顏色反映了不同的群體:ME 1,黃色;ME 2,紫色;野生葡萄,紅棕色;釀酒葡萄,藍(lán)色;食用葡萄, 綠色。Admixture 圖, K = 6 。圖右側(cè)的紅點(diǎn)和藍(lán)色三角形分別顯示來自食用或釀酒組的葉綠體或線粒體是否明顯起源于歐洲野生葡萄。

B:五個(gè)組的 PCA。

C:五組的雜合性。

D:不同傳播類型下的正向模擬結(jié)果。藍(lán)線表示異交繁殖,而橙色線表示克隆繁殖。


圖 1 顯示,釀酒葡萄和食用葡萄在進(jìn)化過程中發(fā)生了早期的分化,表明它們?cè)谟猛旧嫌忻黠@的區(qū)別。野生葡萄樣本也呈現(xiàn)出單系群,但分為三個(gè)不同的群體:歐洲野生葡萄(EU)、位于里海周圍葡萄 (ME 1) 和位于地中海附近的肥沃新月地帶的葡萄 (ME 2)。通過主成分分析 (PCA) 和祖先成分比例的估計(jì),也證實(shí)了這些種群之間的分化。釀酒葡萄和食用葡萄 (均為 0.24) 的雜合性比野生種群更高 (歐洲為 0.17,ME1 為 0.20,ME2 為 0.22),這可能是由于歷史上的漸滲事件和長(zhǎng)期的無性繁殖導(dǎo)致了雜合突變的積累。


 基因漸滲方向 


研究人員在最初的模型基礎(chǔ)上,估計(jì)了食用葡萄、釀酒葡萄和歐洲野生葡萄之間可能存在的 34 種基因流動(dòng)模式。根據(jù)最佳模型,fastsimcoal 推斷歐洲野生葡萄大約在 4 萬年前發(fā)生了分化。


圖片圖 2:漸滲檢測(cè)


水平分支中的時(shí)間 (T) 是每個(gè)組的分化時(shí)間 (年),T_i 表示推斷的漸滲開始時(shí)間。


底部的數(shù)字是每組的估計(jì)有效種群規(guī)模 (Ne)。


圖 2 顯示,在最佳模型下,fastsimcoal 推斷出 EU 類群在大約 4 × 104 年前分化;食用葡萄的馴化早在 1.5 × 104 年前就開始了;大約在 1.0 × 104 年前,釀酒葡萄從食用葡萄中分離出來。模型表明,歐洲野生種群和馴化種群之間的基因流動(dòng)始于 1.8 × 103 年前。此外,最佳擬合模型還表明,基因從歐洲野生種群流動(dòng)到馴化種群的概率很高,向釀酒葡萄 (1.7 × 10?4) 的遷移率是食用葡萄 (3.8 × 10?5) 的 5 倍。


 基因漸滲區(qū)域 


研究人員使用機(jī)器學(xué)習(xí)方法來識(shí)別葡萄基因組的基因漸滲區(qū)域,以及這些區(qū)域的基因組特征。


圖片圖 3:漸滲區(qū)域的三種基因


Filet 預(yù)測(cè)的假定基因漸滲區(qū)域用黑線標(biāo)記在 19 條染色體上。


三種顏色代表三種基因漸滲區(qū)域內(nèi)的基因

紅色:開花相關(guān)基因

綠色:芳香化合物相關(guān)基因

藍(lán)色:應(yīng)激反應(yīng)基因。


研究人員對(duì)整個(gè)基因組中的漸滲選擇基因進(jìn)行了 GO 功能研究,并重點(diǎn)關(guān)注開花相關(guān)基因、風(fēng)味相關(guān)基因和應(yīng)激反應(yīng)相關(guān)基因。圖 3 顯示,許多與開花相關(guān)的基因在滲入后選擇,其次是芳香族化合物相關(guān)的基因。大多數(shù) GO 分類的富集也與風(fēng)味相關(guān),包括木質(zhì)素降解過程、L-苯丙氨酸降解過程和肉桂酸生物合成過程。因此,研究人員推斷釀酒葡萄和歐洲野生葡萄之間的適應(yīng)性漸滲主要影響了與風(fēng)味相關(guān)的性狀。


為了解等位基因的漸滲動(dòng)態(tài),研究人員對(duì)異交繁殖和克隆繁殖的漸滲進(jìn)行了正向模擬。


圖片圖 4:非漸滲區(qū)域和漸滲區(qū)域中有益SNPs和有害SNPs的SFS


E:整個(gè)漸滲群體中漸滲等位基因的總數(shù)

F:整個(gè)漸滲群體中不同類型的漸滲等位基因的數(shù)量

G:異交組第 500 代漸滲有益和有害等位基因的 SFS

H克隆組第 500 代漸滲有益和有害等位基因的 SFS


研究發(fā)現(xiàn),雜交后漸滲等位基因 (包括有益和有害等位基因) 的總數(shù)都有所增加,直至達(dá)到平衡。這些模擬表明,在克隆和異交系統(tǒng)中,漸滲等位基因的情況可能存在顯著差異。漸滲對(duì)有益和有害變異的補(bǔ)充起到了重要作用,這些變異可能成為葡萄栽培基因組設(shè)計(jì)的主要目標(biāo),包括在有性繁殖過程中清除潛在的有害變異。


 AGIS:專注農(nóng)業(yè)科技創(chuàng)新


值得注意的是,該論文的多名作者均來自中國(guó)農(nóng)業(yè)科學(xué)院深圳農(nóng)業(yè)基因組研究所。基因組所成立于 2014 年,通過整合生物學(xué)和大數(shù)據(jù)科學(xué),來認(rèn)識(shí)與利用農(nóng)業(yè)生物基因組,服務(wù)全球農(nóng)業(yè)生產(chǎn)。基因組所的長(zhǎng)期愿景是致力于通過顛覆性創(chuàng)新來促進(jìn)全球農(nóng)業(yè)可持續(xù)發(fā)展,服務(wù)于個(gè)性化食品供給體系,并提升人類健康水平和農(nóng)民社會(huì)地位。


基因組所在包括 Science、Nature、Cell 等頂級(jí)期刊在內(nèi)的雜志上發(fā)表 SCI 論文 620 多篇,農(nóng)業(yè)基因組學(xué)等研究領(lǐng)域占據(jù)世界前沿。除了研究葡萄的基因漸滲問題,該所還發(fā)布了另外兩篇與葡萄基因相關(guān)的研究成果,不僅聯(lián)合國(guó)內(nèi)外學(xué)者首次繪制了葡萄完整基因組圖譜,還揭示了野生葡萄的抗皮爾斯病的全基因組效應(yīng)和氣候適應(yīng)性機(jī)制。


所長(zhǎng)表示,基因組所還是一個(gè)非常年輕的科研院所,建設(shè)國(guó)際一流的農(nóng)業(yè)科研院所任重而道遠(yuǎn),將立足新時(shí)代新征程新使命,以堅(jiān)持「四個(gè)面向」助力高水平科技自立自強(qiáng),為建設(shè)「農(nóng)業(yè)強(qiáng)國(guó)」繼續(xù)做出我們的貢獻(xiàn)。目前,基因組所聯(lián)合深圳市相關(guān)部門提出了建設(shè)「深圳國(guó)際食品谷」建議,規(guī)劃已得到市政府批復(fù),將在深圳構(gòu)建農(nóng)業(yè)食品產(chǎn)學(xué)研協(xié)作生態(tài),做出科技推動(dòng)農(nóng)業(yè)食品產(chǎn)業(yè)轉(zhuǎn)型升級(jí)的先行示范。


基因組所官網(wǎng):https://www.agis.org.cn/index.htm
參考文獻(xiàn):[1]https://www.163.com/dy/article/I6KVQLV205328VPM.html[2]https://www.sohu.com/a/682674856_121124027[3]https://www.caas.cn/xwzx/kyhd/60f2e9b4dff84bed9e315b7097aeb26b.htm[4]https://www.agis.org.cn/bsgk/yjsjj/index.htm[5]https://www.agis.org.cn/xwzx/kyjz/677aecae97c448c9bed7e89f95daae7f.htm


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉