博客專欄

EEPW首頁 > 博客 > 清華學(xué)者主導(dǎo)干濕結(jié)合“下一代細胞工廠”開源使能平臺問世!數(shù)據(jù)驅(qū)動全基因組基因型-工業(yè)表型關(guān)聯(lián)技術(shù),賦能合成生物學(xué)高效底盤細胞設(shè)計

清華學(xué)者主導(dǎo)干濕結(jié)合“下一代細胞工廠”開源使能平臺問世!數(shù)據(jù)驅(qū)動全基因組基因型-工業(yè)表型關(guān)聯(lián)技術(shù),賦能合成生物學(xué)高效底盤細胞設(shè)計

發(fā)布人:深科技 時間:2022-05-05 來源:工程師 發(fā)布文章

1976 年 1 月的一天,一位年輕的風(fēng)險投資人和一位微生物學(xué)教授走進了加州大學(xué)舊金山分校(UCSF)附近的酒吧,原定十分鐘的會面時間延長到了三個小時。從那一刻起,一家改變生物技術(shù)史的公司就此誕生。他們使用 GENetic ENgineering TECHnology 的縮寫命名了這家公司——Gen-en-tech(基因泰克)。

 

圖片

圖丨Genentech 的聯(lián)合創(chuàng)始人赫伯特·博耶(Herbert Boyer)博士(左)和風(fēng)險投資人羅伯特·斯萬森(Robert A.Swanson)先生(右)(來源:資料圖)

 

Genentech 公司首次成功地將人胰島素的 DNA 重組到大腸桿菌細胞內(nèi)的質(zhì)粒上,讓大腸桿菌作為細胞工廠生產(chǎn)出重組人胰島素,并將其產(chǎn)品化。從此,正式拉開了基因工程的序幕。

 

然而,四十多年過去了,人們在技術(shù)層面上重組表達胰島素,幾乎只做了一件事——把外源的 DNA 放進細胞,讓這個基因轉(zhuǎn)錄成 RNA,翻譯成蛋白質(zhì),然后再圍繞著該外源 DNA 的表達翻譯效率做些工程化改造。

 

蛋白要在宿主細胞中高效表達,其實不僅是信息傳遞。原料供應(yīng)、肽鏈延長、翻譯后修飾,折疊、分泌乃至應(yīng)急修復(fù)等,諸多環(huán)節(jié)都有可能影響到蛋白表達的效率。


“要讓細胞這臺精巧的蛋白質(zhì)‘3D 打印機’高效率運轉(zhuǎn),在全基因組層面有大量的基因發(fā)揮著不可或缺作用。然而,盡管我們在基礎(chǔ)研究的層面認識到這件事,但是,到工程層面上,還很難做到全基因組層面的工程化以提升細胞的蛋白表達效率,我們目前的認識還很淺?!鼻迦A大學(xué)張翀教授表示。


張翀是清華大學(xué)長聘副教授,國家級青年人才計劃獲得者,主要研究方向為微生物智能制造,開展高通量基因型-表型關(guān)聯(lián)原創(chuàng)技術(shù)與裝備的研究,包括微生物工業(yè)表型高通量表征與連續(xù)進化,全基因組規(guī)?;蚣拔稽c功能挖掘,基因型與工業(yè)表型關(guān)聯(lián)研究裝備等。

 

圖片

圖丨張翀(來源:張翀)

 

迄今為止,細胞工廠已能夠生產(chǎn)抗生素、氨基酸、重組蛋白、生物能源、生物塑料乃至“人造肉”,被廣泛地應(yīng)用在生物制造、制****、食品、能源和農(nóng)業(yè)等領(lǐng)域。


但是,與重組胰島素合成的案例一樣,目前人們對外源途徑改造較多,但對全基因組層面底盤細胞本身了解較少,進而制約了對其系統(tǒng)化工程改造的能力,細胞底盤自身的潛能還沒有被系統(tǒng)地挖掘。


如果把外源途徑的基因序列比作圖紙,把細胞比作車間,那么,現(xiàn)有的努力大多是在“圖紙”上下功夫,但是仍然十分缺乏對“車間”全局的系統(tǒng)認知和工程化改造的能力。


 從隨機誘變到全基因組定制,多項技術(shù)催生底盤細胞“發(fā)現(xiàn)新大陸”

圖片


合成生物學(xué)細胞工廠構(gòu)建的核心是如何通過設(shè)計合適的基因型,從而得到人們想要的工業(yè)表型。張翀教授認為,在基因組時代,科學(xué)家可通過各類公開生物學(xué)數(shù)據(jù)庫得到大量的基因型相關(guān)的測試數(shù)據(jù),但是,真正有價值的是能得到與工業(yè)表型關(guān)聯(lián)的基因型數(shù)據(jù)。


圖片

圖丨合成生物學(xué)常關(guān)注的工業(yè)表型(來源:該團隊)


隨著分子生物學(xué)和基因工程研究方法的不斷發(fā)展,細胞工廠的構(gòu)建策略經(jīng)歷了不同的歷史階段。相較于早期主要通過非理性誘變育種技術(shù)獲得目標(biāo)產(chǎn)物高產(chǎn)菌株的方式,20 世紀 90 年代以來,隨著分子生物學(xué)、基因工程技術(shù)的逐步引入,代謝工程學(xué)科正式創(chuàng)立。


代謝工程利用重組 DNA 技術(shù)對生物體中已知的代謝途徑進行有目的的設(shè)計,并對細胞內(nèi)的基因網(wǎng)絡(luò)進行調(diào)控和優(yōu)化,構(gòu)建具有特定功能的細胞工廠,例如提高目的產(chǎn)物的產(chǎn)率。

 

然而,代謝工程指導(dǎo)的設(shè)計方法大多都基于已知的生物學(xué)知識,由于微生物代謝網(wǎng)絡(luò)中存在諸多可能對目標(biāo)產(chǎn)物工業(yè)表型產(chǎn)生影響的未知因素,或稱為“生命暗物質(zhì)”。這一手段獲取新知識的效率不高,細胞工廠改造過程仍然需要耗費大量的時間和精力。


圖片

圖丨細胞工廠設(shè)計和構(gòu)建發(fā)展歷程與展望 (來源:該團隊)


那么,為了讓讓細胞工廠的設(shè)計更高效,如何去解析這些“生命暗物質(zhì)”呢?

  

“通過自有的技術(shù)平臺從全基因組層次并行研究微生物特定工業(yè)表型與基因型的關(guān)系,從而獲得大規(guī)模的基因型-工業(yè)表型關(guān)聯(lián)(genotype phenotype associations,GPA)數(shù)據(jù)集?!睆埩埍硎尽?/span>


“近年來,高通量 DNA 合成成本的降低、基因編輯技術(shù)和二代測序技術(shù)的飛躍、高通量檢測技術(shù)的成熟等多項技術(shù)的發(fā)展讓大規(guī)模的 GPA 數(shù)據(jù)集的挖掘成為可能。這些新挖掘的數(shù)據(jù)將成為基因組層面的‘新大陸’?!彼f。

 

“新大陸”指的是新發(fā)現(xiàn)的跟目的工業(yè)表型相關(guān)聯(lián)的基因位點,例如他們發(fā)現(xiàn)很多意外的、和蛋白質(zhì)合成有關(guān)系的位點,比如氧化應(yīng)激(Oxidative Stress)對蛋白質(zhì)合成有積極的幫助等。

 

基于全基因組規(guī)模關(guān)聯(lián)圖譜獲取新知識并驗證其工業(yè)價值后,再在底盤上進行系統(tǒng)工程改造,將為系統(tǒng)提升細胞工廠效率提供一條‘發(fā)現(xiàn)-工程相結(jié)合的全新路徑。”張翀說。

 

通過超高通量、快速、低成本的技術(shù)“三部曲”、實現(xiàn)全基因組規(guī)模基因型-工業(yè)表型關(guān)聯(lián)位點挖掘

圖片

 

張翀團隊已經(jīng)成熟打造了一套技術(shù)平臺,通過該平臺,可進行超高通量、快速、低成本地對全基因組規(guī)模進行 GPA 數(shù)據(jù)集的挖掘。

                                                       

該平臺的背后有三個核心技術(shù)的支撐,分別為:CRISPR 全基因組編輯技術(shù)、超高通量液滴微流控單克隆培養(yǎng)篩選一體化技術(shù)和合成生物傳感技術(shù)。

 

圖片

圖丨全基因組規(guī)模 CRISPR 基因干擾文庫(來源:該團隊)

 

第一,CRISPR 全基因組編輯技術(shù)。該團隊針對典型的工業(yè)宿主建立了細胞全基因組規(guī)??蛇_百萬量級 CRISPR 基因干擾文庫。這里的“干擾”,指的是把底盤細胞的基因敲低或激活,甚至進行基因編輯[1,2,3]。


張翀表示,在該平臺通過 CRISPR 編輯技術(shù)實現(xiàn)了“高版本”的基因型突變。這里的“高版本”是因其具備可定制、可追蹤兩大特點。也就是說,科學(xué)家可在任意位點設(shè)計 sgRNA 的干擾或編輯,并且,在表型變化后,不用測全基因組即可追蹤 sgRNA 的具體位置。


據(jù)悉,目前該團隊已有多種成熟工業(yè)底盤細胞全基因組編輯細胞文庫,并獨立開發(fā)了全基因組 sgRNA 文庫設(shè)計軟件與 web 應(yīng)用程序。

 

圖片

圖丨全基因組 sRNA 文庫設(shè)計軟件工具開發(fā)流程(來源:該團隊)


第二,自主研發(fā)具有百萬通量級篩選能力的液滴微流控細胞培養(yǎng)及篩選一體化技術(shù)。張翀團隊結(jié)合微流控技術(shù)和光電傳感與控制及自動化技術(shù)開發(fā)的“微生物微液滴培養(yǎng)技術(shù) ”,可實現(xiàn)皮升、納升、微升級多種體積規(guī)模下的微生物液滴平行培養(yǎng)、生長曲線測定和適應(yīng)性進化。


該平臺采用集成式單克隆培養(yǎng),單次單克隆數(shù)量可超 10個,與傳統(tǒng)方法相比,培養(yǎng)成本降低約 1000 倍 。并且,該平臺可自動換液,細胞生長狀態(tài)高度均一 ,適宜多種成熟工業(yè)微生物生長[4]。

 

張翀指出,通過環(huán)境條件的控制,液滴內(nèi)微生物可能實現(xiàn)“工業(yè)相似性”培養(yǎng)?!斑@相當(dāng)于實現(xiàn)了文庫獨立的基因型轉(zhuǎn)變?yōu)楠毩⒌姆磻?yīng)器,讓它生長出可獲取的目標(biāo)表型?!?/span>

 

圖片

圖丨超高通量液滴微流控單克隆培養(yǎng)篩選一體化平臺(來源:該團隊)

 

第三,自主研發(fā)的高靈敏、毫秒級響應(yīng)合成生物傳感器。通常,對百萬個皮升級液滴的表型進行測試,會采用定向的光學(xué)技術(shù),尤其是熒光技術(shù)。為此,該團隊建立了一系列針對蛋白質(zhì)、小分子濃度定量測試的合成生物熒光傳感技術(shù)[5,6,7]。


通過該技術(shù),可將目標(biāo)分子濃度定量地轉(zhuǎn)化成熒光信號,其靈敏度高、響應(yīng)速度快,與百萬量級通量的液滴微流控系統(tǒng)完全兼容,為目的代謝物表型-基因型關(guān)聯(lián)圖譜的繪制奠定基礎(chǔ)。

 

圖片

 圖丨蛋白產(chǎn)量與折疊生物傳感器模型(來源:該團隊) 

 

干濕結(jié)合的中心化實驗室,整合數(shù)據(jù)孤島,打造國內(nèi)首個合成生物學(xué)數(shù)據(jù)開源使能平臺

圖片


目前,生物科學(xué)領(lǐng)域所使用的數(shù)據(jù)庫,例如 NCBI、KEGG、PDB 等,都是靠科學(xué)家團隊供應(yīng)離散式數(shù)據(jù)集成形成的,其主要還是科學(xué)屬性的數(shù)據(jù)庫?!?strong style=";padding: 0px;outline: 0px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important">設(shè)想如果我們手頭擁有海量工業(yè)需求驅(qū)動的 GPA 數(shù)據(jù)庫,這樣就掌握著設(shè)計高效細胞工廠的核心原始數(shù)據(jù)。”張翀說。

 

他指出,從行業(yè)內(nèi)部來看,合成生物學(xué)雖然潛力巨大,但是技術(shù)發(fā)展得很早期,還有很多問題需要解決。合成生物學(xué)是個兼具科學(xué)屬性與工程屬性的交叉學(xué)科,但是現(xiàn)階段,科學(xué)屬性仍然較重,工程化較弱。尤其是學(xué)術(shù)界,很多研發(fā)的方式還停留在“手工作坊”階段。

 

張翀認為,通過自動化和高通量技術(shù)讓科學(xué)家做實驗的過程變成中心平臺化的形式,以此來促進合成生物學(xué)從科學(xué)屬性向工程屬性轉(zhuǎn)移。一旦把這個鏈條打通,未來合成生物學(xué)就變成了純粹的信息科學(xué)和數(shù)據(jù)科學(xué)的問題。

 

從生物制造領(lǐng)域來看,細胞工廠設(shè)計是未來的發(fā)展趨勢,從現(xiàn)在離散式的個人實驗室變成中心化實驗室平臺,從分布式的數(shù)據(jù)向集成的大規(guī)模數(shù)據(jù)生產(chǎn),這種高度標(biāo)準化、高質(zhì)量的數(shù)據(jù)為最后演變?yōu)锳I驅(qū)動的設(shè)計提供了極大的可能性。

 

如果能夠利用大規(guī)模 GPA 數(shù)據(jù)集,基于數(shù)據(jù)科學(xué)手段從全基因組范圍深度挖掘傳統(tǒng)分子生物學(xué)手段無法發(fā)現(xiàn)的未知關(guān)聯(lián)基因及其位點,將有可能從數(shù)據(jù)學(xué)習(xí)的角度繞開理性設(shè)計的知識瓶頸,為提高細胞工廠設(shè)計和創(chuàng)建效率提供全新的研究范式。


此外,由于大規(guī)模 GPA 數(shù)據(jù)集搜索范圍更寬(全基因組),不依賴于現(xiàn)有知識,將有可能探索之前理性/半理性所無法達到的表型“高地”,獲得生產(chǎn)效率更為高效、生產(chǎn)性能更加優(yōu)越的下一代定制化細胞工廠。

 

對于該平臺,張翀團隊對其規(guī)劃不僅限于對科學(xué)家的單點服務(wù),還計劃逐漸實行學(xué)術(shù)端開源,助力多維度合成生物學(xué)的數(shù)據(jù)標(biāo)準化。以高通量基因型-工業(yè)表型關(guān)聯(lián)圖譜數(shù)據(jù)驅(qū)動 AI 解析細胞工廠,打造合成生物數(shù)據(jù)使能平臺。


該平臺用工程手段推進科學(xué)研究升級,將輔助科學(xué)家實現(xiàn)技術(shù)轉(zhuǎn)化,并銜接行業(yè)上下游。當(dāng)平臺發(fā)展到一定程度,便會積累較高的產(chǎn)業(yè)化勢能,將來會有多種產(chǎn)業(yè)化的可能性。

 

“科學(xué)家通過提需求,確認想要做的菌株以及表型后,我們來幫他做實驗,再將結(jié)果反饋給科學(xué)家。同時,我們希望把數(shù)據(jù)沉淀到平臺,同時開放地讓學(xué)術(shù)貢獻共同獲取,并驗證它的應(yīng)用價值。未來,這會成為若干工業(yè)表型圖設(shè)計的核心驅(qū)動力?!睆埩堈f。

 

據(jù)悉,該團隊已與國內(nèi)重點高校相關(guān)實驗室建立廣泛合作,如清華大學(xué)、天津大學(xué)、華東理工大學(xué)、上海交通大學(xué)、江南大學(xué)、中科院上海植生所等。同時,張翀正在為該平臺進行技術(shù)授權(quán)及產(chǎn)業(yè)化落地,目前已在籌備成立相關(guān)公司并組建技術(shù)研發(fā)團隊,張翀教授出任首席科學(xué)家。 

 

對該平臺的未來發(fā)展,張翀充滿期待,他稱:“我相信擁有數(shù)據(jù)的核心資源,也就掌握了細胞工廠設(shè)計的核心信息,我們希望這類關(guān)鍵數(shù)據(jù)庫生根在中國,并服務(wù)于中國本土的科研與產(chǎn)業(yè)?!?/span>


-End-


圖片


參考:1.Jiahui Guo et al.Improved sgRNA design in bac teria via genome-wideactivity profifiling.  Nucleic Acids Research 46, 14,7052–7069(2018). DOI:10.1093/nar/gky5722.Huibao Feng et al. Guide-target mismatch effects on dCas9–sgRNAbinding activity in living bacterial cells. Nucleic Acids Research 49, 3,1263–1277(2021). https://doi.org/10.1093/nar/gkaa12953.Wang, T., Guan, C., Guo, J. et al. Pooled CRISPR interference screening enables genome-scale functional genomics study in bacteria with superior performance.Nat Commun 9,2475(2018). https://doi.org/10.1038/s41467-018-04899-x4.JIAN X, GUO X, WANG J, et al. Microbial microdroplet culture system (MMC): an integrated platform for automated, highthroughput microbial cultivation and adaptive evolution[J]. Biotechnology and Bioengineering(2019).DOI: 10.1101/2019.12.19.883561.5.Wang, T., Zheng, X., Ji, H. et al. Dynamics of transcription–translation coordination tune bacterial indole signaling. Nat Chem Biol 16, 440–449 (2020). https://doi.org/10.1038/s41589-019-0430-36.Chenqi Niu et al. Aptamer assisted CRISPR-Cas12a strategy for small molecule diagnostic. Biosensors and Bioelectronics 183:113196(2021). DOI: 10.1016/j.bios.2021.113196. 7.Yikang Zhou et al. Encoding Genetic Circuits with DNA Barcodes Paves the Way forMachine Learning-Assisted Metabolite Biosensor Response CurveProfifiling in Yeast. ACS Synth. Biol.11,2,977–989(2022). https://doi.org/10.1021/acssynbio.1c00595


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)


關(guān)鍵詞: 清華學(xué)者

技術(shù)專區(qū)

關(guān)閉