微軟研究院劉鐵巖：AI for Science：追求人類智能最光輝的一面｜MEET 2023

作者：時間：2023-01-06 來源：量子位

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

過去一年里， AI for Science技術成果集中爆發(fā)，在生物醫(yī)藥、材料、物理、化學、甚至數學上發(fā)揮出越來越重要的作用，不少學界、業(yè)內人士已經看到了AI在自然科學領域的巨大潛力。

本文引用地址：http://butianyuan.cn/article/202301/442431.htm

AI for Science背后的價值到底有些什么？

帶著這樣的追問，微軟研究院科學智能中心亞洲區(qū)負責人、微軟亞洲研究院副院長劉鐵巖和其帶領的團隊，進行了不倦追尋。

去年，劉鐵巖團隊發(fā)布了用于分子模擬的 Graphormer模型。在MEET2023智能未來大會上，劉鐵巖更是全面介紹了他對于AI4Science的理解，以及AI4Science如何作為科學發(fā)現的第五范式，和經驗范式、理論范式、計算范式、數據驅動范式互相促進、水乳交融，共同推進科學研究的飛速發(fā)展。

為了完整體現劉鐵巖的分享及思考，在不改變原意的基礎上，量子位對他的演講內容進行了編輯整理。

關于MEET智能未來大會：MEET大會是由量子位主辦的智能科技領域頂級商業(yè)峰會，致力于探討前沿科技技術的落地與行業(yè)應用。今年共有數十家主流媒體及直播平臺報道直播了MEET2023大會，吸引了超過300萬行業(yè)用戶線上參會，全網總曝光量累積超過2000萬。

演講要點

人工智能還沒能反映出人類智能里最光輝的一面—— 認識世界和改造世界。
AI for Science值得稱為第五范式。
利用AI手段更深一步的目的是修正對已有物理方程的理解，發(fā)現新的科學規(guī)律，實現科學研究的閉環(huán) 。
AI for Science將會對自然科學產生巨大影響，尤其在解釋生命奧秘、以及保障環(huán)境可持續(xù)發(fā)展方面。

（以下為劉鐵巖演講全文）

AI for Science：第五范式

最近10年里，AI飛速發(fā)展，在很多任務上已經和人類媲美。而且近年來，以GPT-3、DALLE2為代表的大模型讓人驚艷。

比如大家現在非常關注的ChatGPT，讓我們覺得 通用人工智能離日常生活越來越近。但這些成果主要集中在感知和認知層面，并沒有反映出人類智能里最光輝的一面，即認識世界和改造世界。

如果戴上科學的顯微鏡，就會發(fā)現我們之所以成為人類、成為生物，是億萬個細胞、甚至是更多微觀粒子相互作用的結果；而如果戴上科學的望遠鏡，就會發(fā)現我們人類不過是地球上百萬物種之一、而地球在蒼茫宇宙里也同樣是不值一提的滄海一粟。

所以，無論是從微觀還是宏觀角度看，我們人類自身都是非常渺小的。我們 不應該讓AI一味地模擬語音、視覺、語言等人類自身的基本技能，而是要讓AI擁有和人類一樣認識世界和改造世界的勇氣和能力。而認識世界和改造世界正是千百年來，自然科學研究的終極目標。

我在微軟的前同事Jim Gray曾經寫過一本書，對科學發(fā)現四個基本范式做了深刻的總結。

第一個范式叫做 經驗范式，基于經驗的觀察， 是天才科學家對萬物萬象的總結。比如著名的天文學家開普勒，他通過觀察總結出天體運行的規(guī)律：“所有的行星圍繞太陽運行的軌道都是橢圓的，太陽處在所有橢圓的公共焦點上”。

第二個范式是 理論范式，指數學家 對經驗進行數學抽象和推演，比如用于描述經典力學的牛頓運動方程，用來描述電場磁場關系的麥克斯韋爾方程等。

第三個范式是 計算范式，隨著計算機的發(fā)明，人們開始有能力 求解復雜的物理方程。比如，通過有限元或者有限差分方式求解流體方程，從而有助于人類對于天氣預報進行精準預測。

第四個范式是 數據驅動的范式，這個過程中 ML（機器學習）扮演著非常重要的角色，人們使用ML方法來分析數據，尋找規(guī)律，并進行預測。

最近這幾年，大家開始關注的一種新的范式，叫做 AI for Science，它是前四種范式的有機結合，發(fā)揮了經驗和理論各自的特長，又把AI和計算科學融合在一起。AI for Science是對科學發(fā)現更全面的認知，因此我們稱之為科學發(fā)現的 第五范式。

為了更好地理解AI for Science，我們可以從如圖的公式講起。

第一、對于物理世界（綠色的X），我們可以利用理論科學對它進行大體的描述，并且可以用AI的手段來加速這些理論方程的求解和推演。這對應了黃色的X（θ）表示的部分，可以看成AI版本的第三范式。

第二、我們需要承認，我們 在科學方面的知識仍然非常有限，已有的理論還不能完美解釋所有的科學現象。換句話說，我們承認物理方程的解X（θ）和實際物理世界X之間存在殘差ε，這個殘差表達的是現有物理方程的邊界，可以用實驗手段觀察，也可以為AI所利用，這就對應了第四范式。當然，這幾年AI領域的新發(fā)展，比如RL （強化學習）、DL （深度學習）、大模型等等，會為第四范式提供新的加持。

第三、通過AI手段從數據出發(fā)，目的不僅僅是為了發(fā)掘一些特定的結果，也可以進一步幫助我們修正對已有物理方程的理解，豐富我們的科學知識，讓我們有機會發(fā)現新的科學規(guī)律，這樣就最終能夠實現科學研究的閉環(huán)，這對應了AI版本的第一范式和第二范式。

接下來，我們就針對這三個方面進行更加深入的討論，并介紹我們團隊最新的研究成果。

形成科學發(fā)現的閉環(huán)

第一，如何用AI 求解物理方程？

傳統(tǒng)數值解法求解物理方程的效率是一個瓶頸。近年來，人們開始利用AI模型來對物理方程進行更加高效的求解。AI模型的訓練數據可以來源于傳統(tǒng)的數值解法，而一旦訓練成功，在求解新的方程的時候就可以 節(jié)省大量的時間。

此外，近年來還出現了一種 physics informed training，甚至不需要提前生成訓練數據，只需要在訓練的過程中，動態(tài)驗證AI模型的輸出是否滿足物理方程，定義損失函數即可，而驗證方程比求解方程簡單得多。

在這個方向上，我們團隊有一些最新研究成果，如發(fā)表在NeurIPS 2021上的 Graphormer模型，和發(fā)表在國際期刊《流體物理》上的 Deep Vortex Net，分別在分子建模和氣象模擬領域取得了國際領先的結果。

第二，如何用AI從科學數據中發(fā)掘有效信息？

各種實驗設備每年都產生海量數據，但顯然不能靠人工有效處理；還有每年都有近150萬篇論文發(fā)表，但任何科學家都沒有精力讀完。

我和團隊提出利用AI方法來自動分析高能粒子對撞的射流數據，在國際期刊《High-energy Physics》上提出了 LorentzNet模型，將洛倫茲等變性構建在模型之中，在新粒子發(fā)現領域取得了比前人顯著提高的精度。

我們還利用科學文獻訓練了 SPT模型，對科學文獻信息的科學知識進行抽取、總結、和預測。該模型近期在PubMed問答任務上首次達到了人類專家的水準。

第三，如何從實驗數據出發(fā)，用AI發(fā)現新的物理方程，形成科學發(fā)現的閉環(huán)。

比如物理的守恒定律，一旦實驗數據不滿足守恒性，往往暗示著一些新物理規(guī)律的存在。我們團隊設計了一個雙通道的AI模型，包含 一個基于拉格朗日神經網絡的守恒通路和 一個基于標準神經網絡的非守恒通路，可精準地從實驗數據中自發(fā)地學到很多已有規(guī)律。該工作發(fā)表在Physical Review上，受到了廣泛關注。

我們相信AI for Science將會對自然科學產生巨大影響，尤其在解釋生命奧秘以及保障環(huán)境可持續(xù)發(fā)展方面，都有很大的潛力。

沿著這兩個方面，我們進行了很多探索，發(fā)表了一系列非常有意思的論文，如果大家感興趣可以參考一下。

為了更好地推動AI for Science這個領域高速發(fā)展，今年7月，微軟研究院在全球成立了一個新的研究機構，我們稱之為 Microsoft Research AI4Science或者是 微軟研究院科學智能中心。這個研究中心設立的目的就是利用AI對分子動力學模擬、流體力學模擬等重要的科學計算工具來進行顛覆式創(chuàng)新，從而推動人類關心的重大問題的求解。

非常榮幸，我作為這個中心的 創(chuàng)始成員之一，帶著團隊一起推動AI for Science的研究。我們也真誠地希望懷揣著科學夢想的同事們能夠加入我們，一起探索科學的新邊界！

新聞中心

微軟研究院劉鐵巖：AI for Science：追求人類智能最光輝的一面｜MEET 2023

評論

相關推薦

技術專區(qū)