陳根：通用AI正在到來(lái)，人類下一步是什么？

作者：陳根時(shí)間：2023-02-02 來(lái)源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

雖然過(guò)去人們對(duì)通用人工智能（AGI）總有各種抽象的想法，但如今，隨著圖像生成、代碼生成、自然語(yǔ)言處理等AI生成技術(shù)的發(fā)展，通用人工智能似乎已經(jīng)走到了一個(gè)重要的十字路口。生成式AI是技術(shù)底座之上的場(chǎng)景革新，涵蓋了圖文創(chuàng)作、代碼生成、游戲、廣告、藝術(shù)平面設(shè)計(jì)等應(yīng)用。

本文引用地址：http://butianyuan.cn/article/202302/442963.htm

可以看到的是，以多模態(tài)預(yù)訓(xùn)練大模型、生成式AI為代表的AI技術(shù)已經(jīng)來(lái)到規(guī)?；耙?、爆發(fā)前的奇點(diǎn)。一方面，人類對(duì)AGI的想象開(kāi)始具象；另一方面，對(duì)AGI前途無(wú)量感到震驚的科學(xué)家們，則開(kāi)始著手探討并如何塑造 AGI 的未來(lái)。

從狹義AI到通用AI

到目前為止，我們所接觸的AI產(chǎn)品大都還是狹義AI。

簡(jiǎn)單來(lái)說(shuō)，狹義AI就是一種被編程來(lái)執(zhí)行單一任務(wù)的人工智能——無(wú)論是檢查天氣、下棋，還是分析原始數(shù)據(jù)以撰寫(xiě)新聞報(bào)道。狹義AI系統(tǒng)可以實(shí)時(shí)處理任務(wù)，但它們從特定的數(shù)據(jù)集中提取信息。因此，這些系統(tǒng)不會(huì)在它們?cè)O(shè)計(jì)要執(zhí)行的單個(gè)任務(wù)之外執(zhí)行。

Google assistant、Google Translate、Siri等自然語(yǔ)言處理工具都是狹義AI的產(chǎn)品。雖然它們能夠與我們交互并處理人類語(yǔ)言，但這些機(jī)器遠(yuǎn)沒(méi)有達(dá)到人類的智能水平。比如，當(dāng)我們與Siri交談時(shí)，Siri并不能靈活地來(lái)響應(yīng)我們的查詢。相反，Siri所能做的，就是處理人類語(yǔ)言，將其輸入搜索引擎，然后返回給我們。

通用AI則是指在不特別編碼知識(shí)與應(yīng)用區(qū)域的情況下，應(yīng)對(duì)多種甚至泛化問(wèn)題的人工智能技術(shù)。雖然從直覺(jué)上看，狹義AI與通用AI是同一類東西，只是一種不太成熟和復(fù)雜的實(shí)現(xiàn)，但事實(shí)并非如此。

狹義AI就像是計(jì)算機(jī)發(fā)展的初期，人們最早設(shè)計(jì)電子計(jì)算機(jī)是為了代替人類計(jì)算者完成特定的任務(wù)。而艾倫·圖靈等數(shù)學(xué)家則認(rèn)為，我們應(yīng)該制造通用計(jì)算機(jī)，我們可以對(duì)其編程，從而完成所有任務(wù)。

于是，曾經(jīng)在一段過(guò)渡時(shí)期，人們制造了各種各樣的計(jì)算機(jī)，包括為特定任務(wù)設(shè)計(jì)的計(jì)算機(jī)、模擬計(jì)算機(jī)、只能通過(guò)改變線路來(lái)改變用途的計(jì)算機(jī)，還有一些使用十進(jìn)制而非二進(jìn)制工作的計(jì)算機(jī)?，F(xiàn)在，幾乎所有的計(jì)算機(jī)都滿足圖靈設(shè)想的通用形式，我們稱其為“通用圖靈機(jī)”。只要使用正確的軟件，現(xiàn)在的計(jì)算機(jī)幾乎可以執(zhí)行任何任務(wù)。

市場(chǎng)的力量決定了通用計(jì)算機(jī)才是正確的發(fā)展方向。如今，即便使用定制化的解決方案，如專用芯片，可以更快、更節(jié)能地完成特定任務(wù)，但更多時(shí)候，人們還是更喜歡使用低成本、便捷的通用計(jì)算機(jī)。現(xiàn)在，AI也將出現(xiàn)類似的轉(zhuǎn)變——通用AI將成為主流，它們與人類更類似，能夠?qū)缀跛袞|西進(jìn)行學(xué)習(xí)。

當(dāng)然，通用AI并非全知全能。與任何其他智能存在一樣，根據(jù)它所要解決的問(wèn)題，它需要學(xué)習(xí)不同的知識(shí)內(nèi)容。比如，負(fù)責(zé)尋找致癌基因的AI算法不需要識(shí)別面部的能力；而當(dāng)同一個(gè)算法被要求在一大群人中找出十幾張臉時(shí)，它就不需要了解任何有關(guān)基因互作的知識(shí)。通用人工智能的實(shí)現(xiàn)僅僅意味著單個(gè)算法可以做多件事情，而并不意味著它可以同時(shí)做所有的事情。

值得一提的是，通用AI又與強(qiáng)人工智能不同。強(qiáng)人工智能（strong artificial intelligence）是約翰·希爾勒在提出“中文屋實(shí)驗(yàn)”時(shí)設(shè)定的人工智能級(jí)別。這個(gè)等級(jí)的人工智能，不僅要具備人類的某些能力，還要有知覺(jué)，有自我意識(shí)，可以獨(dú)立思考并解決問(wèn)題。雖然兩個(gè)概念似乎都對(duì)應(yīng)著人工智能解決問(wèn)題的能力，但通用AI更像是無(wú)所不能的計(jì)算機(jī)，而強(qiáng)人工智能則超越了技術(shù)的屬性成為類似穿著鋼鐵俠戰(zhàn)甲的人類。

如何實(shí)現(xiàn)通用人工智能？

自人工智能誕生以來(lái)，科學(xué)家們就在努力實(shí)現(xiàn)通用AI，實(shí)現(xiàn)通用AI具體可以分為兩個(gè)路徑。

第一條路就是讓計(jì)算機(jī)在某些具體任務(wù)上超過(guò)人類，如下圍棋、檢測(cè)醫(yī)學(xué)圖像中的癌細(xì)胞。如果能夠讓計(jì)算機(jī)在執(zhí)行一些困難任務(wù)時(shí)的表現(xiàn)超過(guò)人類，那么最終就會(huì)發(fā)現(xiàn)如何讓計(jì)算機(jī)在所有任務(wù)中都比人類強(qiáng)。通過(guò)這種方式來(lái)實(shí)現(xiàn)通用AI，AI系統(tǒng)的工作原理以及計(jì)算機(jī)是否靈活就無(wú)關(guān)緊要了。

唯一重要的是，這樣的人工智能計(jì)算機(jī)在執(zhí)行特定任務(wù)時(shí)比其他人工智能計(jì)算機(jī)更強(qiáng)，并最終超越最強(qiáng)的人類。如果最強(qiáng)的計(jì)算機(jī)圍棋棋手在世界上僅僅位列第二名，那么它也不會(huì)登上媒體頭條，它甚至可能會(huì)被視為失敗者。但是，擊敗世界上頂尖的人類棋手就會(huì)被視為一個(gè)重要的進(jìn)步。

第二條路，是重點(diǎn)關(guān)注AI的靈活性。通過(guò)這種方式，人工智能就不必具備比人類更強(qiáng)的性能。科學(xué)家的目標(biāo)就變成了創(chuàng)造可以做各種事情并且可以將從某個(gè)任務(wù)中學(xué)到的東西應(yīng)用于另一個(gè)任務(wù)的機(jī)器。

比如，當(dāng)前發(fā)展如火如荼的AI 生成就遵循了這樣的路徑。過(guò)去一年，有關(guān)AI生成技術(shù)上的進(jìn)展主要包括三個(gè)方面。一個(gè)是圖像生成，即以DALL-E 2、Stable Diffusion為代表的擴(kuò)散模型；一個(gè)是NLP（自然語(yǔ)言處理），即基于GPT-3.5的ChatGPT；還有一個(gè)就是代碼生成，比如基于CodeX的Copilot。

以近日大火的ChatGPT為例，這款當(dāng)今最火爆的AI語(yǔ)言模型，由美國(guó)人工智能實(shí)驗(yàn)室OpenAI于去年11月底發(fā)布，并迅速火遍全球。不同于過(guò)去那些智能語(yǔ)音助手的傻瓜回答，這次ChatGPT卻出乎意料的聰明：它可以用來(lái)創(chuàng)作故事、撰寫(xiě)新聞、回答客觀問(wèn)題、聊天、寫(xiě)代碼和查找代碼問(wèn)題等。外媒評(píng)論甚至稱，ChatGPT會(huì)成為科技行業(yè)的下一個(gè)顛覆者。

事實(shí)也確實(shí)如此，基于龐大的數(shù)據(jù)集，ChatGPT得以擁有更好的語(yǔ)言理解能力，這意味著它可以更像一個(gè)通用的任務(wù)助理，能夠和不同行業(yè)結(jié)合，衍生出很多應(yīng)用的場(chǎng)景。可以說(shuō)，ChatGPT已經(jīng)為通用AI打開(kāi)了一扇大門(mén)。

并且，ChatGPT引入了人類監(jiān)督員，專門(mén)“教”AI如何更好地回答人類問(wèn)題。AI的回答符合人類評(píng)價(jià)標(biāo)準(zhǔn)時(shí)，就給AI打高分，否則就給AI打低分。這使得AI能夠按照人類價(jià)值觀優(yōu)化數(shù)據(jù)和參數(shù)。也就是說(shuō)，互聯(lián)網(wǎng)中，只要涉及文本生成和對(duì)話的，都能夠被ChatGPT“洗一遍”，這使得ChatGPT能得到一個(gè)接近于自然人類語(yǔ)言對(duì)話的效果。

以自動(dòng)駕駛為例，目前的自動(dòng)駕駛與人的交互還是比較機(jī)械的，比如前面有一輛車，按照規(guī)則，它有可能會(huì)無(wú)法正確判斷什么時(shí)候該繞行。而ChatGPT等人工智能的迭代，未來(lái)可能會(huì)讓機(jī)器更接近人的思維模式，學(xué)習(xí)人的駕駛行為，帶領(lǐng)自動(dòng)駕駛進(jìn)入“2.0時(shí)代”。

另外，“ChatGPT+”更是打開(kāi)了想象力大門(mén)。有用戶把 ChatGPT + Stable Diffusion（AI文生圖工具）結(jié)合使用。即先要求 ChatGPT 生成隨機(jī)的藝術(shù) prompt，然后把 prompt 作為 Stable Diffusion 的輸入，生成一副藝術(shù)性很強(qiáng)的畫(huà)作。還有人提出“ChatGPT+WebGPT”， WebGPT為高階版網(wǎng)頁(yè)爬蟲(chóng)，從互聯(lián)網(wǎng)上摘取信息來(lái)回答問(wèn)題，并提供相應(yīng)出處?！癈hatGPT+WebGPT”產(chǎn)生的結(jié)果信息可以實(shí)時(shí)更新，對(duì)于事實(shí)真假的判斷更為準(zhǔn)確。

針對(duì)ChatGPT在解答數(shù)學(xué)題方面的拉垮表現(xiàn)，計(jì)算機(jī)科學(xué)家、Wolfram 語(yǔ)言之父 Stephen Wolfram 發(fā)文表示，正在將ChatGPT與自己的 Wolfram | Alpha 知識(shí)引擎結(jié)合起來(lái)用，因?yàn)楹笳呔哂袕?qiáng)大的結(jié)構(gòu)化計(jì)算能力，可以實(shí)現(xiàn)完美互補(bǔ)?！癈hatGPT+”效應(yīng)的出現(xiàn)，似乎更進(jìn)一步推動(dòng)了通用AI走向我們。

接下去的路應(yīng)該怎么走？

雖然AI生成的快速發(fā)展讓人們看到了通用AI的希望，但實(shí)際上，當(dāng)前的AI生成依然不是根本性的突破。

今天的AI生成之所以能如此靈活，就在于其龐大的訓(xùn)練數(shù)據(jù)集。也就是說(shuō)，如果沒(méi)有根本性的新創(chuàng)新，通用AI就可能會(huì)從更大規(guī)模的模型中產(chǎn)生。ChatGPT就是將海量的數(shù)據(jù)結(jié)合表達(dá)能力很強(qiáng)的Transformer模型結(jié)合，從而對(duì)自然語(yǔ)言進(jìn)行了一個(gè)非常深度的建模。盡管ChatGPT的相關(guān)數(shù)據(jù)并未被公開(kāi)，但它的上一代GPT-3的整個(gè)神經(jīng)網(wǎng)絡(luò)就已經(jīng)有1750億個(gè)參數(shù)了。

雖然越來(lái)越大的模型確實(shí)讓通用AI性能很強(qiáng)，比如圖像生成等任務(wù)都需要借助大模型，但龐大的模型也帶來(lái)了一些問(wèn)題。

首先，世界上可能沒(méi)有足夠的數(shù)據(jù)量來(lái)支持規(guī)模最大化。來(lái)自紐約大學(xué)和蘇黎世聯(lián)邦理工大學(xué)的研究人員William Merrill、Alex Warstadt和Tal Linzen最近提出了一個(gè)證明，稱“目前的神經(jīng)語(yǔ)言模型不太適合在沒(méi)有大量數(shù)據(jù)的情況下提取自然語(yǔ)言的語(yǔ)義”。盡管這個(gè)證明中包含了太多的前置假設(shè)，但是如果這個(gè)假設(shè)接近正確的話，那么在規(guī)模上可能很快就會(huì)出現(xiàn)麻煩。

其次，世界上可能沒(méi)有足夠的可用計(jì)算資源支撐規(guī)模最大化。要知道，計(jì)算從來(lái)都是一件費(fèi)電的事情。Miguel Solano認(rèn)為，要想達(dá)到當(dāng)前的超級(jí)基準(zhǔn)，例如BIG-bench，將會(huì)需要消耗2022年全美國(guó)電力消耗的四分之一還多。而B(niǎo)IG-bench還只是一個(gè)眾包的基準(zhǔn)數(shù)據(jù)集，旨在探索大型語(yǔ)言模型并推斷其未來(lái)的能力，其中包含200多個(gè)任務(wù)。

以AI生成為代表的通用AI除了面對(duì)發(fā)展中技術(shù)的問(wèn)題，還需要回應(yīng)倫理的挑戰(zhàn)。隨著自動(dòng)化的發(fā)展，人工智能將接管更多工作，人們的擔(dān)憂是，人與機(jī)器地位的轉(zhuǎn)換可能會(huì)在我們毫無(wú)防備的情況下突然發(fā)生。實(shí)際上，我們已經(jīng)走在將人類工作讓渡給人工智能的道路上了，而我們需要解決的問(wèn)題是：在一個(gè)處處受到人工智能協(xié)助的世界中，我們接下去的路應(yīng)該怎么走？

顯然，為了讓人類的受益最大化，并促進(jìn)自由、平等、透明和財(cái)富的分享，我們需要決定如何有效運(yùn)用基于人工智能的各種技術(shù)。

一方面，我們不得不重視AI技術(shù)進(jìn)步給社會(huì)帶來(lái)的影響。ChatGPT、AlphaFold等工具出來(lái)后，人們發(fā)現(xiàn)，最先感受到AI沖擊的反而是創(chuàng)造性的工作，而這些涉及創(chuàng)造力、知識(shí)探索的行業(yè)，又是人文領(lǐng)域的核心，是人類最擔(dān)心被機(jī)器化的部分。一直以來(lái)，AI在這些領(lǐng)域的重大突破都伴隨著廣泛的倫理爭(zhēng)議。

世界復(fù)雜性科學(xué)研究中心、美國(guó)圣塔菲研究所教授梅勒妮·米切爾近日在接受媒體采訪時(shí)就談到，過(guò)于盲目采用這些技術(shù)，將我們的交流和創(chuàng)意自動(dòng)化，可能會(huì)導(dǎo)致人類失去對(duì)機(jī)器的控制，“機(jī)器人會(huì)給機(jī)器人寫(xiě)電子郵件，而機(jī)器人會(huì)回復(fù)其他機(jī)器人”。米切爾說(shuō)，“我們作為人的特質(zhì)從我們的信息中被卷走了。”

另一方面，過(guò)分強(qiáng)調(diào)人工智能對(duì)人類生存的威脅，會(huì)把人們的注意力從那些更緊迫的問(wèn)題上分散出去，也可能會(huì)助長(zhǎng)那些反對(duì)能造福社會(huì)技術(shù)的聲音、扼殺技術(shù)創(chuàng)新。實(shí)際上，AI的“思考模式”與人類的思考模式完全不同。20年后，基于深度學(xué)習(xí)的機(jī)器及其“后代”也許會(huì)在很多任務(wù)上擊敗人類，但在很多任務(wù)上，人類會(huì)比機(jī)器更擅長(zhǎng)。

基于此，在未來(lái)，更可能出現(xiàn)的情況，或許是我們?nèi)祟惻c尋求人類與AI的良性共生，而不是糾結(jié)于基于深度學(xué)習(xí)的AI能否成為或者何時(shí)成為通用人工智能的問(wèn)題。通用AI的出現(xiàn)，或許也向人們展示了這樣一個(gè)道理——不只有人類才是智能的黃金標(biāo)桿。

新聞中心

陳根：通用AI正在到來(lái)，人類下一步是什么？

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)

新聞中心

陳根：通用AI正在到來(lái)，人類下一步是什么？

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)

陳根：通用AI正在到來(lái)，人類下一步是什么？