新聞中心

EEPW首頁 > 智能計算 > 市場分析 > 買一萬張芯片,造一個新帝國

買一萬張芯片,造一個新帝國

作者: 時間:2023-04-26 來源:半導(dǎo)體產(chǎn)業(yè)縱橫 收藏

曾與其他業(yè)界大佬共同發(fā)出暫停 GPT-4 以上的大型語言人工智能模型的開發(fā)聲明,但隨后卻成立了新的 公司,并采購了上萬張 NVIDIA 最新的 加速卡,開始發(fā)展自己的 GPT 人工智能模型。這讓人們感到困惑,不知道在想什么。甚至被業(yè)界質(zhì)疑是不是想要拖慢 Open 的發(fā)展腳步好讓自己可以取而代之?

本文引用地址:http://www.butianyuan.cn/article/202304/446027.htm

基本上,發(fā)展的 AI 都是為了服務(wù)人類的創(chuàng)意,并取代重復(fù)的人類工作,但隨著 ChatGPT 的推出,創(chuàng)意和邏輯這塊很快就被 AI 取代了一大部分,馬斯克在這時創(chuàng)立 X.AI,并且要推出「真實」的 GPT 模型,也讓人懷疑,馬斯克這是在打臉自己?然而事情并不是那么單純…

當(dāng)然,馬斯克與 OpenAI 之間的恩怨已經(jīng)有很多人談過,他們之間的是非對錯其實也很難三言兩語就解釋清楚,因此我們這次就來了解馬斯克在 AI 這條路上做了什么,以及以后他藉由 X.AI 來做什么,然后來嘗試解答馬斯克創(chuàng)立 X.AI 公司的目的。

廣被誤解的自動駕駛

先從馬斯克的 AI 發(fā)展歷程稍微回顧一下,馬斯克最早投入 AI 議題是從自動駕駛技術(shù)開始,早在 2014 年時,特斯拉開始在其 Model S 上引入最早的一代 Autopilot 技術(shù),隨后也推廣至 Model X 車種,當(dāng)時這個系統(tǒng)雖然號稱自動駕駛,但實際上汽車無法自行決定路線、方向,也無法判斷路況,只能進(jìn)行簡單的車道置中以及變換車道,雖好于目前的 L2 駕駛輔助,但仍遠(yuǎn)遠(yuǎn)談不上自動駕駛。

當(dāng)然,自動駕駛被誤解其實也是中文翻譯的問題,比如說飛機(jī)上的 AutoPilot 其實也是翻譯成自動駕駛,但實際上,飛機(jī)的自動駕駛也只是在固定的高度維持飛行,而不是可以從起飛、航線變換到降落都可以交給飛機(jī)。不過當(dāng)時的汽車產(chǎn)業(yè)界對其所謂自動駕駛的定義非常苛求,認(rèn)為以特斯拉當(dāng)時的 AutoPilot 功能,根本稱不上自動,特斯拉也因此飽受責(zé)難。

加上當(dāng)時選用的硬件是基于 Mobileye 的 ASIC 方案,性能非常弱,即便后續(xù)更新軟件,也沒辦法滿足消費者的需求。

因此,馬斯克后來在 2016 年結(jié)束語 Mobileye 的合作,轉(zhuǎn)而與 NVIDIA 進(jìn)行合作。眾所周知,NVIDIA 在 2010 年左右開始發(fā)展其 CUDA 與 GPGPU 生態(tài),并借此推動人工智能的發(fā)展,隨后也以 Tegra 方案為基礎(chǔ)推出自動駕駛方案。

NVIDIA 的自動駕駛方案的確強(qiáng)大許多,但仍遠(yuǎn)不及馬斯克心中的想像,加上后續(xù)的中國電動車企業(yè)小鵬爆發(fā)用 AutoPilot 原始碼并與 NVIDIA 進(jìn)行合作的爭議之后,特斯拉隨即結(jié)束與 NVIDIA 的合作關(guān)系,并轉(zhuǎn)而自行研發(fā)真正的自動駕駛平臺。

而馬斯克也重新定義自動駕駛的英文名稱,將其稱為 FSD(Full Self Drive),不在名稱上走擦邊球,馬斯克信心滿滿,覺得在 2020 年就能推出全功能的 FSD 正式版,但截至目前為止,F(xiàn)SD 仍處在測試版階段,目前最新版本是 Beta 11.4。

FSD Beta 徹底翻轉(zhuǎn)以往自駕車邏輯,采用新空間占量概念(Occupancy Network),不再以連續(xù)單張圖片為基礎(chǔ),而是以物體體積的影片為基礎(chǔ)運算,克服許多自駕技術(shù)困難,無需光達(dá)、雷達(dá)和高精地圖,以純視覺就能做到極接近人類駕駛的程度。雖然還有些小瑕疵,但在業(yè)界也已經(jīng)是表現(xiàn)最好的自動駕駛系統(tǒng)。

那么 FSD 是如何被打造出來的?我們可以分為兩個部分來看,一個是汽車上的推理核心,負(fù)責(zé)現(xiàn)場駕駛行為的判斷與執(zhí)行,另一個是云端的訓(xùn)練工作,負(fù)責(zé)從個別的特斯拉汽車收集駕駛資訊,并以之訓(xùn)練精進(jìn) FSD 的駕駛模型。

汽車上的推理芯片由特斯拉自行研發(fā),命名為 Hardware x.0,目前版號已經(jīng)到 4.0,由三星代工生產(chǎn),基于 Exynos 手機(jī)芯片架構(gòu)改造??傔\算性能達(dá)到 490TOPS,超越 NVIDIA 最新自動駕駛平臺 Driver Orin 的 254TOPS。

而云端的部分也有不小的變革。原本特斯拉是采用 NVIDIA 的 GPU 來打造自有的超級電腦,并以之訓(xùn)練自動駕駛模型,該超級電腦使用了 7360 顆 NVIDIA 的 A100 運算芯片,在 2022 年底可以排上全球第七強(qiáng)超級電腦。

透過此超級電腦,特斯拉已經(jīng)可以做到道路物件的標(biāo)記完全自動化,并且能夠更快的基于特斯拉回傳的駕駛資訊訓(xùn)練改進(jìn)駕駛模型。然后馬斯克也就辭退了之前為特斯拉工作的 800 名標(biāo)記師。

不過 NVIDIA 的方案顯然還是無法滿足特斯拉,同樣是在 2022 年,特斯拉在 AI Day 上公布了 Dojo 計劃,包含 Dojo 視覺訓(xùn)練芯片以及超級電腦叢集 ExaPod,預(yù)計在 2023 年上線,屆時將是性能高達(dá) 1.1 EFLOP 的恐怖怪物級超級電腦,性能是現(xiàn)有基于 GPU 架構(gòu)超級電腦的 4 倍以上。

超級工廠與 AI

除了特斯拉電動車以外,用來造車的超級工廠也同樣高度 AI 化,尤其大型產(chǎn)線機(jī)器人,幾乎都已經(jīng)全面自動化,這些機(jī)器人可以執(zhí)行復(fù)雜的操作,甚至在有需要時可以自動變換工具來執(zhí)行不同的組裝任務(wù),因此,特斯拉的產(chǎn)能不斷獲得提升,成本也不斷下降。

特斯拉表示,超級工廠雖然還有數(shù)千名員工,但整合 AI 機(jī)器人之后,工作流程可以由軟件定義、訓(xùn)練、最佳化,極大的改善了制造流程。

而超級工廠下一步,則是要引進(jìn)在 2022 年發(fā)表的特斯拉 Optimus 人形機(jī)器人,透過這個機(jī)器人,可以大量取代需要使用到人工的重復(fù)性工作。該機(jī)器人基本上就是一個人形化的特斯拉汽車,其處理器、電池還有許多電機(jī)技術(shù),都是來自特斯拉。

充電一次就可以工作一整天。馬斯克表示,最快在 2023 年內(nèi)進(jìn)行量產(chǎn),并引進(jìn)超級工廠。馬斯克表示,就如同特斯拉的自動駕駛系統(tǒng)是要用來代替人類執(zhí)行重復(fù)且無聊的駕駛工作,Optimus 也是要用來代替人類進(jìn)行日常購物、清掃、搬運等重復(fù)性工作。

新公司 X.AI 回歸 NVIDIA

既然特斯拉已經(jīng)有能力發(fā)展自己的超級電腦芯片與超級電腦叢集,那為何馬斯克的新 AI 公司仍采購近萬顆 NVIDIA 最新的 H100 芯片來建立資料中心?答案其實很簡單,那就是特斯拉自有的 Dojo 芯片主要是針對視覺處理工作而設(shè)計,軟件框架較為固定,沒有辦法像 NVIDIA 在提供高彈性的同時,也具備高性能。

同時,X.AI 公司要發(fā)展的是類似 OpenAI 的 ChatGPT,這類大型自然語言模型的訓(xùn)練工作還是 NVIDIA 的強(qiáng)項。完整版 H100 芯片能達(dá)到 60TFLOPS 的 FP32 運算能力,D1 則僅為 22TFLOPS,不過 D1 支援特斯拉自訂的 CFP8 浮點格式,比較擅長用于自家的駕駛模型訓(xùn)練工作。

而如果根據(jù)新聞訊息,X.AI 采購了一萬張 H100 演算卡,那么初期 X.AI 的運算能力是超越算出 GPT4 的 OpenAI 所使用的上萬張 A100,因為就純粹性能,H100 是 A100 的 4 倍以上。

也就是說,如果馬斯克要訓(xùn)練出一個 GPT4 等級的 AI 模型,那么理論上性能是綽綽有余的。不過 OpenAI 背后還有微軟這個大金主存在,OpenAI 除了自身擁有內(nèi)建上萬張 A100 的超級電腦以外,還有微軟 Azure 具備的運算力,包含超過一萬張基于 A100 加速卡的超級電腦叢集,專門服務(wù) ChatGPT,以及已經(jīng)采購的超過 7000 張的 H100,將會用來建立新的演算力來服務(wù) GPT4 或未來的 GPT5,OpenAI 負(fù)責(zé)訓(xùn)練,而微軟這邊則是主要提供讓 ChatGPT 可以連接到微軟旗下應(yīng)用的龐大推理能力,當(dāng)然,微軟也有可能出借部分運算能力給 OpenAI 以供其訓(xùn)練模型之用。

馬斯克的目的是什么?

那么回過頭來看,馬斯克的 X.AI 想要服務(wù)的是哪些客戶?想要達(dá)到的是哪些目的?從過去馬斯克的作法來看,他一直利用 AI 來取代偏勞力類型的人類工作,但是 ChatGPT 是要取代人類的部分思想與思考能力,讓人腦專注于創(chuàng)意以及設(shè)定工作目標(biāo),專業(yè)知識與工作流程則是由 ChatGPT 來代勞,所以馬斯克也要學(xué) OpenAI +微軟,開始要搶某些白領(lǐng)工作了?

不過馬斯克強(qiáng)調(diào),他的模型將會專注于真相的傳達(dá),不要有偏見,也不要有限制。然而沒有限制的 AI 聽起來似乎更危險?完全中立似乎也是另外一種偏見?

對此,由馬斯克所招募,擔(dān)任 X.AI 核心技術(shù)研發(fā)與管理的前 DeepMind 與 OpenAI 研發(fā)工程師伊戈爾·巴布什金(Igor Babuschkin)表示,他們更重視語言模型的推理能力與真實性,比如說 GPT3.5/4 都會在某些程度上虛構(gòu)答案,而且這些模型還無法解釋為什么要給出特定的答案,因為邏輯都藏在 AI 模型的黑盒子中。

如果 X.AI 所研發(fā)的模型能夠具備更好的邏輯推論與分辨事實的能力,那是不是也要將人類目前所能擔(dān)任的指示、監(jiān)督與核實 AI 所產(chǎn)生的內(nèi)容的工作也剝奪走,未來的 AI 將可以全自動根據(jù)其觀察到的現(xiàn)況設(shè)定目標(biāo)、解決問題,不需要人類插手,而且也不用怕會像 GPT3.5/4 一樣會自欺欺人,造成潛在的災(zāi)難?

那不是比 ChatGPT 更危險嗎?對此,馬斯克其實還留有一手,他認(rèn)為,如果打不過 AI,那么就加入它,讓大腦透過 NeuraLink 連接電腦/ AI,一起協(xié)同工作,透過強(qiáng)化人類大腦,來讓 AI 無法取代,或者,讓大腦本身變成 AI 的一部份。

Neuralink 目前還在實驗階段,但是進(jìn)展相當(dāng)快速,根據(jù)實驗結(jié)果,已經(jīng)能夠讓猴子進(jìn)行超越人類反應(yīng)的電腦操作。不過 Neuralink 目前還有不少包括倫理上的爭議,以及技術(shù)上的困難,要普及恐怕有點困難,但等到大型語言模型普及,甚至可以完全自主的 AI 模型出現(xiàn),屆時人類可能也沒有太多選擇了?



關(guān)鍵詞: 馬斯克 AI

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉