買一萬張芯片，造一個新帝國

作者：時間：2023-04-26 來源：半導(dǎo)體產(chǎn)業(yè)縱橫

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

馬斯克曾與其他業(yè)界大佬共同發(fā)出暫停 GPT-4 以上的大型語言人工智能模型的開發(fā)聲明，但隨后卻成立了新的 AI 公司，并采購了上萬張 NVIDIA 最新的 AI 加速卡，開始發(fā)展自己的 GPT 人工智能模型。這讓人們感到困惑，不知道馬斯克在想什么。甚至被業(yè)界質(zhì)疑是不是想要拖慢 OpenAI 的發(fā)展腳步好讓自己可以取而代之？

本文引用地址：http://butianyuan.cn/article/202304/446027.htm

基本上，馬斯克發(fā)展的 AI 都是為了服務(wù)人類的創(chuàng)意，并取代重復(fù)的人類工作，但隨著 ChatGPT 的推出，創(chuàng)意和邏輯這塊很快就被 AI 取代了一大部分，馬斯克在這時創(chuàng)立 X.AI，并且要推出「真實」的 GPT 模型，也讓人懷疑，馬斯克這是在打臉自己？然而事情并不是那么單純…

當(dāng)然，馬斯克與 OpenAI 之間的恩怨已經(jīng)有很多人談過，他們之間的是非對錯其實也很難三言兩語就解釋清楚，因此我們這次就來了解馬斯克在 AI 這條路上做了什么，以及以后他藉由 X.AI 來做什么，然后來嘗試解答馬斯克創(chuàng)立 X.AI 公司的目的。

廣被誤解的自動駕駛

先從馬斯克的 AI 發(fā)展歷程稍微回顧一下，馬斯克最早投入 AI 議題是從自動駕駛技術(shù)開始，早在 2014 年時，特斯拉開始在其 Model S 上引入最早的一代 Autopilot 技術(shù)，隨后也推廣至 Model X 車種，當(dāng)時這個系統(tǒng)雖然號稱自動駕駛，但實際上汽車無法自行決定路線、方向，也無法判斷路況，只能進(jìn)行簡單的車道置中以及變換車道，雖好于目前的 L2 駕駛輔助，但仍遠(yuǎn)遠(yuǎn)談不上自動駕駛。

當(dāng)然，自動駕駛被誤解其實也是中文翻譯的問題，比如說飛機(jī)上的 AutoPilot 其實也是翻譯成自動駕駛，但實際上，飛機(jī)的自動駕駛也只是在固定的高度維持飛行，而不是可以從起飛、航線變換到降落都可以交給飛機(jī)。不過當(dāng)時的汽車產(chǎn)業(yè)界對其所謂自動駕駛的定義非?？燎?，認(rèn)為以特斯拉當(dāng)時的 AutoPilot 功能，根本稱不上自動，特斯拉也因此飽受責(zé)難。

加上當(dāng)時選用的硬件是基于 Mobileye 的 ASIC 方案，性能非常弱，即便后續(xù)更新軟件，也沒辦法滿足消費者的需求。

因此，馬斯克后來在 2016 年結(jié)束語 Mobileye 的合作，轉(zhuǎn)而與 NVIDIA 進(jìn)行合作。眾所周知，NVIDIA 在 2010 年左右開始發(fā)展其 CUDA 與 GPGPU 生態(tài)，并借此推動人工智能的發(fā)展，隨后也以 Tegra 方案為基礎(chǔ)推出自動駕駛方案。

NVIDIA 的自動駕駛方案的確強(qiáng)大許多，但仍遠(yuǎn)不及馬斯克心中的想像，加上后續(xù)的中國電動車企業(yè)小鵬爆發(fā)用 AutoPilot 原始碼并與 NVIDIA 進(jìn)行合作的爭議之后，特斯拉隨即結(jié)束與 NVIDIA 的合作關(guān)系，并轉(zhuǎn)而自行研發(fā)真正的自動駕駛平臺。

而馬斯克也重新定義自動駕駛的英文名稱，將其稱為 FSD（Full Self Drive），不在名稱上走擦邊球，馬斯克信心滿滿，覺得在 2020 年就能推出全功能的 FSD 正式版，但截至目前為止，F(xiàn)SD 仍處在測試版階段，目前最新版本是 Beta 11.4。

FSD Beta 徹底翻轉(zhuǎn)以往自駕車邏輯，采用新空間占量概念（Occupancy Network），不再以連續(xù)單張圖片為基礎(chǔ)，而是以物體體積的影片為基礎(chǔ)運(yùn)算，克服許多自駕技術(shù)困難，無需光達(dá)、雷達(dá)和高精地圖，以純視覺就能做到極接近人類駕駛的程度。雖然還有些小瑕疵，但在業(yè)界也已經(jīng)是表現(xiàn)最好的自動駕駛系統(tǒng)。

那么 FSD 是如何被打造出來的？我們可以分為兩個部分來看，一個是汽車上的推理核心，負(fù)責(zé)現(xiàn)場駕駛行為的判斷與執(zhí)行，另一個是云端的訓(xùn)練工作，負(fù)責(zé)從個別的特斯拉汽車收集駕駛資訊，并以之訓(xùn)練精進(jìn) FSD 的駕駛模型。

汽車上的推理芯片由特斯拉自行研發(fā)，命名為 Hardware x.0，目前版號已經(jīng)到 4.0，由三星代工生產(chǎn)，基于 Exynos 手機(jī)芯片架構(gòu)改造?？傔\(yùn)算性能達(dá)到 490TOPS，超越 NVIDIA 最新自動駕駛平臺 Driver Orin 的 254TOPS。

而云端的部分也有不小的變革。原本特斯拉是采用 NVIDIA 的 GPU 來打造自有的超級電腦，并以之訓(xùn)練自動駕駛模型，該超級電腦使用了 7360 顆 NVIDIA 的 A100 運(yùn)算芯片，在 2022 年底可以排上全球第七強(qiáng)超級電腦。

透過此超級電腦，特斯拉已經(jīng)可以做到道路物件的標(biāo)記完全自動化，并且能夠更快的基于特斯拉回傳的駕駛資訊訓(xùn)練改進(jìn)駕駛模型。然后馬斯克也就辭退了之前為特斯拉工作的 800 名標(biāo)記師。

不過 NVIDIA 的方案顯然還是無法滿足特斯拉，同樣是在 2022 年，特斯拉在 AI Day 上公布了 Dojo 計劃，包含 Dojo 視覺訓(xùn)練芯片以及超級電腦叢集 ExaPod，預(yù)計在 2023 年上線，屆時將是性能高達(dá) 1.1 EFLOP 的恐怖怪物級超級電腦，性能是現(xiàn)有基于 GPU 架構(gòu)超級電腦的 4 倍以上。

超級工廠與 AI

除了特斯拉電動車以外，用來造車的超級工廠也同樣高度 AI 化，尤其大型產(chǎn)線機(jī)器人，幾乎都已經(jīng)全面自動化，這些機(jī)器人可以執(zhí)行復(fù)雜的操作，甚至在有需要時可以自動變換工具來執(zhí)行不同的組裝任務(wù)，因此，特斯拉的產(chǎn)能不斷獲得提升，成本也不斷下降。

特斯拉表示，超級工廠雖然還有數(shù)千名員工，但整合 AI 機(jī)器人之后，工作流程可以由軟件定義、訓(xùn)練、最佳化，極大的改善了制造流程。

而超級工廠下一步，則是要引進(jìn)在 2022 年發(fā)表的特斯拉 Optimus 人形機(jī)器人，透過這個機(jī)器人，可以大量取代需要使用到人工的重復(fù)性工作。該機(jī)器人基本上就是一個人形化的特斯拉汽車，其處理器、電池還有許多電機(jī)技術(shù)，都是來自特斯拉。

充電一次就可以工作一整天。馬斯克表示，最快在 2023 年內(nèi)進(jìn)行量產(chǎn)，并引進(jìn)超級工廠。馬斯克表示，就如同特斯拉的自動駕駛系統(tǒng)是要用來代替人類執(zhí)行重復(fù)且無聊的駕駛工作，Optimus 也是要用來代替人類進(jìn)行日常購物、清掃、搬運(yùn)等重復(fù)性工作。

新公司 X.AI 回歸 NVIDIA

既然特斯拉已經(jīng)有能力發(fā)展自己的超級電腦芯片與超級電腦叢集，那為何馬斯克的新 AI 公司仍采購近萬顆 NVIDIA 最新的 H100 芯片來建立資料中心？答案其實很簡單，那就是特斯拉自有的 Dojo 芯片主要是針對視覺處理工作而設(shè)計，軟件框架較為固定，沒有辦法像 NVIDIA 在提供高彈性的同時，也具備高性能。

同時，X.AI 公司要發(fā)展的是類似 OpenAI 的 ChatGPT，這類大型自然語言模型的訓(xùn)練工作還是 NVIDIA 的強(qiáng)項。完整版 H100 芯片能達(dá)到 60TFLOPS 的 FP32 運(yùn)算能力，D1 則僅為 22TFLOPS，不過 D1 支援特斯拉自訂的 CFP8 浮點格式，比較擅長用于自家的駕駛模型訓(xùn)練工作。

而如果根據(jù)新聞訊息，X.AI 采購了一萬張 H100 演算卡，那么初期 X.AI 的運(yùn)算能力是超越算出 GPT4 的 OpenAI 所使用的上萬張 A100，因為就純粹性能，H100 是 A100 的 4 倍以上。

也就是說，如果馬斯克要訓(xùn)練出一個 GPT4 等級的 AI 模型，那么理論上性能是綽綽有余的。不過 OpenAI 背后還有微軟這個大金主存在，OpenAI 除了自身擁有內(nèi)建上萬張 A100 的超級電腦以外，還有微軟 Azure 具備的運(yùn)算力，包含超過一萬張基于 A100 加速卡的超級電腦叢集，專門服務(wù) ChatGPT，以及已經(jīng)采購的超過 7000 張的 H100，將會用來建立新的演算力來服務(wù) GPT4 或未來的 GPT5，OpenAI 負(fù)責(zé)訓(xùn)練，而微軟這邊則是主要提供讓 ChatGPT 可以連接到微軟旗下應(yīng)用的龐大推理能力，當(dāng)然，微軟也有可能出借部分運(yùn)算能力給 OpenAI 以供其訓(xùn)練模型之用。

馬斯克的目的是什么？

那么回過頭來看，馬斯克的 X.AI 想要服務(wù)的是哪些客戶？想要達(dá)到的是哪些目的？從過去馬斯克的作法來看，他一直利用 AI 來取代偏勞力類型的人類工作，但是 ChatGPT 是要取代人類的部分思想與思考能力，讓人腦專注于創(chuàng)意以及設(shè)定工作目標(biāo)，專業(yè)知識與工作流程則是由 ChatGPT 來代勞，所以馬斯克也要學(xué) OpenAI +微軟，開始要搶某些白領(lǐng)工作了？

不過馬斯克強(qiáng)調(diào)，他的模型將會專注于真相的傳達(dá)，不要有偏見，也不要有限制。然而沒有限制的 AI 聽起來似乎更危險？完全中立似乎也是另外一種偏見？

對此，由馬斯克所招募，擔(dān)任 X.AI 核心技術(shù)研發(fā)與管理的前 DeepMind 與 OpenAI 研發(fā)工程師伊戈爾·巴布什金（Igor Babuschkin）表示，他們更重視語言模型的推理能力與真實性，比如說 GPT3.5/4 都會在某些程度上虛構(gòu)答案，而且這些模型還無法解釋為什么要給出特定的答案，因為邏輯都藏在 AI 模型的黑盒子中。

如果 X.AI 所研發(fā)的模型能夠具備更好的邏輯推論與分辨事實的能力，那是不是也要將人類目前所能擔(dān)任的指示、監(jiān)督與核實 AI 所產(chǎn)生的內(nèi)容的工作也剝奪走，未來的 AI 將可以全自動根據(jù)其觀察到的現(xiàn)況設(shè)定目標(biāo)、解決問題，不需要人類插手，而且也不用怕會像 GPT3.5/4 一樣會自欺欺人，造成潛在的災(zāi)難？

那不是比 ChatGPT 更危險嗎？對此，馬斯克其實還留有一手，他認(rèn)為，如果打不過 AI，那么就加入它，讓大腦透過 NeuraLink 連接電腦/ AI，一起協(xié)同工作，透過強(qiáng)化人類大腦，來讓 AI 無法取代，或者，讓大腦本身變成 AI 的一部份。

Neuralink 目前還在實驗階段，但是進(jìn)展相當(dāng)快速，根據(jù)實驗結(jié)果，已經(jīng)能夠讓猴子進(jìn)行超越人類反應(yīng)的電腦操作。不過 Neuralink 目前還有不少包括倫理上的爭議，以及技術(shù)上的困難，要普及恐怕有點困難，但等到大型語言模型普及，甚至可以完全自主的 AI 模型出現(xiàn)，屆時人類可能也沒有太多選擇了？