到底什么是AI PC、AI手機(jī)？

作者：inside 時(shí)間：2024-02-02 來(lái)源：半導(dǎo)體產(chǎn)業(yè)縱橫

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

相信大家現(xiàn)在每天經(jīng)?？梢栽趫?bào)章媒體上看到「AI PC」、「AI 手機(jī)」這兩個(gè)詞吧？特別是財(cái)經(jīng)新聞，這幾個(gè)月時(shí)不時(shí)就可以看見(jiàn)哪一只股票又因是 AI PC 概念股上揚(yáng)之類。有的報(bào)道中甚至表示 2024 年是「AI PC 元年」。

本文引用地址：http://www.butianyuan.cn/article/202402/455318.htm

你會(huì)不會(huì)好奇，這些大廠或者是報(bào)章雜志整天在喊的 AI PC、AI 手機(jī)，到底是什么？他們跟一般的 PC、手機(jī)，又差在哪邊？這篇文章就是要用最通俗的方式告訴你，AI PC、AI 手機(jī)，他們?yōu)槭裁磿?huì)出現(xiàn)的來(lái)龍去脈，以及未來(lái)可能的發(fā)展方向。

顧名思義 AI PC、AI 手機(jī)就是可以運(yùn)行人工智能的 PC 跟手機(jī)。但沒(méi)有這么簡(jiǎn)單，不然現(xiàn)在就算是一臺(tái)配備普通中低端手機(jī)，不都可以通過(guò) app 或?yàn)g覽器，用上 ChatGPT、Bard 或是 DALL-E、Midjourney 等 AI 了嗎？

現(xiàn)在大家在喊的 AI PC、AI 手機(jī)，最簡(jiǎn)單的定義就是「不用連網(wǎng)，就可以在本機(jī)端運(yùn)算 AI 模型的 PC/手機(jī)」。

相信就有的讀者會(huì)問(wèn)了：「跑 AI 模型？那不是有 GPU/顯卡就可以跑了嗎？」理論上沒(méi)錯(cuò)，其實(shí)有一張不錯(cuò)的消費(fèi)級(jí)顯卡，就很夠拿來(lái)跑許多一般中小型 AI 模型了。

不過(guò)，這是不考慮一臺(tái)電腦效能功耗比的狀況下所得出的結(jié)論。現(xiàn)在大廠們喊的 AI PC、AI 手機(jī)，其實(shí)就是裝了 NPU（神經(jīng)網(wǎng)絡(luò)處理器）的 PC/手機(jī)。

這里跟不太熟的讀者們稍微科普一下：我們現(xiàn)在所熟悉的 AI 模型，像是前面提到 ChatGPT 或是 DALL-E，背后通通都是「神經(jīng)網(wǎng)絡(luò)模型」所寫(xiě)出來(lái)的，這是一種模仿人腦的系統(tǒng)，人腦中我們是使用神經(jīng)元接收、發(fā)送訊息，而在神經(jīng)網(wǎng)絡(luò)中，是使用數(shù)學(xué)上的模型來(lái)模仿這種行為。

NPU 就是專門拿來(lái)算神經(jīng)網(wǎng)絡(luò)模型的芯片，單一「塊」NPU 跟一塊 GPU 的算力，當(dāng)然是 GPU 強(qiáng)，但單一「塊」NPU 的成本、能耗又小又便宜，拿來(lái)跑 AI 模型的話可以好好分擔(dān) GPU 的工作量。

簡(jiǎn)言之，就是 Intel、AMD、高通以及聯(lián)發(fā)科這些大廠看準(zhǔn)了未來(lái) AI 模型會(huì)走進(jìn)每個(gè)人的電腦與手機(jī)里，紛紛推出了「CPU+GPU+NPU」的架構(gòu)，反正多多益善，何樂(lè)不為？但為什么會(huì)是「現(xiàn)在」2023-2024 之際，這些大廠才推出這種三層運(yùn)算架構(gòu)的產(chǎn)品呢？

一言以蔽之：大型語(yǔ)言模型（LLM）。更精確的說(shuō)，是 Meta（Facebook）在消費(fèi)市場(chǎng)上開(kāi)了這扇大門。在 ChatGPT 掀起生成式 AI 的狂潮之后，眾多科技大廠（特別是網(wǎng)絡(luò)跟軟件這端）開(kāi)始猛起直追，紛紛加大投入大型語(yǔ)言模型研究。在這些大廠之中，Meta 比較特別，走了一條開(kāi)源的路，把它的 LLM「LLaMA」讓各機(jī)構(gòu)提出申請(qǐng)，以非商業(yè)授權(quán)使用。

不過(guò)說(shuō)來(lái)也很崎嶇，LLaMA 沒(méi)幾天就意外外流，讓有意的使用者都能下載到使用，再過(guò)幾天事情快速發(fā)酵，陸續(xù)有人把容量比較小的 LLaMA 裝在 Mac、Google 手機(jī) Pixel，甚至還裝在 Raspberry Pi 4 上，大家瞬間了解到就算技術(shù)上還有很多待突破的地方，但要把 LLM 裝在終端裝置上，是可行的。也是從這一刻起，Meta 主動(dòng)意識(shí)到大有可為，在隨后 7 月發(fā)布新版 Llama 2 第一時(shí)間就宣布已跟高通攜手，要把 Llama 2 積極帶進(jìn)智能手機(jī)、 PC 等終端裝置。

再說(shuō)通俗一點(diǎn)：這波 AI PC、AI 手機(jī)風(fēng)潮，是被 Meta、高通有意帶動(dòng)起來(lái)的。高通去年也憑借這股底氣，用 Snapdragon X Elite 正式向蘋(píng)果、AMD、Intel 下戰(zhàn)帖，不然像 AMD，也是早早就有 Ryzen AI 擺在那邊。

不然 NPU 說(shuō)白了也不是全新玩意，像是蘋(píng)果很早就開(kāi)始在用了，早在什么時(shí)候呢？早在 2017 A11 Bionic，那還是 iPhone 8 就有非圖形專用的神經(jīng)處理單位。然后蘋(píng)果不管是在手機(jī)、電腦，只要是自己研發(fā)的芯片，每年都越塞越多顆 NPU，理論上來(lái)說(shuō)他們才是 AI PC、AI 手機(jī)的鼻祖。至于非消費(fèi)者端的部分，Google 就更早了，早在 2015 年 Google 就開(kāi)始偷偷把自己設(shè)計(jì)的 TPU 用在數(shù)據(jù)中心。

那到底 AI PC、AI 手機(jī)會(huì)是真主流，還是只是又一場(chǎng)泡沫？這是一個(gè)很難現(xiàn)在就用 yes 或 no 二分法回答的問(wèn)題，其一是因?yàn)檫@個(gè)問(wèn)題，其實(shí)已經(jīng)在 2018 年「計(jì)算攝影」（也就是 AI 優(yōu)化手機(jī)照相）時(shí)被問(wèn)過(guò)一次了，事后證明 NPU 確實(shí)被越來(lái)越多開(kāi)發(fā)者重視，但消費(fèi)端反而還沒(méi)那么（在表面）重視 NPU 的表現(xiàn)。

但筆者認(rèn)為，不妨從幾條軸線來(lái)觀察 AI PC、AI 手機(jī)的發(fā)展：一是觀察 LLM 的壓縮率跟硬體什么時(shí)候到達(dá)「甜蜜點(diǎn)」，像是手機(jī)存儲(chǔ)器的部分，普遍都需要 24GB 以上才夠運(yùn)行 LLM（但現(xiàn)在的主流規(guī)格只有 8~16GB）；軟件這邊去年已經(jīng)有非常多研究單位，在壓縮 LLM 上有豐碩的成果（最著名的就是 SpQR 法），就看雙方什么時(shí)候可以耦合。

二則是觀察開(kāi)發(fā)框架的發(fā)展速度，像是蘋(píng)果最近就推出專為 Apple Silicon 芯片進(jìn)行優(yōu)化的深度學(xué)習(xí)框架「MLX」，經(jīng)開(kāi)發(fā)者證實(shí)，MLX 在跑模型時(shí)已經(jīng)優(yōu)于自家的 MPS，且跟用 CUDA 的 V100 PCIe 相比也不遜色。蘋(píng)果自家開(kāi)發(fā)框架的表現(xiàn)相當(dāng)快速、優(yōu)異，至于一般 PC 這里，就要看有沒(méi)有同樣出色的開(kāi)發(fā)框架出現(xiàn)了。