到底什么是AI PC、AI手機?
相信大家現(xiàn)在每天經(jīng)常可以在報章媒體上看到「AI PC」、「AI 手機」這兩個詞吧?特別是財經(jīng)新聞,這幾個月時不時就可以看見哪一只股票又因是 AI PC 概念股上揚之類。有的報道中甚至表示 2024 年是「AI PC 元年」。
本文引用地址:http://www.butianyuan.cn/article/202402/455318.htm你會不會好奇,這些大廠或者是報章雜志整天在喊的 AI PC、AI 手機,到底是什么?他們跟一般的 PC、手機,又差在哪邊?這篇文章就是要用最通俗的方式告訴你,AI PC、AI 手機,他們?yōu)槭裁磿霈F(xiàn)的來龍去脈,以及未來可能的發(fā)展方向。
顧名思義 AI PC、AI 手機就是可以運行人工智能的 PC 跟手機。但沒有這么簡單,不然現(xiàn)在就算是一臺配備普通中低端手機,不都可以通過 app 或瀏覽器,用上 ChatGPT、Bard 或是 DALL-E、Midjourney 等 AI 了嗎?
現(xiàn)在大家在喊的 AI PC、AI 手機,最簡單的定義就是「不用連網(wǎng),就可以在本機端運算 AI 模型的 PC/手機」。
相信就有的讀者會問了:「跑 AI 模型?那不是有 GPU/顯卡就可以跑了嗎?」理論上沒錯,其實有一張不錯的消費級顯卡,就很夠拿來跑許多一般中小型 AI 模型了。
不過,這是不考慮一臺電腦效能功耗比的狀況下所得出的結(jié)論?,F(xiàn)在大廠們喊的 AI PC、AI 手機,其實就是裝了 NPU(神經(jīng)網(wǎng)絡處理器)的 PC/手機。
這里跟不太熟的讀者們稍微科普一下:我們現(xiàn)在所熟悉的 AI 模型,像是前面提到 ChatGPT 或是 DALL-E,背后通通都是「神經(jīng)網(wǎng)絡模型」所寫出來的,這是一種模仿人腦的系統(tǒng),人腦中我們是使用神經(jīng)元接收、發(fā)送訊息,而在神經(jīng)網(wǎng)絡中,是使用數(shù)學上的模型來模仿這種行為。
NPU 就是專門拿來算神經(jīng)網(wǎng)絡模型的芯片,單一「塊」NPU 跟一塊 GPU 的算力,當然是 GPU 強,但單一「塊」NPU 的成本、能耗又小又便宜,拿來跑 AI 模型的話可以好好分擔 GPU 的工作量。
簡言之,就是 Intel、AMD、高通以及聯(lián)發(fā)科這些大廠看準了未來 AI 模型會走進每個人的電腦與手機里,紛紛推出了「CPU+GPU+NPU」的架構(gòu),反正多多益善,何樂不為?但為什么會是「現(xiàn)在」2023-2024 之際,這些大廠才推出這種三層運算架構(gòu)的產(chǎn)品呢?
一言以蔽之:大型語言模型(LLM)。更精確的說,是 Meta(Facebook)在消費市場上開了這扇大門。在 ChatGPT 掀起生成式 AI 的狂潮之后,眾多科技大廠(特別是網(wǎng)絡跟軟件這端)開始猛起直追,紛紛加大投入大型語言模型研究。在這些大廠之中,Meta 比較特別,走了一條開源的路,把它的 LLM「LLaMA」讓各機構(gòu)提出申請,以非商業(yè)授權(quán)使用。
不過說來也很崎嶇,LLaMA 沒幾天就意外外流,讓有意的使用者都能下載到使用,再過幾天事情快速發(fā)酵,陸續(xù)有人把容量比較小的 LLaMA 裝在 Mac、Google 手機 Pixel,甚至還裝在 Raspberry Pi 4 上,大家瞬間了解到就算技術(shù)上還有很多待突破的地方,但要把 LLM 裝在終端裝置上,是可行的。也是從這一刻起,Meta 主動意識到大有可為,在隨后 7 月發(fā)布新版 Llama 2 第一時間就宣布已跟高通攜手,要把 Llama 2 積極帶進智能手機、 PC 等終端裝置。
再說通俗一點:這波 AI PC、AI 手機風潮,是被 Meta、高通有意帶動起來的。高通去年也憑借這股底氣,用 Snapdragon X Elite 正式向蘋果、AMD、Intel 下戰(zhàn)帖,不然像 AMD,也是早早就有 Ryzen AI 擺在那邊。
不然 NPU 說白了也不是全新玩意,像是蘋果很早就開始在用了,早在什么時候呢?早在 2017 A11 Bionic,那還是 iPhone 8 就有非圖形專用的神經(jīng)處理單位。然后蘋果不管是在手機、電腦,只要是自己研發(fā)的芯片,每年都越塞越多顆 NPU,理論上來說他們才是 AI PC、AI 手機的鼻祖。至于非消費者端的部分,Google 就更早了,早在 2015 年 Google 就開始偷偷把自己設計的 TPU 用在數(shù)據(jù)中心。
那到底 AI PC、AI 手機會是真主流,還是只是又一場泡沫?這是一個很難現(xiàn)在就用 yes 或 no 二分法回答的問題,其一是因為這個問題,其實已經(jīng)在 2018 年「計算攝影」(也就是 AI 優(yōu)化手機照相)時被問過一次了,事后證明 NPU 確實被越來越多開發(fā)者重視,但消費端反而還沒那么(在表面)重視 NPU 的表現(xiàn)。
但筆者認為,不妨從幾條軸線來觀察 AI PC、AI 手機的發(fā)展:一是觀察 LLM 的壓縮率跟硬體什么時候到達「甜蜜點」,像是手機存儲器的部分,普遍都需要 24GB 以上才夠運行 LLM(但現(xiàn)在的主流規(guī)格只有 8~16GB);軟件這邊去年已經(jīng)有非常多研究單位,在壓縮 LLM 上有豐碩的成果(最著名的就是 SpQR 法),就看雙方什么時候可以耦合。
二則是觀察開發(fā)框架的發(fā)展速度,像是蘋果最近就推出專為 Apple Silicon 芯片進行優(yōu)化的深度學習框架「MLX」,經(jīng)開發(fā)者證實,MLX 在跑模型時已經(jīng)優(yōu)于自家的 MPS,且跟用 CUDA 的 V100 PCIe 相比也不遜色。蘋果自家開發(fā)框架的表現(xiàn)相當快速、優(yōu)異,至于一般 PC 這里,就要看有沒有同樣出色的開發(fā)框架出現(xiàn)了。
評論