生成式人工智能：半導(dǎo)體行業(yè)的下一個(gè)S曲線？

作者：EEPW 時(shí)間：2024-04-09 來源：EEPW

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

隨著ChatGPT和Sora等生成式人工智能（gen AI）應(yīng)用席卷全球，對(duì)計(jì)算能力的需求正在飆升。半導(dǎo)體行業(yè)發(fā)現(xiàn)自己正接近一個(gè)新的S曲線——對(duì)于高管來說，一個(gè)迫切的問題是該行業(yè)是否能跟得上。

本文引用地址：http://www.butianyuan.cn/article/202404/457321.htm

領(lǐng)導(dǎo)者們正在通過承諾大量的資本支出來擴(kuò)大數(shù)據(jù)中心和半導(dǎo)體制造工廠（晶圓廠），同時(shí)探索芯片設(shè)計(jì)、材料和架構(gòu)的創(chuàng)新，以滿足不斷發(fā)展的gen AI驅(qū)動(dòng)的商業(yè)格局的需求。

為了指導(dǎo)半導(dǎo)體行業(yè)領(lǐng)導(dǎo)者度過這一轉(zhuǎn)型階段，我們制定了幾種gen AI對(duì)B2B和B2C市場影響的情景。每個(gè)情景都涉及對(duì)計(jì)算和因此晶圓的巨大需求增長。這些情景聚焦于數(shù)據(jù)中心，同時(shí)承認(rèn)智能手機(jī)等邊緣設(shè)備的影響，但規(guī)模要小得多。

需求情景，來自麥肯錫的AI分析，是根據(jù)半導(dǎo)體行業(yè)可能提供的晶圓產(chǎn)量進(jìn)行的，考慮到資本和設(shè)備等約束因素。即使更加雄心勃勃的情景也是有可能的，但是對(duì)數(shù)據(jù)中心所需的晶圓數(shù)量以及數(shù)據(jù)中心所需的能源供應(yīng)的影響將使它們不太可能出現(xiàn)。

本文將討論高性能組件的預(yù)計(jì)晶圓需求，包括邏輯、內(nèi)存、數(shù)據(jù)存儲(chǔ)芯片，以及為它們提供支持所需的晶圓廠的數(shù)量。擁有這些信息，行業(yè)利益相關(guān)者可以戰(zhàn)略性地規(guī)劃和分配資源，以滿足不斷增長的計(jì)算能力需求，確保未來幾年其運(yùn)營的可伸縮性和可持續(xù)性。

生成式人工智能計(jì)算需求的組成部分對(duì)于人工智能和生成式人工智能應(yīng)用需求的激增伴隨著與之成比例的計(jì)算需求增長至關(guān)重要。然而，對(duì)于半導(dǎo)體行業(yè)領(lǐng)導(dǎo)者來說，理解這種需求的起源以及生成式人工智能將如何應(yīng)用是至關(guān)重要的。我們預(yù)計(jì)將會(huì)看到兩種不同類型的生成式人工智能應(yīng)用：B2C和B2B用例。在B2C和B2B市場上，對(duì)于生成式人工智能的需求可以分為兩個(gè)主要階段：訓(xùn)練和推斷。訓(xùn)練通常需要大量的數(shù)據(jù)和計(jì)算資源。相比之下，推斷通常對(duì)于每個(gè)用例的運(yùn)行需要更低的計(jì)算資源。

為了使半導(dǎo)體行業(yè)領(lǐng)導(dǎo)者能夠更好地應(yīng)對(duì)這些市場的復(fù)雜性和需求，我們概述了B2B計(jì)算需求的六種用例原型及其相應(yīng)的計(jì)算成本和同時(shí)生成的gen AI價(jià)值創(chuàng)造。

麥肯錫的分析估計(jì)，B2C應(yīng)用將占大約70%的生成式人工智能計(jì)算需求，因?yàn)樗鼈儼ɑ鞠M(fèi)者互動(dòng)（例如起草電子郵件）和高級(jí)用戶互動(dòng)（例如從文本創(chuàng)建可視化內(nèi)容）的工作量。預(yù)計(jì)B2B用例將占大約30%的需求。這些包括業(yè)務(wù)的高級(jí)內(nèi)容創(chuàng)建（例如，生成市場材料）、解決客戶查詢或生成標(biāo)準(zhǔn)財(cái)務(wù)報(bào)告等用例。

跨行業(yè)垂直領(lǐng)域和功能的B2B應(yīng)用可分為六種用例原型：

編碼和軟件開發(fā)應(yīng)用程序，解釋和生成代碼創(chuàng)意內(nèi)容生成應(yīng)用程序，編寫文檔和通信（例如生成營銷材料）客戶互動(dòng)應(yīng)用程序，涵蓋自動(dòng)化客戶服務(wù)的外展、查詢和數(shù)據(jù)收集（例如通過聊天機(jī)器人處理客戶查詢）創(chuàng)新應(yīng)用程序，為研發(fā)過程生成產(chǎn)品和材料（例如設(shè)計(jì)候選藥物分子）簡化的摘要應(yīng)用程序，使用結(jié)構(gòu)化數(shù)據(jù)集總結(jié)和提取見解（例如生成標(biāo)準(zhǔn)財(cái)務(wù)報(bào)告）復(fù)雜的摘要應(yīng)用程序，使用非結(jié)構(gòu)化或大型數(shù)據(jù)集總結(jié)和提取見解（例如在臨床圖像中合成MRI或CT掃描結(jié)果）

麥肯錫根據(jù)其價(jià)值創(chuàng)造和服務(wù)成本來定義這六個(gè)不同和復(fù)雜的B2B用例原型。通過定義服務(wù)成本和價(jià)值創(chuàng)造，決策者可以更熟練地了解B2B用例的具體情況，并在采用它們時(shí)做出明智的選擇。在核心，服務(wù)成本的分析包括訓(xùn)練、微調(diào)和推斷成本。該分析還包括超大規(guī)模的基礎(chǔ)設(shè)施即服務(wù)（IaaS）邊際成本，其中包括計(jì)算硬件、服務(wù)器組件、IT基礎(chǔ)設(shè)施、能源消耗和估計(jì)的人才成本。通過諸如生產(chǎn)率改進(jìn)和勞動(dòng)力成本節(jié)約等指標(biāo)，對(duì)生成式人工智能價(jià)值創(chuàng)造的評(píng)估。

生成式人工智能需求情景隨著組織應(yīng)對(duì)采用生成式人工智能的復(fù)雜性，這些原型的戰(zhàn)略利用變得至關(guān)重要。gen AI采用的經(jīng)濟(jì)模型、算法效率以及組件和系統(tǒng)級(jí)別的持續(xù)硬件進(jìn)步等因素進(jìn)一步影響了gen AI的采用和技術(shù)進(jìn)步。三種需求情景——基礎(chǔ)、保守和加速——代表了對(duì)B2B和B2C應(yīng)用的生成式人工智能需求可能的結(jié)果。基礎(chǔ)情景是根據(jù)一系列必要假設(shè)進(jìn)行的，例如持續(xù)的技術(shù)進(jìn)步和快速采用，由能夠覆蓋gen AI訓(xùn)練和推斷的資本和運(yùn)營成本的商業(yè)模式支持。保守和加速采用情景代表了采用的上升和下降余地，分別。

麥肯錫的分析估計(jì)，到2030年，在基礎(chǔ)情景下，生成式人工智能的總計(jì)算需求可能達(dá)到25x1030 FLOPs（浮點(diǎn)運(yùn)算），其中大約70%來自B2C應(yīng)用，30%來自B2B應(yīng)用。

B2C計(jì)算需求情景B2C計(jì)算需求受到與gen AI互動(dòng)的消費(fèi)者數(shù)量、他們的互動(dòng)水平以及其計(jì)算含義的影響。具體來說，B2C推斷工作負(fù)載取決于每個(gè)用戶的gen AI互動(dòng)次數(shù)、gen AI用戶的數(shù)量以及每個(gè)基本和高級(jí)用戶互動(dòng)的FLOP。訓(xùn)練工作負(fù)載取決于每年的訓(xùn)練次數(shù)、gen AI模型提供者的數(shù)量以及不同gen AI模型的每次訓(xùn)練運(yùn)行的FLOP（例如2023年的最新模型，例如GPT-4，以及較小或較早的模型）。對(duì)于所有情景，公司能夠開發(fā)可持續(xù)的商業(yè)模型至關(guān)重要。

對(duì)于所有情景，公司能夠開發(fā)可持續(xù)的商業(yè)模型至關(guān)重要。

基礎(chǔ)采用。到2030年，預(yù)期的每日智能手機(jī)用戶的平均每天互動(dòng)次數(shù)（每次互動(dòng)是一系列提示）為基本消費(fèi)者應(yīng)用，例如起草電子郵件。另一個(gè)預(yù)期的平均數(shù)是高級(jí)消費(fèi)者應(yīng)用，例如創(chuàng)建更長的文本或綜合復(fù)雜的輸入文檔。通過使用當(dāng)前的在線和基于應(yīng)用程序的搜索查詢的數(shù)字，麥肯錫的分析估計(jì)互動(dòng)次數(shù)約為預(yù)計(jì)的每日在線搜索查詢次數(shù)的兩倍（約280億）2030年。支持基本B2C情景的基本假設(shè)是穩(wěn)定的技術(shù)進(jìn)步、有利的監(jiān)管發(fā)展以及不斷增長的用戶接受程度。

保守采用。此情景可能涉及消費(fèi)者對(duì)數(shù)據(jù)隱私、監(jiān)管發(fā)展的持續(xù)關(guān)注以及技術(shù)僅有漸進(jìn)性改進(jìn)，導(dǎo)致基本情況的互動(dòng)次數(shù)減少一半。

加速采用。此情景表明對(duì)技術(shù)的高度信任和廣泛的用戶接受度。此情景的驅(qū)動(dòng)因素可能是具有吸引力的新商業(yè)模式、快速的技術(shù)進(jìn)步或有利的監(jiān)管。例如，顛覆性的硬件架構(gòu)將大大降低服務(wù)成本。此外，對(duì)軟件驗(yàn)證過程的改進(jìn)可能會(huì)顯著提高生成式人工智能解決方案的效率。諸如此類的因素可能會(huì)加速采用曲線，并導(dǎo)致2030年之前半導(dǎo)體行業(yè)中生成式人工智能實(shí)施的顯著增長。

生成式人工智能B2B需求情景生成式人工智能用例在B2B部門的采用受到半導(dǎo)體芯片供應(yīng)的充分性和成本的顯著影響。企業(yè)必須能夠合理化其對(duì)計(jì)算基礎(chǔ)設(shè)施的投資，確保服務(wù)成本低于公司的支付意愿。對(duì)于這些B2B需求情景，麥肯錫的分析假設(shè)支付意愿對(duì)應(yīng)于總價(jià)值創(chuàng)造的約20%。

在B2B用例的背景下，麥肯錫的分析表明，六種用例原型中只有五種對(duì)廣泛采用是經(jīng)濟(jì)可行的。第六個(gè)原型，復(fù)雜摘要，預(yù)計(jì)由于與其成本相比的有限價(jià)值創(chuàng)造以及在分析復(fù)雜和非結(jié)構(gòu)化數(shù)據(jù)輸入方面消耗大量計(jì)算資源，不會(huì)被廣泛采用。

新聞中心

生成式人工智能：半導(dǎo)體行業(yè)的下一個(gè)S曲線？

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)