新聞中心

EEPW首頁(yè) > 市場(chǎng)分析 > DeepSeek爆火的背后,大模型/生成式AI市場(chǎng)生態(tài)的潛在影響引人關(guān)注

DeepSeek爆火的背后,大模型/生成式AI市場(chǎng)生態(tài)的潛在影響引人關(guān)注

作者: 時(shí)間:2025-02-10 來(lái)源: 收藏

2025年1月以來(lái),中國(guó)市場(chǎng) AI 創(chuàng)企深度求索開(kāi)發(fā)的 AI開(kāi)源 大模型 DeepSeek的爆火引起廣泛關(guān)注,深度求索共發(fā)布了三款大模型,包括基座模型DeepSeek V3、推理模型R1、多模態(tài)模型JanusPro,DeepSeek 創(chuàng)新的使用了一系列模型訓(xùn)練和推理的優(yōu)化技術(shù),這促使市場(chǎng)重新審視他們對(duì)大模型性能如何最大化和促進(jìn)產(chǎn)業(yè)鏈升級(jí)的假設(shè)。

本文引用地址:http://www.butianyuan.cn/article/202502/466800.htm

中國(guó)市場(chǎng) DeepSeek AI 模型的推出在大模型/生成式AI市場(chǎng)上引起了轟動(dòng),從大模型供應(yīng)商到基礎(chǔ)設(shè)施和平臺(tái)供應(yīng)商的整個(gè)AI產(chǎn)業(yè)生態(tài)都掀起了一波“新浪潮”。國(guó)際數(shù)據(jù)公司(IDC)于近日發(fā)布的最新報(bào)告《IDC Market Glance: 中國(guó)生成式AI市場(chǎng)概覽, 1Q25》(Doc#CHC52821325,2025年2月)中,所定義的AI產(chǎn)業(yè)鏈主要包括如下幾個(gè)部分:基礎(chǔ)設(shè)施層、模型層、平臺(tái)層、應(yīng)用層及服務(wù)層。

1739179748944588.jpg

DeekSeek爆火的背后,對(duì)于大模型/生成式AI市場(chǎng)生態(tài)帶來(lái)的潛在影響有哪些? 基于此,IDC進(jìn)行了總結(jié),旨在為技術(shù)供應(yīng)商和行業(yè)用戶提供參考:

模型層:基礎(chǔ)大模型開(kāi)啟另一開(kāi)發(fā)新范式——將以一系列降低成本/復(fù)雜性的創(chuàng)新優(yōu)化技術(shù)/手段,降低門(mén)檻,未來(lái)差異化競(jìng)爭(zhēng)的結(jié)果是NLP大模型的進(jìn)一步更新升級(jí)。

降低成本/復(fù)雜性的創(chuàng)新優(yōu)化技術(shù)/手段

DeepSeek引入了創(chuàng)新性的多令牌預(yù)測(cè)(MTP)技術(shù),對(duì)注意力模塊進(jìn)行了拓展,從而在模型訓(xùn)練與推理過(guò)程中,于較低計(jì)算量條件下實(shí)現(xiàn)了性能的顯著提升。團(tuán)隊(duì)也采用了FP8精度進(jìn)行訓(xùn)練,并成功構(gòu)建了混合專家模型,通過(guò)高效的“門(mén)控網(wǎng)絡(luò)”實(shí)現(xiàn)令牌的路由,進(jìn)一步削減了推理成本。此外,其多頭潛在注意力機(jī)制(MLA)的創(chuàng)新,使得KV緩存需求大幅降低,極大程度上降低了硬件資源的消耗。DeepSeek在模型訓(xùn)練中廣泛應(yīng)用強(qiáng)化學(xué)習(xí)技術(shù),通過(guò)試錯(cuò)機(jī)制和環(huán)境反饋優(yōu)化模型的決策能力,特別是在推理和復(fù)雜問(wèn)題解決方面。DeepSeek還通過(guò)開(kāi)發(fā)內(nèi)部工具生成訓(xùn)練數(shù)據(jù),并使用“蒸餾”技術(shù)(去噪、降維、提煉等)進(jìn)一步壓縮計(jì)算資源。DeepSeek憑借極具成本優(yōu)勢(shì)的架構(gòu),正在重新定義 AI 模型的研發(fā)與定價(jià)機(jī)制。

降低門(mén)檻

DeepSeek選擇將其技術(shù)開(kāi)源,包括代碼和模型權(quán)重。這種策略不僅降低了用戶進(jìn)入大模型領(lǐng)域的門(mén)檻,還吸引了全球開(kāi)發(fā)者社區(qū)的廣泛參與,通過(guò)開(kāi)源,DeepSeek加速了技術(shù)的迭代和生態(tài)系統(tǒng)的建設(shè)。另外,這也意味著行業(yè)用戶可能不需要在基礎(chǔ)設(shè)施和硬件方面進(jìn)行大量投資,從而降低大模型的引入門(mén)檻。

差異化競(jìng)爭(zhēng)帶來(lái)進(jìn)一步更新升級(jí)

經(jīng)過(guò)IDC分析師初步試驗(yàn),DeepSeek R1 在數(shù)學(xué)、推理、代碼任務(wù)上不乏優(yōu)勢(shì),但其性能并非在所有任務(wù)及指標(biāo)上均領(lǐng)先。從短期來(lái)看,未來(lái)無(wú)論是開(kāi)源還是商業(yè)的基礎(chǔ)大模型還會(huì)進(jìn)行進(jìn)一步的差異化競(jìng)爭(zhēng),國(guó)內(nèi)外大模型的生成效果差距會(huì)趨于收斂。從長(zhǎng)期來(lái)看,NLP大模型會(huì)朝著經(jīng)濟(jì)高效、上下文準(zhǔn)確、高質(zhì)量、安全可靠演進(jìn),技術(shù)供應(yīng)商需要在成本、不同任務(wù)/應(yīng)用領(lǐng)域的生成質(zhì)量、用戶體驗(yàn)及安全性等多方面尋找產(chǎn)品差異化優(yōu)勢(shì)。

平臺(tái)層:多模型選擇、高效且可靠地部署方式是實(shí)現(xiàn)大模型商業(yè)化的基石

從2024年以來(lái),隨著大模型基礎(chǔ)能力的提升,以及應(yīng)用形態(tài)的不斷創(chuàng)新,連接大模型和應(yīng)用側(cè)的平臺(tái)產(chǎn)品演變出現(xiàn)了多種形式,預(yù)計(jì)未來(lái)大模型平臺(tái)會(huì)分化成底層平臺(tái)以及智能體開(kāi)發(fā)平臺(tái)等產(chǎn)品。平臺(tái)層產(chǎn)品往往跟模型層深度綁定,使得大模型更加易用、普惠。隨著大模型的日益普及,平臺(tái)中多種模型選擇、如何將大模型高效且可靠地部署于生產(chǎn)環(huán)境,已成為當(dāng)前備受矚目的核心議題。當(dāng)前,全球技術(shù)供應(yīng)商如英偉達(dá)、微軟、英特爾、AMD、AWS以及國(guó)內(nèi)技術(shù)供應(yīng)商如阿里云、百度智能云、華為云、騰訊云、火山引擎、京東云、天翼云、用友、360、云軸科技等已接入了DeepSeek模型。同時(shí),大模型的部署過(guò)程需同時(shí)滿足高并發(fā)與低延遲的嚴(yán)苛要求,并需全面考量數(shù)據(jù)安全、隱私保障、資源彈性擴(kuò)展以及系統(tǒng)維護(hù)等多重因素,DeepSeek推出了多種部署模式許可也挑戰(zhàn)了全球大模型技術(shù)提供商的主要商業(yè)化方法,目前推出的方式有云端部署、本地/內(nèi)網(wǎng)部署、邊緣部署、混合部署、容器化/微服務(wù)部署,以及聯(lián)邦部署模式等。

基礎(chǔ)設(shè)施層:軟硬件協(xié)同創(chuàng)新

以往行業(yè)用戶依賴高端 GPU芯片進(jìn)行規(guī)?;?xùn)練和推理,導(dǎo)致計(jì)算資源緊缺、成本高企。隨著DeepSeek的推出,一方面引發(fā)大家對(duì)于算力的重新思考,當(dāng)然另一方面也可能會(huì)驅(qū)動(dòng)更多企業(yè)部署AI進(jìn)而帶來(lái)算力市場(chǎng)增長(zhǎng),而此功能的商業(yè)化將促使整個(gè)生態(tài)系統(tǒng)向硬件與軟件協(xié)同創(chuàng)新的模式轉(zhuǎn)型。

應(yīng)用層:廣泛的應(yīng)用場(chǎng)景,加速商業(yè)化落地

大模型的更新升級(jí)將有助于加速應(yīng)用場(chǎng)景的創(chuàng)新及商業(yè)化落地,未來(lái)無(wú)論是像文案撰寫(xiě)和內(nèi)容生成、在線會(huì)議總結(jié)、AI助手、搜索等面向個(gè)人生產(chǎn)效率提升的應(yīng)用,還是面向客服、營(yíng)銷等水平業(yè)務(wù)職能的場(chǎng)景,亦或是行業(yè)特有場(chǎng)景的商業(yè)化落地都將會(huì)是今年市場(chǎng)關(guān)注的重點(diǎn)。

1739179765592520.jpg

程蔭

IDC中國(guó)研究經(jīng)理

IDC中國(guó)研究經(jīng)理程蔭表示,DeepSeek引領(lǐng)基礎(chǔ)大模型開(kāi)啟另一開(kāi)發(fā)新范式——以一系列降低成本/復(fù)雜性的創(chuàng)新優(yōu)化技術(shù)/手段,降低門(mén)檻,未來(lái)差異化競(jìng)爭(zhēng)的結(jié)果是NLP大模型的進(jìn)一步更新升級(jí),軟件及硬件供應(yīng)商應(yīng)提供多模型選擇、高效且可靠地部署方式的大模型開(kāi)發(fā)平臺(tái)或應(yīng)用開(kāi)發(fā)工具,并進(jìn)行軟硬件協(xié)同創(chuàng)新。2025年產(chǎn)業(yè)界也更加關(guān)注大模型和生成式AI的落地,整個(gè)生態(tài)系統(tǒng)應(yīng)通力合作加速應(yīng)用場(chǎng)景的創(chuàng)新及商業(yè)化。

如需進(jìn)一步了解AI研究相關(guān)的信息,請(qǐng)與IDC中國(guó)研究經(jīng)理程蔭或IDC中國(guó)研究總監(jiān)盧言霞聯(lián)系。

免責(zé)聲明

本文中的內(nèi)容和數(shù)據(jù)均來(lái)源于IDC所發(fā)布的報(bào)告,所有內(nèi)容及數(shù)據(jù)均為我公司所有。未經(jīng)IDC書(shū)面許可,任何機(jī)構(gòu)和個(gè)人不得以任何形式翻版、復(fù)制、刊登、發(fā)表或引用。



關(guān)鍵詞:

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉