必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟(jì)5G手機(jī)智能汽車智慧城市會(huì)展特約記者

“買顯存送核心”,AI芯片競賽進(jìn)入“內(nèi)存為王”!智能體大時(shí)代,中國AI芯片有何機(jī)會(huì)?

2026年3月5日 13:16每日經(jīng)濟(jì)新聞

每經(jīng)記者|朱成祥每經(jīng)編輯|杜宇

曾經(jīng),云服務(wù)廠商買AI芯片,關(guān)注GPU(圖形處理器)算力大小,而如今,可能更多的是看重顯存大小,比如是40GB還是80GB。

甚至有人調(diào)侃“買顯存送核心”,即買一張GPU算力卡,更看重的是顯存帶寬和容量,而不是GPU算力大小。

如今,內(nèi)存芯片一兩個(gè)月價(jià)格翻倍的大漲潮,正是對AI芯片進(jìn)入“內(nèi)存為王”的集中體現(xiàn)。

AI云基礎(chǔ)設(shè)施廠商PPIO相關(guān)專家告訴每經(jīng)記者:“HBM(高帶寬內(nèi)存)及CoWoS(基板上晶圓、芯片)封裝產(chǎn)生的成本已經(jīng)超過純GPU芯片,HBM成本已經(jīng)‘碾壓’核心,‘買顯存送核心’已成為現(xiàn)實(shí)!

某GPU芯片企業(yè)技術(shù)負(fù)責(zé)人李明(化名)對每經(jīng)記者表示:“結(jié)合我們硬件設(shè)計(jì)與供應(yīng)鏈經(jīng)驗(yàn),CoWoS封裝GPU中,當(dāng)前HBM顯存成本已接近甚至超過GPU核心,是整卡成本最高的單一組件!

懂芯創(chuàng)始人張慧娟告訴每經(jīng)記者:“AI芯片的競爭已從單純的算力競賽,轉(zhuǎn)向了內(nèi)存帶寬和內(nèi)存容量的雙重競賽。HBM通過先進(jìn)封裝技術(shù)與GPU裸片集成在同一封裝內(nèi),實(shí)現(xiàn)了計(jì)算與存儲(chǔ)的緊耦合,極大地緩解了內(nèi)存難題,越來越成為業(yè)界追捧的主要方向!

圖片來源:每經(jīng)媒資庫

2025年下半年以來,存儲(chǔ)芯片持續(xù)漲價(jià)成了半導(dǎo)體行業(yè)最熱門的話題。進(jìn)入2026年,存儲(chǔ)芯片仍保持上漲趨勢,且漲幅驚人。

而這背后,是AI芯片已進(jìn)入“內(nèi)存為王”的時(shí)代。

2023年,ChatGPT石破天驚,人類社會(huì)進(jìn)入大模型時(shí)代。進(jìn)入2026年,大模型已然從思考轉(zhuǎn)向應(yīng)用,智能體、Skill以及“養(yǎng)蝦”成了熱門話題。

人工智能的發(fā)展,也對AI芯片有了新的要求。隨著大模型參數(shù)的增加,訓(xùn)練和推理對顯存(內(nèi)存的一種)的需求也與日俱增。

張慧娟表示:“我們已經(jīng)見證了模型參數(shù)量的指數(shù)級增長,從GPT-3的1750億到萬億級MoE(混合專家模型),直接推動(dòng)了HBM需求的爆發(fā)。這也逐步造成,制約算力的瓶頸往往不是芯片算力本身,而是數(shù)據(jù)從內(nèi)存?zhèn)鬏數(shù)接?jì)算核心的速度,因?yàn)閰?shù)必須被加載到計(jì)算單元附近的高速存儲(chǔ)介質(zhì)中,計(jì)算單元才能以極低的延遲調(diào)用它們進(jìn)行運(yùn)算!

李明認(rèn)為:“大模型的參數(shù)量與內(nèi)存需求之間存在著直接的正向關(guān)系。在2026年的技術(shù)背景下,雖然模型架構(gòu)(如MoE混合專家模型)和量化技術(shù)(Quantization)在不斷優(yōu)化,但‘參數(shù)量越大,內(nèi)存需求越高’依然是AI領(lǐng)域的基本物理定律。除了模型權(quán)重需要的靜態(tài)顯存占用以外,大模型運(yùn)行時(shí)需要的KV Cache和激活值等都會(huì)額外占用顯存。在訓(xùn)練任務(wù)中,還需要額外顯存來保存梯度和優(yōu)化器狀態(tài)等信息!

但大模型對內(nèi)存的強(qiáng)勁“渴望”,不僅僅局限于參數(shù)的增長。

智能體的快速發(fā)展,令A(yù)I推理對AI芯片的需求大增。業(yè)界普遍認(rèn)為,未來AI推理對AI芯片的需求將大幅超越AI訓(xùn)練。

PPIO專家表示:“大模型推理場景中,GPU內(nèi)存主要用于兩個(gè)方面,一是保存大模型的權(quán)重,另一個(gè)是推理過程中用于存儲(chǔ)中間狀態(tài),也就是KV Cache緩存。前者由大模型參數(shù)量決定,后者取決于會(huì)話的上下文長度。大模型發(fā)展至今,參數(shù)量已經(jīng)趨于穩(wěn)定,不會(huì)大幅增加。而會(huì)話的上下文長度還在持續(xù)增加,特別是Agent(智能體)場景下,1百萬Token的上下文長度已成為主流。這樣進(jìn)一步增加對內(nèi)存的開銷,長上下文成為內(nèi)存需求的主要因素。”

參數(shù)、長上下文,這兩大因素的作用下,內(nèi)存的重要性已然超越GPU計(jì)算核心。

不僅僅客戶需求側(cè)更加看重內(nèi)存。在成本結(jié)構(gòu)中,內(nèi)存的成本也大幅高于純粹的GPU核心。

PPIO專家稱:“一張GPU的成本構(gòu)成主要分成三部分,一是HBM內(nèi)存,容量越大成本越高;二是GPU核心(邏輯計(jì)算芯片);三是先進(jìn)封裝工藝(CoWoS)。高端GPU,由于HBM內(nèi)存容量更大,其HBM的成本更高,以B200(英偉達(dá)GPU)為例,其總生產(chǎn)成本的構(gòu)成中,HBM內(nèi)存占比約45%,CoWoS封裝及良率損失占比約34%,GPU核心芯片占比只有14%左右!

即英偉達(dá)B200的成本結(jié)構(gòu)中,45%源自向SK海力士、三星、美光等廠商購買HBM,14%源自臺(tái)積電代工的GPU裸芯,34%源自臺(tái)積電代工的CoWoS封裝及良率損失。

而HBM由多層DRAM(動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)堆疊而成。HBM需求大增,意味著SK海力士這類廠商將越來越多的DRAM產(chǎn)能用于制造HBM,相應(yīng)用于消費(fèi)級的DRAM產(chǎn)能便少了。

PPIO專家表示:“三大存儲(chǔ)巨頭(三星、SK海力士、美光)已經(jīng)將70%的產(chǎn)能轉(zhuǎn)移到HBM上,用于消費(fèi)電子的GDDR產(chǎn)能反而會(huì)下降。因此我們首先看到消費(fèi)領(lǐng)域的GeForce GPU的價(jià)格普遍上漲,大內(nèi)存GPU減產(chǎn)甚至停產(chǎn),這是由于GDDR內(nèi)存減產(chǎn)以優(yōu)先保障HBM內(nèi)存導(dǎo)致的!

那么,若未來存儲(chǔ)行業(yè)產(chǎn)能提升,消費(fèi)電子領(lǐng)域存儲(chǔ)價(jià)格是否也將率先受到?jīng)_擊?

張慧娟認(rèn)為:“消費(fèi)電子往往是最先感知到波動(dòng)的領(lǐng)域。特別是對于存儲(chǔ)來說,比如手機(jī)、PC(個(gè)人電腦)用的LPDDR(低功耗內(nèi)存)、SSD(固態(tài)硬盤)等接近于標(biāo)準(zhǔn)品,價(jià)格彈性大。一旦上游晶圓產(chǎn)能提升,最先反映在現(xiàn)貨價(jià)上的是這些產(chǎn)品!

李明認(rèn)為:“未來存儲(chǔ)產(chǎn)能提升后,最先受到影響的是消費(fèi)電子用存儲(chǔ)。消費(fèi)級存儲(chǔ)認(rèn)證周期短、需求彈性大、替換靈活,新產(chǎn)能可快速導(dǎo)入消費(fèi)端,價(jià)格波動(dòng)也最為明顯。而數(shù)據(jù)中心用存儲(chǔ)認(rèn)證流程通常需要6—18個(gè)月,新產(chǎn)能導(dǎo)入速度較慢,且存儲(chǔ)廠商會(huì)優(yōu)先保障數(shù)據(jù)中心的產(chǎn)能供給,因此它受產(chǎn)能提升的影響最晚、幅度最小?傮w而言,產(chǎn)能提升的影響會(huì)先平抑消費(fèi)端價(jià)格,再逐步傳導(dǎo)至企業(yè)級市場。”

簡而言之,存儲(chǔ)產(chǎn)能提升后,將率先平抑消費(fèi)端存儲(chǔ)芯片價(jià)格。

值得一提的是,三星、SK海力士未來將有兩座晶圓廠陸續(xù)投產(chǎn),這將緩解內(nèi)存“缺貨漲價(jià)”嗎?若P4L(三星電子)和M15x(SK海力士)提前投入運(yùn)營,是否將對存儲(chǔ)芯片價(jià)格帶來沖擊?

張慧娟認(rèn)為:“P4L和M15x新增產(chǎn)能,很大程度上是為HBM和高性能DDR5(第五代計(jì)算機(jī)內(nèi)存規(guī)格)準(zhǔn)備的,而不是傳統(tǒng)的DDR4(第四代計(jì)算機(jī)內(nèi)存規(guī)格)或NAND(閃存)。這些屬于高端產(chǎn)能。”

其補(bǔ)充表示:“對HBM的價(jià)格沖擊可能不大,甚至不會(huì)降價(jià)。因?yàn)锳I芯片開發(fā)周期長,且市場處于供不應(yīng)求的局面。新增產(chǎn)能是為了填平供需缺口,有望抑制價(jià)格進(jìn)一步大漲,但難以帶來大幅降價(jià)。對普通DRAM而言,假設(shè)HBM需求不及預(yù)期,或者廠商將部分產(chǎn)線切換回通用DRAM,那么會(huì)對消費(fèi)電子內(nèi)存價(jià)格帶來壓力。但目前看,晶圓廠更傾向于優(yōu)先保證高利潤的HBM生產(chǎn)!

李明對每經(jīng)記者表示:“從存儲(chǔ)芯片供應(yīng)鏈與GPU硬件配套的角度分析,三星P4L與SK海力士M15x即便提前投產(chǎn),短期內(nèi)對存儲(chǔ)芯片價(jià)格的沖擊也較為有限。核心原因在于,這兩座工廠的新產(chǎn)能主要聚焦于HBM、先進(jìn)制程DDR等高端存儲(chǔ)產(chǎn)品,并未直接擴(kuò)產(chǎn)消費(fèi)級存儲(chǔ)。”

李明補(bǔ)充表示:“當(dāng)前AI需求呈爆發(fā)式增長,高端存儲(chǔ)仍處于供需緊張狀態(tài),因此短期價(jià)格將維持高位。中長期來看,隨著產(chǎn)能逐步釋放,高端存儲(chǔ)的供給壓力會(huì)有所緩解,但新產(chǎn)能將優(yōu)先配套AI與數(shù)據(jù)中心需求,普通消費(fèi)級存儲(chǔ)不會(huì)出現(xiàn)大幅降價(jià),整體呈現(xiàn)結(jié)構(gòu)性緩和態(tài)勢。此外,各大廠商的存儲(chǔ)優(yōu)化技術(shù),也能進(jìn)一步平衡供需,避免全品類存儲(chǔ)價(jià)格出現(xiàn)大幅波動(dòng)!

PPIO認(rèn)為:“HBM的產(chǎn)能嚴(yán)重不足以及AI數(shù)據(jù)中心對GPU的旺盛需求是造成HBM內(nèi)存成本遠(yuǎn)高于GPU核心的主要因素。市場的供需不平衡會(huì)促使更多內(nèi)存廠商擴(kuò)大生產(chǎn),尤其是增加HBM的生產(chǎn)和供給,不過短期很難改變供需失衡的現(xiàn)狀,未來HBM內(nèi)存價(jià)格還將繼續(xù)上漲,但趨勢會(huì)放緩!

在AI算力相對不稀缺而HBM短缺的背景下,中國AI芯片廠商有何機(jī)會(huì)?

據(jù)記者了解,國內(nèi)AI芯片廠商除了自身產(chǎn)品和技術(shù)解決方案,還在基礎(chǔ)軟件層面聯(lián)合各大人工智能基礎(chǔ)設(shè)施公司、大模型廠商和互聯(lián)網(wǎng)等生態(tài)伙伴一同研究例如低精度量化、專家預(yù)測加載等工程優(yōu)化技術(shù),來系統(tǒng)性地降低實(shí)際大模型部署和應(yīng)用過程中對內(nèi)存的需求。

即在工程化領(lǐng)域,中國工程師紅利或?qū)⑼癸@。

封面圖片來源:每經(jīng)媒資庫

編 輯:魏德齡
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報(bào)價(jià)聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2026 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動(dòng)文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像