必讀視頻專題飛象趣談光通信人工智能低空經濟5G手機智能汽車智慧城市會展特約記者

AI競賽轉向推理,如何影響國際科技競爭格局?

2026年1月7日 07:1321世紀經濟報

周城雄(中國科學院科技戰(zhàn)略咨詢研究院研究員、數智創(chuàng)新與治理研究中心副主任)

2026年1月5日,美國拉斯維加斯CES展會上,英偉達CEO黃仁勛出人意料地提前發(fā)布了下一代AI芯片平臺“Rubin”,打破其一貫在3月GTC大會集中發(fā)布新品的傳統(tǒng)。這一舉動釋放出一個關鍵信號:全球AI競賽正從“訓練主導”全面轉向“推理驅動”,這不僅是技術路線的演進,更是整個AI產業(yè)生態(tài)、基礎設施布局乃至國家間科技競爭格局的重大轉折點。

過去數年,大模型訓練是AI發(fā)展的核心焦點。以GPT、Llama、Claude等為代表的大語言模型(LLM)不斷刷新參數規(guī)模,對算力的需求呈指數級增長,催生了以英偉達H100、Blackwell為代表的高性能GPU集群建設熱潮。然而,訓練只是AI生命周期的一環(huán)。真正決定AI能否落地、能否創(chuàng)造經濟價值的關鍵,在于推理——即模型在實際應用場景中對用戶輸入進行實時響應的能力。

推理場景具有高頻、低延遲、高并發(fā)、成本敏感等特點。例如,一個智能客服系統(tǒng)每天可能處理數百萬次用戶查詢,每一次都需要在毫秒級內完成推理;自動駕駛車輛則需在復雜環(huán)境中持續(xù)進行多模態(tài)推理以保障安全。這些需求對硬件效率、能耗比、系統(tǒng)協(xié)同性提出了遠高于訓練階段的要求。

英偉達此次發(fā)布的Rubin平臺,正是為推理時代量身打造。據官方披露,Rubin在推理token成本上最高可降低10倍,同時通過集成CPU、GPU、DPU、SuperNIC、交換芯片等六顆芯片,構建了“極端協(xié)同”的全棧系統(tǒng)。尤為關鍵的是,Rubin同步推出了專為推理設計的“上下文存儲平臺”,用于高效管理KV Cache(鍵值緩存),避免重復計算,顯著提升推理效率。這表明,AI基礎設施的競爭已從單一芯片性能,升級為系統(tǒng)級工程能力的比拼。

Rubin平臺等產品的亮相背后,是全球AI發(fā)展的“馬太效應”正在顯現。一方面,擁有強大算力和先進推理系統(tǒng)的國家與企業(yè),將更快實現AI商業(yè)化落地,形成數據—模型—應用—收入的正向循環(huán);另一方面,缺乏底層基礎設施能力的參與者,將越來越依賴外部平臺,陷入“應用繁榮但根基脆弱”的困境。

面對全球AI競賽向推理階段的加速演進,對中國AI產業(yè)既是挑戰(zhàn)也是機遇。盡管近年來中國在大模型研發(fā)上取得顯著進展,涌現出通義、文心、混元等優(yōu)秀模型,但在底層硬件和系統(tǒng)級優(yōu)化方面仍存在一些短板。目前國產GPU如昇騰、寒武紀等取得一定突破,但在軟件生態(tài)、系統(tǒng)協(xié)同、能效比等方面仍需進一步提升。

更重要的是,中國AI產業(yè)需要加快形成“芯片+網絡+存儲+安全+開發(fā)框架”的全棧推理解決方案。當前國內AI基礎設施在對推理場景的深度優(yōu)化方面,還有很大的發(fā)展?jié)摿Α@,KV Cache管理、動態(tài)批處理、模型量化壓縮等關鍵技術尚未在主流國產平臺上實現高效集成,若能實現,將有效降低推理成本、推動AI應用的規(guī);渴稹

為此,中國應從三個層面加速準備。首先,強化全棧式AI基礎設施研發(fā)。不能僅聚焦于GPU性能追趕,而應考慮秉持“協(xié)同設計”理念,推動國產CPU、DPU、高速互連、AI原生存儲等組件的聯合創(chuàng)新。鼓勵芯片企業(yè)與阿里云、騰訊云、百度智能云等云廠商深度合作,構建自主可控的推理系統(tǒng)棧。

其次,大力發(fā)展推理優(yōu)化技術與開源生態(tài)。應支持高校與企業(yè)攻關低比特量化、稀疏化推理、動態(tài)批處理、緩存復用等核心技術。同時,需推動建立中文AI推理基準測試體系,引導開發(fā)者關注推理效率而非僅參數規(guī)模;鼓勵開源社區(qū)圍繞國產硬件適配推理框架,降低遷移門檻。

最后,搶占物理AI與邊緣推理新賽道。在機器人、自動駕駛、工業(yè)智能等新興領域,中國擁有豐富的應用場景和數據資源。應加快部署面向邊緣端的輕量化推理芯片與開發(fā)平臺,支持具身智能、車路協(xié)同等創(chuàng)新應用。通過“場景驅動+技術反哺”的模式,倒逼底層硬件與系統(tǒng)軟件的協(xié)同進化。

總之,此次CES上,Rubin平臺等AI新產品的發(fā)布,不僅是技術迭代的里程碑,更是AI產業(yè)范式轉移的宣言書。當AI從“能回答問題”邁向“能理解世界、規(guī)劃行動、完成任務”的智能體階段,推理能力將成為衡量國家AI競爭力的關鍵指標。對中國而言,這既是挑戰(zhàn),也是彎道超車的機遇。產業(yè)界需摒棄“唯訓練論”的慣性思維,以系統(tǒng)工程視角重構AI基礎設施,才能更好地在推理時代贏得主動權。

編 輯:章芳
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創(chuàng)”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
推薦閱讀

精彩視頻

精彩專題

關于我們廣告報價聯系我們隱私聲明本站地圖

CCTIME飛象網 CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經書面許可,禁止轉載、摘編、復制、鏡像