DeepSeek(深度求索)的“長尾效應(yīng)”還在繼續(xù)。近日,全國多地政府陸續(xù)披露了在政務(wù)領(lǐng)域推進(jìn)DeepSeeK私有化部署的進(jìn)展。除了在政務(wù)領(lǐng)域“紅得發(fā)紫”,DeepSeek在金融、醫(yī)療、能源等行業(yè)的部署熱情也一漲再漲,直接帶動(dòng)各類AI一體機(jī)快速出圈。
政務(wù)審批提速90%、餐飲巨頭88臺(tái)傳統(tǒng)服務(wù)器縮至8臺(tái)、中國移動(dòng)(105.660, -1.56, -1.45%)斬獲海外首單AI一體機(jī)試圖以“集成算力+大模型+場(chǎng)景方案”的模式,掀起政企數(shù)字化升級(jí)的“新基建革命”。在國產(chǎn)大模型部署成本下探與數(shù)據(jù)安全強(qiáng)監(jiān)管的雙重催化下,這款“智能盒子”儼然成了各大廠商的必爭(zhēng)之地。
值得注意的是,當(dāng)前AI一體機(jī)市場(chǎng)雖是多方競(jìng)逐,各家占比相對(duì)均衡,但大多AI一體機(jī)都是幾個(gè)廠商“聯(lián)合出品”。盡管AI一體機(jī)市場(chǎng)熱度逐步攀升,但部分廠商對(duì)其商業(yè)價(jià)值的考量仍然保持理性。與華為合作發(fā)布SageOne IA一體機(jī)解決方案的第四范式(HK06682)就明確表示,不會(huì)單獨(dú)統(tǒng)計(jì)一體機(jī)的銷量和增長率,而是將其視為整體營收增長的一部分。
政務(wù)、金融領(lǐng)域需求緊俏廠商加密布局AI一體機(jī)
談到如今高漲的AI一體機(jī)熱度,3月12日,北京市社會(huì)科學(xué)院副研究員王鵬告訴《每日經(jīng)濟(jì)新聞》記者,目前來看,政府、金融、醫(yī)療等領(lǐng)域的付費(fèi)意愿較強(qiáng),背后的刺激因素有很多。政策層面,AI終端產(chǎn)業(yè)被納入戰(zhàn)略布局,一系列鼓勵(lì)政策接連出臺(tái)。技術(shù)層面,國產(chǎn)大模型與GPU的協(xié)同發(fā)展給本地化部署和高效性能運(yùn)行提供了條件,AI一體機(jī)成為首選。
此外,天使投資人、資深人工智能專家郭濤還提出,數(shù)據(jù)隱私法規(guī)的加強(qiáng)、云計(jì)算成本的上升、5G技術(shù)的普及也帶動(dòng)了本地部署AI解決方案的需求。
供給的激增也能反映需求的熱烈。
今年2月以來,來自不同廠商、不同模型公司的一體機(jī)產(chǎn)品如雨后春筍般密集上線。2月5日,聯(lián)想集團(tuán)與沐曦股份聯(lián)合發(fā)布了首個(gè)國產(chǎn)DeepSeek一體機(jī)解決方案,截至3月7日累計(jì)發(fā)貨量超千臺(tái),配備近萬張沐曦國產(chǎn)GPU卡;2月13日,華為宣布推出昇騰DeepSeek一體機(jī);2月28日,神州數(shù)碼(48.700, 0.50, 1.04%)發(fā)布問學(xué)一體機(jī)DeepSeek版;同日,中國移動(dòng)通過中移國際在亞太區(qū)某國金融服務(wù)業(yè)完成DeepSeek一體機(jī)私有化部署,拿下國產(chǎn)AI一體機(jī)出海第一單;3月7日,第四范式聯(lián)合華為昇騰AI發(fā)布了全新升級(jí)SageOne IA一體機(jī)解決方案從內(nèi)銷到出海,AI一體機(jī)顯然已是廠商的“必爭(zhēng)之地”。
和此前的AI服務(wù)器相比,AI一體機(jī)憑什么成為基建更新的“香餑餑”?
資深產(chǎn)業(yè)經(jīng)濟(jì)觀察家梁振鵬告訴記者,目前來看,AI一體機(jī)可以將GPU、大模型、終端硬件等深度適配集成,減少企業(yè)采購及部署的成本和時(shí)間,同時(shí)還能進(jìn)一步保障數(shù)據(jù)安全。
以具體產(chǎn)品為例,根據(jù)聯(lián)想集團(tuán)方面介紹,其2月5日發(fā)布的國產(chǎn)DeepSeek一體機(jī)解決方案可將大模型業(yè)務(wù)的接入門檻降至五萬元起,在數(shù)小時(shí)內(nèi)即可完成部署。第四范式也舉例稱,公司某大型連鎖餐飲客戶在推薦算法場(chǎng)景中采用8臺(tái)一體機(jī)替換了88臺(tái)傳統(tǒng)服務(wù)器,并將AI應(yīng)用上線周期從數(shù)月縮短至數(shù)天。
不過,盡管AI一體機(jī)的熱度逐步攀升,廠商對(duì)其商業(yè)價(jià)值的考量仍然保持理性。第四范式就明確表示,不會(huì)單獨(dú)統(tǒng)計(jì)AI一體機(jī)的銷量和增長率,而是將其視為整體營收增長的一部分。
國產(chǎn)大模型應(yīng)用成本下探加速廠商布局
需要注意的是,大模型早已不是新鮮產(chǎn)物,除了剛需用戶,此輪AI一體機(jī)“部署熱”還與國產(chǎn)大模型成本下降有關(guān)。
3月初,DeepSeek在社交網(wǎng)站發(fā)文披露了自身理論成本和利潤率等關(guān)鍵信息。按照披露數(shù)據(jù),若所有Tokens(文本處理的基本單位)全部按照DeepSeek R1的定價(jià)計(jì)算,理論上DeepSeek一天的總收入為56.2027萬美元,成本利潤率為545%。
不過,DeepSeek方面也表示:“當(dāng)然我們實(shí)際上沒有這么多收入,因?yàn)閂3的定價(jià)更低,同時(shí)收費(fèi)服務(wù)只占了一部分,另外夜間還會(huì)有折扣!
此文一出,立即引發(fā)業(yè)內(nèi)熱議。資深科技(20.220, 0.45, 2.28%)博主梁賽告訴記者,此前中小云廠商都嘗試在這波AI浪潮到來時(shí)分一杯羹,但部署成本很高,結(jié)果是一邊流血虧損,一邊爭(zhēng)奪市場(chǎng)。
“DeepSeek發(fā)布的這個(gè)利潤率,超出很多人意料。相信大廠會(huì)很快落地部署產(chǎn)品。提供大模型推理服務(wù)的云廠商一旦跑通,大模型價(jià)格戰(zhàn)還會(huì)進(jìn)一步加劇!绷嘿惙Q。
第四范式相關(guān)負(fù)責(zé)人也在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)指出,隨著生成式AI的爆發(fā),企業(yè)大模型應(yīng)用需求大幅增加,尤其是DeepSeek的出現(xiàn),讓企業(yè)看到了能以更加低廉的成本應(yīng)用大模型。
在GPU成本居高不下的情況下,充分榨取GPU資源、提高利用率、降低算力成本成為企業(yè)的關(guān)注焦點(diǎn)。以第四范式SageOne IA一體機(jī)為例,相較于傳統(tǒng)AI架構(gòu),該產(chǎn)品可將算力資源利用率提升5至10倍,最高可節(jié)省80%的硬件成本。
“廠商合作”爭(zhēng)奪千億級(jí)市場(chǎng)本地還是云端仍需博弈
從產(chǎn)業(yè)規(guī)模上看,AI一體機(jī)將帶來多大的市場(chǎng)?據(jù)浙商證券(11.570, 0.07, 0.61%)測(cè)算,2025年至2027年,智算一體機(jī)的市場(chǎng)需求將達(dá)到15萬至72萬臺(tái),市場(chǎng)規(guī)模有望突破5200億元。
藍(lán)!罢T惑”下,下場(chǎng)的玩家自然少不了。
據(jù)梁振鵬介紹,目前來看,AI一體機(jī)市場(chǎng)呈現(xiàn)出多方競(jìng)逐的格局,各玩家占比相對(duì)均衡,沒有哪一類玩家占比最大。PC廠商如聯(lián)想集團(tuán)、云計(jì)算廠商如阿里云、垂直場(chǎng)景服務(wù)商如云從科技(19.400, -0.64, -3.19%)、芯片新勢(shì)力如沐曦股份等都在積極布局。郭濤還提到,目前制約AI一體機(jī)成本下探的核心因素主要包括GPU價(jià)格、大模型訓(xùn)練成本以及終端硬件的適配和優(yōu)化。其中芯片是關(guān)鍵,尤其是高性能的GPU。
王鵬進(jìn)一步指出,入場(chǎng)玩家中,PC廠商擁有較好的硬件制造能力和渠道優(yōu)勢(shì),但在軟件算法和模型優(yōu)化方面需要提升;云計(jì)算廠商有較豐富的計(jì)算資源,能提供全方位的AI解決方案,但在硬件制造和渠道上有所欠缺;垂直場(chǎng)景服務(wù)商往往專注于特定行業(yè)或場(chǎng)景的AI應(yīng)用,產(chǎn)品更加貼合實(shí)際需求,但市場(chǎng)規(guī)模和渠道覆蓋可能有限。
如此一來,合作成了不少廠商做AI一體機(jī)的首選。
根據(jù)目前公布的產(chǎn)品細(xì)則,PC廠商/大模型廠商+手握芯片的大廠是較為常見的組合,如聯(lián)想集團(tuán)與沐曦股份、第四范式與華為、恒為科技(34.920, 0.75, 2.19%)與華為等。在第四范式看來,國產(chǎn)AI基礎(chǔ)設(shè)施已經(jīng)進(jìn)入“軟硬協(xié)同、場(chǎng)景驅(qū)動(dòng)”的新階段。
不過,盡管“搭伙”模式相似,各家的技術(shù)路徑卻不同,尤其是在選擇“本地輕量化模型”還是“云端協(xié)同推理”上仍存在分歧。
具體來看,據(jù)薩摩耶云科技集團(tuán)首席經(jīng)濟(jì)學(xué)家鄭磊介紹,本地輕量化模型是指通過模型壓縮、量化、知識(shí)蒸餾等技術(shù),將大模型優(yōu)化為可在本地設(shè)備運(yùn)行的小模型。這種方式的優(yōu)勢(shì)在于低延遲與高實(shí)時(shí)性。然而,本地輕量化模型也存在一些局限性,如輕量化過程可能導(dǎo)致模型精度下降,對(duì)于需要大規(guī)模計(jì)算的任務(wù),本地設(shè)備可能難以勝任。
而云端協(xié)同推理是指將復(fù)雜的推理任務(wù)分配到云端,同時(shí)利用本地設(shè)備進(jìn)行預(yù)處理或簡(jiǎn)單推理。優(yōu)勢(shì)在于云端可以處理復(fù)雜的任務(wù),如深度推理、多輪對(duì)話等。云端可以利用大規(guī)模數(shù)據(jù)進(jìn)行模型訓(xùn)練和更新,也可根據(jù)需求動(dòng)態(tài)分配云端資源。不過,云端協(xié)同推理也面臨數(shù)據(jù)隱私風(fēng)險(xiǎn);網(wǎng)絡(luò)延遲和穩(wěn)定性也會(huì)影響推理效率,且長期使用云端算力還可能導(dǎo)致較高的運(yùn)營成本。
至于如何在數(shù)據(jù)安全與降低本地算力需求之間尋求平衡,在鄭磊看來,“云—邊—端”的協(xié)同混合架構(gòu)可結(jié)合兩者優(yōu)點(diǎn),根據(jù)任務(wù)復(fù)雜度和隱私需求靈活分配云端和本地的計(jì)算資源。隱私敏感和實(shí)時(shí)性要求高的場(chǎng)景,如自動(dòng)駕駛、醫(yī)療設(shè)備等優(yōu)先采用本地輕量化模型;復(fù)雜任務(wù)和需要大規(guī)模數(shù)據(jù)支持的場(chǎng)景,如多輪對(duì)話、知識(shí)生成等則采用云端協(xié)同推理。
第四范式方面還提出,當(dāng)前數(shù)據(jù)安全問題仍是客戶的首要考量,許多企業(yè)更傾向于本地部署模式,尤其是涉及業(yè)務(wù)核心數(shù)據(jù)的場(chǎng)景。在技術(shù)快速迭代的背景下,預(yù)計(jì)在很長一段時(shí)間里,關(guān)于本地還是云端的博弈仍會(huì)繼續(xù)。