必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟(jì)5G手機(jī)智能汽車智慧城市會(huì)展特約記者

大模型不再拼“塊頭”

2025年11月27日 07:18北青網(wǎng)

如今,大模型蓬勃發(fā)展,有沒(méi)有指標(biāo)來(lái)衡量AI大模型的“智力能力水平”?近日,清華大學(xué)研究團(tuán)隊(duì)提出了大模型的密度法則,相關(guān)論文刊發(fā)于自然子刊《自然·機(jī)器智能》上。密度法則揭示大語(yǔ)言模型的最大能力密度隨時(shí)間呈指數(shù)級(jí)增長(zhǎng),2023年2月至2025年4月,約每3.5個(gè)月翻一倍。

計(jì)算機(jī)領(lǐng)域的“摩爾定律”大家已經(jīng)耳熟能詳:芯片上可容納的晶體管數(shù)量,每隔一段時(shí)間就會(huì)翻一番。計(jì)算機(jī)的強(qiáng)大,不是因?yàn)樾酒兊孟穹孔右粯哟,而是因(yàn)樗谥讣咨w大小的面積上集成了天文數(shù)字的計(jì)算單元。清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系助理研究員肖朝軍告訴科技日?qǐng)?bào)記者,大模型的智力能力水平應(yīng)該也有一個(gè)指標(biāo),這就是“能力密度”。

研究的核心假設(shè)是,采用相同制造工藝、充分訓(xùn)練的不同尺寸模型,其能力密度相同。正如芯片行業(yè)通過(guò)提升電路密度實(shí)現(xiàn)了計(jì)算設(shè)備的小型化和普惠化,大模型也在通過(guò)提升能力密度實(shí)現(xiàn)高效化發(fā)展。

肖朝軍說(shuō),過(guò)去,在規(guī)模法則的指引下,大家關(guān)心一個(gè)大模型的“塊頭”(參數(shù)量)有多大,越大就越智能,就像關(guān)心一個(gè)舉重運(yùn)動(dòng)員的體重,體重越重,力量越大,F(xiàn)在,密度法則從另一個(gè)視角揭示了大模型“高效發(fā)展”的規(guī)律——我們更應(yīng)該關(guān)心它的“能力密度”,即每一單位“腦細(xì)胞”(參數(shù))里包含了多少“智慧”。“如同評(píng)價(jià)一個(gè)武林高手,看的不是他肌肉多發(fā)達(dá),而是他一招一式里蘊(yùn)含了多少功力!毙こ娬f(shuō)。

研究團(tuán)隊(duì)對(duì)51個(gè)近年來(lái)發(fā)布的開(kāi)源大模型進(jìn)行了系統(tǒng)分析,他們發(fā)現(xiàn)了一個(gè)重要規(guī)律:大模型的最大能力密度隨時(shí)間呈指數(shù)級(jí)增長(zhǎng),2023年以來(lái)平均每3.5個(gè)月翻一倍。這意味著,隨著“數(shù)據(jù)—算力—算法”的協(xié)同發(fā)展,可以用更少參數(shù)實(shí)現(xiàn)相同的智能水平。

團(tuán)隊(duì)還給出了一些推論。比如,同能力模型的推理開(kāi)銷隨時(shí)間指數(shù)級(jí)下降,同時(shí)大模型能力密度正在加速增強(qiáng)。ChatGPT發(fā)布前能力密度每4.8個(gè)月翻倍,而ChatGPT發(fā)布后能力密度每3.2個(gè)月翻倍,密度增強(qiáng)速度提升了50%。這表明隨著大模型技術(shù)的成熟和開(kāi)源生態(tài)的繁榮,能力密度提升正在加速。

肖朝軍表示,從直觀上看,能力密度越高,大模型就越聰明,運(yùn)行大模型所需要的算力越少,成本就越低。圍繞這一科學(xué)指引,學(xué)術(shù)界、工業(yè)界能進(jìn)行多維度的技術(shù)創(chuàng)新,讓大模型越來(lái)越普惠。

從大模型的應(yīng)用角度來(lái)說(shuō),密度法則也意味著AI正在變得越來(lái)越可用。肖朝軍介紹,隨著芯片電路密度(摩爾定律)和模型能力密度(密度法則)持續(xù)增強(qiáng),此前只能在云端部署的大模型,未來(lái)用終端芯片就裝得下、跑得動(dòng)。大模型跑在終端設(shè)備上,在響應(yīng)速度、用戶隱私等方面具備先天優(yōu)勢(shì),可以為用戶做得更多。

肖朝軍舉了個(gè)例子。此前大模型在智能汽車上的應(yīng)用,都是“幫我打開(kāi)車窗”“幫我查一下附近的餐廳”等“被動(dòng)式”服務(wù)。端側(cè)模型“上車”后,通過(guò)豐富的“艙內(nèi)外感知”和“意圖理解”能力,可以實(shí)現(xiàn)艙內(nèi)外環(huán)境的多模態(tài)感知融合與主動(dòng)決策閉環(huán),驅(qū)動(dòng)智能座艙從“被動(dòng)響應(yīng)”走向“主動(dòng)服務(wù)”,讓智能浸潤(rùn)每一次駕駛體驗(yàn)。

編 輯:高靖宇
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報(bào)價(jià)聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號(hào)-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)

公司名稱: 北京飛象互動(dòng)文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像