近一年以來,隨著基于大模型技術(shù)的新一輪人工智能技術(shù)浪潮崛起,如何有效應(yīng)對AI部署帶來的功耗和成本挑戰(zhàn)?如何構(gòu)建可持續(xù)的算力系統(tǒng)?AI PC能改善消費電子需求減弱的現(xiàn)狀嗎?一系列的問題,成為整個科技行業(yè)的熱門議題。
近日,新浪科技《科創(chuàng)100人》采訪了英特爾研究院副總裁、英特爾中國研究院院長宋繼強。對話中,宋繼強指出,“應(yīng)對大模型部署的功耗和成本挑戰(zhàn),可以從芯片制程、系統(tǒng)架構(gòu)、異構(gòu)算力以及數(shù)據(jù)中心規(guī)劃設(shè)計等多維度入手!
作為最為底層的芯片算力企業(yè),英特爾和國內(nèi)外眾多云廠商、電信廠商已有超過十年的合作,其間作為顧問去幫這些企業(yè)成立數(shù)據(jù)中心,做架構(gòu)優(yōu)化,過程中積累了大量的經(jīng)驗。談及國內(nèi)該如何構(gòu)建可持續(xù)的算力系統(tǒng)時,宋繼強強調(diào),“在新建數(shù)據(jù)中心的時候,一定要嚴(yán)卡能效比!
在宋繼強看來,AI PC概念的提出,類似于之前在計算機上加上WiFi功能一樣的變革。因為體積和算力的原因,電腦可以把多種算力架構(gòu)組合進去,支持更多的生成式AI創(chuàng)新。
“與手機相比,PC能支持更多生成式AI創(chuàng)新”
近一年以來,隨著生成式AI技術(shù)的快速發(fā)展,越來越多的PC和消費電子廠商紛紛圍繞AI技術(shù)展開創(chuàng)新,AI PC的概念也隨之出現(xiàn)。作為個人電腦領(lǐng)域最為底層的芯片算力提供商,英特爾如何看待這一輪AI浪潮對于PC等消費電子行業(yè)的影響呢?
宋繼強表示,AI PC這一波新的技術(shù)增長或應(yīng)用增長拐點,就像當(dāng)年把WiFi做到筆記本上一樣,因為他突然給傳統(tǒng)的 PC或筆記本增加了一些AI能力,這會導(dǎo)致交互方式發(fā)生很大的變化,如果PC再去結(jié)合諸如邊緣智能設(shè)備進行工作,這將帶來很多生產(chǎn)力上的改變,催生出一些新興的應(yīng)用。
“這些被催生出的新興應(yīng)用都跟終端設(shè)備有關(guān),但目前在手機上的挑戰(zhàn)可能要比在 PC上更大。”宋繼強表示。
在宋繼強看來,由于手機體積較小能夠支撐的算力有限,而筆記本或者臺式機則可以把多種架構(gòu)組合起來去實現(xiàn)更多的功能,因此也將能夠支撐更多的硬件創(chuàng)新。
“應(yīng)對AI大模型部署挑戰(zhàn),要從三方面下手”
在部署大模型的過程中,AI工作負載帶來的功耗和成本挑戰(zhàn),是目前業(yè)界迫切希望解決的。在宋繼強看來,AI工作的功耗問題,實際上可以從四方面分別進行解讀。
第一,芯片本身是否來自高能效比的工藝節(jié)點。如果我們想讓AI性能和能效提高,就要選用更具有高能效比的工藝節(jié)點去生產(chǎn)。比如,英特爾現(xiàn)在4年5個節(jié)點往前推進,從Intel 7、Intel 4、Intel 3,到2024年上半年和下半年分別會大批量生產(chǎn)的Intel 20A和Intel 18A,這些節(jié)點每代都會比前一代有兩位數(shù)性能提升。
“這些都是相對絕對的,因為它是半導(dǎo)體制程所帶來,能定義出一個晶體管的能效比、漏電情況、計算次數(shù)等,這是最底層的,也是芯片級的。”宋繼強表示。
第二,架構(gòu)設(shè)計是否能夠跟工作負載特點吻合。有了基礎(chǔ)的晶體管制造工藝后,上面就是架構(gòu)層的事,是如何組織晶體管并讓它去形成技術(shù)。這里會涉及CPU、GPU、NPU以及DPU等不同的架構(gòu),這些架構(gòu)由于工作模式不同,所以對于自己擅長那部分的工作負載能效比就挺好。比如在模型部署應(yīng)用里,有一些是屬于前期的數(shù)據(jù)清洗和處理分析,包括數(shù)據(jù)結(jié)構(gòu)的優(yōu)化等,這些通過傳統(tǒng)CPU加上一些內(nèi)存架構(gòu)優(yōu)化,其實就挺好。如果后面涉及大模型,再引入GPU或者一些專門的AI加速器,性價比會更好。
在宋繼強看來,現(xiàn)在的大模型所面臨的其實不是計算式主瓶頸,而是內(nèi)存的帶寬和容量是一個很大的瓶頸,所以整個系統(tǒng)的架構(gòu)里面是不是把這部分專門進行優(yōu)化,也是它最后效率高低的一個差別。因為只要你負載沒運行完,這些都在耗電,不管它是在空轉(zhuǎn)地等數(shù)據(jù),還是其他的都在耗電。同時,一些復(fù)雜的工作也可以用更具突破性的架構(gòu)去實現(xiàn),比如說類腦計算芯片,做同一類任務(wù),你用類腦芯片去實現(xiàn)和用這個傳統(tǒng)的CPU+GPU實現(xiàn),他們的能效比、能耗能相差到千倍以上。
上層系統(tǒng)是否從網(wǎng)絡(luò)到軟件都進行了優(yōu)化。以數(shù)據(jù)中心服務(wù)器是否用最先進的綠色計算方案為例,在整個服務(wù)器數(shù)據(jù)中心里,要知道怎么給它供電、散熱,怎么去減少空調(diào)的功率。因為在數(shù)據(jù)中心里邊,除了數(shù)據(jù)中心計算消耗的電量外,它產(chǎn)生了熱,空調(diào)就要去對它進行冷卻,所以空調(diào)的電量也是能耗的一部分。
當(dāng)然,宋繼強也看到,對于想要提高AI能效比的企業(yè)而言,想要很好地兼顧好這些不同層面的技術(shù)因素,難度也是非常大的。在數(shù)智化需求側(cè)期待快速提升時,有什么基于現(xiàn)在技術(shù)更靈活、快速的方案呢?據(jù)他介紹,在芯片制造、處理器架構(gòu)以及整個計算系統(tǒng)構(gòu)成環(huán)節(jié),英特爾IDM2.0所提供的系統(tǒng)級代工服務(wù),能夠給客戶提供全棧式的優(yōu)化計算方案。此外,英特爾還可以通過專用軟件工具或合作客戶解決方案,去幫客戶優(yōu)化并構(gòu)造解決相應(yīng)的AI能耗和成本問題。
“建數(shù)據(jù)中心,生態(tài)不統(tǒng)一最讓人頭疼”
據(jù)宋繼強介紹,在數(shù)據(jù)中心能耗優(yōu)化和算網(wǎng)融合的能效比優(yōu)化方面,英特爾和國內(nèi)外支持的眾多云廠商、電信廠商,已有超過十年的合作歷史,英特爾通常會作為顧問去幫這些企業(yè)成立數(shù)據(jù)中心,并做整個架構(gòu)的優(yōu)化,過程中也積累了大量的經(jīng)驗。
在宋繼強看來,在推動可持續(xù)的算力生態(tài)建設(shè)過程中,一定要嚴(yán)卡能效比。畢竟,現(xiàn)在國內(nèi)數(shù)據(jù)中心上量太快了,各個城市都在建設(shè)。因此,一定要通過數(shù)智驅(qū)動等手段,把能效真正地降下來。比如,通過加上傳感器做運維輔助,讓整個IT系統(tǒng)在運行工作負載的時候能夠節(jié)能;又或者通過優(yōu)化空調(diào)用電,做到非IT系統(tǒng)的節(jié)能。
他結(jié)合英特爾綠色數(shù)據(jù)中心技術(shù)框架2.0分享表示,在建數(shù)據(jù)中心時鼓勵要更多地采用稍微先進一些的數(shù)據(jù)中心架構(gòu)模式!耙驗,一旦數(shù)據(jù)中心建成并成為基礎(chǔ)設(shè)施,都是朝著使用10—15年去的,如果中間再去替換的話,成本都非常高”。因此,在做實施時,盡量找有前瞻性的企業(yè)或顧問團來做方案,也是非常重要的。
宋繼強表示,國內(nèi)現(xiàn)在在建一些新的計算中心時,有時候也會找英特爾去做咨詢。會發(fā)現(xiàn),他們遇到的一些問題是,之前采用的一些異構(gòu)算力或者技術(shù)供應(yīng)商,經(jīng)歷一年兩年以后都消失了,又得重新迭代。“所以現(xiàn)在國內(nèi)建計算中心的時候也是很頭疼的,而且大家的生態(tài)都不統(tǒng)一,在這上面開發(fā)應(yīng)用是很大的一個投資風(fēng)險。”
據(jù)他介紹,目前英特爾也會參與國內(nèi)一些智能算力中心的硬件能效比或計算能力評測中,去定制一些行業(yè)標(biāo)準(zhǔn),去比較不同芯片或不同架構(gòu)組合對于解決問題的能力,做類似于基準(zhǔn)測試的定義,進而促進行業(yè)的規(guī)范發(fā)展。