算力狂飆下的“能效”革命:英諾達如何用國產(chǎn)EDA給AI芯片“降功耗”?
關(guān)鍵詞: 算力需求,能耗挑戰(zhàn),芯片功耗,功耗設(shè)計瓶頸,英諾達解決方案
在人工智能與高性能計算迅猛發(fā)展的今天,全球算力需求呈現(xiàn)爆發(fā)式增長,而隨之而來的能耗問題已成為制約行業(yè)可持續(xù)發(fā)展的關(guān)鍵瓶頸。

算力爆發(fā)的背后:日益嚴峻的能耗挑戰(zhàn)
根據(jù)中國信通院《綠色算力發(fā)展研究報告》(2025)數(shù)據(jù)顯示:2025至2030年間,全球數(shù)據(jù)中心累計IT設(shè)備負載將新增106GW,年均增長達17.7GW。這一數(shù)字背后,是AI服務(wù)器作為核心驅(qū)動力所帶來的巨大能源壓力。

為更直觀地理解這一規(guī)模,王琦博士做了一個生動的類比:中國三峽水電站的總裝機容量約為22.5GW。這意味著,年均新增的17.7GW負載,相當于每年需新增近0.8個三峽水電站的發(fā)電能力;而規(guī)劃期內(nèi)全部新增負載,則需近5個三峽電站滿負荷運行才能滿足;若以核電為參照,一個典型核電機組的功率約為1GW,那么每年新增負載相當于需新建17至18臺核電機組。
在微觀層面,單次AI請求的耗電量同樣令人震驚。一次標準Google搜索耗電約0.3Wh,而一次AI驅(qū)動的Google搜索耗電高達8.9Wh,提升近30倍(中國信通院《綠色算力發(fā)展研究報告》(2025))。王琦指出:“這還只是開始。當前AI系統(tǒng)的能效,距離人類智能的‘節(jié)能水平’仍有巨大差距。”
芯片功耗的急劇攀升:從300W將到2000W的挑戰(zhàn)
隨著制程工藝與架構(gòu)迭代,AI/HPC加速芯片的熱設(shè)計功耗持續(xù)攀升。據(jù)SemiAnalysis數(shù)據(jù),該類芯片的TDP(Thermal Design Power,熱設(shè)計功耗)從2017年的約300W迅速增長至1400W,未來很可能突破2000W。英偉達、AMD等廠商的產(chǎn)品均呈現(xiàn)相同趨勢。
以英偉達H100 GPU為例,其TDP達700W,而新一代GPU產(chǎn)品功耗提升至1400W。相比之下,CPU的功耗增長較為平緩。一般家用蒸汽電熨斗的功耗通常在1000瓦到2500瓦之間,取中間值則是1500瓦。也代表新一代GPU的功耗水平已接近家用電器如電熨斗的功耗水平,這迫使數(shù)據(jù)中心必須采用液冷等先進散熱方案。
功耗問題不僅是技術(shù)問題,更是商業(yè)戰(zhàn)略問題
在算力爆發(fā)的時代,芯片功耗問題已經(jīng)超越了傳統(tǒng)意義上的技術(shù)范疇,演變?yōu)橛绊懫髽I(yè)核心競爭力的戰(zhàn)略要素。王琦博士對此有著深刻的洞察,他將高功耗帶來的挑戰(zhàn)系統(tǒng)性地歸納為三個關(guān)鍵維度:
技術(shù)維度:物理極限的嚴峻挑戰(zhàn)。隨著制程工藝的不斷演進,芯片面臨的功耗挑戰(zhàn)呈現(xiàn)出三重技術(shù)困境:動態(tài)功耗呈指數(shù)級增長,電源管理復(fù)雜度急劇上升,散熱方案逐漸逼近物理極限。迫使整個行業(yè)轉(zhuǎn)向液冷等更先進的散熱方案。然而,這僅僅是治標不治本的應(yīng)對之策。
商業(yè)維度:市場競爭力的直接威脅。在商業(yè)層面,功耗問題直接轉(zhuǎn)化為企業(yè)的經(jīng)營壓力。過高的功耗導(dǎo)致產(chǎn)品在能效比這一關(guān)鍵指標上失去競爭力,制造成本因需要復(fù)雜的電源管理和散熱系統(tǒng)而大幅攀升,更重要的是,為了解決功耗問題而延長的開發(fā)周期直接影響了產(chǎn)品的上市時間。
戰(zhàn)略維度:發(fā)展路徑的根本抉擇。王琦博士表示:“當前行業(yè)中‘重散熱、輕能效’的做法,就像發(fā)燒了就吃退燒藥,咳嗽就用止咳藥,只解決表面癥狀而不究其根本。而我們應(yīng)該學習中醫(yī)思維,注重系統(tǒng)調(diào)理,從設(shè)計源頭控制功耗?!?/p>
這種理念的差異反映了企業(yè)在技術(shù)路線上的戰(zhàn)略選擇。是繼續(xù)沿著“高功耗-強散熱”的老路艱難前行,還是轉(zhuǎn)向“源頭控制、系統(tǒng)優(yōu)化”的新路徑,這已經(jīng)成為一個關(guān)乎企業(yè)長遠發(fā)展的戰(zhàn)略決策。
功耗設(shè)計流程的三大瓶頸

在深入分析行業(yè)痛點的基礎(chǔ)上,王琦博士指出了當前芯片設(shè)計流程中存在的三個根本性瓶頸,這些瓶頸嚴重制約了功耗優(yōu)化工作的效率和效果。
瓶頸一:優(yōu)化窗口的時效性困境。“功耗優(yōu)化必須宜早不宜遲”,這是他反復(fù)強調(diào)的核心觀點。當前行業(yè)中普遍存在的誤區(qū)是將功耗優(yōu)化工作后置,待到設(shè)計后期甚至流片前才著手解決。然而,功耗優(yōu)化的效果與介入時機密切相關(guān)。一旦錯過早期優(yōu)化窗口,后續(xù)能夠采取的優(yōu)化措施將極其有限,效果也會大打折扣。
瓶頸二:分析效率的工程學挑戰(zhàn)。精度功耗分析嚴重依賴后仿真的完成,這個過程通常需要數(shù)天甚至數(shù)周時間。以一個中等規(guī)模的AI芯片設(shè)計為例,完成一次完整的后仿真可能需要2-3周時間,期間需要處理數(shù)十GB的波形文件,消耗大量的計算資源。這種漫長的分析周期嚴重制約了設(shè)計迭代的速度,使得工程師難以及時獲得反饋并進行優(yōu)化調(diào)整。
瓶頸三:工具生態(tài)的協(xié)同性難題。現(xiàn)代芯片設(shè)計流程中使用的工具鏈存在割裂現(xiàn)象。各個設(shè)計階段使用不同的工具和功耗模型,數(shù)據(jù)格式不統(tǒng)一,信息傳遞不暢。這種割裂導(dǎo)致設(shè)計團隊需要在不同工具間進行頻繁的數(shù)據(jù)轉(zhuǎn)換和驗證,不僅大幅增加了工作量,還引入了額外的誤差風險。更重要的是,這種碎片化的工具生態(tài)使得全局性的功耗優(yōu)化難以實施。
英諾達的破局之道:全流程協(xié)同的解決方案

面對以上瓶頸,英諾達提出了“前端介入、全程協(xié)同”的解決方案。EnFortius?凝鋒?系列低功耗EDA工具。實現(xiàn)在架構(gòu)設(shè)計、RTL編碼等早期階段就開展功耗優(yōu)化工作。
其中,EnFortius? RTL Power Explorer(ERPE)能夠在設(shè)計早期自動識別功耗優(yōu)化機會,實測可幫助客戶降低動態(tài)功耗;而EnFortius? Gate-level Power Analyzer(EGPA)通過創(chuàng)新的波形重放功能,將功耗分析周期從數(shù)周縮短至數(shù)小時,同時保證精度在簽核工具的3%以內(nèi)。

這種全流程的協(xié)同優(yōu)化模式,不僅解決了各個階段的具體問題,更重要的是建立了貫穿始終的功耗優(yōu)化體系,使功耗管理從被動應(yīng)對轉(zhuǎn)變?yōu)橹鲃右?guī)劃,從局部優(yōu)化升級為系統(tǒng)優(yōu)化。
正如王琦博士所言:“我們正在推動一場芯片設(shè)計方法的革命——從依賴個人經(jīng)驗的藝術(shù),轉(zhuǎn)向基于數(shù)據(jù)驅(qū)動的科學。”這場變革的核心,就是要打破傳統(tǒng)設(shè)計流程中的壁壘,實現(xiàn)功耗優(yōu)化的前置化、系統(tǒng)化和智能化。

除此之外,英諾達曜奇?系統(tǒng)驗證云平臺(EnCitius? System Verification Studio),該平臺具備以下特點:基于Palladium Z1/Z2/Z3硬件仿真系統(tǒng)構(gòu)建,其總仿真容量超100億門,單設(shè)計最大容量達46億門;提供PCIe、CXL、USB、Video、Ethernet等各類接口板;數(shù)據(jù)加密傳輸、物理隔離、專業(yè)防火墻保障客戶設(shè)計安全。
同時,他還介紹說,該平臺不僅提供仿真資源,更與EnFortius工具鏈深度融合,實現(xiàn)“基于硬件的功耗驗證閉環(huán)”,為功耗分析提供準確的信號活動信息,助力客戶在早期完成架構(gòu)優(yōu)化與功耗調(diào)優(yōu)。
結(jié)語:AI算力發(fā)展正從“粗放階段”走向“精細時代”
在王琦看來,AI算力發(fā)展正從“大力出奇跡”的粗放階段,轉(zhuǎn)向“高能效、高智慧”的精細時代。“唯有從設(shè)計源頭系統(tǒng)性地解決功耗問題,才能真正突破大算力時代的能效瓶頸。”
英諾達以“性能優(yōu)先”為突破點,通過工具鏈與云平臺的雙輪驅(qū)動,正逐步贏得國內(nèi)先進設(shè)計公司的認可。王琦總結(jié)道:“我們不一定能在所有點上超越國際巨頭,但我們可以在關(guān)鍵路徑上做得更快、更早、更聰明——這正是國產(chǎn)EDA的價值所在?!?/p>
責編:Clover.li