中信證券:Token量井噴導(dǎo)致算力荒 國產(chǎn)算力在推理端加速突圍
中信證券發(fā)布研報(bào)稱,Agent&多模態(tài)等應(yīng)用爆發(fā)導(dǎo)致國內(nèi)算力荒,國產(chǎn)大模型在推理端積極適配為國產(chǎn)算力廠商帶來加速放量機(jī)遇,預(yù)計(jì)2026年國產(chǎn)算力芯片出貨量至少實(shí)現(xiàn)翻倍以上增長,將為算力設(shè)計(jì)公司、先進(jìn)制程、先進(jìn)封裝、先進(jìn)存儲以及配套產(chǎn)業(yè)鏈帶來強(qiáng)勁增長動能。建議關(guān)注:1)AI芯片設(shè)計(jì)公司。2)晶圓代工與先進(jìn)封裝。3)存儲。4)其他。
中信證券主要觀點(diǎn)如下:
Token井噴:全民養(yǎng)蝦&多模態(tài)帶動驅(qū)動需求爆發(fā)。
進(jìn)入2026年以來,全球算力需求快速增長,增長曲線陡峭,2026年4月全球最大的API聚合平臺 OpenRouter平臺周度累計(jì)Token消耗量較一年前提升約7-8倍,其中國產(chǎn)大模型是爆發(fā)主驅(qū)力,OpenRouter口徑下最新市占率~40%?!叭耩B(yǎng)蝦”及多模態(tài)AI應(yīng)用普及是算力需求邊際加速的兩項(xiàng)核心催化:
1)“全民養(yǎng)蝦”熱潮下Agent常態(tài)化運(yùn)行,負(fù)載常駐對算力需求快速提升。以 OpenClaw 為代表的 AI Agent 單次任務(wù)消耗Token是ChatBot的10-100倍,而國內(nèi)廠商積極布局紛紛推出“國產(chǎn)龍蝦”進(jìn)一步加速國內(nèi)“養(yǎng)蝦”普及并拉升對應(yīng)算力支持需求。
2)多模態(tài)應(yīng)用普及拉升單次交互消耗。2026年以來文生圖、文生視頻等AI多模態(tài)應(yīng)用持續(xù)爆火,圖片輸入與生成、視頻識別與生成相比于純文本對話,單次交互對應(yīng)的Token 消耗通常呈數(shù)量級上升;而字節(jié)Seedance等國產(chǎn)多模態(tài)大模型快速崛起,國內(nèi)多模態(tài)AI應(yīng)用熱潮加速爆火。
算力荒:大模型漲價(jià)&限額、算力租賃售罄。
Token調(diào)用量井噴帶來的是算力需求極大爆發(fā),與此同時(shí)供給側(cè)受到各類硬約束短期邊際增量有限,目前國內(nèi)外均出現(xiàn)了嚴(yán)重的算力荒。具體來看,
1)模型漲價(jià)及高峰限額措施:如騰訊云3月上調(diào)混元系列核心模型價(jià)格約 430%+;4月上調(diào)AI算力、容器服務(wù)及彈性 MapReduce等產(chǎn)品刊例價(jià)約5%;2026年2-3月,國產(chǎn)大模型如Kimi在使用過程中時(shí)常出現(xiàn)“高峰期算力不足”提示;海外大模型Claude宣布通過調(diào)整高峰時(shí)段用戶會話時(shí)長限制以減輕高峰期算力壓力。
2)B端算力租賃市場AI芯片租賃價(jià)格走高:SemiAnalysis 數(shù)據(jù)H100 的一年期租賃合約價(jià)格已由 2025 年 10 月的低點(diǎn)約 1.70 美元/小時(shí)/GPU 提升至 2026 年 3 月的 2.35 美元/小時(shí)/GPU,漲幅近 40%。
3)消費(fèi)級旗艦游戲顯卡、主機(jī)的溢價(jià)與缺貨:包括英偉達(dá)旗艦級游戲顯卡RTX 5090、蘋果Mac mini M4主機(jī)等。
4)主流AI應(yīng)用(如字節(jié)seedance等)生成反饋的排隊(duì)等待、面向AI 編程工具開發(fā)者群體的Coding plan套餐缺貨與售罄。此外2月以來國內(nèi)頭部云廠商及模型廠商均明確公開提及算力資源緊缺,亦是國內(nèi)算力荒的直接證明。
國產(chǎn)算力:本土推理卡迎來加速放量機(jī)遇。
AI應(yīng)用爆發(fā)對應(yīng)的國內(nèi)算力荒將會加速國產(chǎn)卡放量,其中對推理芯片的帶動更加直接。AI芯片需求可以分為訓(xùn)練和推理,目前Agent和多模態(tài)應(yīng)用的爆發(fā)對推理端算力需求拉動極大,而從國產(chǎn)算力導(dǎo)入難度角度來看,推理環(huán)節(jié)對算力產(chǎn)品綜合性能要求相較訓(xùn)練端任務(wù)更低,國產(chǎn)算力芯片廠商通過與互聯(lián)網(wǎng)廠商深度合作(針對特定需求定制化/優(yōu)化),能夠提供更適配互聯(lián)網(wǎng)廠商需求的推理芯片,國產(chǎn)替代節(jié)奏相較于訓(xùn)練端進(jìn)展更快。
當(dāng)前國產(chǎn)大模型正積極適配國產(chǎn)算力卡,尤其是在推理端,如Minimax、智譜、DeepSeek均宣布與華為昇騰、摩爾線程、沐曦、海光、寒武紀(jì)等國產(chǎn)芯片進(jìn)行適配與合作。當(dāng)前國產(chǎn)單芯片性能加速追趕,但仍落后英偉達(dá)1~2代,看好在國內(nèi)算力荒背景下國產(chǎn)推理芯片等AI芯片迎來爆發(fā)增長機(jī)遇,預(yù)估國內(nèi)AI芯片市場當(dāng)前國產(chǎn)化率約30~40%,2030年有望提升至60~70%。
風(fēng)險(xiǎn)因素:
AI需求不及預(yù)期;國產(chǎn)大模型發(fā)展不及預(yù)期;國產(chǎn)推理芯片發(fā)展不及預(yù)期;國內(nèi)產(chǎn)業(yè)鏈發(fā)展不及預(yù)期;技術(shù)變革與產(chǎn)品迭代風(fēng)險(xiǎn);宏觀經(jīng)濟(jì)波動及地緣政治風(fēng)險(xiǎn)。
免責(zé)聲明:本頁所載內(nèi)容來旨在分享更多信息,不代表九方智投觀點(diǎn),不構(gòu)成投資建議。據(jù)此操作風(fēng)險(xiǎn)自擔(dān)。投資有風(fēng)險(xiǎn)、入市需謹(jǐn)慎。
暫無評論
趕快搶個沙發(fā)吧
推薦閱讀
相關(guān)股票
相關(guān)板塊
相關(guān)資訊
掃碼下載
九方智投app
掃碼關(guān)注
九方智投公眾號
頭條熱搜
漲幅排行榜
寫評論
聲明:用戶發(fā)表的所有言論等僅代表個人觀點(diǎn),與本網(wǎng)站立場無關(guān),不對您構(gòu)成任何投資建議。《九方智投用戶互動發(fā)言管理規(guī)定》