每日經(jīng)濟新聞 2026-03-23 10:25:28
從算力層面來看,英偉達的芯片產(chǎn)品是行業(yè)發(fā)展的核心風(fēng)向標(biāo)。作為全球AI計算芯片領(lǐng)域占據(jù)絕對市場份額的龍頭企業(yè),英偉達的產(chǎn)品迭代節(jié)奏,對整個AI硬件行業(yè)具備極強的指引作用。
從英偉達的產(chǎn)品迭代來看,芯片制程正在持續(xù)微縮。此前推動全球半導(dǎo)體產(chǎn)業(yè)制程持續(xù)迭代的核心動力是智能手機,比如此前臺積電最先進的制程工藝,絕大部分產(chǎn)能都優(yōu)先供應(yīng)蘋果公司。但現(xiàn)在,推動半導(dǎo)體制程迭代的核心主角已經(jīng)發(fā)生變化,未來這一趨勢也將持續(xù)延續(xù)。
為什么要持續(xù)推進制程升級?核心是讓AI計算能夠充分受益于摩爾定律帶來的性能紅利。但摩爾定律的迭代速度相對有限,通常需要兩年多時間才能實現(xiàn)性能翻倍。當(dāng)前半導(dǎo)體制程逐漸逼近1納米物理極限,摩爾定律的迭代速度還在持續(xù)放緩。但與此同時,AI算力需求呈現(xiàn)爆發(fā)式增長,如何填補這一供需缺口,成為行業(yè)核心命題。
在這樣的行業(yè)背景下,行業(yè)選擇通過擴大芯片部署規(guī)模來滿足算力需求——當(dāng)摩爾定律帶來的單芯片性能提升跟不上算力需求增長時,就通過增加芯片投放量、擴建數(shù)據(jù)中心的方式,填補算力缺口。這也直接推動了算力芯片市場的高速增長。海外市場中,無論是英偉達的GPU,還是谷歌的TPU等AI算力芯片,均實現(xiàn)了極快的增長。以上就是算力層面的行業(yè)發(fā)展趨勢。
對于存儲的情況,其最本質(zhì)的需求就來自于AI的帶動。因為我們知道,AI領(lǐng)域需要大量存儲來存放數(shù)據(jù),不管是GPU上面有很多的HBM——HBM就是一種高帶寬內(nèi)存。除了HBM以外,英偉達還在其機柜里面配置了大量DRAM、NAND等存儲芯片,催生了對應(yīng)的需求。現(xiàn)在隨著agent的快速發(fā)展以及放量,尤其推理市場現(xiàn)在起量得這么快,我們知道很多用戶,比如很多人可以看到自己的公司里面可能已經(jīng)部署了一些大模型了。這種大模型在部署的時候,本身帶有海量參數(shù),每個大模型的參數(shù)規(guī)模都極為龐大,用來存儲這些參數(shù)的存儲需求也十分強勁。后續(xù)大模型還在不斷地走強,那么從這一發(fā)展邏輯來看,后續(xù)存儲的需求還會快速地增加。就目前來看,存儲的漲價可能還會持續(xù)一段時間。所以存儲的景氣度,本質(zhì)上還是來源于AI的計算需求在快速地增長,從而帶來的價格上行效應(yīng)。
而運力,是我們今天想重點給大家分享的板塊。其實對于運力而言,其組網(wǎng)邏輯主要分為兩個部分?;蛘哒f我們可以想象,海外的云廠商要進行組網(wǎng),是通過兩個階段實現(xiàn)的:第一個是scale up。
這個scale up怎么理解?比如英偉達之前的A100以及H100的GPU,都是以八張GPU組成一個小型集群,再把這些服務(wù)器通過柜外連接,組成超大規(guī)模的數(shù)據(jù)中心。單臺服務(wù)器內(nèi)部的GPU互聯(lián),我們就可以看作是scale up,它原本就要把服務(wù)器里面的GPU連接成一個整體,服務(wù)器之內(nèi)的互聯(lián)就是scale up。我們從scale up的發(fā)展來看,單集群內(nèi)的GPU數(shù)量在不斷地增加。目前來看,單柜GPU數(shù)量已經(jīng)增加到72卡,后續(xù)本次發(fā)布的576卡機柜將進一步刷新單機柜算力規(guī)模。這也是剛剛提到的,我們在GTC大會上看到的核心發(fā)布內(nèi)容。
Scale out是什么?就是要把這些服務(wù)器或者機柜組成一個超大規(guī)模的整體,只有組成完整的大規(guī)模集群、搭建起超大型數(shù)據(jù)中心之后,才能開展AI的訓(xùn)練以及推理工作。從目前來看,海外頭部的云廠商,已經(jīng)建成了十幾萬卡的GPU集群,整體發(fā)展速度非??臁?/p>
那么我們在實現(xiàn)scale up和scale out的互聯(lián)時,有哪些可用的技術(shù)方案?第一個是PCB,可能有的朋友知道PCB是什么。大家如果在家拆過鬧鐘或者其他電器,就會知道里面基本都會有一塊PCB。PCB就是印刷電路板,被稱作電子元器件之母,其核心作用就是讓電路能夠更高效、更穩(wěn)定地運行。當(dāng)然,不同PCB之間的規(guī)格差異極大,比如我們家里鬧鐘里面用的PCB,一平方米可能也就100多塊錢。
但是像英偉達這類企業(yè),或是其他云廠商,用于GPU計算芯片的PCB,規(guī)格都非常高:基材目前基本都在M8級別,后續(xù)還會向M9甚至M10的材料迭代;層數(shù)也很高,普遍能達到二三十層,還帶有一次DI的相關(guān)設(shè)計。所以AI場景所用的PCB單價極高,部分產(chǎn)品一平方米能賣到幾萬塊錢,甚至更高。
所以我們可以看到,相關(guān)PCB企業(yè)的業(yè)績成長得也非常迅猛,從市場規(guī)模來看,也在快速地擴大,目前整個行業(yè)產(chǎn)能都處于供不應(yīng)求的狀態(tài)。大家可以看到,很多廠商目前都在快速地擴產(chǎn),后續(xù)產(chǎn)能釋放之后,對相關(guān)廠商的業(yè)績提振是比較樂觀的。當(dāng)然這里只是給大家做行業(yè)情況的分析列示,不做任何個股推薦。
第二種備選的互聯(lián)方式是銅連接。大家可以看到,我列示了英偉達機柜背面的實拍情況,機柜背面這些銀白色、一捆一捆的部件,就是英偉達目前在NVL72機柜中所用的銅纜,整體用量非常大。

資料來源:Nvidia
這些銅纜的作用是什么?大家可以看下方的示意圖,英偉達的機柜內(nèi)部是一個個獨立的托盤,每個計算托盤里放置4個GPU,一個機柜內(nèi)有18個計算托盤,所以總共有72張GPU。計算托盤內(nèi)部的GPU,主要通過PCB來連接。從內(nèi)部結(jié)構(gòu)來看,這個結(jié)構(gòu)就相當(dāng)于一個托盤,每個托盤里有兩個超級芯片,每個超級芯片上搭載兩個GPU,下方藍色的部分就是兩塊PCB,也就是我們剛剛提到的高規(guī)格PCB。這里我們可以看到,PCB將4個GPU組成了一個完整的計算托盤。

下一步,就是要把所有的計算托盤,組成一個完整的機柜整體。而機柜內(nèi)部的跨托盤互聯(lián),就是靠銅纜來實現(xiàn)的?;揪褪峭ㄟ^銅纜連接NV Switch芯片,從而把機柜內(nèi)所有72張GPU組成一個完整的互聯(lián)整體。

資料來源:Nvidia
但是銅纜也有自身的技術(shù)局限。比如目前單層網(wǎng)絡(luò)下,用銅纜組成72卡集群已經(jīng)接近物理極限,如果再疊加一層網(wǎng)絡(luò),最多也只能擴展到576卡,且這還只是技術(shù)層面的設(shè)想,未必能完全實現(xiàn)。因為銅本身存在諸多物理限制,我們知道銅是導(dǎo)體,而當(dāng)下數(shù)據(jù)中心的功耗極高,功耗高的核心原因,是計算芯片的計算吞吐量極大,數(shù)據(jù)傳輸過程中的運算量極高,傳輸?shù)碾娏鞲蟆⑿盘栴l率也更快。

資料來源:Nvidia
如果用銅纜承擔(dān)數(shù)據(jù)傳輸任務(wù),極有可能出現(xiàn)過度發(fā)熱的問題。持續(xù)發(fā)熱就意味著能量損耗,長時間工作還會引發(fā)數(shù)據(jù)丟失等問題,這在AI訓(xùn)練與推理場景中是絕對無法容忍的。為什么?我們以訓(xùn)練為例,AI模型需要通過一次次的迭代,不斷尋找到最優(yōu)的參數(shù)集合,如果每次迭代都丟失一部分?jǐn)?shù)據(jù),最終很可能導(dǎo)致整個訓(xùn)練過程完全無效。所以銅纜的核心問題就在這里:它只能支持短距離的連接,傳輸距離過長就無法滿足需求。從目前來看,銅纜最多只能支持幾米的傳輸距離,而英偉達的互聯(lián)網(wǎng)絡(luò)已經(jīng)升級到800G通信規(guī)格,后續(xù)還會進一步向1.6T升級,銅纜的局限性會持續(xù)凸顯。
當(dāng)然,在英偉達機柜規(guī)格持續(xù)提升的過程中,柜內(nèi)互聯(lián)的整體市場規(guī)模也在不斷擴大。在這個擴容的過程中,我們認(rèn)為無論是PCB還是銅纜,后續(xù)都能獲得可觀的市場份額。但如果要讓它們承擔(dān)柜內(nèi)全部的互聯(lián)任務(wù),尤其是本次發(fā)布的576卡機柜的互聯(lián)需求,僅靠銅和PCB在技術(shù)上存在不小的難度。后續(xù)隨著Feynman芯片的量產(chǎn)落地,將正式引入CPO技術(shù),同步推進柜內(nèi)可插拔光模塊等光互聯(lián)方案的落地應(yīng)用。
柜外的互聯(lián)要如何實現(xiàn)?從英偉達的方案來看,其目前所用的網(wǎng)絡(luò)架構(gòu),主要是葉脊網(wǎng)絡(luò)。什么叫葉脊網(wǎng)絡(luò)?大家可以看下方的拓?fù)鋱D,葉脊網(wǎng)絡(luò)的架構(gòu)其實很簡單,看起來就像一棵樹,從樹根不斷長出更多的樹枝,樹枝再進一步分化出更細(xì)的枝丫,最終連接到葉片,就是這樣的架構(gòu)。

注:以上為根據(jù)英偉達資料推論所得,具體應(yīng)用網(wǎng)絡(luò)會在客戶間有一定差異
葉脊網(wǎng)絡(luò)的邏輯就是如此,比如我們假設(shè)有四個輸入端口,中間設(shè)置兩臺交換機,從這個架構(gòu)來看,最基本的要求,就是任意一個輸入端口到任意一個輸出端口之間,至少要有一條通信通路。
而所有的交換機不僅承擔(dān)輸入功能,也承擔(dān)輸出功能,如果我們把上面的拓?fù)鋱D沿中線對折,就形成了英偉達所用的網(wǎng)絡(luò)架構(gòu)。大家可以看到,最上層是脊交換機,把下層的葉交換機連接成一個整體,葉交換機再進一步連接大量的GPU,最終組成數(shù)據(jù)中心的完整集群。
這個架構(gòu)中需要用到大量的光模塊。光模塊的應(yīng)用場景在哪里?大家可以看到,拓?fù)鋱D里標(biāo)注的這些線路,其實都是光纜,而交換機側(cè)和服務(wù)器側(cè)處理信號時,用的都是電信號。所以信號要從一臺交換機傳輸?shù)搅硪慌_交換機,或是從一臺服務(wù)器傳輸?shù)搅硪慌_服務(wù)器,傳輸過程中需要多次完成光電轉(zhuǎn)換,而這個核心功能,就是由光模塊來實現(xiàn)的。
我在這里給大家做了相關(guān)測算:在三層網(wǎng)絡(luò)架構(gòu)下,GPU與光模塊的配比大約是1:6。當(dāng)然這里是用同規(guī)格的光模塊進行測算的,比如在Hopper架構(gòu)芯片下,1:6的配比對應(yīng)的是400G光模塊;在Blackwell架構(gòu)芯片下,1:6的配比對應(yīng)的是800G光模塊;下一代Rubin架構(gòu),對應(yīng)的則是1.6T光模塊。當(dāng)然大家也知道,光模塊有很強的靈活適配性,兩個800G的光模塊可以合并當(dāng)作一個1.6T的光模塊使用,一個1.6T的光模塊也可以拆分成兩個800G的光模塊使用。所以這個配比在實際產(chǎn)品應(yīng)用中可能會有小幅波動,但整體對應(yīng)的帶寬需求是固定的,因此三層網(wǎng)絡(luò)下的配比基本維持在1:6左右。
由此可以看到,隨著下游芯片的快速放量,光模塊的整體市場規(guī)模會迎來快速增長。后續(xù)來看,“光入柜內(nèi)”會是整個市場預(yù)期最高的發(fā)展方向之一。為什么會有光入柜內(nèi)這樣的預(yù)期?剛才我已經(jīng)給大家介紹過,實現(xiàn)scale up和scale out互聯(lián)的技術(shù)方案,目前只有三種:銅連接、PCB,以及光模塊。目前在英偉達的技術(shù)體系中,scale up對應(yīng)的柜內(nèi)互聯(lián),全部通過電連接實現(xiàn),也就是銅纜和PCB;而柜外的長距離互聯(lián),基本都通過光模塊來實現(xiàn)。
往后面去看,正是因為Scale Up在不斷地擴張,我們可以看到從8卡到72卡再到576卡,甚至后續(xù)規(guī)??赡軙絹碓酱?、覆蓋的卡量越來越多。隨著GPU的數(shù)量在不斷地增加,對應(yīng)的部署空間也在不斷地擴大,對吧?所以大家可以看到,比如本次發(fā)布的576卡的機柜落地后,所需的部署空間就已經(jīng)非??捎^了。
對于這么大的部署空間而言,不管是PCB還是銅纜,都會存在自身的固有局限。比如說PCB無法制造得過大,不可能做出一間屋子那么大的PCB板,因為其內(nèi)部尤其是多層板的壓合工藝,會受到諸多機械條件的限制。而銅纜則受自身物理特性的限制,無法實現(xiàn)長距離的信號傳輸。所以其實在scale up市場規(guī)模持續(xù)擴大的過程中,光技術(shù)后續(xù)很有可能會成為核心選擇。
在scale up規(guī)模持續(xù)擴大的過程中,我再強調(diào)一下:scale up的市場規(guī)模在不斷擴張的過程中,首先PCB的成長性是比較強的。不管是本次發(fā)布的Rubin Ultra采用的正交背板,還是其技術(shù)持續(xù)升級、層數(shù)不斷增加,亦或是所用材料的性能持續(xù)提升,PCB的成長性都十分強勁。我只是想說明,在scale up規(guī)模持續(xù)增長的過程中,PCB與銅纜很難獨自承接市場的全部份額。所以往后面去看,光技術(shù)會是非常重要的選擇。
那么scale up這個市場到底有多大?從目前來看,即便我們給大家做相關(guān)測算,結(jié)果也并不具備足夠的參考性。但從博通CEO的表述來看,該市場規(guī)模有5到10倍的增長空間。雖然產(chǎn)業(yè)鏈上有5到10倍的增長預(yù)期,但各家公司可能都有自身的發(fā)展訴求。從我們目前的觀察來看,該市場規(guī)模至少會超過柜外市場。
對于當(dāng)前的可插拔光模塊廠商而言,對應(yīng)的市場機會大概是怎樣的?我們知道,當(dāng)前的scale out市場,大致可以理解為柜外市場,已經(jīng)是可插拔光模塊的核心主戰(zhàn)場。而后續(xù)的scale up場景中,采用的可能是可插拔光模塊,也可能是CPO。但無論是可插拔光模塊還是CPO,對于當(dāng)前的行業(yè)龍頭廠商而言,都有充足的訂單機會可以承接。即便是CPO,也有諸多相關(guān)方案正在驗證階段,后續(xù)有望拿到大量訂單,所以大家也不用過度擔(dān)心。
總體從產(chǎn)業(yè)層面來看,算力、存力、運力仍在快速地成長。在這樣的發(fā)展過程中,相關(guān)廠商都將迎來更多的成長機會。
長期來看,AI行業(yè)發(fā)展遠未觸頂,2026年全球AI資本開支預(yù)計超7000億美元,Agent技術(shù)進入規(guī)?;逃迷辏a(chǎn)業(yè)成長空間全面打開。投資層面,核心推薦通信ETF國泰(515880),光模塊、服務(wù)器等算力核心權(quán)重超75%,2025年漲幅居全市場ETF首位;半導(dǎo)體設(shè)備ETF國泰(159516)受益于全球存儲擴產(chǎn)與國產(chǎn)替代雙重邏輯,具備充足業(yè)績彈性。同時短期布局需警惕美聯(lián)儲貨幣政策不確定性、大宗商品漲價推高運營成本等潛在風(fēng)險。
風(fēng)險提示:
投資人應(yīng)當(dāng)充分了解基金定期定額投資和零存整取等儲蓄方式的區(qū)別。定期定額投資是引導(dǎo)投資人進行長期投資、平均投資成本的一種簡單易行的投資方式。但是定期定額投資并不能規(guī)避基金投資所固有的風(fēng)險,不能保證投資人獲得收益,也不是替代儲蓄的等效理財方式。
無論是股票ETF/LOF基金,都是屬于較高預(yù)期風(fēng)險和預(yù)期收益的證券投資基金品種,其預(yù)期收益及預(yù)期風(fēng)險水平高于混合型基金、債券型基金和貨幣市場基金。
基金資產(chǎn)投資于科創(chuàng)板和創(chuàng)業(yè)板股票,會面臨因投資標(biāo)的、市場制度以及交易規(guī)則等差異帶來的特有風(fēng)險,提請投資者注意。
板塊/基金短期漲跌幅列示僅作為文章分析觀點之輔助材料,僅供參考,不構(gòu)成對基金業(yè)績的保證。
文中提及個股短期業(yè)績僅供參考,不構(gòu)成股票推薦,也不構(gòu)成對基金業(yè)績的預(yù)測和保證。
以上觀點僅供參考,不構(gòu)成投資建議或承諾。如需購買相關(guān)基金產(chǎn)品,請您關(guān)注投資者適當(dāng)性管理相關(guān)規(guī)定、提前做好風(fēng)險測評,并根據(jù)您自身的風(fēng)險承受能力購買與之相匹配的風(fēng)險等級的基金產(chǎn)品?;鹩酗L(fēng)險,投資需謹(jǐn)慎。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP