|
引言
% {% b9 k2 U/ H& Z w# u0 W在快速發(fā)展的計算領(lǐng)域中,高效的內(nèi)存管理和互連技術(shù)對系統(tǒng)性能起著關(guān)鍵作用。計算快速鏈接(Compute Express Link,CXL)已成為連接內(nèi)存與各種處理元件以及在數(shù)據(jù)中心內(nèi)共享內(nèi)存資源的主要協(xié)議。本文探討CXL的功能、演變及其對現(xiàn)代計算架構(gòu)的影響[1]。* U+ W) P2 x: |5 |8 M
2 s2 K! k( k! w5 N0 d什么是CXL?
* N. p/ V( q: s7 j7 M+ i) N計算快速鏈接(CXL)是建立在PCI Express(PCIe)基礎(chǔ)上的開放行業(yè)標(biāo)準(zhǔn)互連技術(shù)。它于2019年3月首次提出,此后獲得了主要芯片制造商的廣泛支持。CXL的主要功能是通過串行通信連接CPU、GPU、FPGA和其他專用加速器,同時允許跨器件池化內(nèi)存以提高利用率和資源效率。
: ]4 n& r! J, N; D$ C" t7 z& K0 J5 R( h$ Q- y+ f0 S2 }( `
CXL由三個子協(xié)議組成:CXL.ioCXL.cacheCXL.memory
! j; v7 @, }2 L) p) K9 j* n[/ol]
0 d; G" s& k5 `0 Q其中,CXL.memory因其在數(shù)據(jù)中心內(nèi)存擴(kuò)展和先進(jìn)AI拓?fù)渲械臐摿Χ鹆俗疃嚓P(guān)注。2 g6 y" Q5 F; m/ T
3 ?* F0 Q1 ~3 H( r7 }
w2p1sg53goz64076743312.png (190.05 KB, 下載次數(shù): 0)
下載附件
保存到相冊
w2p1sg53goz64076743312.png
4 天前 上傳
. P! U9 N) a; z- w/ p
圖1展示了CXL版本3.0和3.1的擴(kuò)展功能,突出了該協(xié)議的演進(jìn)和能力。
; i+ i7 d! g5 e0 v
6 d) d, |* q8 |' }CXL與其他互連技術(shù)的比較! g/ W+ I& F0 F& T, o* b; H; X9 M4 z
雖然CXL經(jīng)常被與NVIDIA的NVLink(用于連接GPU的高帶寬技術(shù))相比較,但它已經(jīng)沿著不同的路徑發(fā)展。CXL的主要焦點(diǎn)已從加速器到主機(jī)通信轉(zhuǎn)向內(nèi)存連接。
- x- Y! A0 E" B/ L0 A& r
% i9 T+ G3 U3 t/ r! X+ ~Rambus高級產(chǎn)品營銷經(jīng)理Zaman Mollah解釋道:"CXL將與其他類似的互連技術(shù)共存,有自己的應(yīng)用和使用場景。CXL可能無法提供GPU中心的AI應(yīng)用所需的帶寬,但在加速器和基于CPU的AI用例中有用處。"
$ X5 M D! b& B& B" J- o
6 T1 G: y- S7 t* F6 `+ R t( a/ fCXL的獨(dú)特優(yōu)勢包括:8 G4 s. g6 M* p% t7 @2 w
增加容量和帶寬的內(nèi)存擴(kuò)展內(nèi)存重用智能內(nèi)存分層應(yīng)用可組合的數(shù)據(jù)中心架構(gòu)以可接受的延遲靈活且經(jīng)濟(jì)地增加內(nèi)存容量和帶寬
9 g2 f! e) B0 T* _* Z7 w6 u, j' D
, y1 ~8 C% p) G+ m/ Y% E- JCXL的演變:從1.0到3.1
7 [2 b1 V' c3 A+ B! q自誕生以來,CXL經(jīng)歷了幾次修訂,每個版本都引入了新功能和能力:: p; |6 Q% d/ D1 m; P# A* @
CXL 1.0(2019):初始發(fā)布CXL 2.0(2020):增強(qiáng)內(nèi)存池化和共享CXL 3.0(2022):引入fabric能力CXL 3.1(2023):改進(jìn)fabric管理能力和安全功能
; X& o9 h3 d9 d/ I& v* k) P, W/ {& z1 y4 j% |6 B! u0 c' m
CXL 3.1:最新進(jìn)展- I5 d3 X" `5 T$ A! @+ `
2023年11月發(fā)布的CXL 3.1規(guī)范為該協(xié)議帶來了顯著改進(jìn)。主要增強(qiáng)包括:, w# h$ v* P! Y8 k$ V
改進(jìn)了分解系統(tǒng)的fabric管理能力優(yōu)化了資源利用擴(kuò)展了內(nèi)存共享和池化能力促進(jìn)了加速器之間的內(nèi)存共享$ d$ w% V+ D, _0 E- o; O6 y
. g T. O; a, f- v& k% U7 }( @
4 [2 S8 q. S6 d- c; y& {' |+ ?8 j
t4elzqgmvlc64076743412.png (261.36 KB, 下載次數(shù): 0)
下載附件
保存到相冊
t4elzqgmvlc64076743412.png
4 天前 上傳
: U; I7 i! l7 G0 { r6 K圖2說明了CXL 3.1中可信安全協(xié)議(TSP)如何增強(qiáng)安全性。% [! c- z2 Y0 e3 l: t( E& k
2 o- Q7 ]) | k0 p V7 X- H& ZRambus硅IP產(chǎn)品營銷高級總監(jiān)Lou Ternullo強(qiáng)調(diào)了CXL 3.1中的一些新功能:CXL.IO點(diǎn)對點(diǎn)(P2P)無序I/O(UIO)CXL.mem P2P可信執(zhí)行環(huán)境(TEE)操作碼跨PCIe傳輸層的完整性和數(shù)據(jù)加密(IDE)支持
2 \. ?: y6 P1 c' M[/ol]( \; V% A) d {) R# c
這些功能共同作用,減少延遲,提高安全性,并增強(qiáng)CXL fabric中端點(diǎn)和主機(jī)之間的通信。" A% H- }( L& l1 u B. G
% u) A% W; d$ `2 K0 u4 z
ruof03je2pj64076743513.png (216.31 KB, 下載次數(shù): 0)
下載附件
保存到相冊
ruof03je2pj64076743513.png
4 天前 上傳
$ y2 E/ I2 ]2 ^5 v% f
圖3描述了CXL 3.1中引入的新全局集成內(nèi)存(GIM)概念。* c' X1 Y) v4 C5 X7 L2 G
( q- C8 L2 }# P/ z
Fabric能力和擴(kuò)展1 a6 e$ L, j! o% B0 G- c" k
CXL 3.1中最顯著的改進(jìn)之一是交換Fabric能力的增強(qiáng)。Ternullo解釋道:"現(xiàn)在可以處理基于端口的路由,這允許進(jìn)行規(guī)模擴(kuò)展部署。交換fabric不受傳統(tǒng)樹狀層次結(jié)構(gòu)的限制。允許主機(jī)和器件進(jìn)行跨域訪問,一個器件能夠訪問多達(dá)4,096個主機(jī)或其他器件。"6 ^5 y+ c& k$ M4 V( s
% \" [: X1 C6 n: t5 R8 T
這一進(jìn)步使設(shè)計者能夠?qū)崿F(xiàn)具有任意到任意通信的大型系統(tǒng)或拓?fù),為?shù)據(jù)中心架構(gòu)創(chuàng)造了新的可能性。; c5 ?. W9 W: n/ B! `1 C
, e4 c# H! O5 f- {# G" m安全性和元數(shù)據(jù)增強(qiáng)
! r0 |" ~- Q8 }+ dCXL 3.1還引入了重要的安全功能,包括:
2 h! t7 D: Z' e3 J0 Z1 T+ h增強(qiáng)保護(hù)的可信安全協(xié)議擴(kuò)展的元數(shù)據(jù)能力(最多34位)
; ~, G! o$ b! a3 ^" K2 f% ]$ @0 ~ ^: y( X' ?
這些改進(jìn)對于通過fabric連接眾多虛擬機(jī)的規(guī)模擴(kuò)展部署非常重要,允許更好的監(jiān)控和診斷。
. x' s* l m6 k8 a0 \
: D+ x9 _7 e; i% r5 M內(nèi)存池化和擴(kuò)展
# t" ~' x/ a3 i4 G3 V( B) A5 ECXL最令人興奮的應(yīng)用之一是其促進(jìn)內(nèi)存池化和擴(kuò)展的能力。這一能力解決了數(shù)據(jù)密集型應(yīng)用(如AI和機(jī)器學(xué)習(xí)工作負(fù)載)對更多內(nèi)存的日益增長的需求。3 T3 G8 k% ^0 g8 i! z
# J3 q! [0 j3 D- z+ p+ X9 qCadence高級產(chǎn)品營銷總監(jiān)Arif Khan指出,盡管在成本和軟件復(fù)雜性方面存在一些批評,但實(shí)施者對使用CXL構(gòu)建內(nèi)存擴(kuò)展器和池化器件仍有很大興趣。
, f( _& C, f1 t
- w8 y' X3 \0 p
qf22ywzfth364076743613.png (549.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊
qf22ywzfth364076743613.png
4 天前 上傳
) W3 O! [! R+ e1 d2 l7 }- R. R, o) b圖4概述了CXL的使用案例和驗(yàn)證解決方案,展示了該協(xié)議的多功能性。4 Y# X6 F( x5 w, j
' s' ^- w$ r) ~7 |+ G
內(nèi)存池化的經(jīng)濟(jì)性特別具有吸引力,正如Rambus的Mollah解釋的那樣:"隨著每字節(jié)成本降低,內(nèi)存池化等高級應(yīng)用將變得更具吸引力,并允許分解的數(shù)據(jù)中心基礎(chǔ)設(shè)施,降低總擁有成本(TCO)。"
# ]' o! r4 [( N& m: Y( [8 R8 @0 V9 b
CXL在其他技術(shù)環(huán)境中的地位- d! u0 }5 j3 X: g" F
雖然CXL已經(jīng)獲得了顯著的關(guān)注,但了解其在其他互連技術(shù)中的位置很重要。Synopsys高級技術(shù)產(chǎn)品經(jīng)理Richard Solomon強(qiáng)調(diào),CXL應(yīng)被視為選擇范圍的一部分,類似于內(nèi)存如何有廣泛的產(chǎn)品來滿足特定需求。9 K: x& ]; y6 j F2 `2 h4 z5 i
: s1 L. Q n6 P/ } J' \3 oSiemens Digital Industries Software VIP產(chǎn)品線高級總監(jiān)Christopher Browy提供了CXL與其他技術(shù)比較的見解:"基于PCIe SerDes的CXL具有更低的錯誤率、更低的延遲和相應(yīng)的較低帶寬。NVLink和UALink使用以太網(wǎng)風(fēng)格的SerDes,導(dǎo)致高錯誤率、高延遲和高帶寬,因此對于最高性能帶寬受限的情況,如GPU到GPU,這些技術(shù)具有優(yōu)勢。"0 J$ a- R" \* p C. x/ V
8 N/ o7 a" r7 x8 ]" R
未來展望& K' n; ?! \/ I& E) U4 A
CXL的未來看起來很有希望,Yole Research預(yù)測到2028年市場將達(dá)到160億美元。隨著技術(shù)的成熟,可以期待看到:
4 ~# e/ b( s' @, H. O: z5 b繼續(xù)用于內(nèi)存擴(kuò)展進(jìn)一步實(shí)現(xiàn)異構(gòu)計算增強(qiáng)數(shù)據(jù)中心分解最小化服務(wù)器過度配置按需訪問內(nèi)存、存儲和加速資源' \" z. x: e2 y, k! W5 v
' u5 d! L L. M; N& u$ O+ C. iCXL聯(lián)盟營銷工作組聯(lián)合主席兼英特爾高級營銷經(jīng)理Anil Godbole強(qiáng)調(diào),CXL正在成為主流:"隨著我們推出CXL,每個CPU都將具有CXL功能,因此現(xiàn)在正成為主流。"
' w, w' t# t7 |# U4 ^! g8 w9 q+ W+ ?9 O' U2 b9 }
結(jié)論
- I5 S# G& @, Z# mCXL迅速發(fā)展成為現(xiàn)代計算架構(gòu)中的重要技術(shù)。其高效連接和池化內(nèi)存資源的能力,加上fabric能力和安全功能的持續(xù)改進(jìn),使CXL成為未來數(shù)據(jù)中心和高性能計算設(shè)計中的關(guān)鍵參與者。隨著技術(shù)繼續(xù)成熟并獲得廣泛采用,可以期待看到利用CXL獨(dú)特能力的創(chuàng)新解決方案,以滿足數(shù)據(jù)密集型應(yīng)用和異構(gòu)計算環(huán)境日益增長的需求。( C, G, B& ~. g- J5 X
- ^9 ]7 U+ U$ T9 [8 M! M
參考文獻(xiàn)( b& @0 y: o j6 ?
[1] K. Heyman, "CXL Thriving As Memory Link," Semiconductor Engineering, Sep. 16, 2024. [Online].
6 U) y3 h5 V0 iEND6 m9 T% V6 `5 a: p8 X
7 S- i. E2 C: a4 w/ h6 E
6 ^# L% P! l2 ^/ p" B2 D$ _軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。0 t' } }% v6 ^7 j& @; M
點(diǎn)擊左下角"閱讀原文"馬上申請 i$ u: b( @& U
% _- L- j7 E: {( x# p歡迎轉(zhuǎn)載' |/ ~3 D$ ?7 T6 D
1 a7 J7 a' [+ b& C) J9 i
轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!! c. u- F- I& V7 }
8 T9 G- x% V, G6 l/ @
4 ~; ~+ J, c2 @6 ?; ^8 p
4 r' t0 {1 {# }8 E; j! u
5n2oxhiqkds64076743713.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊
5n2oxhiqkds64076743713.gif
4 天前 上傳
& i% h; h) i" o+ g; `# i' V8 ~
! D- ]- w) `# G: b$ x: L( _4 ~! ~, b$ Y
關(guān)注我們 H1 _8 w- C- u5 ~6 p
9 X1 O# i0 \" L3 _
1 F- ^* L- q$ Y& F
rvd1e5k2qu464076743813.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊
rvd1e5k2qu464076743813.png
4 天前 上傳
# p0 I# _3 z% L& j
| 5 v! j& | C" e, l1 P
yq04wwlhj0e64076743913.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊
yq04wwlhj0e64076743913.png
4 天前 上傳
' G9 z3 }9 W. j5 N6 d
| * ^1 t! p3 K2 ]( k; {
svsnew3foyh64076744013.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊
svsnew3foyh64076744013.png
4 天前 上傳
5 ^1 ?& G8 {! w X
| $ H1 A$ j- B4 {; D7 g. y
3 k: S5 c$ m, m+ @; X4 U: R2 e* S' Q/ z7 T
. C1 A o0 l2 J5 P/ R關(guān)于我們:
' z% Q _5 i* i! a A% B: T1 o深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
# |$ d8 M5 y1 C6 H" k: l. X/ D
http://www.latitudeda.com/
7 V+ Z) g/ j- x! _8 W(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|