電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 43|回復(fù): 0
收起左側(cè)

理解Compute Express Link(CXL)內(nèi)存互連技術(shù)

[復(fù)制鏈接]

511

主題

511

帖子

3950

積分

四級會員

Rank: 4

積分
3950
跳轉(zhuǎn)到指定樓層
樓主
引言
% {% b9 k2 U/ H& Z  w# u0 W在快速發(fā)展的計算領(lǐng)域中,高效的內(nèi)存管理和互連技術(shù)對系統(tǒng)性能起著關(guān)鍵作用。計算快速鏈接(Compute Express Link,CXL)已成為連接內(nèi)存與各種處理元件以及在數(shù)據(jù)中心內(nèi)共享內(nèi)存資源的主要協(xié)議。本文探討CXL的功能、演變及其對現(xiàn)代計算架構(gòu)的影響[1]。* U+ W) P2 x: |5 |8 M

2 s2 K! k( k! w5 N0 d什么是CXL?
* N. p/ V( q: s7 j7 M+ i) N計算快速鏈接(CXL)是建立在PCI Express(PCIe)基礎(chǔ)上的開放行業(yè)標(biāo)準(zhǔn)互連技術(shù)。它于2019年3月首次提出,此后獲得了主要芯片制造商的廣泛支持。CXL的主要功能是通過串行通信連接CPU、GPU、FPGA和其他專用加速器,同時允許跨器件池化內(nèi)存以提高利用率和資源效率。
: ]4 n& r! J, N; D$ C" t7 z& K0 J5 R( h$ Q- y+ f0 S2 }( `
CXL由三個子協(xié)議組成:
  • CXL.io
  • CXL.cache
  • CXL.memory
    ! j; v7 @, }2 L) p) K9 j* n[/ol]
    0 d; G" s& k5 `0 Q其中,CXL.memory因其在數(shù)據(jù)中心內(nèi)存擴(kuò)展和先進(jìn)AI拓?fù)渲械臐摿Χ鹆俗疃嚓P(guān)注。2 g6 y" Q5 F; m/ T

    3 ?* F0 Q1 ~3 H( r7 } . P! U9 N) a; z- w/ p
    圖1展示了CXL版本3.0和3.1的擴(kuò)展功能,突出了該協(xié)議的演進(jìn)和能力。
    ; i+ i7 d! g5 e0 v
    6 d) d, |* q8 |' }CXL與其他互連技術(shù)的比較! g/ W+ I& F0 F& T, o* b; H; X9 M4 z
    雖然CXL經(jīng)常被與NVIDIA的NVLink(用于連接GPU的高帶寬技術(shù))相比較,但它已經(jīng)沿著不同的路徑發(fā)展。CXL的主要焦點(diǎn)已從加速器到主機(jī)通信轉(zhuǎn)向內(nèi)存連接。
    - x- Y! A0 E" B/ L0 A& r
    % i9 T+ G3 U3 t/ r! X+ ~Rambus高級產(chǎn)品營銷經(jīng)理Zaman Mollah解釋道:"CXL將與其他類似的互連技術(shù)共存,有自己的應(yīng)用和使用場景。CXL可能無法提供GPU中心的AI應(yīng)用所需的帶寬,但在加速器和基于CPU的AI用例中有用處。"
    $ X5 M  D! b& B& B" J- o
    6 T1 G: y- S7 t* F6 `+ R  t( a/ fCXL的獨(dú)特優(yōu)勢包括:8 G4 s. g6 M* p% t7 @2 w
  • 增加容量和帶寬的內(nèi)存擴(kuò)展
  • 內(nèi)存重用
  • 智能內(nèi)存分層應(yīng)用
  • 可組合的數(shù)據(jù)中心架構(gòu)
  • 以可接受的延遲靈活且經(jīng)濟(jì)地增加內(nèi)存容量和帶寬
    9 g2 f! e) B0 T* _* Z7 w6 u, j' D

    , y1 ~8 C% p) G+ m/ Y% E- JCXL的演變:從1.0到3.1
    7 [2 b1 V' c3 A+ B! q自誕生以來,CXL經(jīng)歷了幾次修訂,每個版本都引入了新功能和能力:: p; |6 Q% d/ D1 m; P# A* @
  • CXL 1.0(2019):初始發(fā)布
  • CXL 2.0(2020):增強(qiáng)內(nèi)存池化和共享
  • CXL 3.0(2022):引入fabric能力
  • CXL 3.1(2023):改進(jìn)fabric管理能力和安全功能
    ; X& o9 h3 d9 d/ I& v* k) P, W/ {
    & z1 y4 j% |6 B! u0 c' m
    CXL 3.1:最新進(jìn)展- I5 d3 X" `5 T$ A! @+ `
    2023年11月發(fā)布的CXL 3.1規(guī)范為該協(xié)議帶來了顯著改進(jìn)。主要增強(qiáng)包括:, w# h$ v* P! Y8 k$ V
  • 改進(jìn)了分解系統(tǒng)的fabric管理能力
  • 優(yōu)化了資源利用
  • 擴(kuò)展了內(nèi)存共享和池化能力
  • 促進(jìn)了加速器之間的內(nèi)存共享$ d$ w% V+ D, _0 E- o; O6 y

    . g  T. O; a, f- v& k% U7 }( @
    4 [2 S8 q. S6 d- c; y& {' |+ ?8 j
    : U; I7 i! l7 G0 {  r6 K圖2說明了CXL 3.1中可信安全協(xié)議(TSP)如何增強(qiáng)安全性。% [! c- z2 Y0 e3 l: t( E& k

    2 o- Q7 ]) |  k0 p  V7 X- H& ZRambus硅IP產(chǎn)品營銷高級總監(jiān)Lou Ternullo強(qiáng)調(diào)了CXL 3.1中的一些新功能:
  • CXL.IO點(diǎn)對點(diǎn)(P2P)
  • 無序I/O(UIO)
  • CXL.mem P2P
  • 可信執(zhí)行環(huán)境(TEE)操作碼
  • 跨PCIe傳輸層的完整性和數(shù)據(jù)加密(IDE)支持
    2 \. ?: y6 P1 c' M[/ol]( \; V% A) d  {) R# c
    這些功能共同作用,減少延遲,提高安全性,并增強(qiáng)CXL fabric中端點(diǎn)和主機(jī)之間的通信。" A% H- }( L& l1 u  B. G

    % u) A% W; d$ `2 K0 u4 z $ y2 E/ I2 ]2 ^5 v% f
    圖3描述了CXL 3.1中引入的新全局集成內(nèi)存(GIM)概念。* c' X1 Y) v4 C5 X7 L2 G
    ( q- C8 L2 }# P/ z
    Fabric能力和擴(kuò)展1 a6 e$ L, j! o% B0 G- c" k
    CXL 3.1中最顯著的改進(jìn)之一是交換Fabric能力的增強(qiáng)。Ternullo解釋道:"現(xiàn)在可以處理基于端口的路由,這允許進(jìn)行規(guī)模擴(kuò)展部署。交換fabric不受傳統(tǒng)樹狀層次結(jié)構(gòu)的限制。允許主機(jī)和器件進(jìn)行跨域訪問,一個器件能夠訪問多達(dá)4,096個主機(jī)或其他器件。"6 ^5 y+ c& k$ M4 V( s
    % \" [: X1 C6 n: t5 R8 T
    這一進(jìn)步使設(shè)計者能夠?qū)崿F(xiàn)具有任意到任意通信的大型系統(tǒng)或拓?fù),為?shù)據(jù)中心架構(gòu)創(chuàng)造了新的可能性。; c5 ?. W9 W: n/ B! `1 C

    , e4 c# H! O5 f- {# G" m安全性和元數(shù)據(jù)增強(qiáng)
    ! r0 |" ~- Q8 }+ dCXL 3.1還引入了重要的安全功能,包括:
    2 h! t7 D: Z' e3 J0 Z1 T+ h
  • 增強(qiáng)保護(hù)的可信安全協(xié)議
  • 擴(kuò)展的元數(shù)據(jù)能力(最多34位)
    ; ~, G! o$ b! a3 ^" K2 f% ]
    $ @0 ~  ^: y( X' ?
    這些改進(jìn)對于通過fabric連接眾多虛擬機(jī)的規(guī)模擴(kuò)展部署非常重要,允許更好的監(jiān)控和診斷。
    . x' s* l  m6 k8 a0 \
    : D+ x9 _7 e; i% r5 M內(nèi)存池化和擴(kuò)展
    # t" ~' x/ a3 i4 G3 V( B) A5 ECXL最令人興奮的應(yīng)用之一是其促進(jìn)內(nèi)存池化和擴(kuò)展的能力。這一能力解決了數(shù)據(jù)密集型應(yīng)用(如AI和機(jī)器學(xué)習(xí)工作負(fù)載)對更多內(nèi)存的日益增長的需求。3 T3 G8 k% ^0 g8 i! z

    # J3 q! [0 j3 D- z+ p+ X9 qCadence高級產(chǎn)品營銷總監(jiān)Arif Khan指出,盡管在成本和軟件復(fù)雜性方面存在一些批評,但實(shí)施者對使用CXL構(gòu)建內(nèi)存擴(kuò)展器和池化器件仍有很大興趣。
    , f( _& C, f1 t
    - w8 y' X3 \0 p
    ) W3 O! [! R+ e1 d2 l7 }- R. R, o) b圖4概述了CXL的使用案例和驗(yàn)證解決方案,展示了該協(xié)議的多功能性。4 Y# X6 F( x5 w, j
    ' s' ^- w$ r) ~7 |+ G
    內(nèi)存池化的經(jīng)濟(jì)性特別具有吸引力,正如Rambus的Mollah解釋的那樣:"隨著每字節(jié)成本降低,內(nèi)存池化等高級應(yīng)用將變得更具吸引力,并允許分解的數(shù)據(jù)中心基礎(chǔ)設(shè)施,降低總擁有成本(TCO)。"
    # ]' o! r4 [( N& m: Y( [8 R8 @0 V9 b
    CXL在其他技術(shù)環(huán)境中的地位- d! u0 }5 j3 X: g" F
    雖然CXL已經(jīng)獲得了顯著的關(guān)注,但了解其在其他互連技術(shù)中的位置很重要。Synopsys高級技術(shù)產(chǎn)品經(jīng)理Richard Solomon強(qiáng)調(diào),CXL應(yīng)被視為選擇范圍的一部分,類似于內(nèi)存如何有廣泛的產(chǎn)品來滿足特定需求。9 K: x& ]; y6 j  F2 `2 h4 z5 i

    : s1 L. Q  n6 P/ }  J' \3 oSiemens Digital Industries Software VIP產(chǎn)品線高級總監(jiān)Christopher Browy提供了CXL與其他技術(shù)比較的見解:"基于PCIe SerDes的CXL具有更低的錯誤率、更低的延遲和相應(yīng)的較低帶寬。NVLink和UALink使用以太網(wǎng)風(fēng)格的SerDes,導(dǎo)致高錯誤率、高延遲和高帶寬,因此對于最高性能帶寬受限的情況,如GPU到GPU,這些技術(shù)具有優(yōu)勢。"0 J$ a- R" \* p  C. x/ V
    8 N/ o7 a" r7 x8 ]" R
    未來展望& K' n; ?! \/ I& E) U4 A
    CXL的未來看起來很有希望,Yole Research預(yù)測到2028年市場將達(dá)到160億美元。隨著技術(shù)的成熟,可以期待看到:
    4 ~# e/ b( s' @, H. O: z5 b
  • 繼續(xù)用于內(nèi)存擴(kuò)展
  • 進(jìn)一步實(shí)現(xiàn)異構(gòu)計算
  • 增強(qiáng)數(shù)據(jù)中心分解
  • 最小化服務(wù)器過度配置
  • 按需訪問內(nèi)存、存儲和加速資源' \" z. x: e2 y, k! W5 v

    ' u5 d! L  L. M; N& u$ O+ C. iCXL聯(lián)盟營銷工作組聯(lián)合主席兼英特爾高級營銷經(jīng)理Anil Godbole強(qiáng)調(diào),CXL正在成為主流:"隨著我們推出CXL,每個CPU都將具有CXL功能,因此現(xiàn)在正成為主流。"
    ' w, w' t# t7 |# U4 ^! g8 w9 q+ W+ ?9 O' U2 b9 }
    結(jié)論
    - I5 S# G& @, Z# mCXL迅速發(fā)展成為現(xiàn)代計算架構(gòu)中的重要技術(shù)。其高效連接和池化內(nèi)存資源的能力,加上fabric能力和安全功能的持續(xù)改進(jìn),使CXL成為未來數(shù)據(jù)中心和高性能計算設(shè)計中的關(guān)鍵參與者。隨著技術(shù)繼續(xù)成熟并獲得廣泛采用,可以期待看到利用CXL獨(dú)特能力的創(chuàng)新解決方案,以滿足數(shù)據(jù)密集型應(yīng)用和異構(gòu)計算環(huán)境日益增長的需求。( C, G, B& ~. g- J5 X
    - ^9 ]7 U+ U$ T9 [8 M! M
    參考文獻(xiàn)( b& @0 y: o  j6 ?
    [1] K. Heyman, "CXL Thriving As Memory Link," Semiconductor Engineering, Sep. 16, 2024. [Online].
    6 U) y3 h5 V0 iEND6 m9 T% V6 `5 a: p8 X
    7 S- i. E2 C: a4 w/ h6 E

    6 ^# L% P! l2 ^/ p" B2 D$ _軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。0 t' }  }% v6 ^7 j& @; M
    點(diǎn)擊左下角"閱讀原文"馬上申請  i$ u: b( @& U

    % _- L- j7 E: {( x# p歡迎轉(zhuǎn)載' |/ ~3 D$ ?7 T6 D
    1 a7 J7 a' [+ b& C) J9 i
    轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!! c. u- F- I& V7 }
    8 T9 G- x% V, G6 l/ @
    4 ~; ~+ J, c2 @6 ?; ^8 p

    4 r' t0 {1 {# }8 E; j! u & i% h; h) i" o+ g; `# i' V8 ~
    ! D- ]- w) `# G: b$ x: L( _4 ~! ~, b$ Y
    關(guān)注我們  H1 _8 w- C- u5 ~6 p

    9 X1 O# i0 \" L3 _

    1 F- ^* L- q$ Y& F # p0 I# _3 z% L& j
    5 v! j& |  C" e, l1 P
    ' G9 z3 }9 W. j5 N6 d
    * ^1 t! p3 K2 ]( k; {
    5 ^1 ?& G8 {! w  X
                          $ H1 A$ j- B4 {; D7 g. y

    3 k: S5 c$ m, m+ @
    ; X4 U: R2 e* S' Q/ z7 T

    . C1 A  o0 l2 J5 P/ R關(guān)于我們:
    ' z% Q  _5 i* i! a  A% B: T1 o深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
    # |$ d8 M5 y1 C6 H" k: l. X/ D
    http://www.latitudeda.com/
    7 V+ Z) g/ j- x! _8 W(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表