電子產業(yè)一站式賦能平臺

PCB聯(lián)盟網

搜索
查看: 75|回復: 0
收起左側

光計算互連(OCI)

[復制鏈接]

686

主題

686

帖子

5863

積分

四級會員

Rank: 4

積分
5863
跳轉到指定樓層
樓主
發(fā)表于 2024-10-12 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |正序瀏覽 |閱讀模式
引言
# I: W$ _" t7 H1 j- q( v( P; A在人工智能(AI)和機器學習(ML)快速發(fā)展的背景下,對更快、更高效、可擴展的計算基礎設施的需求正在飛速增長。隨著我們不斷突破AI的可能性邊界,數(shù)據(jù)傳輸和處理方面的新挑戰(zhàn)也隨之出現(xiàn)。光計算互連(OCI)技術應運而生,這項突破性技術有望徹底改變我們構建和連接AI系統(tǒng)的方式[1]。+ o7 b* O' p+ h# U5 y

$ q8 m; R+ U9 ?# e' s( Q& W/ h* U 6 Z! E* Z) ^: B! _/ m' o9 W: L
( F9 M  V" _8 x
挑戰(zhàn):AI基礎設施中的輸入/輸出瓶頸
! T- v( h# Y6 }; L8 s; d+ H隨著AI模型變得越來越復雜和龐大,計算節(jié)點之間需要傳輸?shù)臄?shù)據(jù)量呈指數(shù)級增長。傳統(tǒng)的電氣互連難以滿足這些需求,造成了限制AI系統(tǒng)整體性能的瓶頸。8 E+ u2 }' G/ L( q, H8 T
+ L: N0 F- ]6 G0 i

1 R" ]9 z, R: V& J% o* r! O: _圖1:展示了計算網絡互連帶寬與AI應用需求之間隨時間推移而不斷增大的差距。! K/ k2 d  {, }; n& d

; L( i3 a+ M( S這張圖清楚地顯示了計算網絡互連在歷史上如何落后于AI應用不斷演進的帶寬需求。隨著AI的持續(xù)發(fā)展,這一差距預計將進一步擴大,創(chuàng)造了對新解決方案的迫切需求。7 s5 _( P. @+ T/ f
! Q7 X8 P- n7 D
解決方案:集成光電子技術和OCI
3 `1 O, R, q/ p+ V  Z( c  U1 f為了應對這些挑戰(zhàn),研究人員和工程師正轉向集成光電子技術,特別是光計算互連(OCI)技術。OCI利用光來傳輸數(shù)據(jù),相比傳統(tǒng)的電氣互連具有幾個關鍵優(yōu)勢:0 A; u. ?3 a) L1 _
  • 更高的帶寬密度
  • 更低的功耗
  • 更低的延遲
  • 更遠的傳輸距離
    3 l+ `$ S: N0 d! U

    9 H+ t/ ?6 ?) b" f) f" n& V9 t" K0 a6 U& I$ y
    9 t8 o' N! W0 ?2 [: @& [% L' @- G
    圖2:展示了不同互連技術的帶寬密度和傳輸距離之間的關系,突出了xPU光學I/O的優(yōu)勢。- {! |* }. f% L8 P, H7 T, ]: j

    + g/ m! L3 a3 ^6 p  o6 Q這張圖描述了通過集成光電子技術實現(xiàn)的xPU光學I/O如何能夠同時達到高帶寬密度和更遠的傳輸距離,相比傳統(tǒng)的電氣I/O和可插拔光模塊具有明顯優(yōu)勢。
    . r; d0 S/ |! `3 l
    ' G* g5 T$ a6 X/ |3 AOCI在AI基礎設施中的應用
    1 [8 J( l$ V7 O1 b# d' n, C$ q. }OCI技術在AI基礎設施中有兩個主要應用:
  • 計算Fabric(AI/ML集群)
  • 資源分解* e* o0 v" q: C$ D" y9 j& X
    [/ol]
    " H) ]" i* d4 `6 Z! Q2 t計算Fabric(AI/ML集群): i8 @/ M& ?& q( }" \7 K
    在AI/ML集群中,OCI可用于連接基于CPU/GPU的服務器,可以是節(jié)點到節(jié)點的連接,也可以是交換式Fabric配置。這種應用提供了幾個優(yōu)勢:
    ( Z8 Y9 x( J* t1 w7 H
  • 為更大的集群提供增加的帶寬
  • 相比銅線互連延長了傳輸距離
  • 更低的延遲
  • 降低功耗" [0 I; f% H6 a4 R7 A4 F
      i" k* X1 P  l9 x0 M$ o3 p3 E
    8 ~3 J& E% o8 R3 V
    9 C7 b+ \  H. s8 P
    圖3:illustrating了OCI在AI/ML集群計算Fabric中的應用,顯示了互連的XPU節(jié)點。/ J5 U- ?% c* C0 q" b2 U
    0 W: f5 T9 P1 Z1 X
    這個圖表展示了OCI如何用于連接AI/ML集群中的多個XPU(CPU/GPU)節(jié)點,實現(xiàn)計算資源之間的高帶寬、低延遲通信。
    4 E9 C  r: ~, }' m  [0 N) J
    3 C  A! |& k* j: q, B# l0 W資源分解9 a  \1 f8 H! Q: ]2 Y5 Q0 _
    OCI還能實現(xiàn)資源分解,允許在多個計算節(jié)點之間創(chuàng)建更大的共享資源池。這種方法提供了幾個優(yōu)勢:
    / i' u9 Y' |# P4 a. d
  • 將資源從封裝和插槽限制中解放出來
  • 提高資源利用率和效率
  • 對延遲敏感的連接
  • 高帶寬密度
  • 低功耗
    0 d. K6 s( v/ n" W
    . R4 g7 }7 B+ K+ D, q2 R

    + C2 i/ p( r3 Y: n& s6 z 4 N/ @2 r. n! O  l! o+ q5 M0 n: i
    圖4:展示了OCI在資源分解中的應用,描繪了不同計算資源的分離和池化。
    4 [: Y8 C2 G$ U3 }, u$ |4 C/ A% ?9 f: K& C! t
    這個圖表描繪了OCI如何實現(xiàn)各種計算資源的分解,如CPU/XPU、內存、加速器和存儲,允許在AI基礎設施中更靈活和高效地利用這些組件。
    8 l1 j: K# ]- O; O& V1 d! }; b8 Y7 B% F: y, F, t1 T. y7 ], x
    英特爾的OCI方法/ a3 a3 B  l" p" T
    英特爾在OCI開發(fā)的前沿,利用其在硅基光電子和先進封裝方面的專業(yè)知識,為AI基礎設施創(chuàng)造了可擴展的解決方案。他們的方法集中在三個關鍵領域:
  • 在光電子集成芯片(PIC)上集成更多的光電子功能
  • 使用先進封裝技術將PIC與最佳的電子集成電路(EIC)集成
  • 將光學Chiplet與主機(XPU,交換機)更緊密地集成$ |4 {4 n2 E# D8 k' U3 a
    [/ol]; Q$ M. k" i, T: D
    : b5 p# I1 E7 R( {% k, D
    + U9 f7 S; e' U
    圖5:英特爾OCI Chiplet概念圖,展示了xPU與OCI模塊的集成。* ?/ r5 J. q) ]5 E$ o* c: D& O

    + K8 |0 w* u; Z2 ^4 `這個圖表illustrates了英特爾的OCI Chiplet概念,將xPU(CPU或GPU)與OCI模塊緊密集成,實現(xiàn)直接從計算單元進行高帶寬、低延遲的光通信。, P3 w. W7 H7 q* k

    " n. v+ C( u  Y; d; _OCI和AI基礎設施的未來2 w2 J% l7 _0 J* |" d0 y; U
    隨著AI的持續(xù)發(fā)展和對更強大計算能力的需求不斷增加,OCI技術將在實現(xiàn)下一代AI基礎設施中發(fā)揮關鍵作用。英特爾的OCI發(fā)展路線圖包括:/ x" s) j1 R7 N2 x+ Y* S1 o% U
  • 擴展波長數(shù)量
  • 提高線路速率
  • 擴大光纖數(shù)量
  • 利用偏振技術8 b# Q5 ^; A& M3 a0 l

    0 d# Y9 E- r' _6 h) m* h- \. M這些進步將使帶寬、功率效率和可擴展性持續(xù)提升,最終實現(xiàn)更強大、更高效的AI系統(tǒng)。
    8 a! d' g) b3 W  a- `* F" o3 B1 ]8 W' Y; ?# E& T

      P2 c  |2 U# J5 ~2 _6 R圖6:展示了英特爾OCI擴展路線圖,illustrating了隨時間推移預計的帶寬增長。
    3 |4 N5 w; I5 V) u% L$ T
    - f( N/ [* F7 p  p% X! l2 \  D這張圖展示了英特爾對OCI技術擴展的宏偉計劃,預計從2Tbps PCIe5/CXL到未來迭代中的16Tbps UCIe/DWDM,帶寬將顯著提升。
    7 c' _7 |; y' \, d  d; Q& a* Z/ A
    * y0 S& [7 v; _2 Y總結而言,光計算互連(OCI)技術代表了解決現(xiàn)代AI基礎設施互連挑戰(zhàn)的重大進步。通過利用集成光電子技術的力量,OCI有望提供下一代AI和ML應用所需的帶寬、延遲和功率效率。隨著英特爾等公司繼續(xù)投資和開發(fā)這項技術,我們可以期待看到越來越強大和高效的AI系統(tǒng),將推動人工智能的可能性向前發(fā)展。
    ' L* \1 T& A$ D2 ?( y/ M) m8 @5 z9 d. ^+ s0 D9 c6 T
    OCI技術的具體實現(xiàn)2 f) l( k* \2 c+ l2 {6 C
    英特爾在OCI技術的實現(xiàn)上取得了顯著進展。以下是一些關鍵的技術細節(jié):; x$ L1 i) s  A4 D
  • 集成光電子芯片(PIC)
  • 英特爾開發(fā)了一個完全集成的8Tbps光電子集成芯片,具有以下特點:
  • 密集波分復用(DWDM)光接口
  • 8個光纖對 x 8波長 x 64G,符合CW-WDM MSA標準
  • 每個方向4Tbps的吞吐量
  • 標準單模光纖輸出,具有低數(shù)值孔徑,用于無源對準的V形槽, ]  `4 r# f# P& L& m; M

    7 P! E5 r5 |- U8 W9 p) h
    3 _9 O/ W  y0 [, G% B' z * p& A0 Y6 g8 j
    圖7:英特爾8Tbps集成光電子芯片的概念圖,顯示了主要特性。
    7 Y+ `" i6 O6 d% F$ K
    1 s+ x7 D4 @& q' B7 u這個高度集成的PIC包含了完整的光學子系統(tǒng),包括片上激光源、高效微環(huán)調制器、鍺光電探測器和半導體光放大器等。這種高度集成不僅提高了性能,還降低了成本和功耗。" y7 M! k4 l+ k9 u7 U# a

    , D3 T5 N2 y4 {, g" ?異質集成- j7 `; B( \0 l# e$ L0 s+ W
    英特爾采用了晶圓級異質集成技術,將III-V族材料(如InP)與硅基光電子器件集成在一起。這種方法具有以下優(yōu)勢:2 V/ b+ b4 @# t- N% R$ s( X
  • 性能:最小化耦合損耗
  • 可靠性:激光器可靠性
  • 可制造性:晶圓級到已知良好管芯(KGD)
  • 成本:無需昂貴的激光器后端
  • 可擴展性:高通道數(shù),資源共享
  • 靈活性:多波長能力,備用
    5 D2 A1 ^5 r% [# Z* M

    ) E" R6 A4 J6 m; n
    5 [8 W5 Q" l& j% K( x / b! `. r1 J) W) ^% `4 {3 C
    圖8:異質集成技術的示意圖,顯示了III-V族材料與硅基底的集成。, E5 B" U* w' `& E0 I' ~

    ' C" P3 W5 [# V0 G0 x! W這種異質集成技術已經在超過8百萬個部署在超大規(guī)模云服務提供商處的PIC中得到驗證,包含超過3200萬個片上激光器。4 b- S& O0 t6 o5 h7 N  v% P- c
    5 Y0 ~' c- N5 C1 ~5 @
    OCI Chiplet
    4 ^6 Y/ ^& ]: _/ e  N5 }% o英特爾的OCI Chiplet是一個die堆疊,提供使用英特爾硅基光電子技術的光學I/O,可以與xPU共同封裝。第一代OCI Chiplet的主要參數(shù)包括:+ p7 t4 m# h, F0 Q% J
  • 主機接口:PCIe gen5 SerDes接口
  • 光學端:8光纖 x 8波長 x 32G NRZ,通過單模光纖的密集波分復用
  • 總帶寬:4 Tbps(雙向各2 Tbps)
  • 端到端比特錯誤率:
  • 能量效率:~5 pJ / bit
    * I" B% J! B: @+ |! }) E3 N- h7 c

    7 O( g9 Z; c) p
    4 C4 u- H, q) O+ I( ?! l! H
    ( }# _( ^' k9 S圖9:OCI Chiplet概念圖,顯示了xPU與OCI模塊的共同封裝。+ D! }" f2 v6 l4 e& w

    & P3 c3 ^* `) s" E* s& q英特爾在OFC 2024上展示的概念CPU與共同封裝OCI,展示了這項技術的實際應用。該演示顯示,僅就光學鏈路而言,OCI技術在功率和密度方面分別比可插拔模塊提高了3倍以上和5倍以上。
    $ Y- _- X$ W! [! `" W
    ' j/ _! U" d% `7 _OCI技術的未來發(fā)展  h; @( u& e2 d6 z, ~' B
    英特爾對OCI技術的發(fā)展有明確的路線圖,包括以下幾個關鍵方向:7 I1 |1 U& U6 T; }9 g0 h
  • 波長數(shù)量的擴展:從當前的8波長增加到16波長,甚至更多。
  • 線路速率的提升:從32G NRZ提升到64G PAM4,未來可能達到128G或更高。
  • 光纖數(shù)量的增加:在保持小型化的同時增加光纖數(shù)量,提高總帶寬。
  • 利用偏振技術:通過偏振復用進一步提高帶寬密度。
    . q$ L- M+ a  l: t

    * l! o% \1 `+ h# @, \8 N" h8 b這些進步將使OCI技術能夠支持更高帶寬、更低延遲和更高能效的AI和高性能計算應用。
    5 ?4 H9 Q+ }: D3 Z! z0 e) U4 `  e( r) d# M+ J" O  m! Z
    結論
    6 Q* `4 w4 f: C- \% S光計算互連(OCI)技術代表了AI基礎設施互連領域的重大突破。通過利用集成光電子技術的優(yōu)勢,OCI提供了下一代AI和ML應用所需的高帶寬、低延遲和高能效。隨著英特爾等公司持續(xù)投資和開發(fā)這項技術,我們可以期待看到更強大、更高效的AI系統(tǒng)出現(xiàn),推動人工智能領域的持續(xù)發(fā)展。7 n* X2 s. R1 J$ M7 O' b5 s

    + P% P$ U/ ]' K2 @. |! F2 KOCI技術不僅解決了當前AI基礎設施面臨的挑戰(zhàn),還為未來的發(fā)展提供了可擴展的解決方案。通過持續(xù)的技術創(chuàng)新和產業(yè)合作,OCI有潛力成為支撐下一代AI和高性能計算基礎設施的關鍵技術。; x) b) F# V, w. f
    - j- [) p4 t9 O$ }" D9 _& F
    本文詳細介紹了OCI技術的原理、應用和發(fā)展前景,希望能為讀者提供對這一新興技術的全面了解。隨著技術的不斷進步,我們可以期待OCI在推動AI和高性能計算領域發(fā)展中發(fā)揮越來越重要的作用。
    ! t3 C8 x+ P2 F" D$ N( c3 O9 K
    $ x# m- x* M' k* i  x參考文獻
    ' u( ~2 v5 g1 ^# ?7 R4 ?; Z; e[1] C. Urricariet, "Optical Compute Interconnect (OCI): A new class of optics for AI infrastructure," presented at LightCounting Webinar: "Special Requirements for Optical Connectivity in AI Clusters," Jul. 30, 2024.) @7 E, q# n) y7 b/ \

    6 s3 b0 `7 J8 ~7 Z. E$ L- END -$ k5 y6 b; ^* a; I0 c2 S! W

    8 ^! L: ?" a, B7 Z8 U$ K3 b軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。! X/ T& f* H( x& n; B
    點擊左下角"閱讀原文"馬上申請
    . ~" g4 I1 z3 N0 s' }) v( `. H. h- ^/ a* I. m; G7 v8 p3 o1 |
    歡迎轉載7 c  [" A% w1 e$ i  R. w

      X5 D' q/ p& c1 H# Q% H轉載請注明出處,請勿修改內容和刪除作者信息!8 l# ], X6 [; }+ h
    $ D. @$ J( ~/ d! q* S% u; l

    # i1 P) X6 [* d3 |

    & ~* {- @2 C+ Z$ J : {2 C" F, k3 ~/ z. j) ~. R
    + [0 q; S; h" V& s
    關注我們8 F. q1 U# |& g8 p7 B) I, R

    ( C! J  i1 G# B3 l; d$ I' d

    6 x3 y7 k. M8 @
    4 e8 A. Y* B+ W, d; C( Q
    6 q# T1 f) n3 T/ x1 ^" E- G  a
    4 T7 l0 i+ w6 c( ^3 @% d

    4 o; A: C1 i' _2 q* }4 ?. B % z4 x& S0 e' C$ I( `
                          - Z9 C1 \: G8 U# v# D2 O/ R* S4 [
      X6 ~. `$ A" q+ _& Y: ?3 h& g3 Q1 K

    / y. s+ z% g) `/ H' |0 s3 {
    3 B% j- U5 n+ ~9 T" V3 [" b關于我們:
    3 v8 S* i6 ~. _' o, ?$ l深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產業(yè)鏈發(fā)展,致力于為客戶提供前沿技術與服務。
      O- }' M3 E9 G3 f* ~, \, [
    5 A/ X( K2 v& C% d7 {2 Y: D5 chttp://www.latitudeda.com/- m" i" u! H7 F. d( l
    (點擊上方名片關注我們,發(fā)現(xiàn)更多精彩內容)
  • 回復

    使用道具 舉報

    發(fā)表回復

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則


    聯(lián)系客服 關注微信 下載APP 返回頂部 返回列表