|
引言
9 z, N- q' G$ i0 F4 U2 Q! d基于可編程馬赫-曾德干涉儀(MZI)網格實現的光神經網絡(ONN)已成為加速機器學習計算的方法。本文概述了基于MZI的光處理器,重點介紹了兩種關鍵架構 - Reck網格和Diamond網格,并分析了實現ONN的性能。6 z+ }7 `+ v; F
/ I* j1 z' i J" w
MZI光處理器基礎
; s( f, A+ |% C) n. d- Q/ w6 _1 n6 \光處理器的基本構建模塊是2x2可重構MZI,如圖11所示。由兩個3-dB耦合器組成,帶有可調相移器θ和φ,用于控制功率分配比和兩個輸出之間的相對相位。
5 d# b% Q: M' n/ ?1 l7 n; S
oopqxrhyxww64076734929.png (420.64 KB, 下載次數: 3)
下載附件
保存到相冊
oopqxrhyxww64076734929.png
6 小時前 上傳
+ [- {( n" ~# [* s8 _# d* K圖1:具有可調相移器θ和φ的2x2可重構MZI示意圖。: e; C/ t# h; y/ \7 ^3 s. ?
/ A1 K; s* G. J0 \- s( O+ c
單個MZI的單一轉移矩陣由下式給出:
. q H' D1 H t, K" S7 _/ X
3potgicok5u64076735029.png (106.42 KB, 下載次數: 4)
下載附件
保存到相冊
3potgicok5u64076735029.png
6 小時前 上傳
3 u/ k2 u; c0 z* c6 i
$ p" ?; F( d# l通過在網格中級聯多個MZI,可以實現更大的單一變換。圖2所示的4x4處理器的Reck網格是一種三角形排列,可使用6個MZI實現任何4x4單一矩陣。
, C% v& a$ E6 t4 O0 X- j0 Q, L
h2 A1 {1 y: }+ Y9 y# R) L
bbtbhgtws5d64076735129.png (84.74 KB, 下載次數: 4)
下載附件
保存到相冊
bbtbhgtws5d64076735129.png
6 小時前 上傳
% E8 F& i1 `, A圖2:由6個MZI組成的4x4 Reck網格光處理器示意圖。
* e2 R4 j1 l- y& ~9 r, P% w# o; Z" \1 u
完整4x4 Reck處理器的單一矩陣由各個MZI矩陣的乘積給出:
5 P) d% @3 n+ |' W" E! z* M
v5gyerqtnfy64076735230.png (38.98 KB, 下載次數: 5)
下載附件
保存到相冊
v5gyerqtnfy64076735230.png
6 小時前 上傳
0 @3 \4 w- J" M/ X
8 C0 X+ F5 w4 y/ g, e光處理器編程1 X3 E' b; |5 ^
要對光處理器進行編程以實現所需的單一變換,必須確定每個MZI所需的相移。這是通過分解過程完成的,該過程將目標矩陣依次乘以逆MZI矩陣:
6 y; c, P5 f' Q' j! U/ C" [* q' E
i2d2rtbjzyu64076735330.png (40.11 KB, 下載次數: 5)
下載附件
保存到相冊
i2d2rtbjzyu64076735330.png
6 小時前 上傳
( T4 Y( O. b( m7 _
9 |/ M6 Q' G7 u4 E+ `& ^通過在每個步驟中將非對角元素設置為零,可以提取所需的相移。圖3顯示了4x4 Reck網格在此分解過程中考慮MZI的順序。: r" M; [( B$ m0 S# ^, x
x5rbbssmxsr64076735430.png (146.39 KB, 下載次數: 4)
下載附件
保存到相冊
x5rbbssmxsr64076735430.png
6 小時前 上傳
0 c/ N& h% W. Q. G) f4 N T4 P' B! n9 K圖3:4x4 Reck網格中用于編程的MZI分解順序。
# P3 l1 ?9 X) G; i2 n/ P3 r( W( i0 p2 W( P8 A! F
光神經網絡
; ?; v8 u: q% \1 v* g. l0 X/ {ONN利用這些可編程光處理器來實現神經網絡層中的線性變換。圖4顯示了單層ONN的結構。' w0 {8 l( z) E4 k
1ioqdxfr24i64076735530.png (222.16 KB, 下載次數: 3)
下載附件
保存到相冊
1ioqdxfr24i64076735530.png
6 小時前 上傳
& {0 w# K7 M0 d/ l+ N0 }& h% Q
圖4:光學實現的單層神經網絡示意圖。
* N3 e/ Y& k( x* |4 W
' a3 n2 A! B1 u& E) D光處理器實現權重矩陣W,而非線性激活函數通常以電子方式應用。對于分類任務,網絡接受多維輸入I0并為每個類別產生輸出概率。0 S: U5 G. h1 I- m7 ]9 L: S
5 J% n* p! W& p0 q; S6 }( X" R網絡使用反向傳播進行訓練,通過最小化均方誤差等損失函數來優(yōu)化權重矩陣:" i% M! k4 _: W# a- S# G7 p
0jkfbzbd0vd64076735630.png (25.62 KB, 下載次數: 4)
下載附件
保存到相冊
0jkfbzbd0vd64076735630.png
6 小時前 上傳
. w1 s6 G1 w+ l, r0 z5 e3 A
( d# a8 D) P% _) I' [8 z圖5顯示了4類數據集示例和4x4 ONN的訓練過程。, X' e: O- O- }0 n
v1o45em4svh64076735730.png (253.27 KB, 下載次數: 6)
下載附件
保存到相冊
v1o45em4svh64076735730.png
6 小時前 上傳
. \! a' g4 g3 G! T8 ]& d. F
圖5:(a)4類高斯數據集和(b)顯示4x4 ONN的損失和準確度與訓練周期的關系的訓練過程。2 `, r' W1 T6 ?7 u: d2 Z+ m& i& ?
: g5 o7 J! n; `; O% qDiamond網格架構! N" |! p5 s' R
Reck網格可以實現任何單一矩陣,但對制造誤差和光損耗很敏感。為解決這個問題,提出了一種替代的Diamond網格架構,如圖6所示的4x4處理器。
* b6 p& \5 X P/ ^8 m3 x! H# w
1qdmqy20vq364076735831.png (496.17 KB, 下載次數: 4)
下載附件
保存到相冊
1qdmqy20vq364076735831.png
6 小時前 上傳
, w4 T6 T# \$ z4 P+ B圖6:具有9個MZI的4x4 Diamond網格光處理器示意圖。1 i' r9 Z& r! L% U/ C8 H4 G y* x% c
8 s' S1 ^ A$ q$ D. k
與相同大小的Reck網格相比,Diamond網格使用額外的N(N-1)(N-2)/2個MZI。這提供了幾個優(yōu)點:更對稱的拓撲結構,具有平衡的光路能夠將不需要的光重定向到額外的輸出優(yōu)化權重矩陣的額外自由度9 X3 a, w; Y$ R# M3 `3 O
[/ol]
+ X# C' @" U$ T2 ?6 q4x4 Diamond處理器的單一矩陣由下式給出:! b# g& z1 A; S% y" I/ R) Z
1prnfvrpj5e64076735931.png (71.81 KB, 下載次數: 2)
下載附件
保存到相冊
1prnfvrpj5e64076735931.png
6 小時前 上傳
; a' m7 n* B* K9 l: |- ?1 ?9 W1 Y/ O+ q b" h8 _/ f
可以使用與Reck網格類似的分解過程對其進行編程,遵循圖7所示的順序。
0 {7 @% ~/ d) e% R# k' |* {
zz1clakmcvm64076736031.png (236.55 KB, 下載次數: 4)
下載附件
保存到相冊
zz1clakmcvm64076736031.png
6 小時前 上傳
0 |- d- }' ]) w9 V
圖7:4x4 Diamond網格中用于編程的MZI分解順序。
' i1 K$ V. g0 |- K9 i) ]( a. M+ L8 r, | ~$ L# [
性能比較, b: W; h; T( E
為比較Reck和Diamond架構,分析了各種大小的單層ONN的實現性能。圖8顯示了4x4處理器的分類準確度與相位誤差的關系。* k) Q, c* }+ ~/ w. m- l) F
rlujfeftugo64076736131.png (125.34 KB, 下載次數: 4)
下載附件
保存到相冊
rlujfeftugo64076736131.png
6 小時前 上傳
; ^5 k+ ?9 e# B4 S, i* D圖8:4x4 Reck和Diamond ONN的分類準確度與相位誤差的關系,每個MZI的損耗為(a)0 dB和(b)1 dB。
, i* v* e' s$ k( n% d A; P0 I( j; `: M+ b) j
Diamond網格對相位誤差表現出更好的魯棒性,尤其是在存在光損耗的情況下。這種優(yōu)勢在更大的網絡規(guī)模中變得更加明顯。% H5 v9 d Z0 t4 [
9 C( F4 m' f7 P0 d. w- ^圖9比較了不同大小處理器(最大64x64)的準確度與相位誤差的關系。
! J: |* r O( h) V% q l4 H% j- `1 n
p0oz0wwbgf364076736231.png (416.84 KB, 下載次數: 6)
下載附件
保存到相冊
p0oz0wwbgf364076736231.png
6 小時前 上傳
3 `! P* P5 ~8 k% y- ^1 O, p圖9:不同大。╝-d)Reck和(e-h)Diamond ONN的分類準確度與相位誤差的關系。
6 D5 E) w% r- }6 z0 S2 Z( n& F8 _. k) b1 C" M
對于較大的網絡,高精度區(qū)域縮小,但Diamond網格在所有尺寸上都保持更好的性能。
4 O; h0 a0 G$ F) K t1 u
$ v! j- m1 Q* F圖10將此分析擴展到包括每個MZI的光損耗影響。
5 u6 X4 V% _, h+ W$ H. ?% o$ S$ s
kagrofhrnyk64076736332.png (391.07 KB, 下載次數: 5)
下載附件
保存到相冊
kagrofhrnyk64076736332.png
6 小時前 上傳
8 G5 w, G3 `$ ~7 A, A' \7 r' M圖10:不同大。╝-d)Reck和(e-h)Diamond ONN的分類準確度與損耗和相位誤差的關系。
7 l7 k6 }3 O- X, e9 ^! |6 y: V* M8 T# {' J8 x2 K& c
再次,Diamond網格在所有網絡規(guī)模上表現出更優(yōu)的魯棒性。
2 l6 A, H& Q7 t9 h: q+ b+ a3 q$ k8 i/ ~. [5 p" ^. p7 p
最后,圖11總結了不同網絡規(guī)模的兩個關鍵性能指標 - 性能指標(>75%準確度的區(qū)域)和訓練期間達到的最終損失值。
; `# V8 T7 a5 I+ Z* y9 A4 m% n, a
ry5kcbvddlr64076736432.png (92.32 KB, 下載次數: 4)
下載附件
保存到相冊
ry5kcbvddlr64076736432.png
6 小時前 上傳
8 n( l. ~% j: B9 y' s+ ^0 e圖11:不同大小的Reck和Diamond ONN的(a)性能指標和(b)最終損失值比較。9 }9 \0 @6 \' _) F4 A$ K
* ^3 O; J0 e, E
Diamond網格在這兩個指標上始終優(yōu)于Reck網格,優(yōu)勢隨網絡規(guī)模增大而增加。7 K% o0 l8 O) N2 _
+ I4 {' z2 v7 i3 }; j" X結論
2 C8 h) `" Z: g. H4 s! M基于可編程MZI的光處理器為實現ONN和加速機器學習計算提供了有前途的平臺。Reck網格提供了可實現任何單一變換的緊湊設計,但Diamond網格提高了對制造誤差和光損耗的魯棒性。這使Diamond架構更適合實際的大規(guī)模ONN。硅基光電子制造和架構設計的持續(xù)進步可能會進一步提高這些光處理器的性能,有望實現新一類超快速、節(jié)能的機器學習加速器。
' ` \2 w+ x: k6 [6 ]0 i
3 a3 E$ ^/ i4 E% g% {* l& [8 ^0 V參考文獻" B) H6 ]1 U: y* s
[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.5 v6 g+ F9 X7 ~, x+ T/ N7 Y2 Q
END9 _4 w' ?; [- e u" c
; W) J1 B- V [# p* H
: J+ I/ q1 @* W3 I2 S9 P4 Y' J軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。2 R: v( Y: ?4 A# M4 j- |
點擊左下角"閱讀原文"馬上申請
( f' o$ g8 ?/ b8 t/ L: e
' M8 M' S2 h2 Y' l: Q6 ?1 ^. I8 p歡迎轉載
- Z. S& x+ [7 a; r2 Q: k$ \0 @7 J8 }, u+ v, Q" U) f: P
轉載請注明出處,請勿修改內容和刪除作者信息!
- N7 m. g* y0 [% |& g
% I: e. J. U `* V
5 _" `& J# D Q- N9 y; l8 U/ r3 @4 C6 i8 z6 E' b/ M
3xfam3wcrst64076736532.gif (16.04 KB, 下載次數: 4)
下載附件
保存到相冊
3xfam3wcrst64076736532.gif
6 小時前 上傳
8 e) _6 E/ {: W1 \. u' r
8 [0 J2 V- i+ X* O% U+ t關注我們
# F- T/ b, w% L9 ?! ~% D% N# T( `6 N* |0 K% v
/ t8 S6 x: R7 L+ o5 E, M
vodpuva2mj564076736632.png (31.33 KB, 下載次數: 4)
下載附件
保存到相冊
vodpuva2mj564076736632.png
6 小時前 上傳
, w2 `, Y, I# K5 Z- L# h" ~ | ' L, r1 _2 K6 b
u5is0s3sr5f64076736732.png (82.79 KB, 下載次數: 4)
下載附件
保存到相冊
u5is0s3sr5f64076736732.png
6 小時前 上傳
9 P% K c+ j% X) }# F | * z$ z7 m" b9 K2 K
txrhkjadsy064076736832.png (21.52 KB, 下載次數: 4)
下載附件
保存到相冊
txrhkjadsy064076736832.png
6 小時前 上傳
* |+ }8 |' U% d! P | 3 N0 D( P! S& v6 l! }/ E
. J; E9 m3 k( H& P- }, n4 c8 y5 w# u2 W: r! E
, Z3 U8 R$ e# K$ ]! Y關于我們:) {, g/ ]2 y) @- o4 Y4 b
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產業(yè)鏈發(fā)展,致力于為客戶提供前沿技術與服務。
5 i" O) D4 e- k# y! j( f/ @ z/ O: y7 A
http://www.latitudeda.com/
8 K8 D0 p% l4 I1 r/ A(點擊上方名片關注我們,發(fā)現更多精彩內容) |
|