Uwni 筆記

幺正矩陣分解與光子學實現

是枼

背景

對於一個線形無損互易無反射 𝑁 輸入 𝑁 輸出 MIMO 器件來說、輸入和輸出之間的傳遞矩陣可以用一個 𝑁 階幺正矩陣 𝑼 來描述.這裏進行簡單的證明.設器件的散射矩陣爲 2𝑁 階方陣 𝑺

若器件是無損的、則 𝑺 是幺正的.則因其無損, 𝒙 |𝒙|2=|𝑺𝒙|2、 即 𝒙𝒙=𝒙𝑺𝑺𝒙𝑺𝑺=𝑰.也就是說 𝑺 是幺正矩陣.

若器件是互易的、就是說任何端口 𝑖 的輸入對端口 𝑗 輸出的貢獻和反過來、𝑗𝑖 的貢獻相同.則 𝑺𝑖𝑗=𝑺𝑗𝑖𝑺=𝑺𝖳𝑺 對稱.

若器件無反射1、即輸入端口的輸出不含任何輸入端口的分量.因爲器件可以任意順序編號、不妨將輸入端口編號爲 1,,𝑁 輸出端口編號爲 𝑁+1,,2𝑁.則 𝑺 可分塊爲

𝑺=[𝑶𝑨𝑩𝑶]

其中每塊階爲 𝑁 階方陣.𝑶𝑁 階零矩陣.此時

[𝒚in𝒚out]=𝑺[𝒙in𝒙out]=[𝑨𝒙out𝑩𝒙in]

因此線形無損互易無反射 𝑁 輸入 𝑁 輸出 MIMO 器件 𝑺 可分塊爲

𝑺=[𝑶𝑼𝖳𝑼𝑶],

其中 𝑼𝑁 階幺正矩陣.表徵了輸入和輸出之間的傳遞關係.即 𝒚out=𝑼𝒙in.這就是我們說的傳遞矩陣.

Example 1.
多模干涉耦合器

多模干涉器、是種常見的線形無損互易無反射 MIMO 器件.它由一個多模波導構成、輸入和輸出端口分別是多模波導的兩端.比如耦合長度爲 3/4𝐿π2×2 MMI、其傳遞矩陣爲

𝑼MMI=12[1𝑗𝑗1]

爲了實現某些功能的器件、我們可能早早的就在理論上得到了器件對應的傳遞矩陣 𝑼、但實際上要構造出來卻是非常困難的.理論上我們已經有了一些方法、將任意幺正矩陣分解成一系列二維旋轉矩陣和對角相位矩陣的乘積.這些二維旋轉矩陣和對角相位矩陣在物理上都比較容易實現、而其乘積恰對應了對應器件的級聯、因此這個分解方法為我們提供了一個從理論到實踐的橋梁.

圖示 3 𝑼(2) 变换基于 MZI 的實現
圖示 4 𝑼(2) 变换基于集成光学 MZI 的實現

在光子學中、二維旋轉矩陣 𝑼(2) 可以通過帶有一個端口移相器的 Mach-Zehnder 干涉儀來實現.其中 是分束器、在波導器件中、可以使用方向耦合器或者多模干涉器來實現.𝜔𝜙 是移相器、可以通過熱光、電光、或者載流子效應來實現.

Reck 三角分解

Reck 在 1994 年以構造性的證明提出了最先提出了第一種分解方法(Reck, Zeilinger, Bernstein, Bertani 1994)、我們稱爲三角形分解或者 Reck 分解. 正如前面所述、我們欲將任意幺正矩陣 𝑼 分解成一系列二維旋轉矩陣 𝑼(2) 和對角相位矩陣的乘積

𝑼(2)=[ei𝜑sin𝜔ei𝜑cos𝜔cos𝜔sin𝜔]

我們定義 𝑻𝑝𝑞𝑀(𝑁) 為在 𝑝𝑞 這兩列上作用 𝑼(2) 變換的矩陣、即

𝑻𝑝𝑞=[11ei𝜑sin𝜔00ei𝜑cos𝜔010010cos𝜔00sin𝜔11]
Example 2.

𝑝=𝑁1𝑞=𝑁

𝑻𝑁,𝑁1=[11sin𝜔cos𝜔eim𝜑cos𝜔eim𝜑sin𝜔].

𝑝=𝑁2𝑞=𝑁

𝑻𝑁,𝑁2=[11sin𝜔0cos𝜔010eim𝜑cos𝜔0eim𝜑sin𝜔].

這個矩陣 𝑻𝑝𝑞 的作用是將 𝑼 的第 𝑝𝑞 列所張之二維子空間上、施以 𝑼(2) 變換、而其他列保持不變.

𝑼 右乘以 𝑻𝑝𝑞、其積 𝑼𝑼𝑻𝑝𝑞 的第 𝑝, 𝑞 列的元素是經 𝑼𝑝𝑞 列的线性组合、而其他列不变.具體來說对任意第 𝑖 行:𝑢𝑖𝑗|𝑗𝑝,𝑞=𝑢𝑖𝑗

[𝑢𝑖𝑝,𝑢𝑖𝑞]=[𝑢𝑖𝑝,𝑢𝑖𝑞][𝑒𝑖𝜑sin𝜔𝑒𝑖𝜑cos𝜔cos𝜔sin𝜔],

故而我们可以适当选择 𝜔𝜑、使 𝑼 的任意第 𝑖 的第 𝑝 列元素 𝑢𝑖𝑝 通过与第 𝑞 列元素 𝑢𝑖𝑞 为零.比如对于 𝑢𝑖𝑞=0, 可解得相位条件 𝜔=arctan|𝑢𝑖𝑝/𝑢𝑖𝑞|+𝑘π, 𝜑=arg(𝑢𝑖𝑝/𝑢𝑖𝑞)+2𝑙π.其中 𝑘,𝑙𝗭

Remark .
在幾何上、因幺正性質、[𝑢𝑖𝑝,𝑢𝑖𝑞][𝑢𝑖𝑝,𝑢𝑖𝑞] 經過保距變換(如旋轉、鏡像)後的向量.因此我們可以將 [𝑢𝑖𝑝,𝑢𝑖𝑞] 「旋轉」到其中一個軸上、使得另一個軸上的分量為零.

我们可以从 𝑼 的最后一行(𝑖=𝑁)开始做起.通过右乘 𝑻𝑁𝑞(𝜔𝑁𝑞,𝜑𝑁𝑞)、对于 𝑞=𝑁1,𝑁2,,1、将 𝑼 最后一行除对角元素 𝑢𝑁,𝑁 外、从右向左依次归零. 取 𝜔=arctan|𝑢𝑁𝑞/𝑢𝑁𝑁| 以及 𝜑=arg(𝑢𝑁𝑞/𝑢𝑁𝑁)

𝑼𝑻𝑁,𝑁1=[𝑢11𝑢1,𝑁2𝑢𝑁1,1𝑢𝑁1,𝑁2𝑢𝑁1𝑢𝑁,𝑁20]

接下来、我们重复同样的操作、將末行第 𝑁2 列元素歸零:

𝑼𝑻𝑁,𝑁1𝑻𝑁,𝑁2=[𝑢11𝑢1,𝑁3𝑢𝑁1,1𝑢𝑁1,𝑁3𝑢𝑁1𝑢𝑁,𝑁300]

直至 𝑼 最后一行除对角元素外的所有元素均归零.

𝑼𝑻𝑁,𝑁1𝑻𝑁,𝑁2𝑻𝑁,1=[00]

利用幺正矩阵的性质23、我们可斷言 𝑼𝑻𝑁,𝑁1𝑻𝑁,𝑁2𝑻𝑁,1 其積:

  1. 幺正、
  2. (𝑁,𝑁) 元素的模为 1
  3. 除了 (𝑁,𝑁) 元素外的最后一行元素均为 0

便是说

𝑼𝑻𝑁,𝑁1𝑻𝑁,𝑁2𝑻𝑁,1=[0000eim𝛼],

于是我们不難驗證、左上角的 (𝑁1)×(𝑁1) 子陣、依然是幺正矩陣.記以爲 𝑼(𝑁1).同時對於任意 𝑁2、定義 𝑹(𝑁)=𝑻𝑁,𝑁1𝑻𝑁,𝑁2𝑻𝑁,1、則有:

𝑼𝑹(𝑁)=[𝑼(𝑁1)𝑶𝑶eim𝛼𝑁]

遞歸此过程直至第 1 行、所有非對角元素悉歸於 0.

𝑼𝑹(𝑁)𝑹(𝑁1)𝑹(2)=[eim𝛼1eim𝛼𝑁]𝑫1

最終得到一個對角相位矩陣、以其可逆、設以爲 𝑫1.是以 𝑼𝑹(𝑁)𝑹(𝑁1)𝑹(2)𝑫=𝑰𝑁.於是可得 𝑼 的分解形式:

𝑼=(𝑹(𝑁)𝑹(𝑁1)𝑹(2)𝑫)1=𝑫𝑹(2)𝑹(𝑁1)𝑹(𝑁)

結論

  • 𝑹(𝑁) 需要 𝑁1𝑼(2) 变换.
  • 因此、𝑼(2) 变换的总数为

    1+2++(𝑁1)=𝑁(𝑁1)2.

然而 Reck 三角形分解出的是不對稱的、即每一路徑上經歷的 𝑼(2) 變換的數量不同.在現實中、物理器件包含的損耗和誤差會隨著 𝑼(2) 變換的數量增加而增加、因此這種不對稱性會導致器件性能的下降.為了克服這個問題、Clements 等人提出了另一種分解方法.

Clements 矩形分解

直到 2016 年、Clements 等人才提出了另一种分解方法(Clements, Humphreys, Metcalf, Kolthammer, Walsmley 2016)、我们称之为矩形分解或者 Clements 分解.与 Reck 分解一眼的是、矩形分解也是將任意幺正矩陣分解成一系列二維旋轉矩陣和對角相位矩陣的乘積、但其二維旋轉矩陣的作用位置不同.

MPLC 分解

MPLC 分解是最近提出的一种分解方法(Tang, Tanemura, Nakano 2017).与前两者不同的是、MPLC 分解將幺正矩陣分解爲一系列混合矩陣和對角相位矩陣的乘積.其中的混合矩陣指的是任何元素皆非零的幺正矩陣.

引據

  • CLEMENTS, William R., HUMPHREYS, Peter C., METCALF, Benjamin J., KOLTHAMMER, W. Steven 和 WALSMLEY, Ian A., 2016. Optimal design for universal multiport interferometers. Optica. Online. 20 十二月 2016. Vol. 3, no. 12, p. 1460. DOI 10.1364/OPTICA.3.001460. [Accessed 2 三月 2026].
  • RECK, Michael, ZEILINGER, Anton, BERNSTEIN, Herbert J. 和 BERTANI, Philip, 1994. Experimental realization of any discrete unitary operator. Physical Review Letters. Online. 4 七月 1994. Vol. 73, no. 1, p. 58~61. DOI 10.1103/PhysRevLett.73.58. [Accessed 8 四月 2025].
  • TANG, Rui, TANEMURA, Takuo 和 NAKANO, Yoshiaki, 2017. Integrated Reconfigurable Unitary Optical Mode Converter Using MMI Couplers. IEEE Photonics Technology Letters. Online. 15 六月 2017. Vol. 29, no. 12, p. 971~974. DOI 10.1109/LPT.2017.2700619. [Accessed 23 五月 2026].
  1. 1一般來說無反射指的是任意端口的輸出不含有輸入成分、即對角元素爲 0、但這裏不是這種定義
  2. 2幺正矩阵的行(和列)构成一组正交归一基.
  3. 3幺正矩阵的乘积仍然是幺正矩阵.

論見