幺正矩陣分解與光子學實現

背景

對於一個線形無損互易無反射 $𝑁$ 輸入 $𝑁$ 輸出 MIMO 器件來說、輸入和輸出之間的傳遞矩陣可以用一個 $𝑁$ 階幺正矩陣 $𝑼$ 來描述．這裏進行簡單的證明．設器件的散射矩陣爲 $2 𝑁$ 階方陣 $𝑺$ 、

若器件是無損的、則 $𝑺$ 是幺正的．則因其無損, $\forall 𝒙$ ${| 𝒙 |}^{2} = {| 𝑺 𝒙 |}^{2}$ 、即 $𝒙^{⊹} 𝒙 = 𝒙^{⊹} 𝑺^{⊹} 𝑺 𝒙 \Leftrightarrow 𝑺^{⊹} 𝑺 = 𝑰$ ．也就是說 $𝑺$ 是幺正矩陣．

若器件是互易的、就是說任何端口 $𝑖$ 的輸入對端口 $𝑗$ 輸出的貢獻和反過來、 $𝑗 \to 𝑖$ 的貢獻相同．則 $𝑺_{𝑖 𝑗} = 𝑺_{𝑗 𝑖} \Leftrightarrow 𝑺 = 𝑺^{𝖳}$ 、 $𝑺$ 對稱．

若器件無反射¹、即輸入端口的輸出不含任何輸入端口的分量．因爲器件可以任意順序編號、不妨將輸入端口編號爲 $1, \dots, 𝑁$ 輸出端口編號爲 $𝑁 + 1, \dots, 2 𝑁$ ．則 $𝑺$ 可分塊爲

𝑺 = [\begin{matrix} 𝑶 & 𝑨 \\ 𝑩 & 𝑶 \end{matrix}]

其中每塊階爲 $𝑁$ 階方陣． $𝑶$ 爲 $𝑁$ 階零矩陣．此時

[\begin{matrix} 𝒚_{in} \\ 𝒚_{out} \end{matrix}] = 𝑺 [\begin{matrix} 𝒙_{in} \\ 𝒙_{out} \end{matrix}] = [\begin{matrix} 𝑨 𝒙_{out} \\ 𝑩 𝒙_{in} \end{matrix}]

因此線形無損互易無反射 $𝑁$ 輸入 $𝑁$ 輸出 MIMO 器件 $𝑺$ 可分塊爲

𝑺 = [\begin{matrix} 𝑶 & 𝑼^{𝖳} \\ 𝑼 & 𝑶 \end{matrix}],

其中 $𝑼$ 是 $𝑁$ 階幺正矩陣．表徵了輸入和輸出之間的傳遞關係．即 $𝒚_{out} = 𝑼 𝒙_{in}$ ．這就是我們說的傳遞矩陣．

Example 1.

多模干涉耦合器

多模干涉器、是種常見的線形無損互易無反射 MIMO 器件．它由一個多模波導構成、輸入和輸出端口分別是多模波導的兩端．比如耦合長度爲 $3 / 4 𝐿_{π}$ 的 $2 \times 2$ MMI、其傳遞矩陣爲

𝑼_{MMI} = \frac{1}{\sqrt{2}} [\begin{matrix} 1 & - 𝑗 \\ - 𝑗 & 1 \end{matrix}]

爲了實現某些功能的器件、我們可能早早的就在理論上得到了器件對應的傳遞矩陣 $𝑼$ 、但實際上要構造出來卻是非常困難的．理論上我們已經有了一些方法、將任意幺正矩陣分解成一系列二維旋轉矩陣和對角相位矩陣的乘積．這些二維旋轉矩陣和對角相位矩陣在物理上都比較容易實現、而其乘積恰對應了對應器件的級聯、因此這個分解方法為我們提供了一個從理論到實踐的橋梁．

圖示 3

𝑼 (2)

变换基于 MZI 的實現

圖示 4

𝑼 (2)

变换基于集成光学 MZI 的實現

在光子學中、二維旋轉矩陣 $𝑼 (2)$ 可以通過帶有一個端口移相器的 Mach-Zehnder 干涉儀來實現．其中 $〼$ 是分束器、在波導器件中、可以使用方向耦合器或者多模干涉器來實現． $𝜔$ 和 $𝜙$ 是移相器、可以通過熱光、電光、或者載流子效應來實現．

Reck 三角分解

Reck 在 1994 年以構造性的證明提出了最先提出了第一種分解方法(Reck, Zeilinger, Bernstein, Bertani 1994)、我們稱爲三角形分解或者 Reck 分解.

圖示 5 Reck 构型的 layout. 其中每一个 ✕ 为一个

𝑼 (2)

正如前面所述、我們欲將任意幺正矩陣 $𝑼$ 分解成一系列二維旋轉矩陣 $𝑼 (2)$ 和對角相位矩陣的乘積

𝑼 (2) = [\begin{matrix} e^{i 𝜑} sin 𝜔 & e^{i 𝜑} cos 𝜔 \\ cos 𝜔 & - sin 𝜔 \end{matrix}]

我們定義 $𝑻_{𝑝 𝑞} \in 𝑀 (𝑁)$ 為在 $𝑝$ 和 $𝑞$ 這兩列上作用 $𝑼 (2)$ 變換的矩陣、即

𝑻_{𝑝 𝑞} = [\begin{matrix} 1 \\ ⋱ \\ 1 \\ e^{i 𝜑} sin 𝜔 & 0 & \dots & 0 & e^{i 𝜑} cos 𝜔 \\ 0 & 1 & 0 \\ ⋮ & ⋱ & ⋮ \\ 0 & 1 & 0 \\ cos 𝜔 & 0 & \dots & 0 & - sin 𝜔 \\ 1 \\ ⋱ \\ 1 \end{matrix}]

Example 2.

當 $𝑝 = 𝑁 - 1$ 而 $𝑞 = 𝑁$ 時

𝑻_{𝑁, 𝑁 - 1} = [\begin{matrix} 1 \\ ⋱ \\ 1 \\ - sin 𝜔 & cos 𝜔 \\ e^{im 𝜑} cos 𝜔 & e^{im 𝜑} sin 𝜔 \end{matrix}] .

當 $𝑝 = 𝑁 - 2$ 而 $𝑞 = 𝑁$ 時

𝑻_{𝑁, 𝑁 - 2} = [\begin{matrix} 1 \\ ⋱ \\ 1 \\ - sin 𝜔 & 0 & cos 𝜔 \\ 0 & 1 & 0 \\ e^{im 𝜑} cos 𝜔 & 0 & e^{im 𝜑} sin 𝜔 \end{matrix}] .

這個矩陣 $𝑻_{𝑝 𝑞}$ 的作用是將 $𝑼$ 的第 $𝑝$ 和 $𝑞$ 列所張之二維子空間上、施以 $𝑼 (2)$ 變換、而其他列保持不變．

将 $𝑼$ 右乘以 $𝑻_{𝑝 𝑞}$ 、其積 $𝑼^{'} ≔ 𝑼 \cdot 𝑻_{𝑝 𝑞}$ 的第 $𝑝$ , $𝑞$ 列的元素是經 $𝑼$ 的 $𝑝$ 和 $𝑞$ 列的线性组合、而其他列不变．具體來說对任意第 $𝑖$ 行： ${𝑢_{𝑖 𝑗}^{'} |}_{𝑗 \neq 𝑝, 𝑞} = 𝑢_{𝑖 𝑗}$

[𝑢_{𝑖 𝑝}^{'}, 𝑢_{𝑖 𝑞}^{'}] = [𝑢_{𝑖 𝑝}, 𝑢_{𝑖 𝑞}] [\begin{matrix} 𝑒^{𝑖 𝜑} sin 𝜔 & 𝑒^{𝑖 𝜑} cos 𝜔 \\ cos 𝜔 & - sin 𝜔 \end{matrix}],

故而我们可以适当选择 $𝜔$ 和 $𝜑$ 、使 $𝑼^{'}$ 的任意第 $𝑖$ 的第 $𝑝$ 列元素 $𝑢_{𝑖 𝑝}^{'}$ 通过与第 $𝑞$ 列元素 $𝑢_{𝑖 𝑞}^{'}$ 为零．比如对于 $𝑢_{𝑖 𝑞}^{'} = 0$ , 可解得相位条件 $𝜔 = arctan | 𝑢_{𝑖 𝑝} / 𝑢_{𝑖 𝑞} | + 𝑘 π$ , $𝜑 = arg (𝑢_{𝑖 𝑝} / 𝑢_{𝑖 𝑞}) + 2 𝑙 π$ ．其中 $𝑘, 𝑙 \in 𝗭$ ．

Remark .

在幾何上、因幺正性質、

[𝑢_{𝑖 𝑝}^{'}, 𝑢_{𝑖 𝑞}^{'}]

是

[𝑢_{𝑖 𝑝}, 𝑢_{𝑖 𝑞}]

經過保距變換（如旋轉、鏡像）後的向量．因此我們可以將

[𝑢_{𝑖 𝑝}, 𝑢_{𝑖 𝑞}]

「旋轉」到其中一個軸上、使得另一個軸上的分量為零．

我们可以从 $𝑼$ 的最后一行（ $𝑖 = 𝑁$ ）开始做起．通过右乘 $𝑻_{𝑁 𝑞} (𝜔_{𝑁 𝑞}, 𝜑_{𝑁 𝑞})$ 、对于 $𝑞 = 𝑁 - 1, 𝑁 - 2, \dots, 1$ 、将 $𝑼$ 最后一行除对角元素 $𝑢_{𝑁, 𝑁}$ 外、从右向左依次归零．取 $𝜔 = arctan | 𝑢_{𝑁 𝑞} / 𝑢_{𝑁 𝑁} |$ 以及 $𝜑 = arg (𝑢_{𝑁 𝑞} / 𝑢_{𝑁 𝑁})$ 、

𝑼 \cdot 𝑻_{𝑁, 𝑁 - 1} = [\begin{matrix} 𝑢_{11} & \dots & 𝑢_{1, 𝑁 - 2} & * & * \\ ⋮ & ⋱ & ⋮ & ⋮ & ⋮ \\ 𝑢_{𝑁 - 1, 1} & \dots & 𝑢_{𝑁 - 1, 𝑁 - 2} & * & * \\ 𝑢_{𝑁 1} & \dots & 𝑢_{𝑁, 𝑁 - 2} & 0 & * \end{matrix}]

接下来、我们重复同样的操作、將末行第 $𝑁 - 2$ 列元素歸零：

𝑼 \cdot 𝑻_{𝑁, 𝑁 - 1} \cdot 𝑻_{𝑁, 𝑁 - 2} = [\begin{matrix} 𝑢_{11} & \dots & 𝑢_{1, 𝑁 - 3} & * & * & * \\ ⋮ & ⋱ & ⋮ & ⋮ & ⋮ & ⋮ \\ 𝑢_{𝑁 - 1, 1} & \dots & 𝑢_{𝑁 - 1, 𝑁 - 3} & * & * & * \\ 𝑢_{𝑁 1} & \dots & 𝑢_{𝑁, 𝑁 - 3} & 0 & 0 & * \end{matrix}]

直至 $𝑼$ 最后一行除对角元素外的所有元素均归零．

𝑼 \cdot 𝑻_{𝑁, 𝑁 - 1} \cdot 𝑻_{𝑁, 𝑁 - 2} \dots 𝑻_{𝑁, 1} = [\begin{matrix} * & \dots & * & * \\ ⋮ & ⋱ & ⋮ & ⋮ \\ * & \dots & * & * \\ 0 & \dots & 0 & * \end{matrix}]

利用幺正矩阵的性质²³、我们可斷言 $𝑼 \cdot 𝑻_{𝑁, 𝑁 - 1} \cdot 𝑻_{𝑁, 𝑁 - 2} \dots 𝑻_{𝑁, 1}$ 其積：

幺正、
$(𝑁, 𝑁)$ 元素的模为 $1$ 、
除了 $(𝑁, 𝑁)$ 元素外的最后一行元素均为 $0$ ．

便是说

𝑼 \cdot 𝑻_{𝑁, 𝑁 - 1} \cdot 𝑻_{𝑁, 𝑁 - 2} \dots 𝑻_{𝑁, 1} = [\begin{matrix} * & \dots & * & 0 \\ ⋮ & ⋱ & ⋮ & ⋮ \\ * & \dots & * & 0 \\ 0 & \dots & 0 & e^{im 𝛼} \end{matrix}],

于是我们不難驗證、左上角的 $(𝑁 - 1) \times (𝑁 - 1)$ 子陣、依然是幺正矩陣．記以爲 $𝑼 (𝑁 - 1)$ ．同時對於任意 $𝑁 \geq 2$ 、定義 $𝑹 (𝑁) = 𝑻_{𝑁, 𝑁 - 1} \cdot 𝑻_{𝑁, 𝑁 - 2} \dots 𝑻_{𝑁, 1}$ 、則有:

𝑼 \cdot 𝑹 (𝑁) = [\begin{matrix} 𝑼 (𝑁 - 1) & 𝑶 \\ 𝑶 & e^{im 𝛼_{𝑁}} \end{matrix}]

遞歸此过程直至第 1 行、所有非對角元素悉歸於 0．

𝑼 \cdot 𝑹 (𝑁) \cdot 𝑹 (𝑁 - 1) \dots 𝑹 (2) = [\begin{matrix} e^{im 𝛼_{1}} \\ ⋱ \\ e^{im 𝛼_{𝑁}} \end{matrix}] ≕ 𝑫^{- 1}

最終得到一個對角相位矩陣、以其可逆、設以爲 $𝑫^{- 1}$ ．是以 $𝑼 \cdot 𝑹 (𝑁) \cdot 𝑹 (𝑁 - 1) \dots 𝑹 (2) \cdot 𝑫 = 𝑰_{𝑁}$ ．於是可得 $𝑼$ 的分解形式：

\begin{aligned} 𝑼 & = {(𝑹 (𝑁) \cdot 𝑹 (𝑁 - 1) \dots 𝑹 (2) \cdot 𝑫)}^{- 1} \\ = 𝑫^{⊹} \cdot {𝑹 (2)}^{⊹} \dots {𝑹 (𝑁 - 1)}^{⊹} \cdot {𝑹 (𝑁)}^{⊹} \end{aligned}

以 $𝑁 = 5$ 為例、將上述遞歸過程逐步展開、可得下圖．每一行對應遞歸的一步、不同的颜色对应不同的编号．

圖示 6 Reck 分解的逐步構造（

𝑁 = 5

）

結論

$𝑹 (𝑁)$ 需要 $𝑁 - 1$ 个 $𝑼 (2)$ 变换．
因此、 $𝑼 (2)$ 变换的总数为
$1 + 2 + \dots + (𝑁 - 1) = \frac{𝑁 (𝑁 - 1)}{2} .$

然而 Reck 三角形分解出的是不對稱的、即每一路徑上經歷的 $𝑼 (2)$ 變換的數量不同．在現實中、物理器件包含的損耗和誤差會隨著 $𝑼 (2)$ 變換的數量增加而增加、因此這種不對稱性會導致器件性能的下降．為了克服這個問題、Clements 等人提出了另一種分解方法．

CLEMENTS, William R., HUMPHREYS, Peter C., METCALF, Benjamin J., KOLTHAMMER, W. Steven 和 WALSMLEY, Ian A., 2016. Optimal design for universal multiport interferometers. Optica. Online. 20 十二月 2016. Vol. 3, no. 12, p. 1460. DOI 10.1364/OPTICA.3.001460. [Accessed 2 三月 2026].
RECK, Michael, ZEILINGER, Anton, BERNSTEIN, Herbert J. 和 BERTANI, Philip, 1994. Experimental realization of any discrete unitary operator. Physical Review Letters. Online. 4 七月 1994. Vol. 73, no. 1, p. 58～61. DOI 10.1103/PhysRevLett.73.58. [Accessed 8 四月 2025].
TANG, Rui, TANEMURA, Takuo 和 NAKANO, Yoshiaki, 2017. Integrated Reconfigurable Unitary Optical Mode Converter Using MMI Couplers. IEEE Photonics Technology Letters. Online. 15 六月 2017. Vol. 29, no. 12, p. 971～974. DOI 10.1109/LPT.2017.2700619. [Accessed 23 五月 2026].

幺正矩陣分解與光子學實現

背景

Reck 三角分解

結論

Clements 矩形分解

MPLC 分解

引據

論見