我的研究过程中,遇到了如下的优化问题.现在考虑下面这种情形,我有任意的 𝑛 阶幺正矩陣 𝑼𝑈(𝑛) 对应了可实现的物理构造,然后有 𝑛 阶输入方阵为 𝑿, 𝑛=2𝑚, 𝑿 的前 𝑚 行是 𝑚 bit 的 BPSK 信号的所有组合,数学上就是 Rademacher 空间,后 𝑛𝑚 行为每行都相同的 𝑛𝑚 个自由未定参数.也就是说 𝑿 的每一列代表了一种 BPSK 编码的输入状态,即 Rademacher 空间 {±1}𝑚 中的一个元素,如若 𝑚=3 的时候的话,𝑿 可写成

(11111111𝑎1𝑎1𝑎1𝑎1𝑎𝑛𝑚𝑎𝑛𝑚𝑎𝑛𝑚𝑎𝑛𝑚)
(1)

每一行代表了一个输入信号通道.

写成分块矩阵为

𝑿(𝒂)=(𝑩𝑨)
(2)

其中 𝑩𝑚 行的 BPSK 信号矩阵,其列枚举了所有的 𝑚 bit BPSK 信号组合,𝑨𝑛𝑚 行的自由参数矩阵.其各列皆为 𝑛𝑚 元向量 𝒂.即

.考虑输入信号的每一种状态,即 𝑿 的每一列

,其中 𝒃𝑗𝑩 的第 𝑗 列.现在考虑功率矩阵 𝑷 为输出 𝑼𝑿 各元素的功率,即有

𝑝𝑖𝑗=|(𝑼𝑿)𝑖𝑗|2=|𝒖𝑖,𝒙𝑗|2,𝒖𝑖𝗖1×𝑛,𝒙𝑗𝗖𝑛×1
(3)

并对 𝑷 的每一列向量归一化后成为 𝑷norm. 我现在要这个物理器件在对以 𝒂 为额外输入参数时,成为一个译码器(decoder)的功能.数学上,即对幺正矩阵 𝑼 和向量 𝒂𝑷norm 𝐼𝐹2 求最小值优化,其中 𝑰 为同阶的单位阵.也就是说要输出尽可能为 one-hot 的分布. 通过数值计算我发现所有的局部最优值都是全局最优(即有多个局部最优但结果都一样),现在要通过理论分析来证明这一点.

整理目標函數

现在有几个重要的事实 显然有一点对于 𝑿 的每一列其功率都是一样的,即对于每一列

𝐿𝒙𝑗2=𝒃𝑗2+𝒂2=𝑚+𝒂2
(4)

即每一列的功率都同为 𝐿. 那么优化问题自然便成了

min𝑼𝑈(𝑛)𝒂𝗖𝑛𝑚𝑷𝐿𝑰𝐹2=𝑖=1𝑛𝑗=1𝑛(𝑝𝑖𝑗𝐿𝛿𝑖𝑗)2=𝑖,𝑗|𝑝𝑖𝑗|22𝐿𝑖=1𝑛𝑗=1𝑛𝑝𝑖𝑗𝛿𝑖𝑗+𝑛𝐿2=𝑖,𝑗|𝑝𝑖𝑗|22𝐿𝑖=1𝑛𝑝𝑖𝑖+𝑛𝐿2
(5)

𝑼 分块,第 𝑖𝒖𝑖𝗖1×𝑛 拆成

𝒖𝑖=(𝒗𝑖𝒘𝑖)
(6)

其中 𝒗𝑖𝗖1×𝑚, 𝒘𝑖𝗖1×(𝑛𝑚).因为 𝑼 幺正,𝒗𝑖2+𝒘𝑖2=1𝑖 行, 𝑗 列,所對應的輸出元素為

𝑦𝑖𝑗=𝒖𝑖,𝒙𝑗=𝒗𝑖,𝒃𝑗+𝒘𝑖,𝒂
(7)

觀察到 𝑗𝒃𝑗=0, 𝑗𝒃𝑗𝒃𝑗𝐻=𝑛𝑰, 定義 𝑟𝑖𝒗𝑖2𝒓(𝑟𝑖), 注意到 0𝑟𝑖1

𝑖=1𝑛𝑟𝑖=𝑖=1𝑛𝒗𝑖2=𝑚
(8)

因爲 𝑾𝑼 的右 (𝑛𝑚) 列块,幺正矩阵的列正交归一化意味着 𝑾H𝑾=𝑰𝑛𝑚,所以定义

𝑖=1𝑛|𝒘𝑖,𝒂|2=𝑾𝒂2=𝒂H𝑾H𝑾𝒂=𝒂2
(9)

對於固定的输出端口 𝑖 在各个状态 𝑗 下的平均功率有

1𝑛𝑗=1𝑛𝑝𝑖𝑗=1𝑛𝑗=1𝑛|𝑦𝑖𝑗|2=1𝑛(|𝒗𝑖,𝒃𝑗|2+|𝒘𝑖,𝒂|2)=
(10)

可行域的結構