我的研究过程中,遇到了如下的优化问题.现在考虑下面这种情形,我有任意的 阶幺正矩陣 对应了可实现的物理构造,然后有 阶输入方阵为 , , 的前 行是 bit 的 BPSK 信号的所有组合,数学上就是 Rademacher 空间,后 行为每行都相同的 个自由未定参数.也就是说 的每一列代表了一种 BPSK 编码的输入状态,即 Rademacher 空间 中的一个元素,如若 的时候的话, 可写成
(1)
每一行代表了一个输入信号通道.
写成分块矩阵为
(2)
其中 为 行的 BPSK 信号矩阵,其列枚举了所有的 bit BPSK 信号组合, 为 行的自由参数矩阵.其各列皆为 元向量 .即
.考虑输入信号的每一种状态,即 的每一列
,其中 为 的第 列.现在考虑功率矩阵 为输出 各元素的功率,即有
(3)
并对 的每一列向量归一化后成为 . 我现在要这个物理器件在对以 为额外输入参数时,成为一个译码器(decoder)的功能.数学上,即对幺正矩阵 和向量 对 求最小值优化,其中 为同阶的单位阵.也就是说要输出尽可能为 one-hot 的分布. 通过数值计算我发现所有的局部最优值都是全局最优(即有多个局部最优但结果都一样),现在要通过理论分析来证明这一点.
整理目標函數
现在有几个重要的事实 显然有一点对于 的每一列其功率都是一样的,即对于每一列
有
(4)
即每一列的功率都同为 . 那么优化问题自然便成了
(5)
把 分块,第 行 拆成
(6)
其中 , .因为 幺正, 而 行, 列,所對應的輸出元素為
(7)
觀察到 , , 定義 ,, 注意到
(8)
因爲 为 的右 列块,幺正矩阵的列正交归一化意味着 ,所以定义
(9)
對於固定的输出端口 在各个状态 下的平均功率有
(10)