我院博士研究生李梦雨和导师孟澄助理教授合作发表多篇高水平论文(李玉乔 博士研究生)
最优输运(optimal transport,ot)是经典的数学问题,目标是寻找一个保测度的映射或规划,使得总的输运代价最小。自18世纪法国数学家gaspard monge提出最优输运以来,这个问题已得到了广泛的关注。国际知名数学家、首位华裔菲尔兹奖得主丘成桐院士对ot与计算几何的联系进行了深入的研究;意大利数学家alessio figalli因在ot理论及其在偏微分方程、度量几何和概率方面的应用做出的重要贡献,被授予2018年菲尔兹奖;martin arjovsky等学者基于ot提出了改进的生成对抗网络(wgan),成功解决了生成对抗网络(gan)训练不稳定、训练进程难以判断、生成样本缺乏多样性等问题,在机器学习领域引起了极大的轰动。此外,最优输运在统计学、金融数学、生物医学、量子物理和量子化学等领域也有广泛的应用。
sinkhorn算法是近似求解ot问题最常用的方法之一。然而,其计算复杂度随样本量增加呈平方增长,难以应用于大规模数据。为了减轻计算负担,我们提出了一种“重要性稀疏化”(spar-sink)方法,快速高效地近似求解平衡或非平衡的ot问题,将sinkhorn算法的平方复杂度降为线性复杂度。具体而言,我们创新性地发现未知的最优输运规划(optimal transport plan)具有天然的已知上界并且能够显式表示。因此,
我们利用这一上界作为重要性采样的采样概率对核矩阵进行稀疏化,从而加速矩阵运算。理论上,在一定的正则条件下,我们证明了所提出算法的收敛性及估计量的相合性。对于心脏超声(echocardiogram)视频,我们提出用ot问题中的wasserstein-fisher-rao距离刻画任意两帧之间的差异,并展示了spar-sink方法能够有效地识别和可视化心脏周期,由此可以初步诊断出心力衰竭和心律不齐(见下图)。为了评估心脏周期预测的数值准确性,我们考虑了预测心脏收缩末期的任务。结果表明,和经典的sinkhorn算法相比,spar-sink算法只需约2.3%的时间即可达到几乎相同的准确率。
gromov-wasserstein (gw)距离常用于度量结构化数据之间的差异,在图分析、形状匹配和点云配准等任务中具有重要应用。然而,精确计算gw距离是一个np-hard问题,计算成本高昂。为了克服这一困难,我们将“重要性稀疏化”的思想拓展至近似gw距离,提出了spar-gw方法(见下图)。该方法适用于任意的数据类型和损失函数,并且可以用于计算gw距离的变体,例如entropic gw距离、fused gw距离和unbalanced gw距离。理论上,我们证明了算法在一定正则化条件下的收敛性。通过广泛的数值模拟和真实数据实验,我们验证了spar-gw方法的性能、效率与稳健性,及其在图分类、图聚类等任务中的价值。
李梦雨,中国人民大学统计与大数据研究院2020级直博生,主要研究方向为大规模数据子抽样方法、最优输运中的计算问题与理论性质分析等。曾获2022年、2023年联合统计会议(joint statistical meetings)学生论文奖。博士学习期间成绩优异,多次获得博士研究生一等奖学金。代表性研究成果:
mengyu li & junlong zhao (2022). “communication-efficient distributed linear discriminant analysis for binary classification.”statistica sinica, 32, 1343–1361.
mengyu li, jun yu, hongteng xu & cheng meng (2023). “efficient approximation of gromov-wasserstein distance using importance sparsification.”journal of computational and graphical statistics, 1–25.
mengyu li, jun yu, tao li & cheng meng (2023). “importance sparsification for sinkhorn algorithm.”the journal of machine learning research. accepted.
mengyu li, jun yu, tao li & cheng meng (2023+). “core-elements for classical linear regression.” revision instatistica sinica.
李涛,中国人民大学统计与大数据研究院2019级直博生,主要研究方向为最优传输、生成模型、非线性相依关系度量和大数据子抽样。目前已有论文发表在期刊《journal of computational and graphical statistics》、《international journal of cyber-physical systems》上。博士学习期间成绩优异,获得博士研究生一等奖学金。
虞俊,北京理工大学数学与统计学院助理教授,博士生导师。详情请见个人主页:https://junyubeta.github.io/yujunbeta.github.io/index.html
许洪腾,中国人民大学高瓴人工智能学院准聘副教授,博士生导师。详情请见个人主页:https://hongtengxu.github.io/
孟澄,中国人民大学统计与大数据研究院助理教授,博士生导师。详情请见个人主页:https://chengzijunaixiaoli.github.io/
发表评论