新加坡国立大学 (NUS) 的统计学家推出了一种新技术,可以使用低维平滑结构准确描述高维数据。这项创新标志着在解决复杂非线性降维挑战方面向前迈出了重要一步。

欧几里得空间之外的高维数据缩减的流形拟合方法

传统的数据分析方法通常依赖于特征之间的欧几里德(线性)依赖关系。虽然这种方法简化了数据表示,但它很难捕获高维数据中潜在的复杂模式,通常位于低维流形附近。

为了弥补这一差距,流形学习技术已经成为一种有前景的解决方案。然而,现有的方法,例如流形嵌入和去噪,由于缺乏详细的几何理解和强大的理论基础而受到限制。

该团队由新加坡国立大学统计与数据科学系副教授姚志刚领导,他拥有博士学位。学生 Jiaji Su 开创了一种有效估计隐藏在高维数据中的低维流形的新方法。这种方法不仅实现了最先进的估计精度和收敛速度,还通过利用深度生成对抗网络(GAN)提高了计算效率。

这项工作是与清华大学丘成桐数学科学中心(YMSC)的丘成桐教授合作进行的。部分工作来自姚教授在学术休假期间访问哈佛大学数学科学与应用中心(CMSA)期间与丘教授的合作。

他们的研究结果已作为方法论论文发表在《美国国家科学院院刊》上。

姚教授在最近于 2024 年 1 月 2 日至 5 日在上海举行的国际中国数学家大会(ICCM)上就这项研究发表了 45 分钟的特邀报告。

姚教授强调了这项工作的意义,他说:“通过精确拟合流形,我们可以降低数据维度,同时保留关键信息,包括底层的几何结构。这代表了数据分析的重大飞跃,提高了准确性和效率。我们的研究提供了一种克服以前方法局限性的解决方案,为增强数据分析铺平了道路,并为科学界的各种应用提供了宝贵的见解。”

展望未来,姚的研究团队正在开发一个新的框架来处理更复杂的数据,例如单细胞RNA序列数据,同时继续与YMSC团队合作。这项正在进行的工作有望彻底改变复杂数据集的减少和处理方法,有可能为一系列科学领域提供新的见解。