基于典型相关性分析的多视图学习方法（基于数据降维的 CCA）——稀疏典型相关分析（Sparse CCA）...

痛经少女小Ta

514人浏览 · 2024-07-16 03:03:25

痛经少女小Ta · 2024-07-16 03:03:25 发布

稀疏典型相关分析（Sparse Canonical Correlation Analysis, Sparse CCA）是典型相关分析（CCA）的一个扩展版本，其目标是在两组变量之间找到具有最大相关性的线性组合，同时使这些线性组合尽可能地简洁，即只包含少量的非零系数。这使得结果更加易于解释，同时也减少了计算负担。

典型相关分析 (CCA)

在传统的CCA中，对于两组随机变量基于典型相关性分析的多视图学习方法（基于数据降维的 CCA）——稀疏典型相关分析（Sparse CCA）_学习方法和，其中是样本数量， 和是各自的特征维度，CCA的目标是找到投影向量和，使得和之间的相关性最大化。

稀疏CCA的目标

在Sparse CCA中，除了最大化相关性之外，我们还希望投影向量 基于典型相关性分析的多视图学习方法（基于数据降维的 CCA）——稀疏典型相关分析（Sparse CCA）_协方差矩阵_06 和是稀疏的，这意味着它们包含很多零元素，只保留最重要的变量。

这可以通过在优化问题中加入正则化项来实现，通常使用的是基于典型相关性分析的多视图学习方法（基于数据降维的 CCA）——稀疏典型相关分析（Sparse CCA）_学习方法_12 范数（Lasso回归），以鼓励系数向量的稀疏性。

Sparse CCA的优化问题

Sparse CCA的优化问题可以表示为：

基于典型相关性分析的多视图学习方法（基于数据降维的 CCA）——稀疏典型相关分析（Sparse CCA）_优化问题_13

其中，

和分别是和的协方差矩阵，
是和之间的互协方差矩阵，
是稀疏性参数，控制投影向量中非零系数的数量，
subject to 即s.t. ，表示约束条件。

公式解释

和
、和：协方差和互协方差矩阵，分别表示和
：表示向量的范数，即向量中所有元素的绝对值之和，用于促进稀疏性。
：稀疏性参数，用于限制和

解决方法

Sparse CCA的优化问题通常不是凸的，因此找到全局最优解可能很困难。实践中，通常使用迭代算法，如交替方向乘子法（ADMM）或坐标下降法，来近似求解这个问题。

总结

Sparse CCA通过在CCA的基础上添加稀疏约束，实现了在保持最大相关性的同时，简化了模型并提高了可解释性。这对于处理高维数据集尤其有用，因为高维数据集中往往包含大量冗余或无关的变量。

原创作者: u_15837794 转载于: https://blog.51cto.com/u_15837794/11458100

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

具身智能策略模型：Diffusion Policy、OpenVLA 与 π0

本文对比了三种机器人动作生成模型的核心原理与差异： DiffusionPolicy：通过加噪-去噪生成连续动作块，解决多峰分布问题，适合精细操作但语言理解能力较弱。 OpenVLA：将连续动作离散化为token，利用VLM理解图像和语言指令，自回归生成动作序列，但需量化可能损失连续性。 π0：结合VLM的语义理解与FlowMatching的连续动作生成，通过预测修正方向迭代优化动作块，兼具任务理解

DAMO开发者矩阵

MiniMax M3 新手快速上手指南

在开发智能应用时，很多开发者往往卡在“如何快速让代码跑通”这一步。面对复杂的文档和繁多的配置项，容易陷入细节而忽略了核心逻辑的验证。其实，接入一个大语言模型并没有想象中那么困难，关键在于理清从密钥获取到首次成功调用的最小路径。一旦打通了这个闭环，后续的上下文管理、流式输出等高级功能自然就能顺势展开。对于正在构建客服机器人、智能助手或数据分析工具的技术人员来说，掌握标准的 API 调用流程是必备技能