时序预测的重要性大家懂的都懂,不过传统模型只擅长处理一维的数字序列,对于交通、气象、金融等领域来说,还是多模态时序预测更受欢迎。

这种热度也体现在最近的顶会上,比如华东师大的首个通用多模态时序预测模型Aurora,在零样本少样本场景下吊打传统模型,性能直接拉满,一经提出就爆火,后续收录于ICLR 2026。

这篇算是当前多模态时序预测最具代表性的前沿工作之一了,属于模型架构与能力增强这个主流创新赛道。对于也想冲顶会的朋友来说,非常值得借鉴。

当然,仅凭这篇是不够当思路参考的,本文整理了18篇多模态时序预测前沿论文,附代码,帮助大家直接站在前沿,快速找到自己的创新点冲击顶会。

全部论文+开源代码需要的同学看文末

【ICLR 2026】Aurora: Towards universal generative multimodal time series forecasting

研究方法:论文提出首个多模态时间序列基础模型 Aurora,在跨域多模态时序语料上预训练,融合时序、文本、图像三种模态信息,通过模态引导多头自注意力注入领域知识,并设计原型引导流匹配实现零样本、生成式概率预测,在单 / 多模态、跨域场景均达到最优效果。

创新点:

  • 提出首个多模态时间序列基础模型Aurora,基于跨域多模态时序语料预训练,支持文本、图像、时序三模态输入与零样本推理。

  • 设计模态引导多头自注意力模块,将文本与图像中的领域知识显式注入时序特征建模,提升跨域泛化能力。

  • 创新原型引导流匹配解码方式,以周期与趋势原型为生成起点,实现稳定高效的生成式概率时序预测。

研究价值:Aurora 作为首个多模态时间序列基础模型,通过融合时序、文本、图像三类模态信息并引入领域知识引导,显著提升了跨域零样本预测性能,为多元场景下通用化、生成式概率时序预测提供了全新技术范式与最优基准。

Multi-Modal View Enhanced Large Vision Models for Long-Term Time Series Forecasting

研究方法:论文提出一种分解式多模态时序预测框架,先把原始时序数据分解为趋势、季节和残差分量,再将时序序列转化为数值与视觉图像两种模态,分别用数值预测模型与大视觉模型建模,最后通过自适应融合机制整合双模态特征,实现更鲁棒、更精准的长时序多变量预测。

创新点:

  • 提出分解式多模态时序预测框架,将时序数据拆分为趋势、季节和残差分量,降低预测难度。

  • 把时序序列同时转化为数值与图像两种模态,分别利用数值模型和大视觉模型进行互补建模。

  • 设计自适应模态融合策略,动态整合双模态信息,提升长时序、多变量场景下预测的精度与稳定性。

研究价值:论文聚焦多模态时序预测,通过时序分解、数值与图像双模态联合建模以及自适应特征融合,显著提升复杂多变量、长时序预测的精度与鲁棒性,为大视觉模型在时序预测领域的深度应用提供了可落地、可推广的技术框架与实践参考。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“222”获取全部方案+开源代码

码字不易,欢迎大家点赞评论收藏

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐