登录社区云,与社区用户共同成长
邀请您加入社区
作者 | 刘瑷玮,清华大学博士生 【ICLR 2025 预讲会】系列内容 ICLR 2025预讲会系列文章来源于 DAMO 开发者矩阵与 AI Time 联合举办ICLR 2025预讲会整理成稿,旨在帮助大家率先了解深度学习领域的最新研究方向和成果。本文为文章作者的观点/研究数据,仅供参考,不代表本账号的观点和研究内容,版权归分享人所有。 内容简介 文本水印技术在检测大型语言模型(LLM)输出以及
作者 | 李佳键,上海交通大学硕士生 【ICLR 2025 预讲会】系列内容 ICLR 2025预讲会系列文章来源于 DAMO 开发者矩阵与 AI Time 联合举办 ICLR 2025预讲会整理成稿,旨在帮助大家率先了解深度学习领域的最新研究方向和成果。本文为文章作者的观点/研究数据,仅供参考,不代表本账号的观点和研究内容,版权归分享人所有。 摘要 LS-Imagine 通过纯视觉观测来玩 Mi
作者 | 易璐中国人民大学高瓴人工智能学院博士生 【ICLR 2025 预讲会】系列内容 ICLR 2025预讲会系列文章来源于 DAMO 开发者矩阵与 AI Time 联合举办 ICLR 2025预讲会整理成稿,旨在帮助大家率先了解深度学习领域的最新研究方向和成果。本文为文章作者的观点/研究数据,仅供参考,不代表本账号的观点和研究内容,版权归分享人所有。 摘要 随着图神经网络(GNNs)在涉及
作者|任毅,英属哥伦比亚大学博士生 【ICLR 2025预讲会】系列内容 ICLR 2025预讲会系列文章来源于 DAMO 开发者矩阵与 AI Time 联合举办 ICLR 2025预讲会整理成稿,旨在帮助大家率先了解深度学习领域的最新研究方向和成果。本文为文章作者的观点/研究数据,仅供参考,不代表本账号的观点和研究内容,版权归分享人所有。 摘要 学习动态(Learning dynamics)描述
作者|陈晓栋,中国人民大学硕士研究生 【ICLR 2025预讲会】系列内容 ICLR 2025预讲会系列文章来源于 DAMO 开发者矩阵与 AI Time 联合举办 ICLR 2025预讲会整理成稿,旨在帮助大家率先了解深度学习领域的最新研究方向和成果。本文为文章作者的观点/研究数据,仅供参考,不代表本账号的观点和研究内容,版权归分享人所有。 摘要 模型剪枝是一类重要而且应用广泛的模型压缩方法,其
作者|李瑞凤,浙江大学博士生 【ICLR 2025预讲会】系列内容 ICLR 2025预讲会系列文章来源于 DAMO 开发者矩阵与 AI Time 联合举办 ICLR 2025预讲会整理成稿,旨在帮助大家率先了解深度学习领域的最新研究方向和成果。本文为文章作者的观点/研究数据,仅供参考,不代表本账号的观点和研究内容,版权归分享人所有。 摘要 分子性质预测是药物研发工作中非常重要且基础的任务。当前的
作者|陈东平,华东科技大学本科生 【ICLR 2025预讲会】系列内容 ICLR 2025预讲会系列文章来源于 DAMO 开发者矩阵与 AI Time 联合举办 ICLR 2025预讲会整理成稿,旨在帮助大家率先了解深度学习领域的最新研究方向和成果。本文为文章作者的观点/研究数据,仅供参考,不代表本账号的观点和研究内容,版权归分享人所有。 摘要 在多模态内容生成领域,提出了ISG 评测框架以解决
作者|方伟,阿里巴巴达摩院高级算法工程师 摘要 在扩散模型的应用中,可控生成具有重要的实际价值,但也具有挑战性。目前的可控生成方法主要聚焦于扩散模型的得分函数(score function)或神经网络结构,而均值回归扩散模型(Mean Reverting Diffusion, MR Diffusion)直接修改随机微分方程(SDE)的结构,使图像控制条件的引入更加简单自然,在图像超分、修复、增强等
作者|陈威华,阿里巴巴达摩院高级算法专家 摘要 近年来,视频生成领域的进展主要依赖于扩散模型来生成短时内容。然而,这些方法在建模复杂叙事和保持角色长期一致性方面存在明显不足,这恰恰是电影等长视频制作的关键需求。 为此,我们提出MovieDreamer——一种创新的层次化框架,通过整合自回归模型和基于扩散的渲染技术,首次实现了具有复杂情节推进和高视觉保真度的长视频生成。 该方法采用自回归模型确保
作者|陈官正,达摩院实习生 摘要 随着 LLM 产业的发展,实践应用中用户愈加看重模型的长文本上下文能力。但主流模型大都是为短上下文场景优化的,其长文本上下文能力往往无法与短文本能力相提并论,主要是长文本数据标注困难等原因造成的。 对此,达摩院团队提出了一种名为 LongPO的新方法。通过自进化学习过程使模型在无需长文本优质数据训练的前提下,将短文本能力迁移泛化到长文本上下文场景,同时不影响模型