大家好,以后就叫我 AI 盒子哥吧。

在 AI 大模型的浪潮中,我们正见证着一场前所未有的技术革命。自 AI 大模型问世以来,其发展速度之快,真是按天计算,令人惊叹。在 AI 大模型领域,中国的表现尤为亮眼。虽然 OpenAI 是大模型的开创者,但它并不开源。而在中国,大模型的开源精神正蓬勃发展,为全球 AI 技术的进步贡献着力量。

让我们回顾一下 2025 年发生的一些重大 AI 大模型事件,感受一下这场技术革命的脉搏:

时间 国外/国内 事件
2025 年 1 月 5 日 国内 讯飞星火发布推理思考模型讯飞星火 X1 和星火语音同传模型,讯飞星火 4.0 Turbo 模型再升级
2025 年 1 月 6 日 国内 生数科技发布上线视频生成模型 Vidu 2.0,生成价格更低、速度更快、质量更稳
2025 年 1 月 9 日 国内 昆仑万维宣布推理思考模型天工 4.0 O1 版(Skywork O1)全量上线,用户可免费使用
2025 年 1 月 15 日 国外 Google 发布人脑记忆模型 Titian,引入神经长期记忆模块,能在测试时学习记忆
2025 年 1 月 16 日 国外 Luma 发布视频模型 Ray 2
2025 年 1 月 17 日 国外 Sakana 推出自适应模型 Transformer square,引入自适应机制,提高语言模型在未见任务上的泛化和自适应能力
2025 年 1 月 20 日 国外 月之暗面公布多模态思考模型 Kimi k1.5,在数学、代码、多模态推理能力等方面都接近 OpenAI 满血版 o1
2025 年 2 月 3 日 国内 百度智能云千帆大模型平台正式上线了 DeepSeek-R1 与 DeepSeek-V3 模型,模型上线首日,已有超 1.5 万家客户通过千帆平台进行模型调用
2025 年 2 月 5 日 国内 百度智能云宣布近日成功点亮昆仑芯三代万卡集群,这也是国内首个正式点亮的自研万卡集群。百度智能云还将进一步点亮 3 万卡集群
2025 年 2 月 8 日 国内 百度智能云宣布旗下客悦、曦灵、一见、甄知四款大模型应用产品,正式上线接入 DeepSeek 模型的新版本。同时,百度智能云正加速推进金融、交通、政务、汽车、医疗、工业等行业应用产品与 DeepSeek 模型的适配验证工作
2025 年 2 月 10 日 国内 百度百舸基于昆仑芯 P800,发布部署 “满血版 DeepSeek R1 + 联网搜索” 服务,帮助企业解决 DeepSeek 企业级部署难题
2025 年 2 月 13 日 国内 百度宣布文心一言将于 4 月 1 日零时起,全面免费,所有 PC 端和 App 端用户均可体验文心系列最新模型
2025 年 2 月 14 日 国内 百度宣布将在未来几个月中陆续推出文心大模型 4.5 系列,并于 6 月 30 日起正式开源
2025 年 2 月 17 日 国外 马斯克发布新一代大模型 Grok 3,并称其为 “地球上最聪明的人工智能”
2025 年 2 月 25 日 国外 Claude 发 3.7 Sonnet,最大的亮点是业界首个混合推理模型
2025 年 2 月 25 日 国内 凌晨 5 点半,阿里发了推理模型 QwQ-Max 的预览版!阿里版的 R1!另外 Qwen 2.5-Max 直接开源了!
2025 年 2 月 25 日 国内 阿里云视频生成大模型万相 2.1(Wan)重磅开源

在这场技术革命中,中国正以惊人的速度和开放的态度引领着 AI 大模型的发展。短短几个月内,不仅有开源语言类大模型,开源视频类大模型也已出现,还有一些正在开源的路上。这种开源精神不仅推动了技术的进步,也为全球开发者提供了更多的机会和可能性。

2025 年 2 月 25 日晚间,阿里云正式宣布其视频生成大模型万相 2.1(Wan)重磅开源,这一消息在 AI 领域引起了广泛关注,被视为 AI 视频发展的重要里程碑。万相 2.1 是全球首个支持中英双语、首个实现无限长 1080P 视频编解码的开源文生视频模型。它采用最宽松的 Apache2.0 协议,将 14B 和 1.3B 两个参数规格的全部推理代码和权重全部开源。这意味着开发者们可以更加自由地使用和研究该模型,推动 AI 视频技术的进一步发展。

曾经,像即梦、Sora 这样的文生图、文生视频工具大多是商业应用,使用它们往往需要单独付费。

如今,阿里改变了这一局面,将 AI 视频模型开源了!阿里成为大厂中首个迈出这一步的,其开源的 AI 视频模型就如同 DeepSeek 的视频版,为行业带来了新的活力。

在硬件要求方面,万相 2.1 也表现出极大的优势。其 1.3B 的模型只需要 8GB 的显存就能运行,大大降低了硬件门槛,使得更多的开发者和企业能够参与到 AI 视频的创作中来。在性能方面,万相 2.1 在权威评测集 VBench 中以总分 86.22% 的成绩超越了 Sora、Luma、Pika 等国内外模型,登顶榜首。这充分证明了其在视频生成领域的强大实力和领先地位。我们看一下效果

效果一:古风女孩,穿着古代服饰,古代发型发髻,头发在空中轻灵的摆动

古风女孩,穿着古代服饰,古代发型发髻,头发在空中轻灵的摆动


 

效果二:连绵的雪山高耸入云,阳光洒在雪山上泛起金色光芒

复古太空通信员,转身操作通信设备,背景是撒哈拉沙漠和金字塔

效果三:水珠落网,蜘蛛网上挂着几颗透明的水珠,形成美丽的光斑

水珠落网,蜘蛛网上挂着几颗透明的水珠,形成美丽的光斑

阿里云此次开源万相 2.1,不仅为开发者们提供了强大的工具,也为 AI 视频行业的发展注入了新的活力。随着万相 2.1 的开源,相信会有越来越多的创新应用和解决方案涌现出来,推动 AI 视频技术在更多领域的应用和发展。这不仅是阿里云的一次重大突破,也是中国 AI 技术在全球舞台上的一次精彩亮相。未来,随着更多开源模型的出现和技术的不断进步,AI 视频领域将迎来更加广阔的发展前景。

 AI 盒子哥感谢您的关注!

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐