黄仁勋2026年度公司演讲,又一次颠覆了认知
甚至当用户的朋友远程接入,问“我的猫 Potato 在干嘛”,Agent 能看摄像头、认出猫、发现它在沙发上、还记得朋友不喜欢猫上沙发、然后通过机器人喊话让猫下去。以前的模型是一口气给你答案,对就对,错就错。这不是普通的代码补全,而是一个真正的 AI Agent,你告诉它想实现什么功能,它会自己规划怎么写,查阅文档,生成代码,测试,修 bug,甚至重构。它会自己规划步骤,调用工具,查资料,写代码,
老黄站在 CES 2026 的舞台上,身后的屏幕突然黑了。“所有系统都挂了,”他笑着说,“这在圣克拉拉从来不会发生。是因为拉斯维加斯吗?外面是不是有人中了头奖?”
这个小插曲倒是个不错的隐喻:2025 年的 AI 行业,就像一台马力全开但偶尔冒烟的机器。所有人都在全速狂奔,所有系统都在满负荷运转。
老黄在 CES 上说,每隔十来年,计算行业就要来一次大洗牌。从大型机到 PC,从 PC 到互联网,从互联网到云,从云到移动端。
这一次不太一样,地震是双重的。不仅应用要建在 AI 之上,连我们写软件的方式本身都变了。
“我们不再编程软件,我们训练软件。不再跑在 CPU 上,而是 GPU 上。”过去的应用是预编译好的,装在你设备上就那样了。现在呢?应用理解你的上下文,每次从零开始,实时生成每个像素、每个 token。
这意味着过去十年砸下去的十万亿美元计算基础设施,都要升级换代。老黄算了一笔账:全球百万亿美元产值的产业,研发预算正在从传统方法向 AI 方法迁移。风投每年两千亿美元涌入这个领域。这就是为什么大家都这么忙。
【1】2025,大模型的三个拐点
老黄回顾了 2025 年 AI 领域的几个关键进展。
第一个是推理模型的出现。2024 年底 OpenAI 发布 o1,第一次让 AI 学会了“思考”。以前的模型是一口气给你答案,对就对,错就错。现在的推理模型会停下来想一想,把问题拆开,一步步推演。想得越久,答案往往越靠谱。老黄管这叫“test-time scaling”,也就是用更多的推理时间换更高的回答质量。
第二个是 Agentic 系统的爆发。AI 不再只是回答问题,而是开始“做事”了。它会自己规划步骤,调用工具,查资料,写代码,甚至操控其他 AI。2025 年,这类系统从实验室走向了真实应用。
第三个是开源模型的崛起。DeepSeek R1 的发布像一颗炸弹,证明了开源模型也能达到前沿水平。虽然还落后闭源模型大约六个月,但下载量已经爆炸式增长。创业公司、研究者、学生、甚至各国政府,都开始用开源模型构建自己的 AI 能力。
这三个突破并非孤立存在。推理能力让 Agent 更聪明,开源模型让 Agent 更容易构建。它们相互催化,共同把 AI 推向了一个新阶段。
【2】Agentic AI:从“能聊天”到“能干活”
三个突破里,Agentic AI 可能是离普通人最近、又最容易被误解的一个。
先说一个直观的例子。老黄提到,英伟达内部现在大量使用 Cursor 编程工具。这不是普通的代码补全,而是一个真正的 AI Agent,你告诉它想实现什么功能,它会自己规划怎么写,查阅文档,生成代码,测试,修 bug,甚至重构。程序员的角色从“写代码的人”变成了“审代码的人”。
这就是 Agentic AI 的本质:AI 从被动回答问题,变成主动完成任务。
ChatGPT 刚出来的时候,最大的槽点是“幻觉”,它会一本正经地胡说八道。因为它只能依赖训练时学到的知识,没法获取新信息,但它又被要求有问必答,所以不得不胡编乱造。你问它今天的天气,它只能编一个。
Agentic 系统解决这个问题的方式很简单:让 AI 学会“查资料”自己补充上下文。遇到不确定的问题,它会先判断“我需不需要去查一下”,然后真的去搜索、去阅读、去核实。这个判断本身就需要推理能力,所以第一个突破(推理模型)是第二个突破(Agentic 系统)的基础。
但 Agentic AI 的能力远不止于此。
【3】Agent 的四种超能力
老黄在演讲中描绘了一个完整的 Agent 能力图谱。我把它总结为四种超能力:
第一,会推理。遇到从没见过的问题,Agent 不会直接说“我不会”。它会把陌生问题拆解成一堆熟悉的小问题,然后逐个击破。就像一个聪明的实习生,虽然没做过这个项目,但能把它分解成自己会的步骤。
第二,会用工具。Agent 可以调用搜索引擎、计算器、代码解释器、数据库,甚至其他 AI 模型。它知道什么时候该用什么工具,就像一个老练的工匠,手边有一整套工具,可以随手选最趁手的那个。
第三,会规划。面对复杂任务,Agent 会先想好怎么做,制定计划,预判可能的结果,然后一步步执行。不是闷头往前冲,而是“三思而后行”。
第四,会协作。这是老黄特别强调的一点:现代 Agent 系统往往是多个模型并存的。一个 Agent 可能同时调用好几个 AI:用专门的模型处理图片,用另一个模型写代码,用第三个模型做总结。就像一个项目经理,知道每个专家擅长什么,然后把任务分配给最合适的人。
他特别提到 Perplexity 的做法让他眼前一亮:“第一次看到他们同时用多个模型,我觉得这太天才了。”道理很简单:一个 AI 当然应该在推理链的任何环节调用最适合那个任务的模型。
所以未来的 AI 应用是什么样的?多模态(理解语音、图像、文字、视频、3D)、多模型(不同任务用不同模型)、多云(模型分布在各个云上)、混合云(有些在边缘、有些在企业、有些在云端)。
【4】一个 Agent 是怎么工作的?
NVIDIA 为此搞了一套叫“Blueprint”的框架。演讲中展示了一个演示:一个小哥用 DGX Spark 搭了个个人助手,能管邮件、日历、待办事项,还能控制一个小机器人。隐私敏感的邮件任务用本地模型,其他用 frontier 模型,中间用一个意图路由器自动分配。
听起来像科幻片,但搭建过程出奇简单。
首先,接入一个前沿大模型的 API 作为“大脑”。然后,为每个功能创建一个“工具”:邮件工具、日历工具、摄像头工具。接着,因为邮件涉及隐私,开发者加了一个本地运行的开源模型专门处理邮件,数据不出本机。最后,加一个“智能路由器”,根据用户的意图自动决定用哪个模型处理。
结果呢?用户说“帮我给 Jensen 发个邮件,告诉他脚本今天能交”,Agent 就自己完成了。用户说“把这张草图变成建筑渲染图,再做个视频带我看看房间”,Agent 也搞定了。甚至当用户的朋友远程接入,问“我的猫 Potato 在干嘛”,Agent 能看摄像头、认出猫、发现它在沙发上、还记得朋友不喜欢猫上沙发、然后通过机器人喊话让猫下去。
老黄说,这一切在两年前是“完全不可想象的”。而现在,“这已经变得微不足道了”。
Agentic AI 的概念其实不新。早在 2023 年,AutoGPT 就火过一阵,号称能让 GPT 自己给自己下指令、自动完成任务。但那时候的 Agent 更像是玩具,经常跑偏、容易卡死、实用性有限。
2025 年的爆发,靠的是几个条件同时成熟:
1. 推理能力的突破。没有可靠的推理,Agent 就像一个冲动的实习生,一拍脑袋就开干,经常把事情搞砸。有了推理,Agent 才能“想清楚再做”。
2. 工具生态的完善。各种 API、各种开源模型、各种开发框架,让 Agent 能调用的“武器库”越来越丰富。
3. 多模型架构的成熟。以前大家想的是“训练一个无所不能的大模型”。现在的思路是“让一个聪明的模型学会调用专业的模型”。这大大降低了构建复杂 Agent 的门槛。
4. 开源社区的推动。老黄反复强调,开源模型让“每个公司、每个行业、每个国家”都能参与 AI 革命。你不用自己训练前沿模型,拿开源的来用就行。
【5】Agent 会取代软件吗?
包括我在内很多人都思考一个问题:未来 Agent 会取代软件吗?交互形式是什么样的?
老黄在演讲中给出的答案是:Agent 不只是一种新应用,而是未来软件的新形态。
他说,以后你跟 Palantir、ServiceNow、Snowflake 这些企业软件打交道,界面可能不再是一堆表格和按钮。你直接跟一个 Agent 对话,告诉它你想干什么,它就帮你搞定。“就像跟人打交道一样简单。”
传统软件的交互方式:填表单、点按钮、写 SQL,本质上是在“迁就机器”。你得学会机器的语言才能让它干活。而 Agent 的交互方式是“机器迁就你”。你用自然语言说需求,Agent 自己翻译成机器能懂的操作。
当然,这不会一夜之间发生。企业软件涉及太多复杂的权限、流程、合规要求,不是换个界面就能解决的。但方向已经很清楚了。
【6】写在最后
老黄这场演讲其实还讲了物理 AI、自动驾驶、机器人、下一代芯片 Vera Rubin,我对那些关注不多就不总结了。但如果只看 AI 大模型这块,核心信息其实就一个:
> AI 正在从“一个聪明的对话伙伴”变成“一个能调动资源、完成任务的系统”。推理模型给了它思考能力,Agentic 架构给了它手脚和工具箱,开放模型让所有人都能参与这场游戏。
我个人比较关注老黄在演讲中提到的 Agentic 系统将成为所有软件平台的新界面。以前你和软件交互,要点菜单、填表格、写命令行。以后你和软件交互,就像和一个懂行的同事说话。你说想干什么,它帮你干。未来的企业软件,入口可能就是一个对话框。
对于开发者来说,这是一个窗口期。开源模型已经足够强,Agentic 框架已经成熟,基础设施已经就位。剩下的就是应用层的创新。
老黄在谈到开放模型时问了一个问题:数字形式的智能,怎么可能把任何人落下?
Agentic AI 的爆发,不是每个人都能训练出最强的模型,但每个人都可以学会编排这些模型,让它们为自己干活。
这可能是最重要的变化。AI 不再只是科技巨头的游戏,它正在变成每个人都能用的工具。
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐



所有评论(0)