从心理学家的奇想到AI革命:游戏正在重塑世界模型的未来。
你有没有想过,我们日常玩的电子游戏,或许会成为训练下一代AI的绝佳试验场?82年前,一名31岁的苏格兰心理学家提出了一个颠覆性假说:人类思考的底层逻辑,是在大脑内部搭建一套现实世界的简化模型,依靠这套模型预判事态、做出决策。这套理论沉寂数十年,如今借着AI浪潮,在游戏赛道迎来落地爆发。今天我们就来拆解,这项理论将如何改变整个科技行业。

一、80年前一位天才的猜想,在当下终于得到验证。
1943年,第二次世界大战还未结束,现代数字计算机尚未问世。苏格兰心理学家肯尼斯·克雷克(Kenneth Craik)撰写了一本不到200页的著作——《解释的本质》。
在这本书中,他提出了颠覆当时学界的观点:人类能够进行思考,并不依靠虚无缥缈的“心灵意识”,本质是大脑为外部现实构建了一套简化的内部模型。遇到问题时,人类不必在现实里反复试错,只需要在大脑模型中推演模拟,就能筛选最优行动方案。
他将完整的思考逻辑拆解为三步:
- 感知:把外界信息转化为大脑可以识别的符号;
- 预测:依托符号逻辑推演,预判后续会发生的状况;
- 决策:将推演结果转化为实际行动。
感知‑预测‑行动,这套闭环,时至今日依旧是所有AI世界模型的底层逻辑。
可惜这位天才没能亲眼见证自己理论落地。1945年,欧洲胜利日前一日,Craik遭遇车祸离世,年仅31岁。事后有资料记载,爱因斯坦在读过他的著作后,评价其为一部极具前瞻性的作品。后续几十年里,人工智能、认知科学领域的研究者,不断引用他的理论。
在他离世后,这套思想分化成三大研究方向:控制论、认知科学、人工智能。1991年,部分AI学者提出“智能不一定依赖内部模型”,该论调让世界模型研究进入将近二十年的停滞期,直到2018年,这套理论才重新回归大众视野。
二、AI科研界达成共识:游戏是训练世界模型的最优试验场。
2018年,Google‑Brain团队联合AI领域学者施米德胡贝(Schmidhuber)发布论文《World‑Models(世界模型)》,让沉寂已久的概念重新重回AI主流赛道。
团队为AI赋予了“虚拟推演(做梦)”的能力:AI不需要持续和真实环境交互,可以在自身生成的虚拟场景里提前学习行为模式,再把习得的能力迁移至现实环境。研究团队以赛车游戏开展对照实验,AI先在自己生成的虚拟赛道内完成训练,迁移到原版游戏环境后就可以完成竞速。
自此该赛道迎来高速发展,从Dreamer算法到MuZero模型,大量实验都印证了:依托世界模型做预判决策,效果优于无模型的直接强化学习。
时至今日,世界模型已经从一项小众AI技术,演变为整个人工智能行业新的技术范式。纵观该领域的所有重大突破,绝大多数实验都依托游戏环境完成,背后存在四大核心原因:
- 自带标注数据
每一帧游戏画面对应玩家键鼠、手柄的操作行为,天然形成输入‑输出数据集,省去人工标注的高昂成本。谷歌训练Genie模型时,取用了20万小时游戏视频素材;如果换成自动驾驶数据集,同等量级的标注成本动辄数亿元。 - 物理规则逻辑固定
游戏内的重力、碰撞、流体等底层物理逻辑复刻现实世界。简化后的物理环境降低了AI的学习门槛,AI先在虚拟场景习得基础规律,再迁移落地到现实机器人、自动驾驶项目。 - 海量数据供给充足
仅Steam平台就拥有十几万款游戏,全球日均游戏玩家数以亿计。单游戏录屏平台每年可沉淀20亿条带操作记录的游戏片段,体量是自动驾驶、具身智能行业很难企及的。 - 动作范式已经定型
数十年的游戏发展,已经将人的主观意图,凝练为键鼠、手柄标准化的操作指令,不用AI从零摸索行为逻辑。
二者属于双向赋能关系:游戏不只是世界模型的训练载体,世界模型同样会革新游戏行业。当下传统游戏的NPC行为、物理交互都是开发人员硬编码写死的,交互模式被提前限定。如果接入世界模型,NPC可以根据实时场景自主做出反应,物理规则实现自主涌现,游戏的开放度和沉浸感会被大幅拉高。
三、各大科技巨头相继入局,游戏企业成为AI新战场。
2024年被视作世界模型商业化落地元年,多个标杆项目优先以游戏作为试验场景,吸引资本与各大科技企业扎堆布局。
谷歌做出了标志性实验:用神经网络重构1993年的经典游戏《DOOM》,摒弃传统游戏引擎的渲染管线、碰撞检测代码。怪物行动、子弹轨迹、门体开关全部由神经网络进行预测,依靠模型推演生成下一帧画面,帧率可以稳定达到20FPS。受限于技术现状,该版本仅能复刻老旧游戏,记忆窗口仅3秒,但已经证实:游戏逻辑可以通过模型学习生成,不必依靠人工硬写代码。
后续Google DeepMind推出迭代版Genie系列模型,实现了仅依靠游戏视频,就能从零生成全新可交互三维虚拟世界。迭代至2025年的Genie 3,已经能够生成时长一分钟、逻辑稳定的可交互3D场景,Waymo也将其用于自动驾驶仿真测试。
整个产业逻辑就此打通:世界模型需要大量带行为标记的视频数据;自动驾驶、人形机器人这类具身智能,需要借助世界模型理解现实物理规律,而游戏刚好补齐二者的中间环节,资本迅速嗅到了风口。
最具代表性的案例是游戏录屏平台Medal.tv。创始人拒绝OpenAI开出的5亿美元收购邀约,独立创立AI企业General Intuition,一年时间完成4.54亿美元融资,企业估值攀升至23亿美元。其核心壁垒,就是平台每年沉淀的20亿条、附带完整操作行为的游戏片段,创始人将其定义为下一代大模型预训练的核心数据源。
韩国《绝地求生》开发商KRAFTON布局更为激进,2025年宣布全面转型AI优先型企业,投入1000亿韩元搭建GPU算力集群,成立独立AI子公司,还联合韩华航空航天研发物理AI技术。企业对外明确表态:长期运营大型线上游戏、搭建虚拟物理环境的经验,是训练AI的核心资产,依托世界模型,业务可以从游戏延伸至国防仿真领域。
英伟达搭建世界模型底层基础设施Cosmos平台,定位为物理AI的基础底座;再结合Isaac‑Sim机器人仿真平台,打通“游戏引擎—世界模型—实体机器人”的完整技术链路。原本服务游戏行业的引擎技术,如今成为训练物理AI的底层支撑。
腾讯作为全球规模最大的游戏厂商,手握混元大模型、庞大算力储备以及完整的游戏产业生态。尽管还没有公开布局人形机器人赛道,但整个行业都在观望,腾讯什么时候依托游戏数据切入具身智能赛道。
四、延伸思考:未来机器人未必是人形形态。
很多人会产生固有认知:用游戏数据训练机器人,就必须复刻人类形态,依托人类肢体动作进行学习。这里其实存在一个思维误区。
一套手柄按键逻辑,既可以操控《艾尔登法环》的人形角色挥剑、翻滚,也能操控GT赛车完成漂移,还能操控GTA的直升机起降。同一套指令,可以适配完全不同形态的物理载体。
这就说明:游戏里的玩家操作数据,本质不是人形肢体的动作样本,而是“主观意图+环境反馈”的对应关系。世界模型从海量游戏数据里学到的,不是双足人形如何走路,而是在动态环境下,如何通过动作达成既定目标。
因此未来的机器人不一定非要做成人类外形,也不局限于双足行进。只要可以把自身意图转化为对应动作,这套行为逻辑完全能够依托海量的游戏人类行为数据训练习得。
回望整条技术脉络:从1943年Craik提出大脑内部模型理论,到如今AI依靠游戏数据训练实体机器人。碳基人类、硅基AI实现智能的底层逻辑始终一致:构建世界模型、推演预测、再执行行动。
当年Craik提出过一个核心观点:只有依靠内部推演模型,人类才能预判还未发生的事,以此节约时间、成本,规避风险。如今这套逻辑正从人脑迁移到AI身上,而游戏就是最好的训练场。
这位在31岁骤然离世的心理学家,没能见证自己理论落地的时代。可他当年脑海中那个简化的世界模型构想,如今正被写成代码、化为模型参数,慢慢落地成能够感知现实、自主行动的智能机器人。
【总结】
游戏早已不止是娱乐载体。当下它正在成为人工智能理解现实物理世界的课堂;而世界模型,也重新改写了游戏的商业价值——从文娱产品,升级成下一代AI的基础设施。这一轮技术变革,最先吃到红利的除了AI企业,还有手握海量游戏数据的游戏厂商。
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐
所有评论(0)