从心理学家的奇想到AI革命：游戏正在重塑世界模型的未来。

hzxxxz

107人浏览 · 2026-06-30 13:43:06

hzxxxz · 2026-06-30 13:43:06 发布

你有没有想过，我们日常玩的电子游戏，或许会成为训练下一代AI的绝佳试验场？82年前，一名31岁的苏格兰心理学家提出了一个颠覆性假说：人类思考的底层逻辑，是在大脑内部搭建一套现实世界的简化模型，依靠这套模型预判事态、做出决策。这套理论沉寂数十年，如今借着AI浪潮，在游戏赛道迎来落地爆发。今天我们就来拆解，这项理论将如何改变整个科技行业。

在这里插入图片描述

一、80年前一位天才的猜想，在当下终于得到验证。
1943年，第二次世界大战还未结束，现代数字计算机尚未问世。苏格兰心理学家肯尼斯·克雷克（Kenneth Craik）撰写了一本不到200页的著作——《解释的本质》。
在这本书中，他提出了颠覆当时学界的观点：人类能够进行思考，并不依靠虚无缥缈的“心灵意识”，本质是大脑为外部现实构建了一套简化的内部模型。遇到问题时，人类不必在现实里反复试错，只需要在大脑模型中推演模拟，就能筛选最优行动方案。
他将完整的思考逻辑拆解为三步：

感知：把外界信息转化为大脑可以识别的符号；
预测：依托符号逻辑推演，预判后续会发生的状况；
决策：将推演结果转化为实际行动。
感知‑预测‑行动，这套闭环，时至今日依旧是所有AI世界模型的底层逻辑。
可惜这位天才没能亲眼见证自己理论落地。1945年，欧洲胜利日前一日，Craik遭遇车祸离世，年仅31岁。事后有资料记载，爱因斯坦在读过他的著作后，评价其为一部极具前瞻性的作品。后续几十年里，人工智能、认知科学领域的研究者，不断引用他的理论。
在他离世后，这套思想分化成三大研究方向：控制论、认知科学、人工智能。1991年，部分AI学者提出“智能不一定依赖内部模型”，该论调让世界模型研究进入将近二十年的停滞期，直到2018年，这套理论才重新回归大众视野。

二、AI科研界达成共识：游戏是训练世界模型的最优试验场。
2018年，Google‑Brain团队联合AI领域学者施米德胡贝（Schmidhuber）发布论文《World‑Models（世界模型）》，让沉寂已久的概念重新重回AI主流赛道。
团队为AI赋予了“虚拟推演（做梦）”的能力：AI不需要持续和真实环境交互，可以在自身生成的虚拟场景里提前学习行为模式，再把习得的能力迁移至现实环境。研究团队以赛车游戏开展对照实验，AI先在自己生成的虚拟赛道内完成训练，迁移到原版游戏环境后就可以完成竞速。
自此该赛道迎来高速发展，从Dreamer算法到MuZero模型，大量实验都印证了：依托世界模型做预判决策，效果优于无模型的直接强化学习。
时至今日，世界模型已经从一项小众AI技术，演变为整个人工智能行业新的技术范式。纵观该领域的所有重大突破，绝大多数实验都依托游戏环境完成，背后存在四大核心原因：

自带标注数据
每一帧游戏画面对应玩家键鼠、手柄的操作行为，天然形成输入‑输出数据集，省去人工标注的高昂成本。谷歌训练Genie模型时，取用了20万小时游戏视频素材；如果换成自动驾驶数据集，同等量级的标注成本动辄数亿元。
物理规则逻辑固定
游戏内的重力、碰撞、流体等底层物理逻辑复刻现实世界。简化后的物理环境降低了AI的学习门槛，AI先在虚拟场景习得基础规律，再迁移落地到现实机器人、自动驾驶项目。
海量数据供给充足
仅Steam平台就拥有十几万款游戏，全球日均游戏玩家数以亿计。单游戏录屏平台每年可沉淀20亿条带操作记录的游戏片段，体量是自动驾驶、具身智能行业很难企及的。
动作范式已经定型
数十年的游戏发展，已经将人的主观意图，凝练为键鼠、手柄标准化的操作指令，不用AI从零摸索行为逻辑。
二者属于双向赋能关系：游戏不只是世界模型的训练载体，世界模型同样会革新游戏行业。当下传统游戏的NPC行为、物理交互都是开发人员硬编码写死的，交互模式被提前限定。如果接入世界模型，NPC可以根据实时场景自主做出反应，物理规则实现自主涌现，游戏的开放度和沉浸感会被大幅拉高。

三、各大科技巨头相继入局，游戏企业成为AI新战场。
2024年被视作世界模型商业化落地元年，多个标杆项目优先以游戏作为试验场景，吸引资本与各大科技企业扎堆布局。
谷歌做出了标志性实验：用神经网络重构1993年的经典游戏《DOOM》，摒弃传统游戏引擎的渲染管线、碰撞检测代码。怪物行动、子弹轨迹、门体开关全部由神经网络进行预测，依靠模型推演生成下一帧画面，帧率可以稳定达到20FPS。受限于技术现状，该版本仅能复刻老旧游戏，记忆窗口仅3秒，但已经证实：游戏逻辑可以通过模型学习生成，不必依靠人工硬写代码。
后续Google DeepMind推出迭代版Genie系列模型，实现了仅依靠游戏视频，就能从零生成全新可交互三维虚拟世界。迭代至2025年的Genie 3，已经能够生成时长一分钟、逻辑稳定的可交互3D场景，Waymo也将其用于自动驾驶仿真测试。
整个产业逻辑就此打通：世界模型需要大量带行为标记的视频数据；自动驾驶、人形机器人这类具身智能，需要借助世界模型理解现实物理规律，而游戏刚好补齐二者的中间环节，资本迅速嗅到了风口。
最具代表性的案例是游戏录屏平台Medal.tv。创始人拒绝OpenAI开出的5亿美元收购邀约，独立创立AI企业General Intuition，一年时间完成4.54亿美元融资，企业估值攀升至23亿美元。其核心壁垒，就是平台每年沉淀的20亿条、附带完整操作行为的游戏片段，创始人将其定义为下一代大模型预训练的核心数据源。
韩国《绝地求生》开发商KRAFTON布局更为激进，2025年宣布全面转型AI优先型企业，投入1000亿韩元搭建GPU算力集群，成立独立AI子公司，还联合韩华航空航天研发物理AI技术。企业对外明确表态：长期运营大型线上游戏、搭建虚拟物理环境的经验，是训练AI的核心资产，依托世界模型，业务可以从游戏延伸至国防仿真领域。
英伟达搭建世界模型底层基础设施Cosmos平台，定位为物理AI的基础底座；再结合Isaac‑Sim机器人仿真平台，打通“游戏引擎—世界模型—实体机器人”的完整技术链路。原本服务游戏行业的引擎技术，如今成为训练物理AI的底层支撑。
腾讯作为全球规模最大的游戏厂商，手握混元大模型、庞大算力储备以及完整的游戏产业生态。尽管还没有公开布局人形机器人赛道，但整个行业都在观望，腾讯什么时候依托游戏数据切入具身智能赛道。

四、延伸思考：未来机器人未必是人形形态。
很多人会产生固有认知：用游戏数据训练机器人，就必须复刻人类形态，依托人类肢体动作进行学习。这里其实存在一个思维误区。
一套手柄按键逻辑，既可以操控《艾尔登法环》的人形角色挥剑、翻滚，也能操控GT赛车完成漂移，还能操控GTA的直升机起降。同一套指令，可以适配完全不同形态的物理载体。
这就说明：游戏里的玩家操作数据，本质不是人形肢体的动作样本，而是“主观意图+环境反馈”的对应关系。世界模型从海量游戏数据里学到的，不是双足人形如何走路，而是在动态环境下，如何通过动作达成既定目标。
因此未来的机器人不一定非要做成人类外形，也不局限于双足行进。只要可以把自身意图转化为对应动作，这套行为逻辑完全能够依托海量的游戏人类行为数据训练习得。
回望整条技术脉络：从1943年Craik提出大脑内部模型理论，到如今AI依靠游戏数据训练实体机器人。碳基人类、硅基AI实现智能的底层逻辑始终一致：构建世界模型、推演预测、再执行行动。
当年Craik提出过一个核心观点：只有依靠内部推演模型，人类才能预判还未发生的事，以此节约时间、成本，规避风险。如今这套逻辑正从人脑迁移到AI身上，而游戏就是最好的训练场。
这位在31岁骤然离世的心理学家，没能见证自己理论落地的时代。可他当年脑海中那个简化的世界模型构想，如今正被写成代码、化为模型参数，慢慢落地成能够感知现实、自主行动的智能机器人。

【总结】
游戏早已不止是娱乐载体。当下它正在成为人工智能理解现实物理世界的课堂；而世界模型，也重新改写了游戏的商业价值——从文娱产品，升级成下一代AI的基础设施。这一轮技术变革，最先吃到红利的除了AI企业，还有手握海量游戏数据的游戏厂商。

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

使用概率图路径规划的机器人路径规划研究Octave（Matlab代码实现）

针对复杂未知环境下传统机器人路径规划算法适应性差、避障稳定性弱、全局搜索效率低的问题，本文开展基于概率图的机器人路径规划方法研究。概率图路径规划依托概率路线图建模思想，通过环境随机采样、节点连通性构建、最优路径检索的核心逻辑，摆脱了传统算法对环境精准建模的依赖，具备强环境适配性与高运算效率。本文系统阐述概率图路径规划的核心理论、运行机制与技术优势，基于Octave仿真平台搭建多场景机器人运动规划仿