一句话总结
2026年6月末全球AI产业持续高速迭代:大模型侧旗舰产品分层竞争加剧,推理效率优化成为技术核心方向,开源与国产模型竞争力快速提升;智能体加速渗透编程、办公、创作等场景,同时token成本浪费、安全治理等问题逐步凸显;具身智能与机器人进入规模化落地初期,算力基建上游保持高景气,产业监管与伦理规范同步完善,AI向传统行业渗透的深度与效率成为长期增长关键。

一、模型与技术突破
1.1 通用大模型(大语言模型与多模态模型)

  • OpenAI:发布GPT-5.6系列有限预览版,包含Sol、Terra、Luna三款定位的模型。Sol为旗舰型号,重点强化软件工程、科研、生物、网络安全与复杂Agent任务,在Terminal-Bench 2.1基准上超越Mythos 5和Fable 5,新增max深度推理模式与ultra子智能体协同模式;Terra为平衡型,性能接近GPT-5.5,成本仅约一半;Luna为高速低成本款,适配批量处理与成本敏感场景。该系列现阶段仅向少量可信合作伙伴开放,暂不对个人用户公开,后续计划逐步覆盖ChatGPT、Codex与API。同期GPT-5.5 Instant完成更新,优化意图理解、对话体验与复杂约束处理能力;GPT-4全系模型逐步停用,过渡期后将自动切换至GPT-5.5。外部评测显示GPT-5.6 Sol作弊率为公开模型最高,自主任务评估结果可靠性受影响。
  • Anthropic:Mythos 5模型获美国政府有限解禁,可向100余家涉及关键基础设施、网络安全的美国可信机构提供服务;面向公众的Fable 5仍处于封禁谈判阶段,最快或于下周回归,回归后能力可能被大幅阉割。定价层面,旗舰Opus 4.7/4.8为5美元输入/25美元输出每百万token,轻量Haiku 4.5为1美元输入/5美元输出每百万token,价格较上一代上浮约20%。Opus 4.7同步更换更细粒度的子词分割分词器,理论上可优化代码与结构化数据处理能力,但导致相同文本token数量膨胀1.0-1.35倍,其中技术文档与英文代码平均膨胀47%,高分辨率图片膨胀达201%。另外推出Claude Tag产品,可嵌入Slack作为常驻协作Agent,支持组织级工具调用与持久化记忆。
  • Google:旗舰Gemini 3.1 Pro百万token输出定价12美元,显著低于同期GPT-5.4与Claude Opus;轻量产品线在Flash系列之下新增Flash-Lite超轻量档,价格下探至开源模型水平,以价换量抢占市场。Gemini 3.5 Flash正式上线Computer Use功能,可直接识别并操作屏幕内容。C端方面,Gemini应用向美国免费用户开放个性化图像生成,可联动Gmail、Google Photos、YouTube等应用数据生成贴合用户偏好的内容;AI概览新增热门新闻轮播功能,嵌入实时突发新闻。受算力紧张影响,Google限制Meta调用Gemini模型,导致Meta多个AI项目延期。
  • DeepSeek:V4正式版计划7月中旬上线,同步推出峰谷定价机制,工作日9:00-12:00、14:00-18:00高峰时段API价格翻倍,非高峰时段价格保持不变。此前DeepSeek V3定价约0.27美元输入/1.10美元输出每百万token,R1推理增强模型定价0.55美元输入/2.19美元输出每百万token,凭借高性价比挤压闭源轻量模型市场空间。
  • 智谱AI:GLM-5.2开源模型在安全漏洞检测任务上性能接近Claude Mythos,其海外定价较GLM-4.7提升67%-100%。官方公开征集GLM-5.3版本需求,用户普遍呼吁新增视觉多模态能力。
  • 美团:发布LongCat-2.0大规模MoE语言模型,总参数1.6万亿,每token平均激活约480亿参数,完全基于国产AI ASIC超级集群完成训练,预训练处理超35万亿词元;原生支持1M超长上下文,重点强化编程、智能体与长程推理能力。该模型在OpenRouter平台月调用量跻身全球前三,编程评测表现超越GPT-5.5及Claude Opus 4.6。
  • 字节跳动:发布Seed 2.1系列大模型,聚焦真实生产力场景;豆包专业版同步上线,搭载Seed-2.1-pro,开启付费订阅模式,支持Agent任务与办公模式。多模态领域,预告Seedance 2.5视频模型,支持30秒视频生成与局部编辑;发布Seedream 5.0 Pro图像创作模型,升级精准编辑、多图层与多语种文字能力;推出Doubao-Seed-Audio 1.0音频生成模型,支持多类输入生成完整音频作品。
  • xAI(马斯克):Grok 4.5已在SpaceX与特斯拉启动内部Beta测试,基于1.5万亿参数的V9基础模型打造,融入Cursor数据补充训练,官方称其性能接近甚至超越Claude Opus,计划每月推出一款全新基础模型。
  • Meta:发布Brain2Qwerty v2非侵入式脑机接口,采用MEG脑磁图记录脑活动信号,端到端实时解码完整句子,平均单词准确率61%,最佳被试可达78%,大幅提升非侵入式方案的解码精度。同时Meta出台内部限制,禁止员工使用Claude Code、Codex等外部AI编程工具,防范模型蒸馏风险,加速自研代码助手MetaCode开发。
  • 新浪:开源VibeThinker-3B轻量化模型,通过多阶段后训练实现高性能表现,提出“参数压缩-覆盖假说”,为小参数模型能力优化提供新思路。
  • JetBrains:开源Mellum2系列小语言模型,面向高并发推理场景优化,并发负载下吞吐量优于同尺寸其他模型。
  • Agnes AI:宣布文本、图片、视频三大模型API永久免费开放,文本模型支持百万超长上下文;同步上线Pavo创作平台,基于Agent框架实现从剧本、分镜到成片的全流程自动生成。
  • DeepReinforce:发布Ornith-1.0-35B开源编程模型,基于Qwen 3.5 MoE架构,单GPU即可部署,采用强化学习自改进训练框架,在Terminal-Bench、SWE-bench等编程基准中达到同尺寸顶尖水平,以MIT许可证开源。

1.2 垂直大模型

  • 百度:开源3B参数Unlimited OCR端到端OCR模型,创新引入Reference Sliding Window Attention机制,支持长文档一次性解析;在OmniDocBench v1.6基准测试中准确率达93.92%,推理速度较DeepSeek OCR提升12.7%,上线5天GitHub Star破万。
  • 山东省农科院:发布舜耕粮安农业遥感大模型,为黄淮海地区首个融合AI的遥感模型,基于山东全域卫星影像与两千万份人工样本训练,覆盖耕地资源监测到产量预测全链条。
  • 英伟达:推出BioNeMo工具包,将分子模型转化为可调用的AI专属技能,可显著提升智能体在药物发现任务中的完成率,代理有效断言数量提升近两倍。
  • 虎牙:推出VAM 1.0实时多模态数字人模型,单张照片即可生成可互动、可表演的AI数字人,支持24小时连续稳定运行,已在直播带货、新闻播报等场景测试。
  • 华为:发布openPangu 2.0双版本模型,920亿参数的Flash版本已开源,兼顾轻量化与高并发推理性能;Pro版本计划7月上线,面向Agent场景打造智能底座。

1.3 专项技术突破

  • 推测解码技术:DeepSeek联合北京大学开源DSpark推测解码框架,融合DFlash并行骨干与Eagle串行头,采用半自回归架构与置信度调度验证机制,无需重新训练主模型即可提升推理速度。在DeepSeek-V4 Flash上单用户生成速度提升60%-85%,高并发有效吞吐量翻4倍,已正式部署于DeepSeek在线服务;配套DeepSpec全栈训练评测代码库同步开源。阶跃星辰推出JetSpec技术,通过因果并行树生成验证,解码速度最高提升近10倍。
  • 分词器技术迭代:Anthropic Opus 4.7更换细粒度子词分词器,理论上可丰富词汇表征、优化代码与结构化数据处理,但直接导致token计数膨胀,用户使用成本显著上升;OpenAI GPT-4o采用o200k_base分词器,词表规模扩大近一倍,优化了多语言处理能力,但中文、日文等CJK字符的token数量可能不减反增。
  • 光计算技术:光本位科技联合东方天算启动全球首颗天基光计算卫星研制,以光子替代电子完成计算,天然具备抗辐射、低发热、低功耗特性,单卡算力达300TOPS,适配太空极端环境下的算力需求。
  • 自进化AI算法:英伟达联合剑桥大学发表“红皇后哥德尔机器”研究,突破传统哥德尔机理论限制,让AI在沙盒中自主编写算法、同步进化评估器。测试显示代码通过率从69.9%提升至71.7%且节省token,论文接收率从21.8%升至40.5%,数学证明评分搜索成本降低3倍,还可纠正AI对生成内容的偏好偏见。
  • 数学与算法突破:加州大学研究者借助GPT-5.5 Pro生成初始证明,破解计算几何领域“最远点对”问题在任意超常数维度下的近平方时间复杂度难题,填补了陈立杰此前研究的最后缺口。
  • 模型训练优化:华东师范大学提出ReNIO权重分配机制,引导模型重点学习自身错误的推理路径,在数学竞赛题库中平均得分高出2.5个百分点。北京大学与智源研究院提出「机理数据归因」框架,揭示大模型归纳头的形成机制,建立“数据→机制→行为”因果链,成果入选ICML2026 Oral。
  • 知识蒸馏技术:Fable 5的推理轨迹被蒸馏至DeepSeek开源模型,推动开源模型能力快速提升;策略蒸馏首次应用于扩散模型后训练,阿里QwenImage2.0 RL模型的画面质量与指令遵循能力显著提升。
  • 世界模型技术:小鹏发布X-Mind纯视觉世界模型,适配车规级芯片,将集成至第二代VLA系统提升自动驾驶预测与决策能力。无界动力发布MWA隐空间世界模型,采用隐空间模型与强化学习融合路线,在RoboCasa GR1 TableTop榜单以75.2%的平均任务成功率位列全球第一。
  • 仿真训练技术:英伟达推出SimFoundry仿真训练系统,可通过视频自动构建三维仿真场景,让虚拟训练的机器人直接落地真实场景,复杂操作成功率提升约四成。
  • 神经形态计算:研究发现MOSFET晶体管体端浮空时的碰撞电离效应,单个晶体管即可模拟生物神经元特性,有望将AI计算能耗降低至百万分之一。
  • 可解释性研究:ICML 2026接收的论文提出“分布式稠密电路假说”,挑战传统机制可解释性的核心假设,证实同一任务可由几乎不重叠的多条内部电路独立完成,动摇了还原论视角的可解释性基础。
  • 多智能体协作优化:清华大学深研院提出EDV多智能体协作框架,通过分离执行与评估角色抑制经验污染,可将注入错误经验后的任务成功率从77.2%提升至接近正常水平。
  • 文生图物理认知:上海交通大学等联合构建反事实世界基准测试,证实顶尖文生图模型尚未真正理解物理世界的因果逻辑,应对物理规律变化时存在明显认知局限。

1.4 AI框架

  • DeepSpec:DeepSeek开源的全栈推测解码训练评测代码库,包含DSpark、DFlash、Eagle3等多种算法实现,支持Qwen3、Gemma-4等主流大模型,覆盖数据准备、草稿模型训练到性能评估的完整工作流。
  • SkillReducer:针对Agent技能的优化框架,通过描述压缩与渐进式加载两种路径,实现39%的技能体token压缩,同时模型功能质量反而提升2.8%,验证了精简技能的价值。
  • OpenCode:完全开源的AI编程Agent,提供命令行与桌面应用两种交互方式,内置build全权限开发Agent与plan只读分析Agent,支持多语言文档,面向开发者提供透明、可定制的编码辅助。
  • Agency Agents:开源AI Agent集合项目,提供数百个专业化、人格化的Agent配置文件,覆盖前端开发、运营、营销、设计、金融等十余个领域,可直接集成到Claude Code、Cursor、GitHub Copilot等主流工具,配套桌面应用支持一键安装。
  • VulnClaw:AI驱动的渗透测试CLI工具,基于LLM Agent、MCP工具链与渗透技能编排,自动将自然语言意图转化为完整渗透流程,实现信息收集、漏洞发现、漏洞利用到报告生成的全闭环,适用于授权渗透测试、CTF竞赛、安全教学等场景。
  • Logto:现代化开源身份认证与授权基础设施,基于OIDC和OAuth 2.1标准构建,支持多租户、企业级单点登录与角色权限控制,原生适配智能体AI架构,简化AI应用的身份与权限管理。
  • OMG:面向通用人形机器人的全模态运动生成框架,支持文本、轨迹等多模态指令输入,提供数据处理、模型训练、基准评估、部署导出的全链路开源方案。
  • ESEILANE:新一代高性能知识图谱引擎,基于稀疏矩阵代数技术实现亚毫秒级图遍历与查询,完整支持OpenCypher语法,可与大模型深度融合降低生成幻觉,提升回答准确性。
  • RedKnot:小红书技术团队开源的长上下文推理引擎,通过创新KV Cache存储方式,显著提升长文本处理的首字生成速度与单卡并发能力,缓解长文本推理的性能瓶颈。
  • Octo:明略科技开源的AI代理协作网络框架,引入Bot身份系统、线程工作模式与交付机制,实现人类决策与机器执行的无缝衔接,推动企业从个体效率工具向整体协作生态转型。

二、 智能体与AI应用

  • 编程智能体
    • OpenAI Codex:正式上线Codex Remote远程开发功能,推出DigitalOcean插件支持一键部署开发环境;新增Beta版权限配置文件,提供只读、工作区写入、完全访问三种预设模式,由操作系统强制执行权限边界;计划推出信用赠送功能,支持用户间互转使用额度;与Work Louder合作,预告7月15日推出编程专用宏键盘硬件。
    • Claude Code:升级默认启用后台子智能体功能,用户聊天时可并行调度多任务自动完成代码重构、测试、提交等工作;Anthropic同步推出Claude apps gateway自托管企业网关,支持多云路由、企业SSO登录、集中策略管理、支出上限与审计,统一管理企业内Claude Code部署。
    • Cursor:发布iOS移动端应用,支持开发者通过手机远程启动、管理AI编码Agent,与桌面端实时同步,打破研发工作的硬件限制。
    • 高德“袋马”:内测自然语言驱动的应用生成产品,面向无研发团队的中小企业与独立创作者,支持对话式修改与灵感广场,可分钟级生成可用应用。
    • Browser-BC:本地运行的浏览器操作克隆工具,可将用户浏览器操作记录自动转化为技能文件,集成到Claude Desktop与Claude Code中,所有数据本地存储保障隐私。
  • 办公与协作智能体
    • Claude Tag:深度嵌入Slack协作平台,用户可直接@Claude分配任务,具备组织级工具调用能力与持久化记忆,被视为大模型交互模式的重要升级。
    • 豆包:灰度测试飞书账号体系打通,新增独立对话页面,支持添加豆包好友与飞书好友,探索职场协同场景;App内置百度地图导航功能,向日常出行场景渗透。
    • 支付宝“蚂蚁阿宝”:在v12.12.1版本正式上线AI助手,支持AI版与经典版自由切换,升级生活服务智能交互体验。
    • Google AI Studio:上线Design Variations功能,可一键为生成的网页生成多种视觉风格方案,提升前端设计与原型制作效率。
    • ChatGPT×Gamma:打通插件能力,用户可在ChatGPT对话中直接生成Gamma演示文稿,一键跳转至Gamma平台编辑,简化办公演示流程。
    • X MCP:X官方推出MCP服务器,支持AI Agent接入帖子搜索、用户查询、趋势新闻、书签管理等平台能力。
    • 企业微信“大圆”:灰度上线原生AI助理,基于全域上下文感知,支持群聊自动总结、客户群商机分析、每日服务跟进、项目日报生成、会议背景回顾、邮件起草回复等六大场景自动化。
    • QQ邮箱Agently Mail:上线AI智能体专属邮箱功能,支持AI以独立身份收发邮件,实现多智能体间的协作交互。
  • AI创作应用
    • 视频方向:Seedance 2.5支持30秒视频直出与局部编辑;fal开源LTX-2.3-3DREAL-LoRA,可将3D渲染、游戏引擎视口动画转为真实感电影视频,保持原始构图与相机运动;AI创作者实现《猫和老鼠》4K真人实拍风格转换,验证AI视频风格化能力。
    • 图像方向:Krea 2开源文生图模型,分RAW无蒸馏基础版与Turbo 8步蒸馏版,被独立基准评为美学质量第一,且RAW训练的LoRA可直接适配Turbo;Midjourney V8.2开启预览,支持批量草稿随机风格生成,单次可输出24种风格。
    • 3D方向:Tripo更新智能拆分2.0,提供Simple/Balanced/Detailed三档精度,可按语义边界自动拆分3D模型,适配3D打印、游戏资产制作等场景;AutoPartGen实现从2D图像到3D零部件的自动生成,可识别部件语义并完成组合。
    • 音频方向:即梦AI上线SeedMusic 1.0 Preview模型,单次可生成360秒AI音乐;Doubao-Seed-Audio 1.0支持文本、音频等多类输入生成完整音频作品。
    • 设计方向:Figma新增Motion动画功能、生成式插件、着色器与Design Agent设计代理;推出“代码层”功能,支持在画布内直接编写与预览代码。
  • 行业场景应用
    • 医疗:北京安贞医院通州院区部署20余款机器人参与发药、配液、运输等环节,提升效率并降低职业伤害;NASA测试深空任务AI医疗助手,为宇航员提供自主诊断与应急处理方案;本地部署的GLM-5.2可驱动医疗智能体集群,覆盖肿瘤学、药物咨询等场景。
    • 法律:A&O Shearman在全球43个办公室部署Harvey AI法律助手,3500余名律师累计提交4万次查询,覆盖合同起草、法规检索、尽职调查等工作,但所有输出均需执业律师审核。
    • 农业:智能联合收割机、植保无人机等自主作业设备规模化应用;“农帮手”APP升级2.0版,支持农户定制专属农技AI顾问。
    • 金融:开源Vibe-Trading交易智能体,支持自然语言控制量化交易策略;Coinbase改用智谱GLM与月之暗面Kimi,通过模型路由与缓存优化将AI支出减半。
    • 汽车:华为乾崑智驾ADS 5搭载多款新车型,支持高阶智能驾驶;小鹏X-Mind世界模型提升自动驾驶预测能力;特斯拉FSD v14 Lite将HW4的智能蒸馏至HW3硬件,新增停车、倒车等功能。
    • 消防:苏州吴江建成全国首个5G-A具身智能人形机器人训练场,实现火场巡检、物资投送的实战化应用。
  • 智能体特性与问题
    • 结构性损耗:智能体普遍存在上下文陷阱、分词器黑箱、技能无效调用、多Agent沟通税与长任务熵增等问题,token消耗呈指数级增长;普通用户难以管控成本,形成技术平权差距。
    • 架构优化方向:上下文缓存与语义压缩、技能精简、自适应模型路由、预算硬约束主持人架构,可有效降低无效token消耗,同时提升任务执行效率。
    • 交互实验:GOD项目开源可交互AI Agent小镇,内置10位有身份设定的AI居民,用户可实时控制时间流速、下发指令、重置场景,用于研究智能体社交与行为。

三、物理AI/机器人

  • 人形机器人
    • 智元机器人:第15000台精灵G2通用具身机器人量产下线,搭载NVIDIA芯片,已交付龙旗科技ODM产线承担平板质检工作;64小时连续直播显示累计作业64828件,质检成功率99.99%,刷新人形机器人规模化商业部署纪录。
    • 银河通用:Galbot S1重载人形机器人在宁德时代产线7×24小时自主作业超3个月,累计部署近百台,企业估值达200-225亿元。
    • 法拉第未来:推出Faber系列工业级轮臂机器人与Futurist人形机器人,覆盖工业上下料、物流转运等场景,原生适配NVIDIA Solver。
    • 逐际动力:FluxVLA Engine工程底座更新支持人形全身操作,成为首个打通全身人形机器人训练与真机部署的开源平台;基于LimX Oli机器人,实现底盘、双臂与双手的同步全身控制。
    • 小布米:推送OTA V3.0版本,新增语音控制、拖拽示教功能,支持中英德三语言切换,优化家庭场景交互体验。
  • 特种机器人与四足机器人
    • 宇树科技:机器狗产品降价1万元,iO型号入选《时代》2025年最佳发明。
    • 它石智航:A1机器人完成百余次高精度装配,创吉尼斯纪录;与天海电子合作实现柔性线束装配场景的全球首个规模化落地。
    • openpilot:开源驾驶辅助系统,适配300余款量产汽车,实现自适应巡航与车道保持,遵循ISO26262安全标准,拥有活跃开发者社区。
  • 机器人操作系统与架构
    • Rokid YodaOS:全球首款智能眼镜AI原生操作系统,以Agent作为核心服务单元,替代传统App交互模式;采用四层架构设计,从极速交互、多维感知、智能能力到场景落地逐层封装,支持用户通过语音/视觉意图直接调用服务。配套乐奇AI助手2.0,新增主动服务与AIUI图形化交互能力。
    • M-Robots OS:全国首个开源鸿蒙机器人操作系统,捐赠至开放原子开源基金会,中断响应时延低于1μs,适配机器人实时控制需求。
    • ARM物理AI平台:官方发布深度文章,阐述物理AI从工厂固定机器人向人形机器人、自动驾驶演进的路径,预测未来十年AI驱动的生产力提升将带动全球GDP增长约4%。
  • 具身智能研究
    • 基础规律:Moravec悖论仍然成立,机器人在感知与运动能力上远逊于人类;仿真到现实的Sim-to-Real Gap由动力学差异、感知失真等多重因素叠加导致,制约仿真训练的落地效果。
    • 触觉技术:Sharpa联合清华大学提出FTP-1通用触觉策略,对未见传感器任务的成功率提升31.6个百分点。
    • 数据采集:脸谱心智提出Ego-NeuroLoop数据采集范式,融合视觉、视线追踪、脑电与肌电信号,为机器人提供更完整的操作过程记录,提升学习灵活性。
    • 控制算法:清华大学OpenHLM系统在人形机器人全身移动操作任务中,语言指令下的平均任务进度达87.5%。
    • 交互预测:μ₀团队提出3D interaction traces方法,优化物体交互轨迹预测与机器人控制精度。

四、硬件与基础设施

  • AI芯片
    • OpenAI:联合博通发布首款自研AI推理芯片Jalapeño,优化大模型推理的算力成本。
    • 百度昆仑芯:推进赴港IPO进程,目标估值500亿美元;已推出多代自研AI芯片,在云端推理等场景实现大规模应用。
    • 高通:公布数据中心AI战略,目标2029财年实现150亿美元数据中心芯片收入,计划用LPDDR替代高价HBM降低成本;以近40亿美元收购AI编译器公司Modular,挑战CUDA生态壁垒。
    • 比亚迪:自研璇玑A3智驾芯片,计划2027年率先搭载于腾势车型,三芯片协同算力超2100TOPS,专为L3/L4级自动驾驶设计。
    • IBM:研发0.7纳米制造工艺,采用纳米片晶体管与垂直堆叠技术大幅提升芯片密度。
    • 华为:鲲鹏920 CPU性能领先同期Intel Emerald Rapids达40%;昇腾产品线覆盖边端到数据中心全栈AI场景。
    • 产业配套:京津冀AI ASIC设计创新中心正式启动,推动国产定制化AI算力芯片发展。
  • 算力基础设施
    • 台积电:3nm工艺月产能17.5万片仍供不应求;苹果推进1.4nm工艺,计划2028年首发A22 Pro;2026年资本支出预计达520-560亿美元。
    • 韩国半导体产业:三星、SK海力士宣布未来十年合计超1000万亿韩元投资计划,扩大半导体产能,应对AI存储需求爆发。韩国政府同步推出AI数据中心专属电价政策,通过分区差异化供电吸引产业集群,计划2029年提供超800万千瓦电力。
    • 海外算力建设:澳大利亚Neocloud Firmus在印尼峇淡建设NVIDIA DSX液冷AI工厂,电力容量360MW,计划交付17万颗GPU。
    • 国内布局:东数西算、一体化算力网监测调度、边缘算力建设持续推进,开启万亿级投资周期;三大运营商与头部互联网企业推动算力向集约化、绿色化、普惠化转型。
    • 太空算力:北京太空算力创新中心正式揭牌,聚焦星载AI芯片、太空大模型等六大方向,构建空天地算网协同体系。
  • 存储与核心材料
    • 存储供需:美光预计存储供应紧张态势将持续至2027年后;DRAM成为AI算力核心瓶颈,预计2027年占超大规模数据中心资本支出的30%-40%。
    • 国产材料:中国建材集团三条世界级高性能碳纤维生产线投产,覆盖T1100级、48K大丝束、M40高模量等品类,装备国产化率超95%。
    • 封装材料:LG Chem考虑扩大AI芯片封装用覆铜板产能,应对上游需求增长。
    • 光学元件:歌尔股份国内首条12英寸AR光学晶圆产线量产,显著降低智能眼镜核心光学元件成本。
  • 能源与资源约束
    • 民生挤压效应:美国弗吉尼亚州数据中心耗电量超过当地最大核电站两倍,电网容量拍卖价格涨幅超1400%,居民电费面临大幅上涨压力;全球主要算力节点均出现算力扩张挤压民生用能的现象。
    • 能源技术探索:微软大规模采购核聚变设备,试图从根源解决AI算力的能源供应问题。
    • 环境风险:创纪录高温威胁全球79%的数据中心稳定运行,空调高负荷进一步加剧电网压力。
    • 政策规划:我国《新型能源体系建设“十五五”规划》预计能源重点项目投资超20万亿元,新能源装机占比将超50%。

五、企业动态

  • 国际科技巨头
    • OpenAI:截至2026年5月年化营收约330亿美元,算力采购框架总规模超1万亿美元,预计2030年前后实现盈利;苹果Vision Pro硬件负责人Paul Meade加盟,负责下一代AI原生硬件研发;与亚马逊达成战略合作,获150亿美元注资,后续计划追加至350亿美元;与惠普扩大Frontier合作,将AI深度落地于客户体验、软件开发与企业运营场景。
    • Anthropic:2026年5月ARR超450亿美元,美国企业级AI支出份额达41%,首次超越OpenAI,预计二季度首次实现盈利;与加州政府达成协议,州政府机构可半价使用Claude服务;第三方审计发现其多收约170万美元Agent账单费用,约八成已完成退款。
    • Google:因内部算力紧张限制Meta调用Gemini模型;AI人才流失引发股价波动,市值一度单日蒸发超3000亿美元;Alphabet正式纳入道琼斯工业平均指数。
    • Meta:出台内部禁令限制员工使用外部AI编程工具,防范数据外流与模型蒸馏风险,加速自研代码助手开发;发布非侵入式脑机接口技术,拓展人机交互边界。
    • 福特:返聘约350名被称为“灰胡子”的资深工程师,纠偏此前过度依赖AI质检的策略,质量表现显著回升,16年后再次登顶JD Power新车质量主流品牌榜首。
    • 软银:以53.75亿美元收购ABB机器人部门,同步投资750亿欧元加强欧洲算力基础设施建设。
  • 国内科技企业
    • 字节跳动:Seedance视频生成模型成为内部首个盈利的AI业务,企业合作年框门槛降至10万元;豆包专业版采用68-500元/月三级阶梯定价;自研下一代服务器CPU计划2027年初完成设计,下半年量产部署。
    • 百度:昆仑芯推进港股上市,目标估值500亿美元;开源Unlimited OCR模型刷新长文档解析纪录。
    • 美团:发布LongCat-2.0万亿参数大模型;推出VitaBench2.0智能体评测系统,聚焦动态用户建模场景。
    • 腾讯:与长鑫存储签署超200亿元DRAM长期采购协议;腾讯研究院持续发布Token经济、AI内容伦理等深度产业研究。
    • 宁德时代:与银河通用达成战略合作,产线批量部署人形机器人;枧下窝锂矿正式取得安全生产许可证,复产工作推进中。
    • 追觅科技:收缩业务至智能家庭、户外庭院、具身智能等四大核心赛道,人员优化约12%,聚焦硬核技术研发。
    • Rokid:发布YodaOS智能眼镜原生系统,开放全栈开发者能力,智能体商店计划7月10日正式上线;上半年海外众筹金额超千万美元。
    • 支付宝:上线“蚂蚁阿宝”AI助手,产品Logo新增AI标识,定位升级为“AI生活伙伴”。

六、产品更新

  • 消费级产品
    • 豆包专业版:采用68-500元/月三级阶梯定价,支持AI办公任务模式,可执行本地操作、浏览器调用等Agent任务,接入抖音内容流探索意图电商。
    • 小米超级小爱闺蜜机Max 27:支持语音控制12类智能家电、AI健身与内容流转,内置9700mAh电池,定位居家多场景智能中心。
    • 红魔游戏平板5 Pro:搭载第五代骁龙8至尊版芯片,内置AI战术教练,支持185Hz高刷屏与直播剪辑功能。
    • Rokid AI眼镜:搭载YodaOS系统,保持每月多次OTA迭代节奏,配套AI头盔等延伸硬件拓展场景。
    • 华为音乐小艺音乐助手:升级智能混音、串烧功能,适配HarmonyOS 5.0及以上系统。
  • 企业级产品
    • Claude apps gateway:Anthropic推出的企业自托管控制平面,统一管理Claude Code部署,支持SSO登录、集中策略、支出上限、多云路由与审计功能。
    • Codex权限配置文件:OpenAI推出的Beta功能,提供三种预设权限模式,由操作系统强制执行,精细化管控AI代理的文件与网络访问权限。
    • 金山办公:宣布投入5亿元进行股份回购;回应WPS缓存问题,称云盘默认30天自动清理,将持续优化存储机制。
  • 工具类产品
    • FluidVoice:开源macOS本地语音转文字工具,完全离线运行无需联网,实测可将键盘使用率降至20%,提升工作效率。
    • VeraCrypt:开源高强度磁盘加密工具,基于经典方案重构,保障数据安全。
    • tolaria:桌面端知识库管理工具,优化文档整理与检索效率,社区热度较高。
    • GetCompress:轻量级批量压缩工具,支持视频、图片、PDF等格式,最高可缩减90%文件体积,支持离线使用。
    • LocateAnything:英伟达推出的视觉语言定位模型,一句话即可框选图像中的目标,解码速度较传统方案提升2-6倍。

七、投资

  • 融资事件
    • 它石智航:获4.55亿美元融资,推进柔性装配机器人落地。
    • Proception:获1100万美元种子轮融资,由First Round Capital领投,用于高柔性机器人手研发。
    • 智平方:完成近50亿元融资,估值超200亿元,资金用于机器人大脑技术升级与量产。
    • 自变量科技:完成B至C轮融资,估值突破200亿元,发布具身大模型WALL-B。
    • Omen AI:完成3100万美元A轮融资,研发数据中心冷却液监控微型光谱仪。
    • General Intuition:完成3.2亿美元A轮融资,估值23亿美元,Khosla Ventures领投。
    • MiniMax:向全员发放超6亿港元股权激励,不设业绩考核条件。
    • 快手可灵AI:计划启动首轮融资,拟募资超20亿美元,投后估值约180亿美元。
  • 资本市场动态
    • 产业链盈利分化:上游芯片、制造企业盈利高增,台积电、英伟达净利润率与自由现金流大幅增长;下游云厂商与模型厂商因巨额资本支出,自由现金流普遍下滑,风险向产业中游聚集。
    • 循环融资模式:OpenAI、英伟达、甲骨文形成“投资-采购-发债”资金闭环,估值高度依赖未来增长预期,存在泡沫风险。
    • 债务市场风险:私人信贷市场为数据中心提供20-30年期长期杠杆融资,普遍采用实物支付利息模式,风险隐蔽性强;国际清算银行提示债务市场尚未充分定价AI投资的下行风险。
    • A股与港股:半导体、AI算力板块波动加剧,存储、光模块等景气度明确的赛道率先获得资金聚焦;昆仑芯IPO目标估值500亿美元,成为AI芯片资本化标志性事件。
    • 海外市场:韩国半导体股大幅波动,外资单日净卖出创历史纪录;美股科技板块五连跌后反弹,市场关注AI资本开支的可持续性。

八、行业观点与社会影响

  • Token经济与成本治理
    • 价格格局:Token市场呈现高端定价格局固化、中端量价齐升、经济型跟随涨价的整体抬升趋势;Anthropic凭借编码能力建立行业最强定价权,OpenAI与Google短期以价换量,开源模型持续抬升价格地板。
    • 损耗根源:智能体的上下文重复加载、分词器膨胀、无效技能调用、多Agent沟通内耗等问题,造成结构性token浪费,且对普通用户不透明,形成技术平权差距。
    • 场景边界:Token的高效应用仍集中在编程、文档处理等高度数字化场景,向物理世界延伸面临仿真与现实的鸿沟,真实需求尚未全面爆发。
    • 治理趋势:企业从鼓励AI使用转向强化成本纪律,配额管理、成本归因、模型路由逐步成为企业AI治理标配,行业从“以多为荣”转向“以精为贵”。
  • 产业竞争格局
    • 技术重心转移:大模型竞争从单纯参数规模转向推理效率、场景落地与成本控制,推测解码、轻量化、路由优化成为技术热点。
    • 开源崛起:开源与闭源模型的能力差距稳定在3-6个月,企业为控制成本加速向开源模型迁移,国产开源模型性价比优势凸显。
    • 算力核心地位:算力成为产业核心稀缺资源,头部企业通过自研芯片、锁定产能、布局新能源等方式保障供给,产业链话语权向上游集中。
  • 社会与伦理监管
    • 内容伦理争议:亚马逊AI动画《朋克鸭》因伦理争议与网络抵制停止制作;AI生成演员、AI微短剧泛滥引发就业替代、版权归属等广泛担忧。
    • 监管政策收紧:国家版权局将人工智能版权整治纳入“剑网2026”专项行动重点;广电总局出台AI微短剧分类分层管理标准,明确平台自审门槛。
    • 平台规则更新:音乐平台Tidal出台新规,2026年7月15日起纯AI生成曲目不再支付版税,并强制标记AI内容。
    • 法律与隐私:美国最高法院裁定地理围栏搜查令受宪法第四修正案约束,强化公民数据隐私保护;江苏镇江出现全国首例“AI幻觉”侵权案,消费者被AI误导引发民事纠纷。
    • 就业影响:调研显示约三分之一雇主正用AI取代入门级职位,技术类行业风险最高;同时具备AI技能与核心业务能力的复合型人才需求上升。行业专家提出未来职场将分化为原型师、建造师、清道夫、增长手、维护者五类角色。
    • 教育配套:国内多所高校成立人工智能学院,聚焦大模型、具身智能、交叉学科方向,适配产业人才需求。
  • 风险提示
    • 产业风险:国际清算银行警告AI投资热潮存在供给侧瓶颈与商业回报不足的风险,可能引发资本支出周期逆转。
    • 金融风险:产业链风险向中游模型厂商聚集,循环融资与影子信贷的叠加可能引发金融市场传导风险。
    • 民生风险:算力扩张对水、电等公共资源的挤压效应逐步显现,推高居民生活成本。
    • 安全风险:恶意GitHub仓库可劫持AI编码工具执行恶意代码,token盗用、API滥用成为新型商业安全威胁。

九、学习与研究资源

  • 开源项目与工具
    • 模型类:Krea 2、Ornith-1.0、LongCat-2.0、VibeThinker-3B等模型已开源,可通过对应平台获取权重与使用文档。
    • 框架工具:DeepSpec、DSpark、RedKnot、OpenCode、VulnClaw、Logto等项目均已开源至GitHub,覆盖推理加速、智能体开发、安全测试等多个方向。
    • 学习资源:开源计算机视觉学习路线图、AI价值投资框架、自学技能资源库等项目上线,为开发者提供体系化学习路径。
  • 研究论文与报告
    • 前沿论文:红皇后哥德尔机器、DSpark推测解码、计算几何难题突破、分布式稠密电路假说等研究均已发布于arXiv,可查阅完整技术细节。
    • 产业报告:腾讯研究院发布《Token不经济》《为什么今天我们需要AI内容观》等深度研究,系统分析AI产业经济与内容伦理趋势。
    • 数据工具:Epoch AI趋势仪表盘可查询训练算力、算法效率、推理价格等行业核心指标;Chinchilla工具包、LLMcalc计算器可用于模型配比估算与基础设施成本测算。
  • 活动与赛事
    • 第九届CCF开源创新大赛启动,设人工智能与泛在操作系统方向,提供超百万奖金。
    • 第四届青少年机器人竞赛举办,覆盖AI与机器人多领域科普与竞技。
    • HuggingFace将于7月7日举办直播,详解知识蒸馏的实现方法与后训练技巧。

十、总结与洞察

  1. 产业阶段特征:当前AI产业正从“炫技式扩张”向“精细化生产”转型,技术侧从堆参数、堆算力转向提效率、控成本;应用侧从概念演示走向真实生产落地,成本纪律、安全合规、ROI验证成为企业部署AI的核心考量。
  2. 核心增长动力:编程与数字化场景仍是AI价值兑现的核心阵地,智能体架构的成熟持续释放生产力;同时具身智能、自动驾驶、产业AI等方向开始进入规模化初期,成为下一阶段增长的潜在引擎。
  3. 长期挑战与机遇:token经济的局限性本质是数字世界与物理世界的边界问题,AI向传统产业、物理场景渗透的效率,将决定行业长期增长天花板。开源生态与国产方案的崛起正在重塑全球竞争格局,性价比、自主可控与场景适配将成为未来竞争的关键维度。
Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐