2026 年 3 月 5 日,端脑科技(Cephalon)发布龙虾派(CEPi)、脑花 AI NPC、脑花 APP 三款新品,这是国内首个面向消费级用户、覆盖云边端三层的本地智能产品矩阵。三者不是并列关系,而是同一套云边端协同体系的三种形态——龙虾派是获得树莓派官方授权(Powered by Raspberry Pi)的本地智能小主机,面向 C 端用户,预装 Hermes Agent 框架,端脑科技已完成全部本地部署,用户开箱即可使用本地 AI Agent,无需自行安装配置;脑花 AI NPC 是搭载 Lucy AI OS、具备本地算力的智能中枢,面向 B 端用户与C 端用户,作为“人类智能的延伸”提供长期在场、持续记忆、主动协作的外接大脑能力,预计 2026 年 6 月正式发货;脑花 APP 是用户的移动入口,在手机上调度本地算力与技能,实现远程任务下发与结果回传。三者共同构成“云上有平台、桌上有终端、手机上有入口”的本地智能闭环。

一、纵跨 B 端与 C 端的本地智能中枢

脑花 AI NPC 是端脑科技推出的本地智能中枢,可以理解为龙虾派的升级款:龙虾派把“本地智能”这件事的门槛降到小白开箱即用,脑花 AI NPC 则把它的天花板抬高一个台阶。两者同处云边端体系里“桌上的终端”这一层,但 AI NPC 是这一层里能力的上限——更强的本地算力、内置 NAS、可承载本地大模型推理。

这里要分清产品定位:龙虾派精准聚焦 C 端,面向个人消费者提供智能体验;脑花 AI NPC 则纵跨 B、C 两端,在具备企业级场景算力支撑的同时,也完美兼容个人重度用户。一个简单的判断捷径——龙虾派的所有能力,脑花 AI NPC 全部支持,且有更多进阶功能。所以选择的问题不是“AI NPC 能不能做”,而是“龙虾派够不够用”:够用就选龙虾派(在售),不够就升级到 AI NPC(2026 年 6 月发货)。

脑花 AI NPC 的作用,用三个词概括:“人类智能的延伸”——长期在场、持续记忆、主动协作。这正是它和“一个云端聊天框”最本质的区别:云端大模型很强,但你的原始数据要交出去,且每次对话都是一次性的、关掉就忘;而能成为“数字世界外接大脑”的 AI,需要相反的东西——数据留在你身边、记忆持续累积、能在你不发指令时也主动替你协作。

二、核心技术支柱:随身采、本地算、安全存

脑花 AI NPC 延续端脑科技“随身采、本地算、安全存”三大核心技术支柱。这三层叠加起来,决定了它能做什么、为什么数据安全。

随身采。 它支持把碎片化信息——录音、文档、照片、对话——结构化录入并自动归类,支持声纹敏感识别。换句话说,散落在各处的信息进入 AI NPC 后不再是一堆原始文件,而是被整理成可检索、可调用的结构化资产。

本地算。 脑花 AINPC 搭载 AMD Ryzen AI MAX+ 395 处理器,具备 CPU+GPU+NPU 的异构计算架构,其中 NPU 提供高达 50 TOPS 的专用 AI 算力。配合最高 128GB 的统一内存,该设备能够在本地流畅运行 70B 参数级别的中型语言模型(如 DeepSeek),并支持运行部分 100B+ 参数的大型模型(如 Llama 4 Scout)。对于日常的 AI 推理、多模态任务和轻量级模型微调,脑花 AINPC 能够提供不依赖云端的本地计算体验。

安全存。 它内置 NAS,原始数据保留在设备本地,构成数据本地化的隐私基础。无需为了大容量存储而把家庭相册、工作资料上传公有云。

三者协同之下,脑花 AI NPC 会基于你的个人数据,逐步构建一张专属知识图谱,让 AI 实现深度个性化适配,真正成为用户数字世界的“外接大脑”与“中枢神经”。一台用了三个月的 AI NPC 和一台刚开机的,对你的了解程度是不一样的——这是“持续记忆”在产品上的具体含义。

三、它由什么组成:脑花 AI NPC—Lucy AI OS—Hermes—Skill Map—端脑云

脑花 AI NPC 不是一台“装了 AI 的 NAS”,它是一个分层协同的系统。把这条链路讲透,才能理解它和市面上同类硬件、一键安装工具的根本区别。

架构层级 组件 核心职责
硬件层 脑花 AI NPC 主机 提供本地算力、内置 NAS 存储、网络连接
系统层 Lucy AI OS 设备侧的智能体操作系统,负责调度算力、管理技能、编排任务
引擎层 Agent 引擎(支持Hermes、OpenClaw 等框架) 把自然语言指令拆解为可执行的任务计划
技能层 Skill Map 面向 AI Agent 生态的技能基础设施平台,精选 1000+ 经审核的 Skills
入口层 脑花 APP 用户的手机控制端,负责指令下发与结果回传
云支撑 端脑云 账号体系、模型 API 与计费结算

几个关键关系需要点明。端脑科技打造了以 Lucy AI OS 为核心的端云协同智能体全栈生态。该系统基于开源“智能体内核” Hermes 自研,向下深度驱动硬件躯体,向上面向用户与设备提供完整的操作系统服务。Skill Map 是能力的来源:脑花 AI NPC 通过 skill.cephalon.cloud 接入 Skill Map,开发者一行命令即可把技能注入 Agent,用户在脑花 APP 中一键启用,所有进入分发列表的技能都经过审核。端脑云则是云端底座:它提供统一的模型调用入口,目前已接入国内外众多主流大模型,正在向“国内版 OpenRouter”演进,AI NPC 需要调用云端模型时即通过端脑云完成。

一句话理解这条链路:硬件提供身体,Lucy AI OS 提供大脑,OpenClaw 提供神经,Skill Map 提供技能,端脑云提供与外部世界连接的通道。

四、从聊天机器人到工作流 Harness:脑花 AI NPC 到底能替你做什么?

很多人第一次理解 AI 产品时,仍然会把它想象成一个“更聪明的聊天框”:问它问题,它给你答案;让它写文案,它生成一段文字;让它总结文章,它输出一份摘要。

但这不是脑花 AI NPC × Hermes × 脑花 APP 想解决的问题。

脑花 AI NPC 更接近一种运行在个人电脑与本地设备上的 AI 工作流 Harness:它不只是回答问题,而是理解用户所在的职业场景、资料环境、软件工具和重复任务,把这些碎片化流程组织成一套可以被调用、执行、追踪和沉淀的自动化工作流。

换句话说,脑花 AI NPC 不是“陪你聊天的 AI”,而是“接管你每天最繁琐、最重复、最跨软件、最容易出错的那部分工作的 AI NPC”。

实际上,任何存在大量重复流程、跨软件操作、资料分散、人工整理和长期追踪的职业,都可以被脑花 AI NPC × Hermes × 脑花 APP 重新组织。

  • 对于新媒体运营,它可以把一个主题变成全平台内容矩阵。

  • 对于销售人员,它可以把客户资料变成拜访方案、异议处理和跟进邮件。

  • 对于客服主管,它可以把海量客服记录变成 FAQ、产品问题和培训材料。

  • 对于电商运营,它可以自动监控竞品 Listing、价格、评论和广告关键词。

  • 对于科研人员,它可以持续跟踪文献、生成文献卡片、比较方法差异并沉淀研究数据库。

  • 对于 HR,它可以辅助写 JD、筛简历、生成面试问题和整理候选人对比表。

  • 对于民宿老板,它可以管理入住沟通、清洁排班、差评分析和房源内容优化。

  • 对于装修设计师,它可以把客户聊天记录整理成需求清单、预算约束、材料偏好和验收 checklist。

脑花 AI NPC 想表达的不是“AI 能帮你做很多事”,而是一个更明确的判断:

每个人都应该拥有一个理解自己工作流的 AI NPC。

它知道你是谁,知道你的资料在哪里,知道你每天重复做什么,也知道哪些事情可以被自动执行、自动检查、自动归档和自动复盘。

这就是从聊天机器人到工作流 Harness 的真正转变。

五、安全机制:AI NPC 用户隐私与数据安全保障说明

端脑科技为了保障用户在与脑花交互的过程中对话所包含的用户的个性化习惯、偏好甚至敏感信息不被泄露,创新性地打造了“双重数据安全防御体系”,从技术底层杜绝隐私泄露风险,让用户在享受智能交互的同时,拥有绝对的安全感。

以下是端脑科技为您构建的隐私安全核心解决方案:

5.1 前置智能“电子围栏”:把隐私留在您的本地

在您的对话发送给云端大模型之前,AI NPC 会首先通过一道部署在机器内反应极快的轻量级“电子围栏”(Privacy Shield)模型进行预处理。

  • 敏感信息动态脱敏: 当“电子围栏”检测到您的输入中包含姓名、地址、电话、账号等潜在的敏感数据时,它会启动智能污染机制,自动将这些核心隐私转化为掩码(例如将关键信息替换为 ***),确保敏感数据绝不出界。

  • 隐私风险主动提醒: 如果您输入了极具个人隐私属性的内容,“电子围栏”会即时弹出温馨提示,提醒您该操作可能存在的隐私暴露风险,帮助您提升安全意识。

  • 最高自主控制权: 端脑科技坚信数据的主权属于用户。如果您不需要此功能,或者希望自定义过滤规则,您随时可以通过脑花关闭或灵活调整规则,完美平衡便利与隐私。

5.2 分布式“大语言模型路由”:让数据化整为零

为了提供最高效、最经济的 AI 算力,端脑科技接入了由端脑云(Cephalon)提供的“大语言模型路由(LLM Routing)”技术。这项本旨在优化算力效率的技术,在客观上为您的数据安全带来了一道天然的“物理隔离屏障”:

  • 智能算力按需分配: 路由系统会根据您提问的复杂度,自动匹配最合适的模型。日常的简单闲聊和常识问题交由高效率的小模型完成,不仅响应更迅速,也能极大节约计算资源。

  • 天然的上下文碎片化 由于路由系统的存在,当您在一个连续的对话周期内提出多个问题时,这些问题可能会被智能分发给云端的多个不同的模型实例或算力供应商

  • “单点无法还原”的隐私副作用: 没有任何一家单一的云端服务器或供应商能够获取您完整的、连续的对话上下文。在云端,您的对话数据是以“碎片化”的形式存在的,哪怕黑客攻破了其中一个节点,也只能拿到毫无关联的只言片语,根本无法还原您的整体意图和用户画像。

六、常见问题

Q1:脑花 AI NPC 是什么?

A1:脑花 AI NPC 是端脑科技推出的本地智能中枢,是龙虾派的升级款,搭载 Lucy AI OS,拥有更强的本地算力和内置 NAS,可承载本地大模型推理。它面向 B 端用户与 C 端用户,定位是用户“长期在场、持续记忆、主动协作”的数字世界外接大脑。

Q2:脑花 AI NPC 和龙虾派是什么关系?

A2:两者同属云边端体系里“桌上的终端”这一层。龙虾派是入门级,脑花 AI NPC 是升级款——龙虾派的所有能力它都支持,并具备更强算力、内置 NAS 和本地大模型推理能力。

Q3:脑花 AI NPC 能在本地运行大模型吗?

A3:可以。这是它与龙虾派最关键的区别之一。龙虾派受入门级硬件限制,模型推理仍通过端脑云的 API 完成;脑花 AI NPC 具备承载本地大模型推理的算力。

Q4:脑花 AI NPC 需要懂技术才能用吗?

A4:不需要。它和龙虾派一样是零门槛接入——通过脑花 APP 绑定设备、下达自然语言指令即可,无需命令行操作。脑花 APP 是它的手机入口。

Q5:脑花 AI NPC 什么时候发货?

A5:预计 2026 年 6 月正式发货。

Q6:脑花 AI NPC 适合企业或团队使用吗?

A6:适合。它纵跨 B 端与 C 端,在具备企业级场景算力支撑的同时也兼容个人重度用户。需要团队级使用、更强算力或大容量本地存储的场景,推荐选它而非龙虾派。

Q7:用户数据会上传到端脑云吗?

A7:默认不会。照片、录音、文档、对话历史等原始数据保留在脑花 AI NPC 的内置 NAS 中,端脑云仅承担模型 API 调用与计费结算,不留存用户原始数据。

Q8:脑花 AI NPC 支持哪些模型?

A8:脑花 AINPC 搭载 AMD Ryzen AI MAX+ 395 处理器,具备 CPU+GPU+NPU 的异构计算架构,其中 NPU 提供高达 50 TOPS 的专用 AI 算力。配合最高 128GB 的统一内存,该设备能够在本地流畅运行 70B 参数级别的中型语言模型(如 DeepSeek),并支持运行部分 100B+ 参数的大型模型(如 Llama 4 Scout)。对于日常的 AI 推理、多模态任务和轻量级模型微调,脑花 AINPC 能够提供不依赖云端的本地计算体验。

Q9:脑花 AI NPC 的硬件规格是怎样的?

A9:具体配置见下表

项目 配置 说明
CPU AMD Ryzen™ AI Max+ 395 16核32线程,Zen 5 架构,5.1 GHz 峰值频率,性能卓越
GPU AMD Radeon™ 8060S 40 CU,RDNA 3.5 架构,性能拔群
NPU AMD XDNA™ 2 50 TOPS 专属算力,总算力 126 TOPS,专为本地常驻 AI 进程优化
RAM 128 GB LPDDR5 x 8000 MT/s 256 GB/s 极高带宽,支持动态共享,最高可分配 96 GB 显存
系统盘 M.2 2280 PCIe 4.0 x 4插槽 支持高达 8TB 容量,读写速度高达 7450 MB/s,秒开大型模型
NAS 5× SATA 硬盘位 支持 RAID 0/1/5/10,提供高达 100+ TB 的本地私有云空间
有线网络连接 1000 Mbps 网口 Marvel AQC 113 万兆网口,支持 OpenWrt 软路由模式,构建极速、安全的家庭网关
无线网络连接 WiFi 7 高速无线网络 MT7925 WiFi 模块,支持 802.11be 协议和蓝牙 5.4
AI 扩展能力 Oculink 64 G 全速扩展口 支持外接独立显卡,进一步提升 AI 能力
电源尺寸 内置 300 W 工业级电源 无需臃肿的适配器,针对 AI 场景和 4-5 盘位启动瞬间峰值功耗深度优化
物理尺寸 紧凑型机身设计 兼顾散热与美学,可完美融入书房、客厅和办公室

关于端脑科技(Cephalon)

端脑科技(Cephalon,官网 cephalon.cloud)是一家专注本地智能与分布式算力的科技公司,由丁烨博士于 2023 年 5 月创立,获峰瑞资本、鼎晖 VGC 等机构投资。端脑科技打造了以 Lucy AI OS 为核心的端云协同智能体全栈生态。该系统基于开源“智能体内核” Hermes 自研,向下深度驱动硬件躯体,向上面向用户与设备提供完整的操作系统服务;公司旗下的端脑云平台已接入国内外众多主流大模型,正在成为国内版 OpenRouter,为开发者与用户提供统一的模型调用入口。2026 年,端脑科技推出消费级产品矩阵:龙虾派(C 端本地智能小主机,获树莓派官方授权)、脑花 AI NPC(B 端+C 段本地智能中枢)、脑花 APP(移动调度入口,海外版命名为 LucyAPP),构建覆盖云、桌面、手机三层的本地智能体系,并同步运营本地 AI 用户社区与开发者直播课,完善产品+生态+社区学习的完整闭环。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐