面向flowable的Spring AI

摘要随着AI技术的普及，工业级AI应用已不再局限于Python编程。低代码平台和聊天机器人工具简化了提示词编写和系统集成，但在企业级应用中仍面临数据隐私、成本控制等限制。SpringAI框架的出现为Java/Kotlin开发者提供了解决方案，支持多供应商AI模型集成和向量数据库连接，并通过MCP协议实现LLM与外部工具的交互。该框架特别适合金融科技领域，可处理销售自动化、信贷管理等复杂任务。研究

分享牛

312人浏览 · 2026-03-02 15:00:00

分享牛 · 2026-03-02 15:00:00 发布

总体问题

过去那种只能用Python语言进行工业级AI模型应用的时代已一去不复返。如今，要掌握大语言模型的使用技巧，根本无需了解任何编程语言。

市场上涌现出大量聊天机器人和低代码平台，例如n8n（Activepieces、Zapier、Make/Integromat以及众多其他平台，数量多到几乎无法计数），这些工具能够帮助你迅速磨练“提示词”编写技巧，并轻松连接各种“工具”。

然而，对于企业级“原样”应用（云端版本）存在一些限制：

数据隐私。
代币成本。
透明度与可控性。
变更管理。
与遗留系统的简单集成。
可重复性。
可靠性。

通过将大语言模型的工作转移到本地“本地部署”基础设施，大多数此类限制都能得以解除。但如果没有专用设备，我们的性能将非常低下。此外，关于所需控制级别以及如何简化应用项目开发的问题，也依然存在。

此外，还需考虑行业任务的特殊性。对于金融科技，可划分为以下几类：

销售自动化。
信贷流水线。
限额管理。
合同与委托的管控。
物流与上门服务。
申请与咨询的处理。
客户忠诚度体系。
企业服务与优惠。

低代码工具的局限性通常使其难以快速解决与遗留系统的集成问题，也难以嵌入高度安全的数据处理环境。它们非常适合快速构建原型和MVP解决方案，然而，金融科技产品的长期维护与生命周期支持则需要专业资源和大量投入。

与此同时，在Java和Kotlin的工业级开发领域，项目Spring AI能够突破此类限制。这是一个相当新的框架（最新版本1.1.2于2025年12月9日发布），旨在解决将人工智能功能集成到企业IT环境中的关键问题，即如何实现遗留数据集与API之间与大语言模型（LLM）的无缝对接。

https://spring.io/projects/spring-ai

众所周知，模型是一种静态的工具。它是在某一特定日期所对应的数据集上进行训练的。因此，大型语言模型并不具备当前的时间背景。如果我们问大型语言模型现在几点了，或者今天是星期几，它将无法给出准确回答，甚至可能会胡乱编造一些答案。就像人类需要钟表和日历来确定时间和星期几一样，LLM模型也需要访问这些工具。

Spring AI 提供了一种极为简便的声明式方法，可通过 MCP 协议（模型上下文协议）将任何工具添加到 LLM 的上下文中。这一开放标准已得到广泛采用，由 Anthropic 公司于 2024 年 11 月 25 日开发并发布。MCP 的主要目标是制定一套统一的规则，用于规范大型语言模型（LLM）与外部数据源和工具之间的交互。

通常，架构由MCP客户端组成，该客户端会访问一个或多个MCP服务器。这些服务器与目标工具和数据源相集成。Spring AI支持以简单声明式的方式实现这一集成。您甚至无需费心处理协议，因为Spring会自动生成工具描述。不过，务必为方法及其参数撰写详尽的说明，以便大型语言模型能够准确理解它需要调用哪些方法以及调用顺序。

Spring AI功能

Spring AI 在一般情况下提供以下功能：

支持来自不同人工智能供应商的可移植API，包括同步和流式两种。支持所有主要的人工智能模型供应商，如Anthropic、OpenAI、Microsoft、Amazon、Google和Ollama。
支持适用于所有向量存储提供商的可移植API，包括全新的元数据过滤API，该API与SQL类似。支持来自所有主要向量数据库供应商的解决方案，例如Apache Cassandra、Azure Cosmos DB、Azure向量搜索、Chroma、Elasticsearch、GemFire、MariaDB、Milvus、MongoDB Atlas、Neo4j、OpenSearch、Oracle、PostgreSQL/PGVector、Pinecone、Qdrant、Redis、SAP Hana、Typesense和Weaviate。
用于自动配置Spring Boot的工具以及用于AI模型和向量存储的启动模块。
结构化输出数据——将AI模型的输出数据映射到POJO对象，以及用于将文档加载到数据处理系统的ETL框架。
ChatClient API 是一种灵活的 API，用于与基于人工智能的聊天模型进行交互，其语法风格与 WebClient 和 RestClient API 类似。
顾问API——封装了生成式AI的重复性模式，对传输至语言模型（LLM）及从语言模型中获取的数据进行转换，并确保在不同模型和使用场景之间的可移植性。
调用工具/功能——允许模型请求执行客户端工具和功能，从而实时获取所需信息并采取相应行动。
可观测性——提供与人工智能相关的操作信息。
AI模型评估——用于分析生成内容并防范幻觉的工具。

我们认为，到2026年，人工智能代理将达到相当成熟的水平，足以在企业环境中以Java进行开发，并用于执行实际的业务任务。例如，Spring AI Agents子系统定义了一种轻量级但功能强大的可移植抽象——AgentClient。而这仅仅是开发者有效与智能体系统交互所需工具集中的一个组成部分。

Spring AI Agents 提供以下抽象，它们共同作用可实现最佳效果：

Goals（目标）：代理需要完成的任务。
上下文（Context）：代理所处的数据与环境——包括原始文件、日志、结构化数据集和文档。
工具（工具）：根据需要提供的自定义功能，通常通过MCP协议提供。
法官（评估员）：基于设定标准对结果进行核查并评估质量的机制。
沙盒（沙箱）：一种抽象环境，使智能体能够安全且可重复地执行其任务。

代理编排作为基础架构

Anthropic前两年的一项研究“构建高效智能体”强调了在人工智能智能体开发中简单性和模块化的重要性。这项研究提出了两种智能体系统之间重要的架构差异：

1. 工作流：通过预设路径编排大语言模型与工具的系统。

2. 智能体：大语言模型动态引导自身流程并调用工具的系统。

智能体能够应对复杂任务，但其具体实现往往相当简单。通常，这不过是调用不同的大型语言模型，并借助基于环境反馈的工具，形成闭环操作。智能体可用于解决迭代次数和类型事先未知的任务，在这类任务中，很难甚至无法预测所需的步数，也难以事先设定明确的路径。

在执行过程中，至关重要的是，智能体应在每一步从环境中获取“真实数据”，并获得中间汇总信息，以评估自身的进展。随后，智能体可暂停下来，向人类寻求反馈；这种反馈可在检查点或遇到障碍时获取。

智能体的自主性意味着更高的计算开销以及累积误差的潜在风险。因此，引入了“责任区”和“协调器”等概念（即专门的智能体或其他技术方案），以确保多智能体系统内部的同步，避免各智能体之间相互干扰。

研究的主要结论是：对于简单场景，完全自主的智能体似乎最具吸引力；但随着工作流复杂性的增加，系统提供的智能体在执行规范化任务时能展现出更好的可预测性和稳定性。这与大型企业提出的要求高度契合，其中可靠性和简便的维护是决定性因素。

关键模式

在之前提到的Anthropic研究中，探讨了五个关键模式，这些模式能够确保智能体系统的有效应用。让我们以BPMN图示为例，来更详细地分析它们。

工作流：提示链式调用

提示链模式的解析
工作流：路由

路由模式的解码
工作流：并行化

并行化模式的解读
工作流：协调器-工作者

Orchestrator-workers 模式解码
工作流：评估器-优化器

评估器-优化器模式的解析

我们认为，所有上述编排模式都易于用BPMN图和DMN表进行描述和实现。因此，若将BPM技术纳入我们公司核心架构，我们既能保留开发团队的专业能力，又能获得经时间检验、可靠且成熟的解决方案，同时这些方案已基于利用AI智能体的新理念。

实践案例

让我们来探讨一下自主创建多智能体系统的流程，为此我们需要：

实现代理设计师。
实现编排器。
实现业务实体。
写在最后

任何管理软件技术领域的发展，离不开企业管理最核心的本质– 降本增效，只要企业的组织架构和协作需求还在，流程的管理及绩效优化依然是企业管理的基础，技术的创新发展离不开业务的本质需求，至于各种新鲜概念更多的还只是营销的需要，专业领域的发展需要持续的沉淀及积累。
推荐一款结合大模型的一款全新旧系统拍照免费迁移工具。能根据聊天和图片生成标准BPMN 2.0 XML，可与主流开源或企业级流程引擎（如Flowable, Camunda、Operaton、activiti）无缝集成。
体验可访问: http://flow.je4.cn/#/login

上传图片，根据图片生成标准BPMN2.0效果：

根据聊天内容生成标准BPMN2.0效果：