FLUX.1-dev-fp8-dit文生图部署教程：Mac M2/M3芯片通过CoreML加速运行方案

yang lebron

728人浏览 · 2026-03-26 04:10:36

yang lebron · 2026-03-26 04:10:36 发布

FLUX.1-dev-fp8-dit文生图部署教程：Mac M2/M3芯片通过CoreML加速运行方案

想在Mac上体验最新的文生图模型，又担心速度慢、操作复杂？今天，我来分享一个在Mac M2/M3芯片上，通过CoreML加速运行FLUX.1-dev-fp8-dit模型的完整方案。这个方案不仅速度快，而且操作简单，特别适合想在本地玩转AI绘画的开发者。

FLUX.1-dev-fp8-dit是当前热门的文生图模型，而SDXL Prompt Styler则能帮你快速生成各种风格的图片。把它们结合起来，你就能在Mac上轻松创作出高质量的艺术作品。下面，我就带你一步步完成部署和运行。

1. 环境准备与快速部署

首先，你需要一个能运行ComfyUI的环境。ComfyUI是一个基于节点的工作流工具，特别适合可视化地搭建AI图像生成流程。

1.1 安装ComfyUI

如果你还没有安装ComfyUI，可以通过以下命令快速安装：

# 克隆ComfyUI仓库
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI

# 创建并激活虚拟环境（推荐）
python -m venv venv
source venv/bin/activate  # Mac/Linux
# 或 venv\Scripts\activate  # Windows

# 安装依赖
pip install torch torchvision torchaudio
pip install -r requirements.txt

安装完成后，启动ComfyUI：

python main.py

在浏览器中打开 http://127.0.0.1:8188，就能看到ComfyUI的界面了。

1.2 获取FLUX.1-dev-fp8-dit工作流

FLUX.1-dev-fp8-dit是一个优化过的模型版本，使用了fp8精度，能在保持质量的同时提升运行速度。你需要下载对应的工作流文件。

通常，工作流文件是一个 .json 文件。你可以从模型发布页面或社区分享中获取。将下载的 flux_workflow.json 文件保存到本地。

2. 加载工作流与模型

环境准备好后，接下来就是加载工作流和模型了。

2.1 导入FLUX.1工作流

在ComfyUI界面中，按照以下步骤操作：

点击右上角的 "Load" 按钮
选择你下载的 flux_workflow.json 文件
工作流会自动加载到画布上

加载后，你会看到一系列连接好的节点，这就是FLUX.1-dev-fp8-dit文生图的完整流程。

2.2 配置CoreML加速

对于Mac M2/M3芯片，我们可以利用CoreML来加速模型推理。确保你的PyTorch版本支持MPS（Metal Performance Shaders）。

在ComfyUI中，通常需要在加载模型的节点处进行设置。找到 "Load Checkpoint" 或类似的模型加载节点：

双击节点打开详细设置
在设备选择中，找到并选择 "mps" 选项
如果节点支持精度设置，可以选择 "fp8" 或 "fp16" 以获得更好的性能

这样配置后，模型就会在Mac的GPU上运行，速度会比在CPU上快很多。

3. 使用SDXL Prompt Styler生成图片

工作流加载好后，最关键的一步就是输入提示词和选择风格了。这里我们会用到SDXL Prompt Styler节点。

3.1 输入提示词与选择风格

在左侧节点区域找到 "SDXL Prompt Styler" 节点。这个节点能帮你快速应用各种艺术风格。

操作很简单：

在节点的文本框中输入你的提示词，比如 "a beautiful sunset over mountains"
从风格下拉菜单中选择一个你喜欢的风格，比如 "Cinematic"、"Anime" 或 "Photographic"
节点会自动将风格词与你的提示词组合，生成更专业的描述

3.2 设置图片参数并生成

接下来，设置图片的大小和其他参数：

找到控制图片尺寸的节点（通常是 "Empty Latent Image" 或类似节点）
设置你想要的宽度和高度，比如 1024x1024
调整采样步数（steps）和引导系数（cfg），这些会影响生成质量和细节

所有设置完成后，点击界面上的 "Queue Prompt" 或 "Execute" 按钮，就开始生成图片了。

第一次运行可能会稍慢一些，因为需要加载模型。后续生成就会快很多，在M2/M3芯片上，生成一张1024x1024的图片通常只需要几十秒。

4. 实用技巧与问题解决

掌握了基本操作后，再来看看如何提升效果和解决常见问题。

4.1 提升生成质量的技巧

提示词要具体：不要只说 "a cat"，试试 "a fluffy white cat with blue eyes, sitting on a windowsill, soft morning light"
多用风格词：SDXL Prompt Styler提供了很多风格，多尝试不同的组合
调整采样器：FLUX.1工作流中可能有不同的采样器选项，试试 Euler、DPM++ 2M Karras 等
控制生成种子：固定种子（seed）可以生成相似的图片，调整种子可以获得不同的变体

4.2 常见问题与解决方法

问题1：生成速度慢

确保选择了MPS设备
降低图片尺寸（从1024x1024降到768x768）
减少采样步数（从30步降到20步）

问题2：图片质量不高

增加采样步数（尝试30-50步）
调整引导系数（cfg值在7-12之间通常效果较好）
使用更详细的提示词

问题3：内存不足

降低图片批次大小（batch size）
使用更低精度的模型（如果支持）
关闭其他占用大量内存的应用

4.3 工作流定制与扩展

ComfyUI的强大之处在于你可以随意修改工作流：

添加节点：从节点库中拖拽新节点到画布
连接节点：将节点的输出连接到其他节点的输入
保存自定义工作流：修改后点击 "Save" 保存你的版本

你可以尝试在流程中添加图片后处理节点，比如放大、修复面部等，让生成的图片更加完美。

5. 效果展示与实际应用

通过这个方案，你可以在Mac上生成各种风格的图片。下面是一些实际应用的例子：

5.1 艺术创作

输入 "a fantasy castle in the clouds, golden hour"，选择 "Fantasy Art" 风格，就能生成梦幻般的城堡图片。适合用于概念艺术、游戏素材创作。

5.2 设计素材

输入 "minimalist logo for a tech company, abstract geometric shape"，选择 "Design" 风格，可以生成Logo设计灵感。设计师可以用这个快速获得创意方向。

5.3 内容配图

输入 "cozy coffee shop interior, people working on laptops"，选择 "Photographic" 风格，生成博客文章配图。内容创作者再也不需要为找图发愁了。

5.4 创意探索

尝试一些有趣的组合，比如 "cyberpunk samurai in rainy Tokyo street" 加上 "Cinematic" 风格，看看AI能创造出什么意想不到的作品。

6. 总结

通过这篇教程，你应该已经掌握了在Mac M2/M3芯片上部署和运行FLUX.1-dev-fp8-dit文生图模型的方法。关键点再回顾一下：

环境搭建：安装ComfyUI并配置好Python环境
工作流加载：导入FLUX.1的JSON工作流文件
加速配置：确保模型在MPS设备上运行以获得CoreML加速
提示词与风格：使用SDXL Prompt Styler节点输入描述和选择风格
生成与调整：设置图片参数，点击执行，根据结果调整提示词和参数

这个方案的最大优势就是本地运行，不需要联网，不需要API密钥，完全在你自己电脑上处理。而且利用Mac的硬件加速，速度相当不错。

对于开发者来说，你还可以进一步探索：

将工作流集成到自己的应用中
批量生成图片
训练自己的风格LoRA模型
尝试其他文生图模型和工作流

AI图像生成正在变得越来越多易用和强大。有了本地运行的能力，你可以随时随地进行创作，不受网络和服务的限制。现在就开始你的AI艺术创作之旅吧！

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

【往复行式遍历】基于A星算法的栅格全覆盖路径规划系统（Matlab代码实现）

针对移动机器人在结构化障碍作业场景中存在的遍历盲区、轨迹冗余度高、运动转向频繁、环境适应性弱等全域路径规划难题，本文以栅格地图环境建模为基础，构建一套完整的改进A*算法全域覆盖路径规划理论体系。结合机器人实际作业运动特性，对传统A*启发搜索机制进行优化改进，采用双代价适配策略区分预估代价与真实行走代价，搭配八方向邻域扩展机制提升算法避障能力与路径贴合度。