【AI开源王炸】Flux.1 Kontext图像编辑实测,免费平替GPT-4o
BlackForestLabs开源全新图像编辑模型FLUX.1Kontextdev,基于12亿参数的流匹配变换器架构,支持消费级硬件运行。该模型具备上下文感知能力,可通过文本指令实现精准图像编辑(如修改颜色、风格等),并保持人物/物体一致性。支持多次迭代编辑且视觉偏差小,采用非商用协议开源,提供BF16(需32G显存)和FP8(需20G显存)两个版本。测试显示其在老照片修复、局部修改等任务中表现优
Black Forest Labs正式宣布,其全新图像编辑模型FLUX.1 Kontext dev现已开源。这一模型作为FLUX.1系列的最新成员,以其强大的图像编辑能力和高效性能被誉为可媲美GPT-4o的开源替代方案。
一、FLUX.1 Kontext [dev]
FLUX.1 Kontext dev基于12亿参数的流匹配变换器架构,专为图像编辑任务设计,支持消费级硬件运行,为创作者、开发者和研究人员提供了前所未有的灵活性。其最大亮点在于上下文感知图像生成与编辑能力,能够同时理解文本和图像输入,实现真正的上下文生成与编辑。
用户可以通过简单的文本指令修改现有图像,例如更改特定区域的颜色、风格或背景,同时保持角色或对象的风格一致性。此外,模型支持多次迭代编辑,最大程度减少视觉漂移,确保图像质量和一致性。
它具备以下核心特性:
-
基于编辑指令更改现有图像:用户可以通过简单的文本指令,如“Change the car to red style (将汽车颜色改为红色)”等编辑提示词,就能实现一句话提示词的精准图像编辑。
-
无需微调即可实现人物、风格和物体引用:模型能够理解并保持人物、风格和物体的一致性,无需额外的微调过程。
-
强大的一致性:用户可以通过多次连续编辑来优化图像,同时保持极小的视觉偏差。
-
通过指导蒸馏进行训练:这使得FLUX.1 Kontext [dev]更加高效。
-
开放权重:需注意的是 FLUX.1 Kontext [dev]采用的是与Flux-DEV一样的非商用协议开源,开放模型权重文件。
二、模型与环境安装
需更新ComfyUI至最新
-
FLUX.1 Kontext [dev]:下载模型并放置ComfyUI/models/diffusion_models目录下。分为官方BF16版本和ComfyUI官方量化FP8版本。 FP8模型需要20G显存可体验,BF16则需要32G显存可体验。GGUF低显存可用,预估8G可尝试。
-
CLIP和VAE模型与Flux-DEV一致。
在线体验:解决方案 - OneThingAI算力云 - 热门GPU算力平台
三、模型测评
本次对 FLUX.1 Kontext Image Edit 的工作流进行测试
01.老照片修复
restore and colorize this photo. Repair the damaged white background. Maintain the consistency between the characters and the background
02.局部修改-衣服换颜色
change the women's dress to red color.
03.多人合影
Keep the facial features, clothing, and hairstyles of the two people unchanged, and have them stand together in the background of image 3, with the background consistent with image 3.

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐
所有评论(0)