AI教程 | FLUX.1 模型入门教程

Flux 的一大亮点是能够微调面部图像，这是以前的开源模型（如 Stable Diffusion 或 SDXL）难以实现的功能。FLUX.1 模型的发布迅速走红全球，生成的图像质量超越了现有的开源模型，且支持通过简单操作进行微调，无需编程知识。本文将详细介绍如何在 Replicate 平台上使用自己的照片微调 FLUX.1 训练一个图像模型，生成各种风格的图片，如超级英雄、卡通角色或冒险者形象等。

执笔人

20859人浏览 · 2024-10-11 15:26:35

执笔人 · 2024-10-11 15:26:35 发布

FLUX.1 模型的发布迅速走红全球，生成的图像质量超越了现有的开源模型，且支持通过简单操作进行微调，无需编程知识。Replicate 上已有数百个公开的 Flux 微调，还有数千个私有微调。

Flux 的一大亮点是能够微调面部图像，这是以前的开源模型（如 Stable Diffusion 或 SDXL）难以实现的功能。自 Dreambooth 以来，能够通过少量训练图像获得出色结果的微调方式再也没有如此简单。

本文将详细介绍如何在 Replicate 平台上使用自己的照片微调 FLUX.1 训练一个图像模型，生成各种风格的图片，如超级英雄、卡通角色或冒险者形象等。

关键步骤包括：

准备训练图片：至少10张不同角度和光线条件下的高质量面部照片。
选择触发词：创建一个唯一的“触发词”用于激活模型。
创建并训练模型：在 Replicate 上上传图片和触发词，训练大约需要 20 分钟。
生成图像：使用训练后的模型生成带有触发词的详细描述文本。

alt

步骤 0: 准备工作

在开始微调 FLUX.1 模型之前，你需要准备：

一个 Replicate 账户
几张自己的照片
2-3 美元的模型训练费用

步骤 1: 收集训练图片

你需要收集几张自己的照片，推荐至少 10 张高质量面部照片，但最少需要 2 张。

图片要求：

格式：WebP、JPG、PNG
分辨率： 1024×1024 或更高
文件名：随意命名，不影响训练
建议最少 10 张，图片越多效果越好
图片多样化：不同背景、服装、灯光和角度

准备步骤：

将图片存放在一个文件夹中，如 data。
将文件夹压缩为 .zip 文件，命名为 data.zip。

alt

步骤 2: 选择唯一的触发词

微调 FLUX.1 模型时，需要选择一个唯一的触发词，后续生成图像时将使用它。

触发词要求：

独特，类似于 MY_UNIQ_TRGGR
不应是现有的语言词汇，如 dog 或 cyberpunk
不使用 TOK，以避免与其他微调冲突

例如，作者选择了 ZIKI 作为触发词。你可以根据个人喜好选择一个类似的唯一词。

步骤 3: 创建并训练模型

接下来，你将在 Replicate 平台上上传图片并开始训练。

网页训练步骤：

访问 Flux 微调表单。
选择模型发布位置：可以选择发布为公共或私有。
上传训练图片：在 input_images 字段中，上传 data.zip 文件。
输入触发词：在 trigger_word 字段中，输入之前选择的触发词。
选择训练步数：默认1000步，建议不要低于此步数。
点击 Create training 开始训练。

alt

步骤 4: 等待训练完成

训练大约需要 20 分钟。在这期间，你可以休息片刻，等返回时模型就准备好了。

步骤 5: 使用网页生成图像

训练完成后，你可以通过网页表单生成图像：

访问 Replicate 平台的 web playground。
输入提示语，包括之前设置的触发词，例如：

"photo of ZIKI looking super-cool, riding a segway scooter"

FLUX 模型适合详细提示语，尽可能多描述。

alt

本文由 mdnice 多平台发布

智灵弹性算力系统

为开发者提供按需使用的算力基础设施。

更多推荐

cover

AIGC - 生产力新工具 Bito AI

智灵弹性算力系统

cover

【AIGC】大模型在金融行业的应用场景和落地路径

智灵弹性算力系统

cover

图生图—AI图片生成Stable Diffusion参数及使用方式详细介绍

智灵弹性算力系统

所有评论(0)

查看更多评论

执笔人

已为社区贡献3条内容