模型

参考图片

上传图片

PNG, JPG, WEBP (max 10MB each)

支持多张图片 • 已上传 0/14

提示词

翻译提示词

0 / 20000

宽高比

Resolution

Output Number

图生图 AI — 参考图驱动的照片变换

变换已有照片需要与从零生成不同的 AI 能力。你有一个需要保留的主体和一个需要执行的变更 — 模型必须同时理解两者。GPT Image Edit 每次变换接受最多 16 张参考图，可以将品牌指南、版面样机、色彩调板和产品照片同时输入一次连贯编辑。Seedream 4.5 Edit 使用 14 张参考图在原生 4K（最高 4096×4096 像素）下进行深度艺术风格迁移 — 将产品照转化为博物馆级插画而不移动主体位置。Seedream 5 Lite Edit 对需要精确身体重新定位或多元素重组的编辑应用思维链空间推理，14 张参考图 3K 输出。Flux 2 Pro Edit 以基准领先胜率在秒级完成大多数变换。Nano Banana 2 通过搜索增强验证真实世界精度，14 张参考图 4K 输出。Nano Banana Pro 在每次变换中锁定面部和服装连续性。上传 JPG、PNG 或 WebP 照片最大 10MB，用自然语言描述变更。

多模型 AI

图生图 AI

4K 分辨率

AI 风格迁移

商用授权

最多 16 张参考图

AI 编辑引擎 — 参考图数量与分辨率对比

每个模型可附加的参考图数量、分辨率上限和编辑方式 — 在上传前了然于胸。

GPT Image Edit

OpenAI · 每次编辑 16 张参考图

本平台单次编辑接受最多参考图的模型 — 最多 16 张同时输入。输入品牌风格指南、目标版面、产品参考、色彩调板和环境照片在一次请求中。模型综合所有 16 个来源的语境产出尊重每个输入的编辑。输出 1024 像素（中等质量）或 1536 像素（高质量），1:1、2:3 和 3:2 三种宽高比。

16 references — highest on platformMulti-source context synthesis1024 px or 1536 px outputBest for complex multi-element compositing16 张参考图 — 平台最多多来源语境综合1024 或 1536 像素输出最适合复杂多元素合成

Seedream 4.5 Edit

字节跳动 · 4K 风格迁移 — 14 张参考图

以原生 4K — 最高 4096×4096 像素 — 使用最多 14 张参考图进行艺术风格迁移。模型将风格参考中的视觉语言映射到源照片上，不移动主体位置或构图。2K 和 4K 编辑档位使用同一渲染管线。八种宽高比含 21:9 超宽。当艺术变换必须与最高分辨率输出配对时的直接选择。

14 reference images per editNative 4K at 4096×4096 px8 aspect ratios including 21:92K and 4K at equal cost tier每次编辑 14 张参考图原生 4K 4096×4096 像素8 种宽高比含 21:92K 和 4K 等价档位

Flux 2 Pro Edit

Black Forest Labs · 基准领先编辑速度

在多图参考编辑基准测试中持有基准领先表现 — 精准照片变换与速度的行业标准。接受最多 8 张参考图，大多数编辑在秒级完成，1K 或 2K 输出七种宽高比。为周转时间重要的生产管线打造：批量背景替换、产品摄影变体和色彩调板迭代。

Benchmark-leading editing accuracy8 reference images per editSeconds-per-edit generation speed1K and 2K resolution output编辑基准领先表现每次编辑 8 张参考图秒级编辑速度1K 和 1080p 分辨率输出

Nano Banana Pro

Google · 跨编辑身份保持

Google 的身份保持编辑模型，将面部几何、发型、服装结构和品牌标记作为硬约束贯穿每次变换。接受最多 8 张参考图用于风格和环境引导。输出 1K、2K 或 4K，11 种宽高比含自动检测。当人物、角色或品牌元素必须在编辑系列中保持视觉一致时的正确模型。

Face and outfit anchoring8 references per edit1K / 2K / 4K resolution11 aspect ratios including auto面部和服装锚定每次编辑 8 张参考图1K / 2K / 4K 分辨率11 种宽高比含自动

Nano Banana 2

Google · 搜索增强 4K 编辑

Google 的搜索增强编辑模型，在变换过程中验证真实世界主体 — 确保涉及可辨识品牌、产品或地标的编辑反映经验证的真实外观。接受 14 张参考图用于复杂多元素编辑。4K 输出 15 种宽高比，Flash 速度生成。适合编辑预可视化、产品合成精度和引用真实资产的品牌内容。

Google Search grounding during edit14 reference images per edit4K resolution at Flash speed15 aspect ratios — widest selection编辑中 Google 搜索增强每次编辑 14 张参考图4K Flash 速度15 种宽高比 — 最广选择

Seedream 5 Lite Edit

字节跳动 · 推理驱动空间编辑

字节跳动的推理驱动编辑模型，对需要空间重组的编辑应用思维链视觉逻辑 — 调整身体姿势、重新定位多个主体在帧内、或重构重叠元素的景深排列。处理 14 张参考图保持身份同时变换空间关系。2K 或 3K 输出八种宽高比。专为运动预可视化和复杂场景重构任务打造。

Chain-of-Thought spatial reasoning14 reference images per edit2K or 3K resolutionMulti-figure recomposition accuracy思维链空间推理每次编辑 14 张参考图2K 或 3K 分辨率多人物重组精度

参考图驱动的照片编辑，不只是文字描述

纯文字编辑提示词描述你想要什么但无法展示。参考图弥补了这个差距。GPT Image Edit 的 16 张参考图容量意味着单次编辑请求可以同时处理风格板、品牌指南、环境照片和版面稿 — 模型综合所有来源生成尊重每个输入的编辑。Seedream 4.5 Edit 从 14 张风格参考中将视觉语言映射到你的主体上，在原生 4K 下产出反映真实艺术意图而非笼统近似的变换。当速度优先时，Flux 2 Pro Edit 以基准领先表现给你快速结果不牺牲一致性。主体身份必须经受每次变换的场景 — 人像、吉祥物、品牌角色 — Nano Banana Pro 将面部和服装作为硬约束而非建议。

Image to image AI example: photo transformation with style transfer using GPT Image 1.5, Seedream 4.5, Flux 2 Pro, and Nano Banana Pro

按任务类型的图生图编辑工作流

六种制作场景，匹配各自最擅长的模型 — 附具体技术原因。

艺术风格迁移

推荐：Seedream 4.5 Edit — 14 张参考图，原生 4K

上传照片加最多 14 张风格参考 — 油画印刷、电影色彩、插画书封 — Seedream 4.5 Edit 将其视觉语言映射到主体上不改变构图。变换在原生 4K 下渲染，整个风格转换过程保留精细细节。

老照片修复与增强

推荐：Nano Banana Pro — 身份锚定细节恢复

修复退化照片，保留原始面部结构、表情和色调特征，同时移除划痕、颗粒和压缩伪影。Nano Banana Pro 利用周围语境重建缺失细节而不重新解读主体。根据最终用途输出 1K、2K 或 4K。

背景替换与环境交换

推荐：GPT Image Edit — 16 张参考图的环境语境

在提示词中描述替换环境或附加展示目标场景的参考图。GPT Image Edit 使用最多 16 张参考图的空间语境 — 包括光照照片、场景照片和氛围参考 — 将前景主体放入新环境中，匹配光照方向和投影位置。

物体添加、移除和替换

推荐：Flux 2 Pro Edit — 基准领先胜率，最快

添加道具、移除干扰物或在场景间交换物体。Flux 2 Pro Edit 秒级处理物体编辑（1K 或 2K），是迭代多种道具摆放或测试同一场景中不同产品变体的实用选择。接受最多 8 张参考图引导物体定位。

4K 细节再生分辨率提升

推荐：Seedream 4.5 Edit 或 Nano Banana 2 — 原生 4K 渲染

在编辑过程中将低分辨率源图以 4K 重新渲染 — 在扩散过程中生成新的精细细节而非从现有像素插值。Seedream 4.5 Edit 以 4096×4096 像素原生输出八种比例。Nano Banana 2 以 4K 15 种比例输出。两者产出的细节是双线性或 AI 放大器无法重建的。

产品样机与品牌合成

推荐：GPT Image Edit — 16 张参考图的品牌元素精度

将产品照片合成到生活场景中，保持标签清晰度和品牌标记精度。GPT Image Edit 同时处理全部 16 张参考输入 — 产品照、品牌指南、目标环境和版面模板 — 生成文字正确渲染、品牌元素空间一致的变体。

图像编辑提示词模板

每个模板配对特定变换类型与最适合的模型，附技术匹配因素。

带品牌文字的产品场景合成

最佳引擎：GPT Image Edit — 16 张参考图，文字精准合成

"将这个产品瓶放在阳光照射的亚麻桌布上。晨光从左上方窗户射入，干净的投影落在产品右侧。保持所有标签文字和品牌标记在 100% 缩放下完全清晰可读。左侧添加一小枝干薰衣草，右侧放一个浅口陶碗。生活方式编辑风格，暖色 5600K 日光，3:2 比例。"

人像艺术风格迁移

最佳引擎：Seedream 4.5 Edit — 14 张风格参考，原生 4K 输出

"将这张人像照片变换为弗兰德斯黄金时代油画风格。保留精确的面部结构、眼睛颜色、发型长度和注视方向 — 不改变肖像相似度。在服装和背景上应用可见的厚涂笔触。伦勃朗式右上方分割光，深赭石和焦赭石色调背景，暖色光油色温。4K 输出，3:2 比例。"

建筑场景昼夜时段变换

最佳引擎：Flux 2 Pro Edit — 快速迭代，编辑基准领先

"将这栋建筑外观从正午变换为蓝色时刻黄昏。添加透过窗户可见的暖色琥珀光，前院地面湿润反射，深靛蓝天空在地平线渐变为铜色。保留所有建筑几何结构、标牌和表面材质。房地产编辑摄影风格，16:9 比例。"

受损照片修复

最佳引擎：Nano Banana Pro — 身份保持，4K 细节重建

"修复这张老照片：消除所有可见划痕、折痕和水渍。使用未受损区域的语境重建面部和背景的受损部分。保留暖色棕褐到中性色调特征和原始景深。增强清晰度和局部对比度。不进行上色处理。4K 输出。"

如何编写保留重要内容的编辑提示词

• 先声明变换类型 - 以编辑类别开头 — 「替换背景为...」「迁移视觉风格至...」「移除物体并填充...」。针对编辑任务训练的模型对显式指令类型的响应比描述性提示词更精准。
• 列出所有不应改变的元素 - 保留锚点与变换指令同样重要。指名保持不变的内容：「保持主体面部、发型长度和夹克颜色不变。」没有显式锚点时，模型可能重新解读你原本想保留的元素。
• 用参考图展示目标效果 - 500 字描述一种画风不如一张该风格的参考图。GPT Image Edit 支持 16 张参考图 — 附上尽可能多能阐明意图的视觉范例。Seedream 4.5 Edit 接受 14 张；Flux 2 Pro Edit 接受 8 张。
• 按编辑核心约束匹配模型 - 最多参考图？GPT Image Edit（16 张）。最高输出分辨率？Seedream 4.5 Edit（原生 4K）。最快周转？Flux 2 Pro Edit（基准领先胜率，秒级编辑）。主体身份必须保持？Nano Banana Pro。需要真实世界精度？Nano Banana 2 搭配 Google 搜索增强。

参考图引导的图像编辑工作原理

上传源图、附加参考、描述变换 — 模型在保持锚点完整的同时处理其余部分。

上传源图和参考图

上传要变换的基础照片（JPG、PNG 或 WebP 格式，最大 10MB）。附加可选参考图 — 风格板、色彩调板、品牌指南 — 引导目标效果。更具体的参考产出更可预测的编辑。

描述什么改变、什么保持

用自然语言描述变换。指定什么应改变（背景、风格、光照、物体）并显式指名什么必须保持（面部、产品标签、构图）。选择匹配参考图数量和分辨率需求的模型。

生成、审查、迭代

5-60 秒内收到编辑后的图片，取决于模型和分辨率。输出下载为无水印 PNG 或 JPEG。在第二个模型上运行同一源图和提示词，对比不同引擎如何解读同一编辑指令。

图生图变换效果

风格迁移、背景替换和身份保持编辑，来自真实用户工作流。

延续你的编辑流程

从零生成基础图片、将编辑后的结果动画化为视频，或从变换后的照片构建动态序列。

文生图 AI 生成器 — 从零创建

文生视频 — 从需求生成动态内容

图生视频 — 将编辑后的照片动画化

图生图 AI 编辑器 — 技术常见问题

参考图管理、模型选择、分辨率规格和编辑最佳实践。

文生图从零创建画面 — 没有源素材，只有文字提示词和选定模型。图生图 AI 编辑从现有照片出发，对其应用描述的变换。模型必须平衡两个竞争约束：遵守应该改变的部分（背景、风格、光照、物体）同时保留不应改变的部分（面部、产品标签、构图）。参考图增加了第三层输入 — 向模型展示目标效果而非只用文字描述。

GPT Image Edit 接受最多 16 张 — 本平台最多。Seedream 4.5 Edit、Seedream 5 Lite Edit 和 Nano Banana 2 各接受最多 14 张。Flux 2 Pro Edit 和 Nano Banana Pro 各接受最多 8 张。参考图数量决定模型在编辑期间可获取的视觉语境量。复杂合成任务受益于更多参考图；简单背景替换用较少参考图同样有效。

文字描述在变换容易命名时效果可靠 — 「将背景换成海滩日落」「转为黑白」。当目标效果需要展示而非描述时附加参考图：来自特定艺术印刷品的画风、设计文件的品牌色调板、电影剧照的环境灯光。抽象的视觉目标 — 特定「氛围」、特定「电影感」— 用参考图比纯文字准确得多。

Seedream 4.5 Edit 专门优化 4K 分辨率下的风格迁移深度。接受 14 张参考图 — 足够输入多个目标风格的范例 — 并在原生 4096×4096 像素下映射到源图上而不降低主体保真度。核心技术优势是变换过程中的原生 4K 渲染，保留风格迁移在低分辨率下运行后放大时通常会退化的精细细节。

Flux 2 Pro Edit 在多图参考编辑基准中位居顶尖，人工评审在正面对比中持续更偏好它的输出。对批量工作流 — 大规模背景替换、产品摄影变体、季节性重新上色 — 基准领先精度加 10 秒内生成速度意味着在生产级吞吐量下依然具备竞争力质量。对 4K 输出或 14 张以上参考图的单次高风险编辑，Seedream 4.5 Edit 或 GPT Image Edit 更合适。

可以。Nano Banana Pro 由于其身份保持架构处理此任务表现好 — 将原始面部结构和构图作为约束，利用周围语境像素重建受损区域而不重新想象主体。上传受损照片作为源图，描述修复目标（「移除划痕，重建缺失区域，保留色调特征」），以 4K 输出获得最大细节恢复。需要色彩或风格增强时 Seedream 4.5 Edit 是替代选择。

Seedream 5 Lite Edit 应用思维链视觉推理 — 在生成前处理编辑请求中的空间关系。这使其成为涉及空间重组的编辑中最精确的模型：调整帧内人物身体姿势、相互间重新定位多个主体、或重构重叠元素的景深排列。标准编辑模型在单次过程中编码和解码；Seedream 5 Lite 构建中间空间规划，在输出中产出更准确的遮挡和比例关系。

当 Nano Banana 2 处理涉及真实世界主体的编辑 — 特定产品、可辨识地标、品牌环境 — 它在应用变换前查询 Google 搜索验证主体的视觉特征。实际效果：产品合成中真实包装的标签设计精确渲染；建筑编辑中特定建筑反映实际立面。没有搜索增强时，模型依赖可能过时或近似的训练数据处理新发布的产品和更新的品牌身份。

源图和参考图支持 JPG、PNG 或 WebP 格式，每个文件最大 10MB。最佳编辑效果请以最高可用分辨率上传源图 — 模型以输入质量作为变换基准，在选定分辨率档位输出。编辑后的图片以 PNG（无损、适合印刷）或 JPEG（适合网页和社交分发）格式下载，无水印。

Flux 2 Pro Edit 最快 — 大多数 1K 编辑在 10 秒内完成。Nano Banana 2 以 Flash 速度生成，通常 4-10 秒。GPT Image Edit 中等质量 10-20 秒。Nano Banana Pro 2K 档 15-30 秒。Seedream 4.5 Edit 和 Nano Banana Pro 4K 档 20-60 秒。Seedream 5 Lite Edit 对复杂空间编辑增加推理时间。实际时间因提示词复杂度、分辨率和参考图数量而异。

可以。Nano Banana Pro 专门为此设计 — 其架构将面部几何、发型结构和服装细节作为硬约束而非软偏好。对将人像转为插画等重大风格变换，使用 Nano Banana Pro 并附显式保持指令：「保持面部结构、眼睛颜色、发型长度和面部表情完全一致；仅在渲染技法和背景上应用风格变换。」Seedream 4.5 Edit 在明确声明身份锚点时也能在 4K 下良好保持主体位置。

GPT Image Edit 最高 1536 像素 — 无 4K 能力。Seedream 4.5 Edit 不支持自动宽高比或 5:4。Seedream 5 Lite Edit 上限 3K 无 4K；推理增加生成延迟。Flux 2 Pro Edit 上限 2K 七种宽高比。Nano Banana Pro 的身份锚定偶尔会过度保留你原本想变换的元素。Nano Banana 2 对精度关键提示词需要搜索延迟。所有模型每次请求处理一次编辑 — 分层变换需要连续编辑过程。

参考图级精度的照片变换

使用 GPT Image Edit 的 16 张参考图在一次请求中综合品牌指南、产品照片和版面稿。使用 Seedream 4.5 Edit 的 14 张参考图进行 4K 艺术风格迁移。Seedream 5 Lite Edit 推理空间重组。Nano Banana 2 搜索增强验证编辑。Nano Banana Pro 锁定每次变换的身份。Flux 2 Pro Edit 以基准领先胜率快速迭代。上传你的照片 — 选择模型 — 下载结果。

图生图 AI — 参考图驱动的照片变换

参考图驱动的照片编辑，不只是文字描述

参考图级精度的照片变换

图生图 AI — 参考图驱动的照片变换