Nano Banana(Gemini 2.5 Flash Image)是谷歌推出的多模态图像生成模型,它能出色地理解自然语言描述并生成高质量图像。下面是一份详细的提示词编写教程和示例,希望能帮你更好地使用它。
Nano Banana 提示词生图终极教程
Nano Banana 模型的核心优势在于其深度的自然语言理解能力,与传统的堆砌关键词相比,它更擅长理解叙事性的、富有描述力的段落,从而生成更优质、更连贯的图像。
✨ 核心功能一览
Nano Banana 提供了多种图像生成和编辑方式,以下是其核心功能的概览,帮助你根据需求选择合适的方法:
功能类型 |
能力描述 |
适用场景 |
文生图 (Text-to-image) |
从简单或复杂的文本描述中生成高质量图像 |
创意构思、场景可视化、角色设计 |
图+文生图 (编辑) |
提供一张图片,通过文本指令添加、移除或修改元素,改变风格或调整色彩 |
照片修复、元素替换、风格调整 |
多图生图 (合成与风格迁移) |
使用多张输入图像来构图新场景,或将一张图像的风格迁移到另一张上 |
风格融合、产品展示、创意合成 |
迭代优化 |
通过多轮对话逐步优化图像,进行微调直至完美 |
细节调整、效果精修 |
文字渲染 |
生成包含清晰、位置得当文字的图像 |
徽标设计、海报制作、图表生成 |
提示词编写基本原则
与许多AI图像生成模型不同,Nano Banana 的核心优势在于其深度的自然语言理解能力。这意味着,与堆砌一堆零散的关键词相比,一段叙事性的、富有描述力的段落几乎总能生成更优质、更连贯的图像。
基本原则:描述场景,而非罗列关键词。想象你在向一位画家或摄影师详细描述你想要的画面,而不是在填写搜索引擎的搜索框。
六大提示词技巧与示例
以下是谷歌官方推荐的六大提示词技巧,附带了详细的模板和示例:
1. 创造照片级真实感场景
想要获得逼真的图像,要像摄影师一样思考。提及相机角度、镜头类型、光线和精致细节,能有效引导模型创造出照片级的效果。
-
模板: 一张照片级的[拍摄类型]照片,主体是[主体],正在[动作或表情],场景位于[环境]。由[光线描述]照亮,营造出[氛围]的氛围。使用[相机/镜头细节]拍摄,突出了[关键纹理和细节]。图像应为 [宽高比]格式 。
-
示例提示词: 一张照片级的特写肖像,主角是一位年迈的日本陶艺家,他脸上布满被阳光雕刻出的深深皱纹,带着温暖而会意的微笑。他正在仔细端详一个刚上釉的茶碗。背景是他那间充满阳光的乡村风格工作室。柔和的金色黄 昏光线从窗户射入,照亮了黏土的细腻纹理。使用85mm人像镜头拍摄,背景柔和模糊(焦外成像)。整体氛围宁静而充满大师风范。竖向构图 。
2. 风格化插图与贴纸
为项目创建贴纸、图标或设计素材时,请明确说明所需的风格,例如在需要时要求使用白色背景。
-
模板: 一张[风格]风格的贴纸,主体是[主体],具有[关键特征]和[调色板]。设计应采用[线条风格]和[填充风格],背景是[背景描述]。确保主体清晰突出,适合用于[用途] 。
-
示例提示词: 一张现代简约风格的贴纸,主体是一只可爱的卡通香蕉,戴着小小的墨镜,具有流畅的线条和明亮的黄色调。设计应采用简洁的黑色轮廓和扁平化填充风格,背景是纯白色的。确保香蕉形象清晰突出,适合用于社交 媒体表情包或文创产品 。
3. 多图融合与风格迁移
此功能非常适合电商产品图合成、角色一致性生成或艺术风格迁移。
-
示例提示词 (角色融合): 使用提供的五个角色参考图,生成一张星空下篝火场景,画面充满温馨与友情,电影级光影 。
-
示例提示词 (服装替换): 将这件大衣穿在女模特身上,保持黑白色调 或 保持模特的姿势和表情不变,将她手中的饮料罐替换为提供红色饮料罐 。
4. 高保真文本渲染
Nano Banana 能够准确生成包含清晰易读且位置合理的文本的图像,这对于设计工作非常有用。
-
模板: 一个[类型]的设计,中央显示文本“[需要渲染的文字]”。采用[风格]风格,配色方案以[颜色1]和[颜色2]为主。文字应清晰易读,字体为[字体类型],整体布局[布局描述]。非常适合用于[具体 用途] 。
-
示例提示词: 一个复古风格的咖啡馆招牌,中央显示文本“Grand Coffee”。采用维多利亚时期装饰艺术风格,配色方案以深胡桃木色和金色为主。文字应清晰易读,字体为优雅的衬线体,整体布局对称且精致。非 常适合用于咖啡馆的菜单和标识 。
5. 迭代优化:通过对话微调图像
你可以通过多轮对话,逐步优化和细化图像。首先提供一个大致描述,然后根据初始结果,在后续指令中不断调整细节。
-
示例流程:
-
第一轮: 一只柯基犬在花园里玩耍。
-
第二轮(基于初始输出): 很好!现在让柯基的毛发看起来更蓬松一些,并且添加一些飞舞的蝴蝶。
-
第三轮: 背景可以更模糊一些,突出主体,并且把光线调整成温暖的夕阳色调。
6. 控制图像一致性
通过设置 consistency_level 参数(1-5级),你可以控制生成图像与参考图之间的相似度。5级最高(特征还原度≥95%),1级最低(保留基础轮廓)。
通用提示词进阶技巧
除了官方技巧,以下通用策略也能有效提升提示词质量:
-
结构化描述:尝试使用“主体-细节-风格-构图-画质”的结构组织你的提示词。例如: [主体] + [细节] + [风格] + [构图/光影] + [画质增强] 。
-
权重控制:用 (关键词:权重值) 调整重要性,例如 (星空:1.5) 强调星空背景, [模糊:0.8] 降低模糊效果。
-
负面提示词:排除不想要的元素,如 低分辨率, 畸变, 水印, 文字, 多肢体 。
-
融入矛盾冲突:尝试组合一些视觉或概念上的对比,如“赛博朋克武士”、“微缩巨大城市”、“玻璃火焰,液态金属”,这能激发AI的创造力,产生意想不到的艺术效果。
好消息是,目前您可以通过「智创聚合API」直接在国内访问并使用Nano Banana模型! 并且支持API接入自己的应用,智创聚合提供了稳定、高效的API接口服务,让您无需繁琐的环境配置,即可轻松集成这一强大的多模态生成能力到您的应用或工作流中,享受高质量的图像生成与编辑体验。

请登录之后再进行评论