引言:AI 绘图的“自然语言”革命
2025 年对于 AI 绘图界是里程碑式的一年。随着 Google DeepMind 正式发布 Nano Banana(内部代号 Gemini 2.5 Flash Image)及其高保真版本 Nano Banana Pro(Gemini 3 Pro Image 预览版),我们见证了从“关键词拼接”到“自然语言指令”的彻底范式转移。
不同于 Midjourney V6 仍需依赖 --stylize 或复杂的权重语法,Nano Banana 系列的设计初衷就是“听懂人话”。它基于 Gemini 原生多模态架构,意味着它不仅能“看”懂你上传的参考图,还能像个资深设计师一样理解你对光影、构图甚至情感氛围的细腻描述。
无论你是通过官方渠道,还是使用更便捷、无需魔法的 Nano Banana 中文版 (AIMirror),掌握一套适配 Gemini 逻辑的提示词(Prompt)策略,将是你从“抽卡玩家”进阶为“AI 创作者”的关键。本文将用 3000+ 字的篇幅,带你彻底拆解 Nano Banana 的提示词工程。
第一章:Nano Banana 的核心逻辑与优势
在开始写 Prompt 之前,必须理解 Nano Banana 的“大脑”是如何工作的。与 DALL-E 3 类似,它会先将你的简短 Prompt“扩写”为详细的图像描述,再进行生成。但 Nano Banana 更进一步,它引入了 Object-Awareness(对象感知) 和 Text-Encoder Precision(文本编码精度)。
1.1 为什么它比 MJ 更懂你的逻辑?
- 空间关系理解:你告诉它“猫在狗的左边,后面是红色的沙发”,它绝不会把猫画在沙发上。
- 原生中文支持:得益于 Gemini 强大的多语言语料库,在 Gemini 中文版 环境下,使用中文 Prompt 的效果往往比英文更精准,尤其涉及中国文化元素(如“汉服”、“赛博修仙”)时。
- 文字渲染(Text Rendering):这是 Nano Banana Pro 的杀手锏。它解决了 AI 绘图长久以来的痛点——无法在画面中准确写字。
1.2 适合 Nano Banana 的 Prompt 风格
- ❌ 错误示范(MJ 风格):
girl, cybernetic, neon lights, 8k, masterpiece, trending on artstation, unreal engine 5 --ar 16:9 --v 6(这种写法在 Nano Banana 里会导致画面元素堆砌,缺乏逻辑关联) - ✅ 正确示范(Gemini 风格):
一张电影感十足的照片,特写一位年轻女性的侧脸。她的皮肤上有发光的微型电路(cybernetic patterns)。背景是模糊的霓虹灯街道。光线柔和但对比度高,呈现出赛博朋克的氛围。画质清晰,细节丰富。(自然语言,逻辑连贯,指代清晰)
第二章:万能提示词公式与词库字典
虽然 Nano Banana 鼓励自然语言,但遵循一定的结构能显著提高成功率。我们总结了一套“黄金公式”:
[主体与动作] + [环境与背景] + [媒介与风格] + [光影与色彩] + [构图与视角] + [特殊参数/文字]
2.1 主体与动作 (Subject & Action)
这是画面的核心。描述越具体,AI 发挥越稳定。
- 人物:不仅要说“一个男人”,要说“一位 30 岁左右、穿着做旧皮夹克的机械师”。
- 动作:使用动态动词。例如“正在奔跑”不如“大步跨越积水的水坑,水花四溅”。
- 表情:微表情是 Nano Banana Pro 的强项,如“嘴角微微上扬的讥讽”、“眼神中流露出的恐惧”。
2.2 媒介与风格 (Medium & Style)
告诉 AI 你想要什么类型的图。Nano Banana 对以下风格词极其敏感:
- 摄影类:
Photorealistic(照片级真实)Cinematic shot(电影镜头)Analog photography(胶片摄影,增加颗粒感)Editorial photography(时尚杂志风)
- 艺术/插画类:
Ukiyo-e(浮世绘)Cyberpunk anime(赛博朋克动漫)Flat design(扁平化设计,适合 UI)Isometric 3D(等轴测 3D,适合图标)Oil painting with impasto(厚涂油画)
2.3 光影与色彩 (Lighting & Color)
光影决定了画面的质感。
- 光线类型:
Volumetric lighting(体积光/丁达尔效应,增加神圣感)Rim lighting(边缘光,勾勒轮廓,分离主体与背景)Rembrandt lighting(伦勃朗光,经典人像三角光)Bioluminescent glow(生物荧光,科幻必备)
- 色彩方案:
Teal and Orange(青橙色调,好莱坞大片感)Pastel color palette(马卡龙色系,清新可爱)Monochrome with red accent(黑白单色加红色点缀,《辛德勒名单》风格)
2.4 构图与视角 (Composition & Camera)
像导演一样调度镜头。
Eye-level shot(平视,亲切)Low angle(仰拍,显高大/压迫感)Over-the-shoulder shot(过肩镜头,对话感)Macro photography(微距,拍昆虫/纹理)Wide angle(广角,大场景)
第三章:八大场景实战演练(Bad vs. Good)
在 Gemini 镜像站 实测中,我们对比了普通 Prompt 与优化后 Prompt 的效果。
场景 1:电商产品摄影(香水)
- Bad Prompt:
一瓶香水,好看,背景是花- 结果:香水瓶设计平庸,花朵杂乱,光线像手机随手拍。
- Good Prompt:
一张极简主义的产品摄影图。主体是一瓶透明的奢华香水,瓶身有钻石切面。它放置在一块黑色的火山岩上。背景是深邃的黑色,只有一束聚光灯打在香水瓶上,形成强烈的高光和倒影。周围漂浮着几片鲜红的玫瑰花瓣,带有动态模糊效果。
- 结果:杂志级大片,质感高级,光影聚焦。
场景 2:UI/UX 网页设计
- Good Prompt:
设计一个 2025 年风格的科技公司落地页界面。主色调是深蓝和紫色渐变。中心是一个悬浮的 3D 玻璃质感星球。UI 布局包含磨砂玻璃(glassmorphism)效果的导航栏和圆角卡片。整体风格现代、干净、扁平化。
场景 3:Logo 设计与文字嵌入
Nano Banana Pro 的绝活。
- Good Prompt:
设计一个咖啡品牌的 Logo,图形是一只戴着眼镜的猫头鹰拿着咖啡杯。矢量风格,线条简洁,黑白配色。在 Logo 下方,用粗体无衬线字清晰地写着 “NIGHT OWL”。白色背景。
场景 4:建筑与室内设计
- Good Prompt:
一个未来的生态豪宅客厅。落地窗外是郁郁葱葱的热带雨林。室内装修采用“Japandi”(日式与北欧混搭)风格:原木色家具,米色亚麻沙发,极简的线条。阳光透过树叶洒在室内地板上,形成斑驳的光影。广角镜头。
场景 5:游戏资产(Sprite Sheet)
- Good Prompt:
为一款 2D 像素风 RPG 游戏生成的角色表(Character Sheet)。主角是一个红发的女剑士。包含正面、侧面、背面三个视图。以及攻击、跳跃、倒地的动作帧。像素艺术风格,16-bit 怀旧感,白色背景,排列整齐。
场景 6:社交媒体头像(Avatar)
- Good Prompt:
生成一个 Pixar(皮克斯)风格的 3D 头像。一个小男孩,戴着橙色的毛线帽,圆圆的眼镜,穿着连帽衫。表情惊讶而开心。灯光柔和温暖,背景是模糊的图书馆书架。
场景 7:概念艺术与世界观构建
- Good Prompt:
概念艺术插画。一座建立在巨大枯树上的蒸汽朋克城市。房屋由黄铜和齿轮构成,悬挂在树枝间。蒸汽火车在空中轨道上行驶。黄昏时刻,天空是紫红色的,云层厚重。史诗感,细节繁复。
场景 8:角色一致性连环画(进阶)
这是利用 Gemini 多模态能力的高级玩法。
- 步骤:先生成一张满意的角色图,保存。
- Prompt:
(上传刚才的角色图作为参考)基于这张参考图中的人物,生成一张新图片。这个人物正在雨中撑着一把透明雨伞哭泣。保持她的发型、发色和服装完全一致。背景是模糊的雨夜街道。
第四章:Nano Banana Pro 的多模态编辑技巧
除了生图,Nano Banana 中文版 还支持“对话式修图”。这比传统的 In-painting(局部重绘)更直观。
4.1 局部修改
- Prompt: “把图中的红色汽车改成蓝色的复古甲壳虫。”
- Prompt: “让人物戴上一副墨镜。”
- 原理:Gemini 能精准识别图像中的语义对象,只修改指定部分,而不破坏整体构图。
4.2 风格迁移
- Prompt: “保持画面内容不变,但把风格变成梵高的《星空》油画风格。”
- Prompt: “把它变成一张黑白素描草图。”
4.3 扩图(Outpainting)
虽然官方叫法不同,但你可以通过 Prompt 实现类似效果:
- Prompt: “将镜头拉远(Zoom out),展示更多周围的环境,这应该是一个繁忙的市场。”
第五章:常见问题排查 (Troubleshooting)
即使是顶级模型也有翻车的时候。以下是针对 Nano Banana 的常见病症与处方:
- 多余的肢体/畸形手:
- 处方:在 Prompt 中加入
anatomically correct hands(解剖学正确的手),或者尽量让手部持有物体(如“拿着杯子”、“插在口袋里”),减少 AI 自由发挥的空间。
- 处方:在 Prompt 中加入
- 文字乱码:
- 处方:确保文字内容用英文双引号
""包裹。如果 Prompt 太长,尝试把文字指令提到最前面。使用 Nano Banana Pro 模式成功率更高。
- 处方:确保文字内容用英文双引号
- 画面灰暗/模糊:
- 处方:加入
high contrast(高对比度)、sharp focus(清晰对焦)、4k resolution。
- 处方:加入
- 风格不伦不类:
- 处方:可能是风格词冲突。检查是否同时写了“照片级真实”和“抽象画”。
- 镜像站连接超时:
- 处方:高峰期官方接口拥堵。尝试切换到 AIMirror 备用线路,或者稍微简化 Prompt 逻辑。
结语:拥抱自然语言创作时代
Nano Banana 的出现,标志着 AI 绘图门槛的进一步降低。你不再需要背诵复杂的魔法书,只需要把你脑海中的画面,用最准确、生动的语言描述出来。
这种能力的提升,使得创意(Idea)的价值远高于技术(Tech)。最好的 Prompt 工程师,本质上是最好的导演、摄影师和诗人。
现在,准备好你的创意,去 Nano Banana 官网/镜像站 挥洒想象力吧!
附录:推荐工具箱
为了构建你的 AI 工作流,除了 Gemini,以下工具也不可或缺:
- Claude 3.5 Sonnet:拥有极强的图像描述能力,可以把参考图发给它,让它帮你写 Prompt。
- 入口:Claude 镜像站
- Banana 镜像站:支持最新的 GPT-4o、Claude 3.5、Nano Banana Pro,并率先接入了 Sora 2 视频生成能力。
- ChatGPT (DALL-E 3):适合通过对话不断调整 Prompt 逻辑。
- 入口:ChatGPT 镜像站
- Gemini 工具集合:更多 Gemini 生态的小工具。
- 入口:Gemini 工具站
本文内容基于 2025 年 12 月的 Gemini 3.0 生态编写。部分功能可能随 Google DeepMind 的更新而演变。1
更多技术细节参考 Google DeepMind Research (2025). ↩︎