引言:AI 绘图的“自然语言”革命

2025 年对于 AI 绘图界是里程碑式的一年。随着 Google DeepMind 正式发布 Nano Banana(内部代号 Gemini 2.5 Flash Image)及其高保真版本 Nano Banana Pro(Gemini 3 Pro Image 预览版),我们见证了从“关键词拼接”到“自然语言指令”的彻底范式转移。

不同于 Midjourney V6 仍需依赖 --stylize 或复杂的权重语法,Nano Banana 系列的设计初衷就是“听懂人话”。它基于 Gemini 原生多模态架构,意味着它不仅能“看”懂你上传的参考图,还能像个资深设计师一样理解你对光影、构图甚至情感氛围的细腻描述。

无论你是通过官方渠道,还是使用更便捷、无需魔法的 Nano Banana 中文版 (AIMirror),掌握一套适配 Gemini 逻辑的提示词(Prompt)策略,将是你从“抽卡玩家”进阶为“AI 创作者”的关键。本文将用 3000+ 字的篇幅,带你彻底拆解 Nano Banana 的提示词工程。


第一章:Nano Banana 的核心逻辑与优势

在开始写 Prompt 之前,必须理解 Nano Banana 的“大脑”是如何工作的。与 DALL-E 3 类似,它会先将你的简短 Prompt“扩写”为详细的图像描述,再进行生成。但 Nano Banana 更进一步,它引入了 Object-Awareness(对象感知)Text-Encoder Precision(文本编码精度)

1.1 为什么它比 MJ 更懂你的逻辑?

  • 空间关系理解:你告诉它“猫在狗的左边,后面是红色的沙发”,它绝不会把猫画在沙发上。
  • 原生中文支持:得益于 Gemini 强大的多语言语料库,在 Gemini 中文版 环境下,使用中文 Prompt 的效果往往比英文更精准,尤其涉及中国文化元素(如“汉服”、“赛博修仙”)时。
  • 文字渲染(Text Rendering):这是 Nano Banana Pro 的杀手锏。它解决了 AI 绘图长久以来的痛点——无法在画面中准确写字。

1.2 适合 Nano Banana 的 Prompt 风格

  • ❌ 错误示范(MJ 风格)girl, cybernetic, neon lights, 8k, masterpiece, trending on artstation, unreal engine 5 --ar 16:9 --v 6 (这种写法在 Nano Banana 里会导致画面元素堆砌,缺乏逻辑关联)
  • ✅ 正确示范(Gemini 风格)一张电影感十足的照片,特写一位年轻女性的侧脸。她的皮肤上有发光的微型电路(cybernetic patterns)。背景是模糊的霓虹灯街道。光线柔和但对比度高,呈现出赛博朋克的氛围。画质清晰,细节丰富。 (自然语言,逻辑连贯,指代清晰)

第二章:万能提示词公式与词库字典

虽然 Nano Banana 鼓励自然语言,但遵循一定的结构能显著提高成功率。我们总结了一套“黄金公式”:

[主体与动作] + [环境与背景] + [媒介与风格] + [光影与色彩] + [构图与视角] + [特殊参数/文字]

2.1 主体与动作 (Subject & Action)

这是画面的核心。描述越具体,AI 发挥越稳定。

  • 人物:不仅要说“一个男人”,要说“一位 30 岁左右、穿着做旧皮夹克的机械师”。
  • 动作:使用动态动词。例如“正在奔跑”不如“大步跨越积水的水坑,水花四溅”。
  • 表情:微表情是 Nano Banana Pro 的强项,如“嘴角微微上扬的讥讽”、“眼神中流露出的恐惧”。

2.2 媒介与风格 (Medium & Style)

告诉 AI 你想要什么类型的图。Nano Banana 对以下风格词极其敏感:

  • 摄影类
    • Photorealistic (照片级真实)
    • Cinematic shot (电影镜头)
    • Analog photography (胶片摄影,增加颗粒感)
    • Editorial photography (时尚杂志风)
  • 艺术/插画类
    • Ukiyo-e (浮世绘)
    • Cyberpunk anime (赛博朋克动漫)
    • Flat design (扁平化设计,适合 UI)
    • Isometric 3D (等轴测 3D,适合图标)
    • Oil painting with impasto (厚涂油画)

2.3 光影与色彩 (Lighting & Color)

光影决定了画面的质感。

  • 光线类型
    • Volumetric lighting (体积光/丁达尔效应,增加神圣感)
    • Rim lighting (边缘光,勾勒轮廓,分离主体与背景)
    • Rembrandt lighting (伦勃朗光,经典人像三角光)
    • Bioluminescent glow (生物荧光,科幻必备)
  • 色彩方案
    • Teal and Orange (青橙色调,好莱坞大片感)
    • Pastel color palette (马卡龙色系,清新可爱)
    • Monochrome with red accent (黑白单色加红色点缀,《辛德勒名单》风格)

2.4 构图与视角 (Composition & Camera)

像导演一样调度镜头。

  • Eye-level shot (平视,亲切)
  • Low angle (仰拍,显高大/压迫感)
  • Over-the-shoulder shot (过肩镜头,对话感)
  • Macro photography (微距,拍昆虫/纹理)
  • Wide angle (广角,大场景)

第三章:八大场景实战演练(Bad vs. Good)

Gemini 镜像站 实测中,我们对比了普通 Prompt 与优化后 Prompt 的效果。

场景 1:电商产品摄影(香水)

  • Bad Prompt: 一瓶香水,好看,背景是花
    • 结果:香水瓶设计平庸,花朵杂乱,光线像手机随手拍。
  • Good Prompt:

    一张极简主义的产品摄影图。主体是一瓶透明的奢华香水,瓶身有钻石切面。它放置在一块黑色的火山岩上。背景是深邃的黑色,只有一束聚光灯打在香水瓶上,形成强烈的高光和倒影。周围漂浮着几片鲜红的玫瑰花瓣,带有动态模糊效果。

    • 结果:杂志级大片,质感高级,光影聚焦。

场景 2:UI/UX 网页设计

  • Good Prompt:

    设计一个 2025 年风格的科技公司落地页界面。主色调是深蓝和紫色渐变。中心是一个悬浮的 3D 玻璃质感星球。UI 布局包含磨砂玻璃(glassmorphism)效果的导航栏和圆角卡片。整体风格现代、干净、扁平化。

场景 3:Logo 设计与文字嵌入

Nano Banana Pro 的绝活。

  • Good Prompt:

    设计一个咖啡品牌的 Logo,图形是一只戴着眼镜的猫头鹰拿着咖啡杯。矢量风格,线条简洁,黑白配色。在 Logo 下方,用粗体无衬线字清晰地写着 “NIGHT OWL”。白色背景。

场景 4:建筑与室内设计

  • Good Prompt:

    一个未来的生态豪宅客厅。落地窗外是郁郁葱葱的热带雨林。室内装修采用“Japandi”(日式与北欧混搭)风格:原木色家具,米色亚麻沙发,极简的线条。阳光透过树叶洒在室内地板上,形成斑驳的光影。广角镜头。

场景 5:游戏资产(Sprite Sheet)

  • Good Prompt:

    为一款 2D 像素风 RPG 游戏生成的角色表(Character Sheet)。主角是一个红发的女剑士。包含正面、侧面、背面三个视图。以及攻击、跳跃、倒地的动作帧。像素艺术风格,16-bit 怀旧感,白色背景,排列整齐。

场景 6:社交媒体头像(Avatar)

  • Good Prompt:

    生成一个 Pixar(皮克斯)风格的 3D 头像。一个小男孩,戴着橙色的毛线帽,圆圆的眼镜,穿着连帽衫。表情惊讶而开心。灯光柔和温暖,背景是模糊的图书馆书架。

场景 7:概念艺术与世界观构建

  • Good Prompt:

    概念艺术插画。一座建立在巨大枯树上的蒸汽朋克城市。房屋由黄铜和齿轮构成,悬挂在树枝间。蒸汽火车在空中轨道上行驶。黄昏时刻,天空是紫红色的,云层厚重。史诗感,细节繁复。

场景 8:角色一致性连环画(进阶)

这是利用 Gemini 多模态能力的高级玩法。

  • 步骤:先生成一张满意的角色图,保存。
  • Prompt

    (上传刚才的角色图作为参考)基于这张参考图中的人物,生成一张新图片。这个人物正在雨中撑着一把透明雨伞哭泣。保持她的发型、发色和服装完全一致。背景是模糊的雨夜街道。


第四章:Nano Banana Pro 的多模态编辑技巧

除了生图,Nano Banana 中文版 还支持“对话式修图”。这比传统的 In-painting(局部重绘)更直观。

4.1 局部修改

  • Prompt: “把图中的红色汽车改成蓝色的复古甲壳虫。”
  • Prompt: “让人物戴上一副墨镜。”
  • 原理:Gemini 能精准识别图像中的语义对象,只修改指定部分,而不破坏整体构图。

4.2 风格迁移

  • Prompt: “保持画面内容不变,但把风格变成梵高的《星空》油画风格。”
  • Prompt: “把它变成一张黑白素描草图。”

4.3 扩图(Outpainting)

虽然官方叫法不同,但你可以通过 Prompt 实现类似效果:

  • Prompt: “将镜头拉远(Zoom out),展示更多周围的环境,这应该是一个繁忙的市场。”

第五章:常见问题排查 (Troubleshooting)

即使是顶级模型也有翻车的时候。以下是针对 Nano Banana 的常见病症与处方:

  1. 多余的肢体/畸形手
    • 处方:在 Prompt 中加入 anatomically correct hands(解剖学正确的手),或者尽量让手部持有物体(如“拿着杯子”、“插在口袋里”),减少 AI 自由发挥的空间。
  2. 文字乱码
    • 处方:确保文字内容用英文双引号 "" 包裹。如果 Prompt 太长,尝试把文字指令提到最前面。使用 Nano Banana Pro 模式成功率更高。
  3. 画面灰暗/模糊
    • 处方:加入 high contrast(高对比度)、sharp focus(清晰对焦)、4k resolution
  4. 风格不伦不类
    • 处方:可能是风格词冲突。检查是否同时写了“照片级真实”和“抽象画”。
  5. 镜像站连接超时
    • 处方:高峰期官方接口拥堵。尝试切换到 AIMirror 备用线路,或者稍微简化 Prompt 逻辑。

结语:拥抱自然语言创作时代

Nano Banana 的出现,标志着 AI 绘图门槛的进一步降低。你不再需要背诵复杂的魔法书,只需要把你脑海中的画面,用最准确、生动的语言描述出来。

这种能力的提升,使得创意(Idea)的价值远高于技术(Tech)。最好的 Prompt 工程师,本质上是最好的导演、摄影师和诗人。

现在,准备好你的创意,去 Nano Banana 官网/镜像站 挥洒想象力吧!

附录:推荐工具箱

为了构建你的 AI 工作流,除了 Gemini,以下工具也不可或缺:

  • Claude 3.5 Sonnet:拥有极强的图像描述能力,可以把参考图发给它,让它帮你写 Prompt。
  • Banana 镜像站:支持最新的 GPT-4o、Claude 3.5、Nano Banana Pro,并率先接入了 Sora 2 视频生成能力。
  • ChatGPT (DALL-E 3):适合通过对话不断调整 Prompt 逻辑。
  • Gemini 工具集合:更多 Gemini 生态的小工具。

本文内容基于 2025 年 12 月的 Gemini 3.0 生态编写。部分功能可能随 Google DeepMind 的更新而演变。1


  1. 更多技术细节参考 Google DeepMind Research (2025)↩︎