最近 Midjourney 的会员到期了,加上那堆 --v --ar --s 的参数背得我脑壳疼,索性试了试 Google 的 Nano Banana。 听说它“听得懂人话”,不需要写那种代码一样的 Prompt。

试用了几天,感觉确实是个“偏科生”。 它在理解复杂逻辑上强得离谱,但在画面的“艺术滤镜”上,如果不特意强调,有时候会显得太直白(有点像早期的 Stock Photo)。

下面是我摸索出来的一点门道,主要讲讲怎么跟它“说话”才不翻车。

1. 它的脑回路跟 MJ 不一样

以前用 MJ,我得像写标签一样: girl, space suit, neon lights, 8k, masterpiece

我也试着把这套搬到 Nano Banana 上,结果并不好。画出来的东西堆砌感很重,没什么逻辑。

后来我发现,Nano Banana 吃的是“句子”。 它更像是一个阅读理解能力很强的人。 你得告诉它:

“一个穿着宇航服的女孩,她正漂浮在洞穴里,周围有发光植物。”

它能理解“漂浮”这个动作和“洞穴”这个环境的关系,而不仅仅是把“宇航服”和“洞穴”这两个元素硬拼在一起。 这点挺爽的,不用再为了让两个人同框不融合而掉头发了。

2. 摸索出的 Prompt 写法(防翻车版)

虽然它听得懂人话,但如果你说得太笼统,它就开始“瞎编”。 比如我试过一句:“画个好看的头像”。 结果它给我画了个非常写实、甚至有点惊悚的 3D 人脸。

所以我给自己定了个检查清单,每次写 Prompt 前过一遍,少一项都可能出废片

主体(到底是谁) + 在干嘛(动作) + 氛围(光影/颜色) + 风格(这步最重要)

2.1 风格必须指定

Nano Banana 默认的风格有点像那种“没有风格的照片”。 如果你想要那种很酷的效果,必须显式地告诉它。

  • 失败案例:“画个森林。” -> 得到一张像手机随手拍的树林照片。
  • 修正后:“画个森林,吉卜力动画风格,色彩饱和度高,像梦境一样。” -> 这次才有那味儿。

2.2 细节要给够

别指望它能猜到你想要什么发型。

  • 我试过:“一个赛博朋克女孩。”
  • 它画了:一个满脸金属片的秃头改装人(虽然很硬核,但不是我要的)。
  • 我改成:“一个赛博朋克女孩,留着粉色短发,戴着透明护目镜。” -> 这次才对。

3. 跟 Midjourney 比,怎么选?

这两个我都用过,说实话,互有胜负。

特性Nano BananaMidjourney
听话程度很强。我说“红帽子”,它绝不会画成绿的。一般。有时候会为了美感牺牲准确度。
文字能力惊喜。能把单词写对(只要单词不长)。灾难。基本是乱码。
画面美感需调教。不加风格词容易画得太土。默认就美。随便输几个词都好看。
上手门槛。像发微信一样说话就行。。得学参数,得去 Discord。

个人建议:如果你是做海报、需要画面内容精准可控(比如必须有三个人,还得拿着特定道具),用 Nano Banana。如果你只是想要一张“好看的图”当壁纸,MJ 还是老大。

4. 实战复盘:给朋友画个吉祥物

有个朋友想给他的编程课弄个吉祥物,叫“码芽”。

第一轮尝试

“画一个可爱的编程吉祥物,叫码芽。”

结果:画了一堆奇怪的绿色外星人,肚皮上写着乱码。

第二轮尝试(套用清单)

“画一个机器人吉祥物。 主体:头部是个旧显示器,身体是树干,脚是轮子。 动作:它正从花盆里钻出来,很开心。 风格:3D 卡通渲染,像皮克斯动画那样,光线要柔和。 文字:花盆上写着 ‘CODE’。”

结果: 这次出来的图能用了。虽然 ‘CODE’ 这个词第一次拼错了,我又重跑了一次(Reroll),第二次拼对了。 这一点挺烦的,抽卡感还是有,特别是涉及文字的时候。

5. 去哪用?

我是在 AIMirror 上用的。 主要是因为不用翻墙,而且它的模型列表里直接有 Nano Banana Pro。 我也试过官网,但网络稍微一抖图就传不上来,体验比较崩。

6. 总结

Nano Banana 不是那种让你“一键生成大师作”的神器。 它更像是一个听话但审美需要你把关的画师。 你品位好,描述得准,它就能出好图。你如果胡乱说,它就胡乱画。

如果你受够了在 MJ 里调参数,或者想试试用中文大白话画图,它值得一试。但别指望它能完全替代专业设计师,起码现在还不能。