最近 Midjourney 的会员到期了,加上那堆 --v --ar --s 的参数背得我脑壳疼,索性试了试 Google 的 Nano Banana。
听说它“听得懂人话”,不需要写那种代码一样的 Prompt。
试用了几天,感觉确实是个“偏科生”。 它在理解复杂逻辑上强得离谱,但在画面的“艺术滤镜”上,如果不特意强调,有时候会显得太直白(有点像早期的 Stock Photo)。
下面是我摸索出来的一点门道,主要讲讲怎么跟它“说话”才不翻车。
1. 它的脑回路跟 MJ 不一样
以前用 MJ,我得像写标签一样:
girl, space suit, neon lights, 8k, masterpiece
我也试着把这套搬到 Nano Banana 上,结果并不好。画出来的东西堆砌感很重,没什么逻辑。
后来我发现,Nano Banana 吃的是“句子”。 它更像是一个阅读理解能力很强的人。 你得告诉它:
“一个穿着宇航服的女孩,她正漂浮在洞穴里,周围有发光植物。”
它能理解“漂浮”这个动作和“洞穴”这个环境的关系,而不仅仅是把“宇航服”和“洞穴”这两个元素硬拼在一起。 这点挺爽的,不用再为了让两个人同框不融合而掉头发了。
2. 摸索出的 Prompt 写法(防翻车版)
虽然它听得懂人话,但如果你说得太笼统,它就开始“瞎编”。 比如我试过一句:“画个好看的头像”。 结果它给我画了个非常写实、甚至有点惊悚的 3D 人脸。
所以我给自己定了个检查清单,每次写 Prompt 前过一遍,少一项都可能出废片:
主体(到底是谁) + 在干嘛(动作) + 氛围(光影/颜色) + 风格(这步最重要)
2.1 风格必须指定
Nano Banana 默认的风格有点像那种“没有风格的照片”。 如果你想要那种很酷的效果,必须显式地告诉它。
- 失败案例:“画个森林。” -> 得到一张像手机随手拍的树林照片。
- 修正后:“画个森林,吉卜力动画风格,色彩饱和度高,像梦境一样。” -> 这次才有那味儿。
2.2 细节要给够
别指望它能猜到你想要什么发型。
- 我试过:“一个赛博朋克女孩。”
- 它画了:一个满脸金属片的秃头改装人(虽然很硬核,但不是我要的)。
- 我改成:“一个赛博朋克女孩,留着粉色短发,戴着透明护目镜。” -> 这次才对。
3. 跟 Midjourney 比,怎么选?
这两个我都用过,说实话,互有胜负。
| 特性 | Nano Banana | Midjourney |
|---|---|---|
| 听话程度 | 很强。我说“红帽子”,它绝不会画成绿的。 | 一般。有时候会为了美感牺牲准确度。 |
| 文字能力 | 惊喜。能把单词写对(只要单词不长)。 | 灾难。基本是乱码。 |
| 画面美感 | 需调教。不加风格词容易画得太土。 | 默认就美。随便输几个词都好看。 |
| 上手门槛 | 低。像发微信一样说话就行。 | 高。得学参数,得去 Discord。 |
个人建议:如果你是做海报、需要画面内容精准可控(比如必须有三个人,还得拿着特定道具),用 Nano Banana。如果你只是想要一张“好看的图”当壁纸,MJ 还是老大。
4. 实战复盘:给朋友画个吉祥物
有个朋友想给他的编程课弄个吉祥物,叫“码芽”。
第一轮尝试:
“画一个可爱的编程吉祥物,叫码芽。”
结果:画了一堆奇怪的绿色外星人,肚皮上写着乱码。
第二轮尝试(套用清单):
“画一个机器人吉祥物。 主体:头部是个旧显示器,身体是树干,脚是轮子。 动作:它正从花盆里钻出来,很开心。 风格:3D 卡通渲染,像皮克斯动画那样,光线要柔和。 文字:花盆上写着 ‘CODE’。”
结果: 这次出来的图能用了。虽然 ‘CODE’ 这个词第一次拼错了,我又重跑了一次(Reroll),第二次拼对了。 这一点挺烦的,抽卡感还是有,特别是涉及文字的时候。
5. 去哪用?
我是在 AIMirror 上用的。 主要是因为不用翻墙,而且它的模型列表里直接有 Nano Banana Pro。 我也试过官网,但网络稍微一抖图就传不上来,体验比较崩。
6. 总结
Nano Banana 不是那种让你“一键生成大师作”的神器。 它更像是一个听话但审美需要你把关的画师。 你品位好,描述得准,它就能出好图。你如果胡乱说,它就胡乱画。
如果你受够了在 MJ 里调参数,或者想试试用中文大白话画图,它值得一试。但别指望它能完全替代专业设计师,起码现在还不能。