“香蕉”熟了，AI作图直接“逆天改命”：这些“邪修”玩法，手办3D都过时了！

TL;DR：

曾经神秘的“nano-banana”大模型，如今被谷歌“认领”为Gemini 2.5 Flash Image，直接把AI作图玩出了花！从多图拼贴到局部“换头”，再到一键生成手办、城市模型，甚至连漫画都能自动画。这根本不是AI，这是“多模态魔法棒”啊！

最近，AI圈里有个神秘的“香蕉”火得一塌糊涂，大家都叫它“nano-banana”。这个名字听起来有点萌，但它的能力简直是**“逆天”！网友们纷纷祭出各种“邪修玩法”**，让这个模型在LMArena¹上大杀四方，甚至一度让大家觉得GPT-4o的吉卜力风潮都显得有点“过时”了。

现在，谷歌官方终于揭开“香蕉皮”，承认它就是自家大杀器——Gemini 2.5 Flash Image！² 这下好了，一个本来就让人惊掉下巴的模型，有了“官方认证”的加持，瞬间感觉又多了一层buff。那么，这个让大家直呼“Photoshop岌岌可危”的“香蕉”，到底有啥“独门绝技”能玩出这么多花样？

告别“傻瓜式”AI：玩转“多模态魔法”，你的脑洞有多大，它就有多“野”！

你还在一张一张地上传参考图，然后苦哈哈地调整prompt，就为了让AI能“听懂人话”？Nano-banana表示：你OUT了！

它的**“多元素拼贴法”简直是懒人福音**。你只需要把想生成的鞋子、眼镜、耳机、相机等一堆东西统统塞进一张图里，然后在上面简单“打个标签”，比如在鞋子上写“white sneaker”，耳机上写“headphone”。接着，把这张“大杂烩”图片扔给AI，再配上简单的文字描述，它就能像**“开了挂”一样，自动帮你处理背景、调整姿势、统一光线，甚至还能解决传统图像生成模型“物品数量受限”**的老大难问题。

“A man is standing in a modern electronic store analyzing a digital camera. He is wearing a watch. On the table in front of him are sunglasses, headphones on a stand, a shoe, a helmet and a sneaker, a white sneaker and a black sneaker.”

— 瞧瞧这Prompt，简洁明了，但AI却能精准识别出各种物品，还能把它们安排得明明白白。这AI，简直比你还懂构图！

更离谱的是，这套玩法不挑素材，不挑Prompt，不管你原图有多“抽象”，它都能给你“盘”出惊喜。想让企鹅Pingu打工？小菜一碟！让四只娃娃在花园里开茶话会？分分钟搞定！

不仅是“大变活人”，“指定局部编辑”功能更是让细节控们“原地起飞”。你只需要上传图片，然后用文字简单描述想改动的部分，比如把人物的表情从“开心”变“悲伤”，或者给房间换个家具，甚至直接把画面里的人“P掉”，其他部分丝毫不受影响。这种精准度，Adobe的Firefly和Photoshop是不是感觉后背一凉？²

而且，这次更新还彻底攻克了传统AI模型面对**“中文字”就“翻车”**的魔咒，能完美生成带3D阴影效果的中文海报，文字笔画清晰，毫无走形。这波，中文用户狂喜！

不止P图，还能“造物”：从猫狗手办到赛博朋克城市，AI“神笔马良”上线！

还沉迷于生成2D图片？格局小了，朋友！ Nano-banana直接带你进入**“万物皆可手办”**的次元新世界。

想象一下，你家毛孩子穿着宇航服在月球漫步的手办，或者你和爱豆跨越时空合影的专属摆件，甚至把你的同事们全部“手办化”——只需要一张照片，加上一些关于比例（1/7 scale PVC figure）、材质（glossy paint）和配件（acrylic stand）的Prompt，AI就能把整个场景“手办化”，材质、比例、风格都给你安排得明明白白，简直是**“钞能力”的平替**。

“用 nano-banana 模型，把插画中的角色制作成1/7比例的商业化手办，风格写实，环境真实。将手办放置在电脑桌上，使用圆形透明亚克力底座，无文字。电脑屏幕上显示手办的ZBrush建模过程。电脑屏幕旁边放置一个印有原始艺术作品的BANDAI风格玩具包装盒。”

— 这Prompt，连细节都拿捏得死死的，AI不给你弄出来都说不过去！

如果说手办化是“小打小闹”，那**“原地起高楼”的建筑图再生功能，就真是“把地平线都给你抬起来”**！一张糊到不能再糊的平面图，或者一张普通的街景照片，经过nano-banana的“点化”，就能瞬间变成干净整洁、比例统一、风格一致的3D立体城市景观模型图。它甚至能理解建筑用途（use=office/mixed-use）、外立面（façade=glass curtain wall）等复杂指令，直接把二维几何“拔高”成立体体量，这推理能力，简直是建筑师的“梦中情模”！

更神奇的是，它还能从一张照片开始，帮你生成完整的四格故事漫画。定好主角，给第一格画面和台词，然后反复续写，即使是“猫猫环游世界”或者“林黛玉和孙悟空成为漫威英雄并肩战斗”这种脑洞大开的剧情，它也能保证画风统一、角色不“跑偏”，甚至还能帮你修改台词、替换角色名。这AI，简直是“编剧、画师、分镜师”三合一！

“香蕉”吃起来有点甜，但要小心“地区限定”：小白上手指南与“薅羊毛”攻略

看了这么多“逆天”案例，是不是已经按捺不住想要“尝鲜”了？别急，新手上路，总得先知道去哪儿“摘香蕉”！

作为谷歌“亲儿子”，nano-banana（也就是Gemini 2.5 Flash Image）的首发平台自然是Google AI Studio。² 网址是aistudio.google.com。不过，这里有个小小的“地区限定”bug，如果你发现界面不对劲，那多半是被“锁区”了。

如果你是开发者，或者动手能力强，也可以直接调用Gemini API，或者通过Chatbox等已宣布支持的平台来“食用”。当然，谷歌云的Vertex AI也第一时间挂上了这个新模型，但需要登记银行卡，大家得**“斟酌斟酌”**。

不想研究API，又被“地区限定”卡住？别怕，“野路子”也很多！

LMArena.ai：就是最初“路透”nano-banana的“擂台”平台。你可以直连，直接感受AI模型“捉对厮杀”的魅力，也能体验生成功能。缺点嘛，可能生成时间长，偶尔会“卡死机”。
Adobe Firefly：如果你是Adobe生态的老用户，那恭喜你，Firefly也已经接入了nano-banana。在Creative Cloud账户下，合规安全，操作也方便。当然，Firefly也有“地区限定”的问题。
Lovart：这个平台直接官宣接入，不仅每天有200点免费额度，听说到9月2日之前使用nano-banana完全不消耗点数！快，羊毛薅起来，过期不候！
Openrouter.ai：目前来看，这是最能匹敌官方的第三方平台。它不仅接入了nano-banana，而且开箱即用，生成速度和品质都相当给力，甚至在某些局部编辑上，效果比官方还“香”！不过，“香蕉”吃多了也可能“拉肚子”，Openrouter在token消耗多的时候，图片清晰度会波动，可能会出现“像素化”的情况。

话说回来，面对市面上五花八门的第三方平台，怎么才能**“慧眼识香蕉”，避免踩坑呢？这里有一份“鉴别清单”**，供你参考：

注册流程是否需要银行卡？
是否提供Gemini 2.5 Flash Image模型选择？
能否设置分辨率、风格、负向词等生成参数？
试生成3-5张图，看看用时和“抽卡”成功率？
是否支持导出原图和元数据？
有无“批量/迭代”功能，方便测试一致性？
计费方式如何？按图还是按时长？每张成本大概多少？
水印策略如何？有没有默认水印？去除水印是否要额外付费？

随着nano-banana的正式发布，会有越来越多的平台支持，比如Flora、ComfyUI等，地区限制很快就不会是问题。所以，选好你的“战场”，开始你的**“邪修出图”**之路吧！毕竟，AI时代，手快有，手慢无！

引用

谷歌揭秘nano-banana模型：Gemini 2.5 Flash Image！·知乎专栏·小小将（2025/8/29）·检索日期2025/8/29 ↩︎
谷歌认领最强AI版Photoshop！现在人人可用，效果确实强悍·量子位·时令（2025/8/29）·检索日期2025/8/29 ↩︎ ↩︎ ↩︎