TL;DR:
谷歌这次直接掀了创意的“天灵盖”!从能写歌的 Lyria 到能拍片的 Veo,AI Studio 里满屏都是“黑科技”。别再只会让 Gemini 写周报了,这波全家桶是打算直接快进到“全自动艺术家”时代。
如果说去年的 AI 圈还在纠结“谁的对话更像人”,那么 2026 年开年的这波节奏,显然已经快进到了“谁的创意更离谱”。谷歌最近一通操作猛如虎,直接把自家的 AI 创意工具箱翻了个底朝天,大有要把文案、音乐、绘画、视频全都“一锅端”的架势。1
Lyria 实时弹奏:贝多芬听了都想点赞?
最让人眼前一亮(或者说耳边一震)的,莫过于谷歌推出的 Lyria 音乐生成模型。如果你还以为 AI 写歌就是那种机械感十足的“电子垃圾”,那 Lyria 可能要来打脸了。
通过 Gemini API,开发者现在可以调用 Lyria RealTime,这玩意儿最骚的操作在于它的实时流式生成能力。2 它不只是给你一段固定的音频文件,而是允许用户通过交互的方式,持续引导乐曲的走向。简单来说,你就像一个手握魔棒的指挥家,AI 在下面玩命地根据你的意图即兴演奏。
“这哪里是生成器,分明是招了一个永远不嫌累、还会十八般武艺的赛博乐手。” ——某位在评论区瑟瑟发抖的独立音乐人。
无论是根据文本描述生成旋律,还是引导特定的乐器演奏,Lyria 的落地速度快得惊人。在 Vertex AI 上,这项技术已经开始面向大众,尝试把“人人都是周杰伦”的口号变成现实。3
AI Studio 变身“创意超市”:全线大模型已就位
如果你觉得只有音乐还不够过瘾,那谷歌的 AI Studio 简直就是创作者的“深夜食堂”。在这个一站式平台上,谷歌把看家本领全摆了出来:
- Veo 3:谷歌最新的视频生成“大杀器”,专为电影制作人和讲故事的人设计。那种电影质感的镜头切换,确实让隔壁的剪辑师感受到了压力。4
- Imagen:依然是图像生成领域的顶流,主打一个“理解力满分”,你说要五彩斑斓的黑,它绝对不敢给你大红大绿。
- Gemini Native Audio:这可不是普通的文字转语音,它支持极具真实感的语音生成,声音里的情感起伏甚至能让你怀疑对面是不是坐了个真人。4
谷歌的逻辑很简单:与其让你在不同的工具间反复横跳,不如直接在自家院子里建一个“创意闭环”。从脚本构思到画面渲染,再到配乐剪辑,Gemini 家族基本上已经实现了“全链条外包”。
行业“地震”:谁在狂欢,谁在忧虑?
谷歌这一波“全家桶”式输出,最开心的莫过于那些恨不得一个人活成一支队伍的初创公司。谷歌云甚至豪横地拿出了最高 35 万美元 的赠金来扶持 AI 初创企业,摆明了是要抢占开发者的心智。5
然而,这种“暴力”的技术迭代也引发了不小的讨论。当 AI 可以实时生成音乐、批量产出视频时,创意的门槛确实降低了,但“创意的含金量”是否也被稀释了?
谷歌的立场倒是很明确:这些工具是用来赋能而非替代。但话说回来,当 AI 已经能把 90% 的基础活儿都干得又快又好时,人类创作者可能真的需要思考,剩下的那 10% “灵魂”到底该往哪儿放。
不管怎样,谷歌这次展示的“未来”已经触手可及。如果你还没去 AI Studio 薅一把羊毛,那可能真的要跟不上这波“赛博艺术”的快节奏了。
引用
-
Gemini - Google · Google · (2026/2/4) · 检索日期2026/2/4 ↩︎
-
使用Lyria RealTime 生成音乐 | Gemini API · Google AI for Developers · (2026/2/4) · 检索日期2026/2/4 ↩︎
-
Lyria | AI 音乐生成器 | Generative AI on Vertex AI · Google Cloud · (2026/2/4) · 检索日期2026/2/4 ↩︎
-
Google AI Studio · Google · (2026/2/4) · 检索日期2026/2/4 ↩︎ ↩︎
-
生成式AI | Google Cloud · Google Cloud · (2026/2/4) · 检索日期2026/2/4 ↩︎