TL;DR:
谷歌给Android开发者开挂了!ML Kit GenAI Prompt API这波操作,直接让手机里的AI大脑Gemini Nano能听懂“人话”,还能处理图片,开发者可以自由发挥,告别“傻瓜式”AI,解锁各种奇葩又实用的新姿势,手机端AI从此迈入“我的地盘我做主”的时代!
当手机不只满足于“刷刷短视频、抢抢红包”,而是开始拥有真正能理解你意图的“智慧”时,那才是真香!最近,谷歌又丢出了一个重磅炸弹:ML Kit GenAI Prompt API Alpha版正式发布,直接把Android设备上的Gemini Nano模型给“深度解放”了!这可不是小打小闹,这意味着你的安卓手机,可能很快就会变成一个能听懂你“天马行空”指令的AI“私人订制”助理。
技术大揭秘:GenAI Prompt API,你的AI“私人订制”顾问上线!
各位“码农”朋友们,以及对AI有点好奇的小白们,先来扒一扒这GenAI Prompt API到底是个什么“神仙”?简单来说,它就像是给安卓手机的“AI大脑”——Gemini Nano,开了一扇全新的**“定制化”大门**。
以前,我们接触到的设备端GenAI API,就像是高级餐厅里预设好的“套餐”。比如你想让AI总结一段文字,或者描述一张图片,它能给你标准答案。但如果你想来点“非主流”的,比如让AI给你描述一张图片,并且要求它“只能用三个字,风格要像周杰伦歌词”,那以前的API就得挠头了,因为它内置的提示词是固定的,给你啥就是啥,没得商量。
“就像是点外卖,以前你只能选‘原味鸡腿堡’,现在Prompt API让你直接能和厨师说‘鸡腿堡加双层芝士,不要酸黄瓜,再多加点神秘酱汁’!”
而现在,Prompt API彻底改变了这种“套餐模式”。它是一个更“底层”的接口,虽然需要开发者“多费点心”去集成,但回报是前所未有的灵活性。它不仅能接受纯文本输入,还能处理图像与文本的组合拳,然后输出文本响应。谷歌官方都拍着胸脯表示,这货支持各种移动场景,从“短平快”的翻译、图像分类,到“秀操作”的内容生成,简直是“多模态AI的狂欢”。1
最骚的是,它直接把**提示词工程(Prompt Engineering)**这个高级玩法搬到了设备端!想想看,以前你得在云端跟大模型“斗智斗勇”,现在你的手机就能自己“开小灶”。比如下面这段代码,开发者可以明确告诉模型:
Generation.getClient().generateContent(
generateContentRequest(
ImagePart(bitmapImage),
TextPart("Categorize this image as one of the following: car, motorcycle, bike, scooter, other. Return only the category as the response."),
) {
// Optional parameters
temperature = 0.2f
topK = 10
candidateCount = 1
maxOutputTokens = 10
},
)
这段代码的意思是:“看这张图,然后告诉我它是汽车、摩托车、自行车、滑板车还是其他,只返回分类名称。” 这不就是把复杂的图像识别和分类,变成了简单的自然语言对话吗?简直是开发者们的“超能力”升级!而且,它在本地处理数据,离线也能跑,隐私保护直接拉满,数据不用“跑长途”去云端,用户心里都踏实多了。2
不只是“秀肌肉”:这波落地,打工人都直呼“真香”?
别以为这又是什么谷歌的“PPT功能”!Prompt API可不是来“打酱油”的,它已经有“干饭人”在用了。韩国的出行巨头Kakao Mobility就是首批吃螃蟹的。他们用Prompt API玩出了什么花样?
想象一下这个场景:你骑着共享单车,结果随手一停,不知道是不是违停了。以前你可能得找半天规定,现在,Kakao Mobility的用户只需要拍张照,加上自定义提示词,比如“这张自行车停放合规吗?”,AI就能瞬间给你答案,帮你避免罚单!2 还有,它还能优化应用内的地址输入体验。这种**“拍照+提问”的交互方式**,简直是懒人福音,也是智能生活的典范。
JobNimbus的首席AI官Tyler Folkman对此评论说,Kakao的实测结果“表明这不仅是一项AI演示功能”。他强调,Prompt API在“隐私不可妥协且硬件可控的受控环境中”具有巨大的前景。2 这话啥意思?就是说,在那些对数据安全和隐私要求极高的场景下,这种设备端AI的“私人订制”能力,简直是杀手锏般的存在。
当然,新事物总有成长的烦恼。目前Prompt API在运行最新Nano-v3的Pixel 10系列设备上表现最佳,其他Pixel 9、三星Galaxy Z Fold7、小米15等虽然也能跑,但只能用能力稍弱的Nano-v2模型。2 Tyler Folkman也指出,它还有一些小“限制”,比如对电池配额的强制要求,以及不支持后台运行。嗯,看来“内卷”的路上,优化空间还是有的。
告别“傻瓜式”AI:开发者,你的“超能力”来了!
GenAI Prompt API的发布,绝不仅仅是多了一个API那么简单。它传递了一个明确的信号:设备端AI正从“预设功能”走向“深度定制”。这对于开发者来说,无疑是开辟了一片全新的蓝海。
- 告别“千篇一律”:开发者不再受限于谷歌提供的几个固定AI功能,而是能根据自己应用的具体需求,用自然语言“搓”出各种稀奇古怪、独一无二的AI能力。
- 解锁“想象力”:无论是复杂的逻辑转换,还是天马行空的创意实现,只要你能用提示词描述出来,Gemini Nano就有可能在你的手机里把它变成现实。这无疑会催生一大批前所未有的创新应用,让我们的手机变得更智能、更懂我们。
- 隐私与效率“我都要”:本地处理数据,无需上传云端,这在数据隐私日益受重视的今天,无疑是一大卖点。同时,离线也能工作,进一步提升了用户体验。
总而言之,GenAI Prompt API就像是给安卓开发者递上了一把**“万能钥匙”。它让每个人都能成为自己应用AI体验的“设计师”,告别了过去“只能按按钮”的傻瓜式操作。从现在起,安卓生态的AI创新,或许会进入一个“私人定制”**的爆发期!各位“弄潮儿”们,准备好迎接手机AI的“大变身”了吗?
引用
-
使用GenAI 提示API 向Gemini Nano 发送自定义请求 | ML Kit·Google Developers·2025/11/10·检索日期2025/11/10 ↩︎
-
Android GenAI Prompt API Enables Natural Language Requests with Gemini Nano·InfoQ·2025/11/10·检索日期2025/11/10 ↩︎ ↩︎ ↩︎ ↩︎