Android Gemini Nano 与端侧 AI：AICore、ML Kit GenAI、LLM 推理与多模态 | Kai | Android Framework、性能优化与工程化深度解析

Android AI 的工程关注点正在从“什么是 Gemini Nano”转向“怎样在 App 里落地端侧生成式 AI”。这个页面围绕 Gemini Nano、AICore、ML Kit GenAI APIs、Android on-device AI、端侧 LLM 和多模态推理相关问题整理阅读路径。

先判断是否适合端侧 AI

端侧 AI 适合低延迟、弱网/离线、隐私敏感、推理成本可控的场景，例如摘要、改写、图片描述、语音识别、智能输入、本地内容检索和小型 RAG。它不适合把所有云端大模型能力硬搬到手机上，尤其是长上下文、复杂推理和大规模知识检索。

技术入口

AICore：系统级服务，负责模型访问、更新、安全和硬件加速。
Gemini Nano：面向端侧任务的 Gemini 模型族，适合低延迟和隐私优先的体验。
ML Kit GenAI APIs：更高层的能力入口，屏蔽部分模型版本差异。
AI Edge / LiteRT / MediaPipe LLM：适合更自定义的端侧模型推理链路。
Compose UI：处理流式输出、多轮对话、多模态输入和状态反馈。

Android Gemini Nano 与端侧 AI

先判断是否适合端侧 AI

技术入口

核心阅读

性能与生产化

官方参考

相关专题