Android Gemini Nano 与端侧 AI

Android AI 的工程关注点正在从“什么是 Gemini Nano”转向“怎样在 App 里落地端侧生成式 AI”。这个页面围绕 Gemini Nano、AICore、ML Kit GenAI APIs、Android on-device AI、端侧 LLM 和多模态推理相关问题整理阅读路径。

先判断是否适合端侧 AI

端侧 AI 适合低延迟、弱网/离线、隐私敏感、推理成本可控的场景,例如摘要、改写、图片描述、语音识别、智能输入、本地内容检索和小型 RAG。它不适合把所有云端大模型能力硬搬到手机上,尤其是长上下文、复杂推理和大规模知识检索。

技术入口

  1. AICore:系统级服务,负责模型访问、更新、安全和硬件加速。
  2. Gemini Nano:面向端侧任务的 Gemini 模型族,适合低延迟和隐私优先的体验。
  3. ML Kit GenAI APIs:更高层的能力入口,屏蔽部分模型版本差异。
  4. AI Edge / LiteRT / MediaPipe LLM:适合更自定义的端侧模型推理链路。
  5. Compose UI:处理流式输出、多轮对话、多模态输入和状态反馈。

核心阅读

性能与生产化

官方参考

相关专题