Android 端侧 AI 专题

这个专题关注 AI 能力如何真正落到 Android 设备上:模型如何加载、推理如何调度、功耗和内存如何控制、端云如何协同,以及 Compose UI 如何承接流式输出和多模态交互。

它和 AI 开发工具 的区别是:AI 开发工具关注研发流程提效,端侧 AI 关注 Android 应用里的 AI 推理、系统能力和工程落地。

学习路径

  1. 先理解 Android AI 生态入口:AICore、Gemini Nano、ML Kit、NNAPI。
  2. 再看推理性能:Benchmark、NPU 调度、内存带宽、功耗热管理。
  3. 接着处理 LLM 工程:Prompt、上下文窗口、流式输出、RAG。
  4. 最后补齐生产化能力:模型下发、并发调度、动态降级、模型安全和多模态交互。

平台与能力入口

推理性能与系统资源

LLM、RAG 与交互架构

生产化治理

下一步

端侧 AI 的瓶颈经常落在性能、Compose UI 和工程化治理上。建议继续阅读 Android 性能优化Jetpack Compose 深度解析移动端工程化