AI推理 相关文章

深入 Android 端侧 AI 推理 Benchmark 评测体系:从延迟/吞吐/功耗三维度量到热影响下的性能退化分析

本文介绍 Android 端侧 AI 推理的 Benchmark 评测体系,从延迟、吞吐、功耗三维度出发,深入分析热影响下的性能退化问题,并提供自动化评测框架。

深入 Android 端云协同 AI 推理架构:从模型路由策略到离线降级的混合智能调度全链路

本文深入探讨Android端云协同AI推理架构设计,涵盖多维路由决策引擎、网络质量感知、三级离线降级策略及优先级请求调度等核心机制,为移动端AI工程化落地提供实践参考。