功耗管理 相关文章

深入 Android 端侧 AI 推理的功耗与热管理全链路:从 SoC DVFS 调度到 Thermal Throttling 的性能稳定性工程实践

本文从端侧 LLM 持续推理的性能退化问题出发,剖析 GPU 功耗画像、DVFS 调度与 Thermal Throttling 机制,提出双层温控感知的负载调度方案,将长时间推理的 P99 延迟从 890ms 压至 380ms。