性能优化 相关文章

深入 Android ConnectivityManager 全链路:从 NetworkCallback 实时监听到网络切换自适应架构

从 NetworkInfo 缺陷到 NetworkCapabilities 能力模型,解析 ConnectivityManager 实时网络监控与自适应切换架构。

深入 Android Compose LazyColumn 滑动性能调优全链路

从 LazyColumn 重组模型与 RecyclerView 的差异出发,系统梳理状态上提、Lambda 引用不稳定、图片加载扩散等高频性能陷阱,并结合 Compose Compiler Metrics 诊断与 Baseline Profile 兜底,提供一套可落地的滑动性能优化方案。

深入 Android ART dex2oat 编译管线:从 DEX 字节码到 OAT 机器码的 AOT/JIT 混合编译

系统梳理 dex2oat 编译管线的完整流程,解析 Compiler Filter 各档位取舍、JIT 与 AOT 的协同机制,以及如何用 Baseline Profile 精准引导编译来压缩 App 冷启动耗时。

Android 端侧 AI 聊天的 Compose UI 架构:流式渲染与多轮对话的声明式工程实践

本文分享端侧 LLM 聊天应用中 Compose UI 的流式渲染实践,通过 Token 缓冲、状态隔离和统一数据源等策略,在高频流式输出下保持流畅体验。

深入 Kotlin inline class/value class 全链路:从编译期消除装箱到类型安全的零开销抽象

深入 Kotlin inline class 编译期装箱消除与字节码实现,涵盖类型安全零开销抽象、Android 高频场景实战与序列化兼容指南。

深入 KSP 全链路:从注解扫描到代码生成的编译期元编程

深入解析 KSP 替代 KAPT 的技术原理,从 SymbolProcessor、Resolver 到 CodeGenerator,揭示其跳过 Java Stub、原生理解 Kotlin AST 带来的编译性能飞跃(55 秒→9 秒),并给出完整的迁移实践指南。

深入 Jetpack Compose Phases 三阶段模型:从 Composition 到 Drawing 的声明式像素生产全链路

深入解析 Jetpack Compose 三阶段(Composition、Layout、Drawing)管线的工作原理,从状态读取的边界效应到阶段跳过机制,帮助开发者写出高性能声明式 UI。

深入 Android 跨进程大数据传输全链路:从 Binder 1MB 限制到 ASharedMemory 零拷贝的进程间数据通道设计

深入分析 Android Binder 1MB 限制的技术根源,对比 MemoryFile、ASharedMemory 零拷贝、Surface 图形流及 ContentProvider 四种跨进程大数据传输方案,结合 Camera 帧传输实战给出工程选型决策指南。

深入 Android 自定义输入法全链路:从 InputMethodService 进程架构到候选词引擎的 IME 工程实践

剖析 Android 自定义输入法的工程全链路,涵盖独立进程架构、InputConnection 双向通信协议、候选词引擎延迟优化与键盘 UI 渲染等核心实践。

深入 Android 缓存系统全链路:从 LruCache 到 DiskLruCache 的三级缓存架构与离线优先工程实践

深入剖析 Android LruCache 与 DiskLruCache 的内部机制,详解三级缓存架构的联动设计、一致性问题及离线优先工程实践。

深入 Android 线上稳定性监控体系全链路:从异常采集 SDK 设计到 APM 性能看板的工程质量保障实践

本文详细剖析了 Android 线上稳定性监控体系的全链路设计,涵盖 Java/Native 异常采集 SDK、ANR 双通道检测、三级缓冲上报架构以及基于堆栈指纹的异常聚类与 APM 看板建设,分享了生产环境中踩过的文件权限、多进程冲突等关键实践坑。

深入 Android 端侧语音识别全链路:从 SpeechRecognizer API 到 Android 16 设备端 ASR 引擎

梳理 Android 端侧语音识别完整链路,从 AudioRecord 音频采集到 Android 16 内置 ASR 引擎的架构设计与工程实践。

深入 Android 端侧 LLM 的上下文窗口工程:从 Prompt 压缩到对话状态机的全链路实践

本文系统梳理了 Android 端侧大模型长对话上下文管理的完整方案,涵盖分层 Prompt 压缩、摘要缓存、对话状态机及 token 预算分配等工程实践,有效突破端侧 4K 窗口限制。

深入 Android 端侧 LLM 推理的流式输出全链路:从 Token 生成到 Compose UI 增量渲染的实时交互架构

本文深入剖析 Android 端侧 LLM 流式输出的完整链路,涵盖 KV Cache 内存优化、Flow 背压机制与 Compose 增量重组三大关键技术,给出从推理引擎到 UI 渲染的协同架构设计与实测数据。

深入 Android 端侧 AI 模型动态下发与版本管理全链路

从 APK 解耦模型,通过三层版本体系、BSDiff 增量更新和热回滚机制,实现端侧 AI 模型独立下发、分钟级迭代与稳定保障。

深入 Android 端侧 AI 推理的功耗与热管理全链路:从 SoC DVFS 调度到 Thermal Throttling 的性能稳定性工程实践

本文从端侧 LLM 持续推理的性能退化问题出发,剖析 GPU 功耗画像、DVFS 调度与 Thermal Throttling 机制,提出双层温控感知的负载调度方案,将长时间推理的 P99 延迟从 890ms 压至 380ms。

深入 Android 端侧 AI 推理的内存带宽优化:从 GPU 共享内存到 NPU 零拷贝的异构数据传输架构

端侧AI推理的性能瓶颈不在算力而在内存带宽。本文深入分析从Camera到GPU再到NPU的数据搬运开销,介绍AHardwareBuffer共享内存、ION buffer复用和NPU零拷贝三条优化路径,给出不同场景的选型建议。

Android 冷启动优化:Baseline 优化方案

Android 应用的首次启动时间对用户留存率至关重要。谷歌在 Google I/O 2022 上向开发者推荐了 Baseline Profiles 方案进行优化,该方案通用性极高,几乎所有 Android 应用都可以采用。

深入 Android 端侧 AI 推理性能剖析:用 Perfetto 追踪 NPU 调度与内存带宽瓶颈

基于 Perfetto 追踪端侧 AI 推理的 NPU 调度与内存带宽瓶颈,通过权重常驻、推理渲染隔离和算子融合将 token 生成速度从 18 提升至 35 token/s。

深入 Android 端侧 AI 图像预处理全链路:从 Bitmap 像素操作到 Tensor 输入的高性能数据管道

端侧 AI 推理中,数据预处理常占 30%-50% 耗时。本文梳理从 Bitmap 像素到 Tensor 输入的完整链路,涵盖内存模型、像素格式转换、Resize 策略、标准化及零拷贝优化,帮助开发者将预处理延迟压到毫秒级。