性能优化相关文章

深入 Android ConnectivityManager 全链路：从 NetworkCallback 实时监听到网络切换自适应架构

深入 Android Compose LazyColumn 滑动性能调优全链路

February 26, 2026

从 LazyColumn 重组模型与 RecyclerView 的差异出发，系统梳理状态上提、Lambda 引用不稳定、图片加载扩散等高频性能陷阱，并结合 Compose Compiler Metrics 诊断与 Baseline Profile 兜底，提供一套可落地的滑动性能优化方案。

Read Post

深入 Android ART dex2oat 编译管线：从 DEX 字节码到 OAT 机器码的 AOT/JIT 混合编译

February 20, 2026

系统梳理 dex2oat 编译管线的完整流程，解析 Compiler Filter 各档位取舍、JIT 与 AOT 的协同机制，以及如何用 Baseline Profile 精准引导编译来压缩 App 冷启动耗时。

Read Post

Android 端侧 AI 聊天的 Compose UI 架构：流式渲染与多轮对话的声明式工程实践

February 10, 2026

本文分享端侧 LLM 聊天应用中 Compose UI 的流式渲染实践，通过 Token 缓冲、状态隔离和统一数据源等策略，在高频流式输出下保持流畅体验。

Read Post

深入 Kotlin inline class/value class 全链路：从编译期消除装箱到类型安全的零开销抽象

January 23, 2026

深入 Kotlin inline class 编译期装箱消除与字节码实现，涵盖类型安全零开销抽象、Android 高频场景实战与序列化兼容指南。

Read Post

深入 KSP 全链路：从注解扫描到代码生成的编译期元编程

January 22, 2026

深入解析 KSP 替代 KAPT 的技术原理，从 SymbolProcessor、Resolver 到 CodeGenerator，揭示其跳过 Java Stub、原生理解 Kotlin AST 带来的编译性能飞跃（55 秒→9 秒），并给出完整的迁移实践指南。

Read Post

深入 Jetpack Compose Phases 三阶段模型：从 Composition 到 Drawing 的声明式像素生产全链路

January 15, 2026

深入解析 Jetpack Compose 三阶段（Composition、Layout、Drawing）管线的工作原理，从状态读取的边界效应到阶段跳过机制，帮助开发者写出高性能声明式 UI。

Read Post

深入 Android 跨进程大数据传输全链路：从 Binder 1MB 限制到 ASharedMemory 零拷贝的进程间数据通道设计

January 9, 2026

深入分析 Android Binder 1MB 限制的技术根源，对比 MemoryFile、ASharedMemory 零拷贝、Surface 图形流及 ContentProvider 四种跨进程大数据传输方案，结合 Camera 帧传输实战给出工程选型决策指南。

Read Post

深入 Android 自定义输入法全链路：从 InputMethodService 进程架构到候选词引擎的 IME 工程实践

December 29, 2025

剖析 Android 自定义输入法的工程全链路，涵盖独立进程架构、InputConnection 双向通信协议、候选词引擎延迟优化与键盘 UI 渲染等核心实践。

Read Post

深入 Android 缓存系统全链路：从 LruCache 到 DiskLruCache 的三级缓存架构与离线优先工程实践

December 25, 2025

深入剖析 Android LruCache 与 DiskLruCache 的内部机制，详解三级缓存架构的联动设计、一致性问题及离线优先工程实践。

Read Post

深入 Android 线上稳定性监控体系全链路：从异常采集 SDK 设计到 APM 性能看板的工程质量保障实践

December 23, 2025

本文详细剖析了 Android 线上稳定性监控体系的全链路设计，涵盖 Java/Native 异常采集 SDK、ANR 双通道检测、三级缓冲上报架构以及基于堆栈指纹的异常聚类与 APM 看板建设，分享了生产环境中踩过的文件权限、多进程冲突等关键实践坑。

Read Post

深入 Android 端侧语音识别全链路：从 SpeechRecognizer API 到 Android 16 设备端 ASR 引擎

December 19, 2025

梳理 Android 端侧语音识别完整链路，从 AudioRecord 音频采集到 Android 16 内置 ASR 引擎的架构设计与工程实践。

Read Post

深入 Android 端侧 LLM 的上下文窗口工程：从 Prompt 压缩到对话状态机的全链路实践

December 17, 2025

本文系统梳理了 Android 端侧大模型长对话上下文管理的完整方案，涵盖分层 Prompt 压缩、摘要缓存、对话状态机及 token 预算分配等工程实践，有效突破端侧 4K 窗口限制。

Read Post

深入 Android 端侧 LLM 推理的流式输出全链路：从 Token 生成到 Compose UI 增量渲染的实时交互架构

December 16, 2025

本文深入剖析 Android 端侧 LLM 流式输出的完整链路，涵盖 KV Cache 内存优化、Flow 背压机制与 Compose 增量重组三大关键技术，给出从推理引擎到 UI 渲染的协同架构设计与实测数据。

Read Post

深入 Android 端侧 AI 模型动态下发与版本管理全链路

December 8, 2025

从 APK 解耦模型，通过三层版本体系、BSDiff 增量更新和热回滚机制，实现端侧 AI 模型独立下发、分钟级迭代与稳定保障。

Read Post

深入 Android 端侧 AI 推理的功耗与热管理全链路：从 SoC DVFS 调度到 Thermal Throttling 的性能稳定性工程实践

November 21, 2025

本文从端侧 LLM 持续推理的性能退化问题出发，剖析 GPU 功耗画像、DVFS 调度与 Thermal Throttling 机制，提出双层温控感知的负载调度方案，将长时间推理的 P99 延迟从 890ms 压至 380ms。

Read Post

深入 Android 端侧 AI 推理的内存带宽优化：从 GPU 共享内存到 NPU 零拷贝的异构数据传输架构

November 20, 2025

端侧AI推理的性能瓶颈不在算力而在内存带宽。本文深入分析从Camera到GPU再到NPU的数据搬运开销，介绍AHardwareBuffer共享内存、ION buffer复用和NPU零拷贝三条优化路径，给出不同场景的选型建议。

Read Post

Android 冷启动优化：Baseline 优化方案

November 18, 2025

Android 应用的首次启动时间对用户留存率至关重要。谷歌在 Google I/O 2022 上向开发者推荐了 Baseline Profiles 方案进行优化，该方案通用性极高，几乎所有 Android 应用都可以采用。

Read Post

深入 Android 端侧 AI 推理性能剖析：用 Perfetto 追踪 NPU 调度与内存带宽瓶颈

November 17, 2025

基于 Perfetto 追踪端侧 AI 推理的 NPU 调度与内存带宽瓶颈，通过权重常驻、推理渲染隔离和算子融合将 token 生成速度从 18 提升至 35 token/s。

Read Post

深入 Android 端侧 AI 图像预处理全链路：从 Bitmap 像素操作到 Tensor 输入的高性能数据管道

November 14, 2025

端侧 AI 推理中，数据预处理常占 30%-50% 耗时。本文梳理从 Bitmap 像素到 Tensor 输入的完整链路，涵盖内存模型、像素格式转换、Resize 策略、标准化及零拷贝优化，帮助开发者将预处理延迟压到毫秒级。

Read Post

性能优化 相关文章

深入 Android ConnectivityManager 全链路：从 NetworkCallback 实时监听到网络切换自适应架构

深入 Android Compose LazyColumn 滑动性能调优全链路

深入 Android ART dex2oat 编译管线：从 DEX 字节码到 OAT 机器码的 AOT/JIT 混合编译

Android 端侧 AI 聊天的 Compose UI 架构：流式渲染与多轮对话的声明式工程实践

深入 Kotlin inline class/value class 全链路：从编译期消除装箱到类型安全的零开销抽象

深入 KSP 全链路：从注解扫描到代码生成的编译期元编程

深入 Jetpack Compose Phases 三阶段模型：从 Composition 到 Drawing 的声明式像素生产全链路

深入 Android 跨进程大数据传输全链路：从 Binder 1MB 限制到 ASharedMemory 零拷贝的进程间数据通道设计

深入 Android 自定义输入法全链路：从 InputMethodService 进程架构到候选词引擎的 IME 工程实践

深入 Android 缓存系统全链路：从 LruCache 到 DiskLruCache 的三级缓存架构与离线优先工程实践

深入 Android 线上稳定性监控体系全链路：从异常采集 SDK 设计到 APM 性能看板的工程质量保障实践

深入 Android 端侧语音识别全链路：从 SpeechRecognizer API 到 Android 16 设备端 ASR 引擎

深入 Android 端侧 LLM 的上下文窗口工程：从 Prompt 压缩到对话状态机的全链路实践

深入 Android 端侧 LLM 推理的流式输出全链路：从 Token 生成到 Compose UI 增量渲染的实时交互架构

深入 Android 端侧 AI 模型动态下发与版本管理全链路

深入 Android 端侧 AI 推理的功耗与热管理全链路：从 SoC DVFS 调度到 Thermal Throttling 的性能稳定性工程实践

深入 Android 端侧 AI 推理的内存带宽优化：从 GPU 共享内存到 NPU 零拷贝的异构数据传输架构

Android 冷启动优化：Baseline 优化方案

深入 Android 端侧 AI 推理性能剖析：用 Perfetto 追踪 NPU 调度与内存带宽瓶颈

深入 Android 端侧 AI 图像预处理全链路：从 Bitmap 像素操作到 Tensor 输入的高性能数据管道

性能优化相关文章