上下文管理 相关文章

深入 Android 端侧 LLM 的上下文窗口工程:从 Prompt 压缩到对话状态机的全链路实践

本文系统梳理了 Android 端侧大模型长对话上下文管理的完整方案,涵盖分层 Prompt 压缩、摘要缓存、对话状态机及 token 预算分配等工程实践,有效突破端侧 4K 窗口限制。