性能优化 相关文章

深入 Android 端侧 LLM 推理的流式输出全链路:从 Token 生成到 Compose UI 增量渲染的实时交互架构

本文深入剖析 Android 端侧 LLM 流式输出的完整链路,涵盖 KV Cache 内存优化、Flow 背压机制与 Compose 增量重组三大关键技术,给出从推理引擎到 UI 渲染的协同架构设计与实测数据。

深入 Android 端侧 AI 模型动态下发与版本管理全链路

从 APK 解耦模型,通过三层版本体系、BSDiff 增量更新和热回滚机制,实现端侧 AI 模型独立下发、分钟级迭代与稳定保障。

深入 Android 端侧 AI 推理的功耗与热管理全链路:从 SoC DVFS 调度到 Thermal Throttling 的性能稳定性工程实践

本文从端侧 LLM 持续推理的性能退化问题出发,剖析 GPU 功耗画像、DVFS 调度与 Thermal Throttling 机制,提出双层温控感知的负载调度方案,将长时间推理的 P99 延迟从 890ms 压至 380ms。

深入 Android 端侧 AI 推理的内存带宽优化:从 GPU 共享内存到 NPU 零拷贝的异构数据传输架构

端侧AI推理的性能瓶颈不在算力而在内存带宽。本文深入分析从Camera到GPU再到NPU的数据搬运开销,介绍AHardwareBuffer共享内存、ION buffer复用和NPU零拷贝三条优化路径,给出不同场景的选型建议。

Android 冷启动优化:Baseline 优化方案

Android 应用的首次启动时间对用户留存率至关重要。谷歌在 Google I/O 2022 上向开发者推荐了 Baseline Profiles 方案进行优化,该方案通用性极高,几乎所有 Android 应用都可以采用。

深入 Android 端侧 AI 推理性能剖析:用 Perfetto 追踪 NPU 调度与内存带宽瓶颈

基于 Perfetto 追踪端侧 AI 推理的 NPU 调度与内存带宽瓶颈,通过权重常驻、推理渲染隔离和算子融合将 token 生成速度从 18 提升至 35 token/s。

深入 Android 端侧 AI 图像预处理全链路:从 Bitmap 像素操作到 Tensor 输入的高性能数据管道

端侧 AI 推理中,数据预处理常占 30%-50% 耗时。本文梳理从 Bitmap 像素到 Tensor 输入的完整链路,涵盖内存模型、像素格式转换、Resize 策略、标准化及零拷贝优化,帮助开发者将预处理延迟压到毫秒级。

深入 Android 端云协同 AI 推理架构:从模型路由策略到离线降级的混合智能调度全链路

本文深入探讨Android端云协同AI推理架构设计,涵盖多维路由决策引擎、网络质量感知、三级离线降级策略及优先级请求调度等核心机制,为移动端AI工程化落地提供实践参考。

深入 Android 推送服务全链路:从 FCM 云端下发到厂商通道保活的消息可达性架构解析

深入分析 Android 推送服务的完整链路,涵盖 FCM 与国内厂商通道的保活机制、Doze 模式影响及消息分级触达策略,提供多通道适配的工程实践与避坑指南。

Android 屏幕录制深度解析:从 MediaProjection 权限模型到 MediaCodec 编码的完整链路

本文深入拆解 Android 屏幕录制的完整链路,涵盖 MediaProjection 权限模型、VirtualDisplay 虚拟屏幕机制、ImageReader 与 MediaCodec 两条消费路径的选型实践,以及 BufferQueue 跨进程传输底层原理,并给出了帧率骤降问题的定位思路。

深入 Android 字体渲染架构:从 Typeface 加载到 Skia 字形光栅化的全链路解析

本文深入剖析 Android 字体渲染全链路:从 Typeface 加载机制、Minikin 字体调度,到 Skia 字形光栅化与缓存策略,并结合实际性能数据给出可落地的优化方案。

深入 Android 共享元素转场动画全链路:从 View 系统的 ActivityOptions 到 Compose SharedTransitionScope 的声明式过渡架构

本文系统梳理 Android 共享元素转场动画的两套实现体系:View 体系的 ActivityOptions(Snapshot → GhostView → RenderThread 动画)和 Compose 的 SharedTransitionScope 声明式过渡,涵盖底层机制、常见踩坑与渐进迁移策略。

深入 Android Zygote 进程全链路解析:从 init fork 到应用孵化的进程创建架构

深入解析 Android Zygote 进程的启动链路、预加载机制与 fork 孵化原理,揭示 COW 机制如何将应用冷启动从秒级降至毫秒级。

深入 Android Vulkan 图形渲染全链路:从 OpenGL ES 迁移到 GPU 驱动调优的低开销渲染架构

本文系统梳理了 Android 端从 OpenGL ES 向 Vulkan 迁移的完整链路,涵盖命令缓冲多线程录制、Render Pass 带宽优化、描述符集与管线缓存等驱动调优实践,帧率提升达 35%。

深入 Android TTS 语音合成全链路:从 API 桥接到端侧声码器

剖析 Android TTS 全链路:从跨进程引擎绑定、合成回调机制,到端侧 HiFi-GAN 声码器部署与流式合成优化,涵盖首字延迟压降的工程实践。

从性能视角看HTTP协议的演进

HTTP(HyperText Transfer Protocol,超文本传输协议)是一种基于请求-响应模型的应用层协议,用于在 Web 浏览器与 Web 服务器之间传输超文本(如 HTML)。作为互联网的基础协议之一,它定义了客户端与服务器之间的通信规则,使用户能够访问和浏览网页、图片、视频等各类网络资源。

深入 Android Sensor 框架全链路:从 SensorManager API 到 Sensor HAL

从SensorManager API到Sensor HAL,深入解析Android传感器框架全链路,涵盖SensorService调度机制、BitTube数据通道、虚拟传感器融合算法、批处理策略与功耗优化,结合实战经验提供排查调优指导。

深入 Android Native 内存分析全链路:从 malloc_debug 到 heapprofd 的 Native 堆内存泄漏排查实战

本文系统讲解 Android Native 层内存泄漏的排查方法论,从轻量级 malloc_debug 快速锁定泄漏模块,到 Perfetto heapprofd 的火焰图与采样机制定位具体代码行,并给出完整实战流程与工具对比。

深入 Android NNAPI 全链路:从 HAL 硬件抽象到 Qualcomm/MTK NPU 厂商驱动的端侧 AI 推理加速架构

深入剖析 Android NNAPI 的全链路架构,从 HAL 硬件抽象层到 QNN/Neuron 厂商驱动,结合图分区、算子回退与真实踩坑经验,系统讲解端侧 AI 推理的加速原理、性能调优与选型决策。

深入 Android Dumpsys 调试全链路:从系统服务 dump() 内部机制到 adb shell 诊断工具的线上排障实战

深入分析 Android dumpsys 的跨进程通信机制、权限门控和缓冲区设计,结合实战脚本构建内存泄漏、ANR 现场保存和 Binder 风暴溯源等线上诊断工具链。