性能优化相关文章

深入 Android 端侧 LLM 推理的流式输出全链路：从 Token 生成到 Compose UI 增量渲染的实时交互架构

深入 Android 端侧 AI 模型动态下发与版本管理全链路

December 8, 2025

从 APK 解耦模型，通过三层版本体系、BSDiff 增量更新和热回滚机制，实现端侧 AI 模型独立下发、分钟级迭代与稳定保障。

Read Post

深入 Android 端侧 AI 推理的功耗与热管理全链路：从 SoC DVFS 调度到 Thermal Throttling 的性能稳定性工程实践

November 21, 2025

本文从端侧 LLM 持续推理的性能退化问题出发，剖析 GPU 功耗画像、DVFS 调度与 Thermal Throttling 机制，提出双层温控感知的负载调度方案，将长时间推理的 P99 延迟从 890ms 压至 380ms。

Read Post

深入 Android 端侧 AI 推理的内存带宽优化：从 GPU 共享内存到 NPU 零拷贝的异构数据传输架构

November 20, 2025

端侧AI推理的性能瓶颈不在算力而在内存带宽。本文深入分析从Camera到GPU再到NPU的数据搬运开销，介绍AHardwareBuffer共享内存、ION buffer复用和NPU零拷贝三条优化路径，给出不同场景的选型建议。

Read Post

Android 冷启动优化：Baseline 优化方案

November 18, 2025

Android 应用的首次启动时间对用户留存率至关重要。谷歌在 Google I/O 2022 上向开发者推荐了 Baseline Profiles 方案进行优化，该方案通用性极高，几乎所有 Android 应用都可以采用。

Read Post

深入 Android 端侧 AI 推理性能剖析：用 Perfetto 追踪 NPU 调度与内存带宽瓶颈

November 17, 2025

基于 Perfetto 追踪端侧 AI 推理的 NPU 调度与内存带宽瓶颈，通过权重常驻、推理渲染隔离和算子融合将 token 生成速度从 18 提升至 35 token/s。

Read Post

深入 Android 端侧 AI 图像预处理全链路：从 Bitmap 像素操作到 Tensor 输入的高性能数据管道

November 14, 2025

端侧 AI 推理中，数据预处理常占 30%-50% 耗时。本文梳理从 Bitmap 像素到 Tensor 输入的完整链路，涵盖内存模型、像素格式转换、Resize 策略、标准化及零拷贝优化，帮助开发者将预处理延迟压到毫秒级。

Read Post

深入 Android 端云协同 AI 推理架构：从模型路由策略到离线降级的混合智能调度全链路

November 13, 2025

本文深入探讨Android端云协同AI推理架构设计，涵盖多维路由决策引擎、网络质量感知、三级离线降级策略及优先级请求调度等核心机制，为移动端AI工程化落地提供实践参考。

Read Post

深入 Android 推送服务全链路：从 FCM 云端下发到厂商通道保活的消息可达性架构解析

October 27, 2025

深入分析 Android 推送服务的完整链路，涵盖 FCM 与国内厂商通道的保活机制、Doze 模式影响及消息分级触达策略，提供多通道适配的工程实践与避坑指南。

Read Post

Android 屏幕录制深度解析：从 MediaProjection 权限模型到 MediaCodec 编码的完整链路

October 20, 2025

本文深入拆解 Android 屏幕录制的完整链路，涵盖 MediaProjection 权限模型、VirtualDisplay 虚拟屏幕机制、ImageReader 与 MediaCodec 两条消费路径的选型实践，以及 BufferQueue 跨进程传输底层原理，并给出了帧率骤降问题的定位思路。

Read Post

深入 Android 字体渲染架构：从 Typeface 加载到 Skia 字形光栅化的全链路解析

October 15, 2025

本文深入剖析 Android 字体渲染全链路：从 Typeface 加载机制、Minikin 字体调度，到 Skia 字形光栅化与缓存策略，并结合实际性能数据给出可落地的优化方案。

Read Post

深入 Android 共享元素转场动画全链路：从 View 系统的 ActivityOptions 到 Compose SharedTransitionScope 的声明式过渡架构

October 7, 2025

本文系统梳理 Android 共享元素转场动画的两套实现体系：View 体系的 ActivityOptions（Snapshot → GhostView → RenderThread 动画）和 Compose 的 SharedTransitionScope 声明式过渡，涵盖底层机制、常见踩坑与渐进迁移策略。

Read Post

深入 Android Zygote 进程全链路解析：从 init fork 到应用孵化的进程创建架构

October 3, 2025

深入解析 Android Zygote 进程的启动链路、预加载机制与 fork 孵化原理，揭示 COW 机制如何将应用冷启动从秒级降至毫秒级。

Read Post

深入 Android Vulkan 图形渲染全链路：从 OpenGL ES 迁移到 GPU 驱动调优的低开销渲染架构

September 26, 2025

本文系统梳理了 Android 端从 OpenGL ES 向 Vulkan 迁移的完整链路，涵盖命令缓冲多线程录制、Render Pass 带宽优化、描述符集与管线缓存等驱动调优实践，帧率提升达 35%。

Read Post

深入 Android TTS 语音合成全链路：从 API 桥接到端侧声码器

September 23, 2025

剖析 Android TTS 全链路：从跨进程引擎绑定、合成回调机制，到端侧 HiFi-GAN 声码器部署与流式合成优化，涵盖首字延迟压降的工程实践。

Read Post

从性能视角看HTTP协议的演进

September 13, 2025

HTTP（HyperText Transfer Protocol，超文本传输协议）是一种基于请求-响应模型的应用层协议，用于在 Web 浏览器与 Web 服务器之间传输超文本（如 HTML）。作为互联网的基础协议之一，它定义了客户端与服务器之间的通信规则，使用户能够访问和浏览网页、图片、视频等各类网络资源。

Read Post

深入 Android Sensor 框架全链路：从 SensorManager API 到 Sensor HAL

September 12, 2025

从SensorManager API到Sensor HAL，深入解析Android传感器框架全链路，涵盖SensorService调度机制、BitTube数据通道、虚拟传感器融合算法、批处理策略与功耗优化，结合实战经验提供排查调优指导。

Read Post

深入 Android Native 内存分析全链路：从 malloc_debug 到 heapprofd 的 Native 堆内存泄漏排查实战

August 8, 2025

本文系统讲解 Android Native 层内存泄漏的排查方法论，从轻量级 malloc_debug 快速锁定泄漏模块，到 Perfetto heapprofd 的火焰图与采样机制定位具体代码行，并给出完整实战流程与工具对比。

Read Post

深入 Android NNAPI 全链路：从 HAL 硬件抽象到 Qualcomm/MTK NPU 厂商驱动的端侧 AI 推理加速架构

August 7, 2025

深入剖析 Android NNAPI 的全链路架构，从 HAL 硬件抽象层到 QNN/Neuron 厂商驱动，结合图分区、算子回退与真实踩坑经验，系统讲解端侧 AI 推理的加速原理、性能调优与选型决策。

Read Post

深入 Android Dumpsys 调试全链路：从系统服务 dump() 内部机制到 adb shell 诊断工具的线上排障实战

July 28, 2025

深入分析 Android dumpsys 的跨进程通信机制、权限门控和缓冲区设计，结合实战脚本构建内存泄漏、ANR 现场保存和 Binder 风暴溯源等线上诊断工具链。

Read Post

性能优化 相关文章

深入 Android 端侧 LLM 推理的流式输出全链路：从 Token 生成到 Compose UI 增量渲染的实时交互架构

深入 Android 端侧 AI 模型动态下发与版本管理全链路

深入 Android 端侧 AI 推理的功耗与热管理全链路：从 SoC DVFS 调度到 Thermal Throttling 的性能稳定性工程实践

深入 Android 端侧 AI 推理的内存带宽优化：从 GPU 共享内存到 NPU 零拷贝的异构数据传输架构

Android 冷启动优化：Baseline 优化方案

深入 Android 端侧 AI 推理性能剖析：用 Perfetto 追踪 NPU 调度与内存带宽瓶颈

深入 Android 端侧 AI 图像预处理全链路：从 Bitmap 像素操作到 Tensor 输入的高性能数据管道

深入 Android 端云协同 AI 推理架构：从模型路由策略到离线降级的混合智能调度全链路

深入 Android 推送服务全链路：从 FCM 云端下发到厂商通道保活的消息可达性架构解析

Android 屏幕录制深度解析：从 MediaProjection 权限模型到 MediaCodec 编码的完整链路

深入 Android 字体渲染架构：从 Typeface 加载到 Skia 字形光栅化的全链路解析

深入 Android 共享元素转场动画全链路：从 View 系统的 ActivityOptions 到 Compose SharedTransitionScope 的声明式过渡架构

深入 Android Zygote 进程全链路解析：从 init fork 到应用孵化的进程创建架构

深入 Android Vulkan 图形渲染全链路：从 OpenGL ES 迁移到 GPU 驱动调优的低开销渲染架构

深入 Android TTS 语音合成全链路：从 API 桥接到端侧声码器

从性能视角看HTTP协议的演进

深入 Android Sensor 框架全链路：从 SensorManager API 到 Sensor HAL

深入 Android Native 内存分析全链路：从 malloc_debug 到 heapprofd 的 Native 堆内存泄漏排查实战

深入 Android NNAPI 全链路：从 HAL 硬件抽象到 Qualcomm/MTK NPU 厂商驱动的端侧 AI 推理加速架构

深入 Android Dumpsys 调试全链路：从系统服务 dump() 内部机制到 adb shell 诊断工具的线上排障实战

性能优化相关文章