tensorflow 李沐 tensorflow lite教程

转载

mob64ca141139a2 2024-04-17 14:11:39

文章标签 tensorflow 李沐数据机器学习嵌入式 文章分类 机器学习人工智能

【导读】TensorFlow Lite是可帮助开发人员在移动端（mobile）、嵌入式（embeded）和物联网（IoT）设备上运行TensorFlow机器学习模型的一组工具。它使设备机器学习具有低延迟和更小的二进制体积。本文是TensorFlow Lite入门指导。

tensorflow 李沐 tensorflow lite教程_嵌入式

TensorFlow Lite

TensorFlow Lite由两个主要组件组成：

interpreter（解释器）：可在许多不同的硬件类型（包括手机，嵌入式Linux设备和微控制器）上运行经过特别优化的模型。
converter（转换器）：将TensorFlow模型转换为供解释器使用的有效形式，并且可以引入优化以改善二进制大小和性能。

下图显示了 TensorFlow Lite 的架构设计：

tensorflow 李沐 tensorflow lite教程_数据_02

在设备端使用模型的过程：

训练并保存模型（开发机器）
转换模型（开发机器）
将转换后的模型复制到设备上
使用TF Lite解释器运行推理

tensorflow 李沐 tensorflow lite教程_嵌入式_03

converter与量化

converter使用TF模型生成FlatBuffer文件（.tflite），然后将FlatBuffer文件部署到客户端设备（例如移动设备，嵌入式设备）并使用TensorFlow Lite解释器在本地运行。下图显示了此转换过程：

tensorflow 李沐 tensorflow lite教程_tensorflow 李沐_04

converter代码实现如下：

tensorflow 李沐 tensorflow lite教程_机器学习_05

为什么要使用FlatBuffer？主要原因有：

无需解析/拆包即可访问序列化数据
内存效率和速度-访问数据所需的唯一内存是缓冲区的内存
没有依赖项的跨平台代码

使用converter转换模型的主要原因：

使模型更小（内存占用更小）

提高推理效率

需要较少的内存访问

推理中使用更少的能量

注：推理（Inference）是通过模型（model）运行数据（data）以获得预测（predictions）的过程。这个过程需要模型（model）、解释器（interpreter）和输入数据（input data）。

为了实现这些目标，主要组成部分是所谓的量化（Quantization）如下图：

tensorflow 李沐 tensorflow lite教程_嵌入式_06

tensorflow 李沐 tensorflow lite教程_tensorflow 李沐_07

参考网址：

https://sahnimanas.github.io/post/quantization-in-tflite/#deep_compression

Quantization有两种量化方式：

Post-training quantization
更容易实现，在大多数情况下非常高效
Training-aware quantization
更复杂，需要重写计算图

量化公式：

tensorflow 李沐 tensorflow lite教程_机器学习_08

r是真实值（通常是float32）

q是B位整数（uint8，uint32等）量化表示

S（floating）和z（integer）是我们缩放的因子

更多内容请参考原始PPT。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：jenkins pipline go企业微信群告警企业微信外部群禁言

下一篇：数据库建立三张表索引 sql数据库3个表怎么关联

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

tensorflow 李沐 tensorflow lite教程

tensorflow 李沐 tensorflow lite教程

51CTO博客