首页  >  文章  >  科技周边  >  新书推荐 | 嵌入式人工智能

新书推荐 | 嵌入式人工智能

王林
王林转载
2023-05-25 13:37:441332浏览

新书推荐 | 嵌入式人工智能

《嵌入式人工智能》

李斌 编著

ISBN:978-7-302-62796-8

定价:69.00元

扫码优惠购书

ChatGPT的问世为人类揭示了通用人工智能(AGI)的雏形。人们发现,当人工神经网络达到一定规模,再加上拟人的学习方法(如RLHF),奇迹就突然产生了,智能开始摆脱人脑的束缚,在计算机上实现了!

然而,仍然有一个挑战亟待解决:我们能否在体积、功耗都与人类相当的机器,如人形机器人上实现以上的奇迹呢?

目前,ChatGPT需要使用超过3万张GPU进行训练和推理,总功率超过1000万瓦特,每天的电费约为5万美元。而人脑的体积不过1.5升左右,功率不到20瓦。如果想要将通用人工智能嵌入到机器人,甚至是更小的无人机、手机、智能家电或物联网设备中时,我们将不得不克服以上的挑战。这就是《嵌入式人工智能》一书想要探讨的话题。

在嵌入式人工智能的领域,我们将用更高的能量效率执行更加精简的算法,并把它们放置在一个体积和重量都更小的机器之内,在真实世界中完成实时推理任务。一句话,我们要将人工智能以最精简的方式来实现!

为了克服这个挑战,需要从各个层面着手解决问题。总结起来,要实现嵌入式人工智能,需要5个方面的组件。

嵌入式AI芯片。它是具有更高能量效率的AI加速器。

轻量级AI算法。它具有更低的计算复杂度和更少的参数,但其准确率与大型AI算法相比毫不逊色。

模型压缩。它进一步裁剪轻量级AI算法中冗余的参数,用更精简的方式表达。

编译优化。它将模型翻译为更适合AI加速器指令的编码。

多层级联的应用程序框架。它在更合适的时机使用更合适的算法,从而降低整个系统的成本和能耗。

新书推荐 | 嵌入式人工智能

这5个组件组合运用起来,通用人工智能就有望真正嵌入到机器中,让它能看、能听、能说、能思考,真正的“活”起来,成为另外一种形态的生命——人工生命。

当然,要实现以上的梦想任重而道远。这本书只是一个入门指南,它探讨了问题并概括了当前解决这些问题的方法和工具。它不是最终的答案,但它提供了获取答案的钥匙。

如果您有志于在机器人、无人机、手机、智能家电、物联网设备上实现通用人工智能,它无疑是一本有益的入门书籍。

本书特色

1. 国内 第一部全面介绍嵌入式人工智能的著作。

2. 内容丰富详实,涵盖 嵌入式人工智能的原理、平台和实践

3. 对嵌入式人工智能的原理做出系统性归纳总结, 概念新颖,条理清晰

4. 全面介绍实现 嵌入式人工智能平台,包括主流的嵌入式神经网络芯片和软件框架。

5. 概括嵌入式人工智能的 开发流程

6. 原理与实践相结合, 结合代码展示嵌入式人工智能的实际应用案例

应用样例

书中最后一章,我们尝试基于无人机实现一种飞行太阳伞,这种伞可以实时跟踪人的运动,随时为人遮挡阳光的照射,从而解放人的双手,让你在炎炎夏日可以开心的逛街、玩耍,并成为人们关注的焦点。

为了让无人飞行伞实现人体跟踪,我们将采用机器视觉的方法。由飞行伞前部的摄像头拍摄人体,通过轻量级人体姿态估计算法计算人体轮廓,获取人的头部五官、肢体关节所在的位置,进而分析人体产生的动作,预测人将会向哪个方向前进、后退、转向或上下坡,从而让无人飞行伞跟踪这种运动,随时调整无人飞行伞的空间位置,实现对人体的跟随和遮阳效果。

考虑到重量、耗电等原因,必须采用专用的嵌入式AI芯片。在书中以英伟达Jetson为例进行了开发。现在,基于ARM的SoC等每瓦推理性能更强的芯片已经得到广泛应用,以应对技术高速发展带来的挑战。但书中介绍的流程和方法仍然是适用的。

为了让上面的轻量级算法在嵌入式AI芯片上达到实时推理的要求,还需采用模型压缩和优化技术,对模型进行剪枝、量化等操作,减小模型的参数,让推理性能成倍增长,功耗成倍降低,并为专用的嵌入式AI芯片推理而优化。书中以TensorRT为例做了说明,如果采用基于ARM的SoC,则可以采用Tensorflow Lite等压缩和优化技术。

最后,借助本书的知识,我们终于可以让无人太阳伞飞起来了!

新书推荐 | 嵌入式人工智能

目录

向上滑动阅览

第一部 原理

第1章 人工智能与人工神经网络

1.1 什么是人工智能

1.2 什么是人工神经网络

1.3 人类大脑

1.4 人工神经网络的基本构成

1.4.1 人工神经元

1.4.2 人工神经网络的结构

1.5 人工神经网络的学习机制

1.6 人工神经网络的类型

1.7 人工神经网络的优势

1.8 深度神经网络

1.8.1 什么是深度神经网络

18.2 常见的深度神经网络

1.8.3 卷积神经网络

1.9 神经网络架构搜索(NAS)

1.9.1 搜索空间

1.9.2 强化学习搜索

1.9.3 渐进式搜索

1.9.4 离散搜索

1.10 迁移学习

1.10.1 什么是迁移学习

1.10.2 迁移学习的类型

1.10.3 迁移学习的优势

1.10.4 迁移学习的方式

1.10.5 迁移学习与嵌入式人工智能

第2章 嵌入式人工智能

2.1 什么是嵌入式人工智能

2.2 为什么需要嵌入式人工智能

2.3 最初的尝试:云计算模式

2.4 从云端到设备:本地模式

2.5 嵌入式人工智能的技术挑战

2.5.1 模型规模

2.5.2 能量效率

2.5.3 内存访问

2.5.4 推理速度

2.5.5 尺寸和重量

2.6 嵌入式人工智能的实现途径

2.7 嵌入式人工智能的实现组件

第3章 嵌入式AI芯片原理

3.1 并行计算

3.2 脉动阵列

3.3 多级缓存

3.4 数据流

第4章 轻量级神经网络

4.1 降低计算复杂度

4.1.1 分组卷积

4.1.2 深度方向卷积

4.1.3 点向卷积

4.1.4 深度可分离卷积

4.1.5 通道乱序混合

4.2 SqueezeNet

4.2.1 核心思想

4.2.2 网络结构

4.2.3 性能

4.3 Xception

4.3.1 核心思想

4.3.2 网络结构

4.3.3 性能

4.4 MobileNet v1

4.4.1 核心思想

4.4.2 网络结构

4.4.3 性能

4.5 MobileNet v2

4.5.1 核心思想

4.5.2 网络结构

4.5.3 性能

4.6 MnasNet

4.6.1 核心思想

4.6.2 网络结构

4.6.3 性能

4.7 MobileNet v3

4.7.1 核心思想

4.7.2 网络结构

4.7.3 性能

4.6 轻量级神经网络的应用

第5章 深度神经网络压缩

5.1 神经网络压缩的一般方法

5.1.1 剪枝

5.1.2 权重共享

5.1.3 量化

5.1.4 二值/三值化

5.1.5 Winograd卷积

5.2 压缩-编译协同设计

5.2.1 压缩编译协同设计的概念

5.2.2 压缩器

5.2.5 编译器

5.2.6 压缩编译协同设计的优势

第6章 嵌入式神经网络应用程序框架

6.1 分层级联系统的构成

6.2 分层级联系统的效率

6.4 本地-云协同模式

第7章 终生深度学习

7.1 传统深度学习的缺陷及原因

7.2 终生深度学习的目标

7.3 终生深度学习的特性

7.4 神经生物学的启示

7.5 终生深度神经网络的实现

7.5.1 双重学习系统

7.5.2 实时更新

7.5.3 记忆合并

7.5.4 适应真实场景

7.6 终生深度学习与嵌入式人工智能

第二部 平台

第8章 嵌入式神经网络硬件加速器

8.1 概述

8.2 NVIDIA Jetson

8.2.1 Jetson模块简介

8.2.1 Jetson模块内部结构

8.2.3 Jetson性能

8.3 Intel Movidius

8.3.1 Movidius Myriad X VPU芯片

8.3.2 Intel神经计算棒

8.4 Google Edge TPU

8.4.1 Google Edge TPU简介

8.4.2 Google Edge TPU工作原理

8.5 XILINX DPU

8.6 ARM Ethos NPU

8.6.1 ARM机器学习处理器

8.6.2 Ethos-N系列

8.6.3 Ethos-U系列

小结

第9章 嵌入式神经网络软件框架

9.1 Tensorflow Lite

9.1.1 TensoFlow Lite简介

9.1.2 TensorFlow Lite 工作原理

9.2 TensorRT

9.3 OpenVINO

9.3.1 OpenVINO简介

9.3.2 Open VINO的构成

9.3.3 Open VINO应用开发

9.4 XILINX Vitis

9.5 uTensor

9.6 Apache TVM

小结

第三部 实现

第10章 搭建嵌入式神经网络开发环境

10.1 嵌入式AI开发流程

10.2 NVIDIA Jetson开发流程

第11章 优化嵌入式神经网络模型

11.1 TensorFlow 模型优化

11.1.1 训练后优化

11.1.2 训练时优化

11.2 TensorRT模型优化

11.2.1 与主流深度学习框架集成

11.2.2 部署到嵌入式系统

11.2.3 TensorRT API

11.2.4 TensorRT应用示例

11.2.5 模型转换器

11.3 两种模型优化技术的对比

第12章 在嵌入式设备上执行推理

12.1 从源代码构建项目

12.2 使用ImageNet实现图像分类

12.2.1 静态图像分类

12.2.2 摄像机实时视频分类

12.3 使用DetectNet实现目标检测

13.3.1 静态图像目标检测

13.3.2 摄像机实时视频目标检测

12.4 使用SegNet实现语义分割

12.4.1 静态图像语义分割

12.4.2 视频语义分割

12.5 使用PyTorch实现迁移学习

12.6 使用转换的模型

第13章 嵌入式神经网络应用示例

13.1 应用场景

13.2 硬件选型

13.3 模型开发

结束语:万物智能

以上是新书推荐 | 嵌入式人工智能的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文转载于:sohu.com。如有侵权,请联系admin@php.cn删除