《嵌入式人工智能》
李斌 编著
ISBN:978-7-302-62796-8
定价:69.00元
扫码优惠购书
ChatGPT的问世为人类揭示了通用人工智能(AGI)的雏形。人们发现,当人工神经网络达到一定规模,再加上拟人的学习方法(如RLHF),奇迹就突然产生了,智能开始摆脱人脑的束缚,在计算机上实现了!
然而,仍然有一个挑战亟待解决:我们能否在体积、功耗都与人类相当的机器,如人形机器人上实现以上的奇迹呢?
目前,ChatGPT需要使用超过3万张GPU进行训练和推理,总功率超过1000万瓦特,每天的电费约为5万美元。而人脑的体积不过1.5升左右,功率不到20瓦。如果想要将通用人工智能嵌入到机器人,甚至是更小的无人机、手机、智能家电或物联网设备中时,我们将不得不克服以上的挑战。这就是《嵌入式人工智能》一书想要探讨的话题。
在嵌入式人工智能的领域,我们将用更高的能量效率执行更加精简的算法,并把它们放置在一个体积和重量都更小的机器之内,在真实世界中完成实时推理任务。一句话,我们要将人工智能以最精简的方式来实现!
为了克服这个挑战,需要从各个层面着手解决问题。总结起来,要实现嵌入式人工智能,需要5个方面的组件。
嵌入式AI芯片。它是具有更高能量效率的AI加速器。
轻量级AI算法。它具有更低的计算复杂度和更少的参数,但其准确率与大型AI算法相比毫不逊色。
模型压缩。它进一步裁剪轻量级AI算法中冗余的参数,用更精简的方式表达。
编译优化。它将模型翻译为更适合AI加速器指令的编码。
多层级联的应用程序框架。它在更合适的时机使用更合适的算法,从而降低整个系统的成本和能耗。
这5个组件组合运用起来,通用人工智能就有望真正嵌入到机器中,让它能看、能听、能说、能思考,真正的“活”起来,成为另外一种形态的生命——人工生命。
当然,要实现以上的梦想任重而道远。这本书只是一个入门指南,它探讨了问题并概括了当前解决这些问题的方法和工具。它不是最终的答案,但它提供了获取答案的钥匙。
如果您有志于在机器人、无人机、手机、智能家电、物联网设备上实现通用人工智能,它无疑是一本有益的入门书籍。
本书特色
1. 国内 第一部全面介绍嵌入式人工智能的著作。
2. 内容丰富详实,涵盖 嵌入式人工智能的原理、平台和实践。
3. 对嵌入式人工智能的原理做出系统性归纳总结, 概念新颖,条理清晰。
4. 全面介绍实现 嵌入式人工智能平台,包括主流的嵌入式神经网络芯片和软件框架。
5. 概括嵌入式人工智能的 开发流程。
6. 原理与实践相结合, 结合代码展示嵌入式人工智能的实际应用案例。
应用样例
书中最后一章,我们尝试基于无人机实现一种飞行太阳伞,这种伞可以实时跟踪人的运动,随时为人遮挡阳光的照射,从而解放人的双手,让你在炎炎夏日可以开心的逛街、玩耍,并成为人们关注的焦点。
为了让无人飞行伞实现人体跟踪,我们将采用机器视觉的方法。由飞行伞前部的摄像头拍摄人体,通过轻量级人体姿态估计算法计算人体轮廓,获取人的头部五官、肢体关节所在的位置,进而分析人体产生的动作,预测人将会向哪个方向前进、后退、转向或上下坡,从而让无人飞行伞跟踪这种运动,随时调整无人飞行伞的空间位置,实现对人体的跟随和遮阳效果。
考虑到重量、耗电等原因,必须采用专用的嵌入式AI芯片。在书中以英伟达Jetson为例进行了开发。现在,基于ARM的SoC等每瓦推理性能更强的芯片已经得到广泛应用,以应对技术高速发展带来的挑战。但书中介绍的流程和方法仍然是适用的。
为了让上面的轻量级算法在嵌入式AI芯片上达到实时推理的要求,还需采用模型压缩和优化技术,对模型进行剪枝、量化等操作,减小模型的参数,让推理性能成倍增长,功耗成倍降低,并为专用的嵌入式AI芯片推理而优化。书中以TensorRT为例做了说明,如果采用基于ARM的SoC,则可以采用Tensorflow Lite等压缩和优化技术。
最后,借助本书的知识,我们终于可以让无人太阳伞飞起来了!
目录
向上滑动阅览
第一部 原理
第1章 人工智能与人工神经网络
1.1 什么是人工智能
1.2 什么是人工神经网络
1.3 人类大脑
1.4 人工神经网络的基本构成
1.4.1 人工神经元
1.4.2 人工神经网络的结构
1.5 人工神经网络的学习机制
1.6 人工神经网络的类型
1.7 人工神经网络的优势
1.8 深度神经网络
1.8.1 什么是深度神经网络
18.2 常见的深度神经网络
1.8.3 卷积神经网络
1.9 神经网络架构搜索(NAS)
1.9.1 搜索空间
1.9.2 强化学习搜索
1.9.3 渐进式搜索
1.9.4 离散搜索
1.10 迁移学习
1.10.1 什么是迁移学习
1.10.2 迁移学习的类型
1.10.3 迁移学习的优势
1.10.4 迁移学习的方式
1.10.5 迁移学习与嵌入式人工智能
第2章 嵌入式人工智能
2.1 什么是嵌入式人工智能
2.2 为什么需要嵌入式人工智能
2.3 最初的尝试:云计算模式
2.4 从云端到设备:本地模式
2.5 嵌入式人工智能的技术挑战
2.5.1 模型规模
2.5.2 能量效率
2.5.3 内存访问
2.5.4 推理速度
2.5.5 尺寸和重量
2.6 嵌入式人工智能的实现途径
2.7 嵌入式人工智能的实现组件
第3章 嵌入式AI芯片原理
3.1 并行计算
3.2 脉动阵列
3.3 多级缓存
3.4 数据流
第4章 轻量级神经网络
4.1 降低计算复杂度
4.1.1 分组卷积
4.1.2 深度方向卷积
4.1.3 点向卷积
4.1.4 深度可分离卷积
4.1.5 通道乱序混合
4.2 SqueezeNet
4.2.1 核心思想
4.2.2 网络结构
4.2.3 性能
4.3 Xception
4.3.1 核心思想
4.3.2 网络结构
4.3.3 性能
4.4 MobileNet v1
4.4.1 核心思想
4.4.2 网络结构
4.4.3 性能
4.5 MobileNet v2
4.5.1 核心思想
4.5.2 网络结构
4.5.3 性能
4.6 MnasNet
4.6.1 核心思想
4.6.2 网络结构
4.6.3 性能
4.7 MobileNet v3
4.7.1 核心思想
4.7.2 网络结构
4.7.3 性能
4.6 轻量级神经网络的应用
第5章 深度神经网络压缩
5.1 神经网络压缩的一般方法
5.1.1 剪枝
5.1.2 权重共享
5.1.3 量化
5.1.4 二值/三值化
5.1.5 Winograd卷积
5.2 压缩-编译协同设计
5.2.1 压缩编译协同设计的概念
5.2.2 压缩器
5.2.5 编译器
5.2.6 压缩编译协同设计的优势
第6章 嵌入式神经网络应用程序框架
6.1 分层级联系统的构成
6.2 分层级联系统的效率
6.4 本地-云协同模式
第7章 终生深度学习
7.1 传统深度学习的缺陷及原因
7.2 终生深度学习的目标
7.3 终生深度学习的特性
7.4 神经生物学的启示
7.5 终生深度神经网络的实现
7.5.1 双重学习系统
7.5.2 实时更新
7.5.3 记忆合并
7.5.4 适应真实场景
7.6 终生深度学习与嵌入式人工智能
第二部 平台
第8章 嵌入式神经网络硬件加速器
8.1 概述
8.2 NVIDIA Jetson
8.2.1 Jetson模块简介
8.2.1 Jetson模块内部结构
8.2.3 Jetson性能
8.3 Intel Movidius
8.3.1 Movidius Myriad X VPU芯片
8.3.2 Intel神经计算棒
8.4 Google Edge TPU
8.4.1 Google Edge TPU简介
8.4.2 Google Edge TPU工作原理
8.5 XILINX DPU
8.6 ARM Ethos NPU
8.6.1 ARM机器学习处理器
8.6.2 Ethos-N系列
8.6.3 Ethos-U系列
小结
第9章 嵌入式神经网络软件框架
9.1 Tensorflow Lite
9.1.1 TensoFlow Lite简介
9.1.2 TensorFlow Lite 工作原理
9.2 TensorRT
9.3 OpenVINO
9.3.1 OpenVINO简介
9.3.2 Open VINO的构成
9.3.3 Open VINO应用开发
9.4 XILINX Vitis
9.5 uTensor
9.6 Apache TVM
小结
第三部 实现
第10章 搭建嵌入式神经网络开发环境
10.1 嵌入式AI开发流程
10.2 NVIDIA Jetson开发流程
第11章 优化嵌入式神经网络模型
11.1 TensorFlow 模型优化
11.1.1 训练后优化
11.1.2 训练时优化
11.2 TensorRT模型优化
11.2.1 与主流深度学习框架集成
11.2.2 部署到嵌入式系统
11.2.3 TensorRT API
11.2.4 TensorRT应用示例
11.2.5 模型转换器
11.3 两种模型优化技术的对比
第12章 在嵌入式设备上执行推理
12.1 从源代码构建项目
12.2 使用ImageNet实现图像分类
12.2.1 静态图像分类
12.2.2 摄像机实时视频分类
12.3 使用DetectNet实现目标检测
13.3.1 静态图像目标检测
13.3.2 摄像机实时视频目标检测
12.4 使用SegNet实现语义分割
12.4.1 静态图像语义分割
12.4.2 视频语义分割
12.5 使用PyTorch实现迁移学习
12.6 使用转换的模型
第13章 嵌入式神经网络应用示例
13.1 应用场景
13.2 硬件选型
13.3 模型开发
结束语:万物智能
以上是新书推荐 | 嵌入式人工智能的详细内容。更多信息请关注PHP中文网其他相关文章!

拥抱Face的OlympicCoder-7B:强大的开源代码推理模型 开发以代码为中心的语言模型的竞赛正在加剧,拥抱面孔与强大的竞争者一起参加了比赛:OlympicCoder-7B,一种产品

你们当中有多少人希望AI可以做更多的事情,而不仅仅是回答问题?我知道我有,最近,我对它的变化感到惊讶。 AI聊天机器人不仅要聊天,还关心创建,研究

随着智能AI开始融入企业软件平台和应用程序的各个层面(我们必须强调的是,既有强大的核心工具,也有一些不太可靠的模拟工具),我们需要一套新的基础设施能力来管理这些智能体。 总部位于德国柏林的流程编排公司Camunda认为,它可以帮助智能AI发挥其应有的作用,并与新的数字工作场所中的准确业务目标和规则保持一致。该公司目前提供智能编排功能,旨在帮助组织建模、部署和管理AI智能体。 从实际的软件工程角度来看,这意味着什么? 确定性与非确定性流程的融合 该公司表示,关键在于允许用户(通常是数据科学家、软件

参加Google Cloud Next '25,我渴望看到Google如何区分其AI产品。 有关代理空间(此处讨论)和客户体验套件(此处讨论)的最新公告很有希望,强调了商业价值

为您的检索增强发电(RAG)系统选择最佳的多语言嵌入模型 在当今的相互联系的世界中,建立有效的多语言AI系统至关重要。 强大的多语言嵌入模型对于RE至关重要

特斯拉的Austin Robotaxi发射:仔细观察Musk的主张 埃隆·马斯克(Elon Musk)最近宣布,特斯拉即将在德克萨斯州奥斯汀推出的Robotaxi发射,最初出于安全原因部署了一支小型10-20辆汽车,并有快速扩张的计划。 h

人工智能的应用方式可能出乎意料。最初,我们很多人可能认为它主要用于代劳创意和技术任务,例如编写代码和创作内容。 然而,哈佛商业评论最近报道的一项调查表明情况并非如此。大多数用户寻求人工智能的并非是代劳工作,而是支持、组织,甚至是友谊! 报告称,人工智能应用案例的首位是治疗和陪伴。这表明其全天候可用性以及提供匿名、诚实建议和反馈的能力非常有价值。 另一方面,营销任务(例如撰写博客、创建社交媒体帖子或广告文案)在流行用途列表中的排名要低得多。 这是为什么呢?让我们看看研究结果及其对我们人类如何继续将


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

螳螂BT
Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

SublimeText3汉化版
中文版,非常好用

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),