经常性神经网络(RNNS):综合指南
经常性的神经网络(RNN)是一种在苹果Siri和Google的语音搜索等应用程序中使用的强大类型人工神经网络(ANN)。它们通过内部记忆保留过去输入的独特能力使它们非常适合诸如股票价格预测,文本生成,转录和机器翻译等任务。与输入和输出是独立的传统神经网络不同,RNN输出取决于序列中的先前元素。此外,RNN在跨网络层共享参数,从而在梯度下降期间优化了重量和偏差调整。
上图说明了基本的RNN。在股票价格预测方案中,使用[45、56、45、49、50,...]之类的数据,每个输入(x0至XT)都包含了过去的值。例如,X0为45,X1为56,这些值有助于预测下一个序列元素。
RNN的功能
在RNN中,信息通过循环循环,使输出成为当前输入和先前输入的函数。
输入层(x)处理初始输入,将其传递到中间层(a),其中包含具有激活功能,权重和偏见的多个隐藏图层。这些参数在隐藏的层上共享,创建一个单个循环图层,而不是多个不同的层。 RNNS通过时间(BPTT)而不是传统的反向传播来计算梯度。由于共享参数,BPTT在每个时间步长汇总错误。
RNN的类型
与具有单个输入和输出的FeedForward网络不同,RNN提供的输入和输出长度具有灵活性。这种适应性使RNN可以处理各种任务,包括音乐生成,情感分析和机器翻译。存在四种主要类型:
- 一对一:一个适合单个输入/输出问题的简单神经网络。
- 一对多:处理单个输入以生成多个输出(例如,图像字幕)。
- 多对一:需要多个输入来预测单个输出(例如,情感分类)。
- 多对多:处理多个输入和输出(例如,机器翻译)。
推荐的机器学习课程
CNNS与RNNS
卷积神经网络(CNN)是馈电网络处理空间数据(如图像),通常在计算机视觉中使用。简单的神经网络与图像像素依赖性抗争,而CNN则凭借其卷积,恢复,汇总和完全连接的层在这一领域中表现出色。
关键差异:
- CNNS处理稀疏数据(图像),而RNN管理时间序列和顺序数据。
- CNN使用标准反向流动,RNN使用BPTT。
- CNN具有有限的输入/输出; RNN是灵活的。
- CNN是喂食的; RNN使用循环进行顺序数据。
- CNN用于图像/视频处理;语音/文本分析的RNN。
RNN限制
简单的RNN面临与梯度有关的两个主要挑战:
- 消失的梯度:梯度变得太小,阻碍参数更新和学习。
- 爆炸梯度:梯度变得过大,导致模型不稳定性和较长的训练时间。
解决方案包括减少隐藏层或使用LSTM和GRU等高级体系结构。
高级RNN体系结构
简单的RNN遭受短期内存限制。 LSTM和GRU通过在长时间内保留信息来解决此问题。
- 长短期内存(LSTM):一种高级RNN,旨在减轻消失/爆炸梯度。它的四个相互作用层有助于长期记忆力保留,使其适合机器翻译,语音合成等。
- 门控复发单元(GRU):使用更新和重置门来管理信息流的更简单的LSTM变化。与LSTM相比,其简化的架构通常会导致更快的培训。
万事达卡股票价格预测使用LSTM&GRU
本节详细介绍了一个使用LSTM和GRU预测万事达卡股价的项目。该代码利用Pandas,Numpy,Matplotlib,Scikit-Learn和TensorFlow等库。
(此处省略了原始输入中的详细代码示例。
- 数据分析:导入和清洁万事达卡库存数据集。
-
数据预处理:将数据分为培训和测试集,使用
MinMaxScaler
进行扩展,然后重塑模型输入。 - LSTM模型:构建和训练LSTM模型。
- LSTM结果:使用RMSE评估LSTM模型的性能。
- GRU模型:建立和培训具有类似体系结构的GRU模型。
- GRU结果:使用RMSE评估GRU模型的性能。
- 结论:比较LSTM和GRU模型的性能。
结论
混合CNN-RNN网络越来越多地用于需要空间和时间理解的任务。本教程提供了对LSTM和GRU等高级体系结构提供的RNN,其局限性和解决方案的基本理解。该项目证明了LSTM和GRU在股票价格预测中的应用,在此特定情况下强调了GRU的出色表现。完整的项目可在Datacamp Workspace上找到。
切记替换https://www.php.cn/link/cc6a6632b380f3f6a1c54b1222cd96c2
和https://www.php.cn/link/8708107b2ff5de15d0244471ae041fdb
假定图像URL是正确且可访问的。
以上是经常性神经网络教程(RNN)的详细内容。更多信息请关注PHP中文网其他相关文章!

法律技术革命正在获得动力,促使法律专业人员积极采用AI解决方案。 对于那些旨在保持竞争力的人来说,被动抵抗不再是可行的选择。 为什么技术采用至关重要? 法律专业人员

许多人认为与AI的互动是匿名的,与人类交流形成了鲜明的对比。 但是,AI在每次聊天期间都会积极介绍用户。 每个单词的每个提示都经过分析和分类。让我们探索AI Revo的这一关键方面

成功的人工智能战略,离不开强大的企业文化支撑。正如彼得·德鲁克所言,企业运作依赖于人,人工智能的成功也同样如此。 对于积极拥抱人工智能的组织而言,构建适应AI的企业文化至关重要,它甚至决定着AI战略的成败。 西蒙诺咨询公司(West Monroe)近期发布了构建蓬勃发展的AI友好型企业文化的实用指南,以下是一些关键要点: 1. 明确AI的成功模式: 首先,要对AI如何赋能业务有清晰的愿景。理想的AI运作文化,能够实现人与AI系统之间工作流程的自然融合。AI擅长某些任务,而人类则擅长创造力、判

Meta升级AI助手应用,可穿戴式AI时代来临!这款旨在与ChatGPT竞争的应用,提供文本、语音交互、图像生成和网络搜索等标准AI功能,但现在首次增加了地理位置功能。这意味着Meta AI在回答你的问题时,知道你的位置和正在查看的内容。它利用你的兴趣、位置、个人资料和活动信息,提供最新的情境信息,这在以前是无法实现的。该应用还支持实时翻译,这彻底改变了Ray-Ban眼镜上的AI体验,使其实用性大大提升。 对外国电影征收关税是对媒体和文化的赤裸裸的权力行使。如果实施,这将加速向AI和虚拟制作的

人工智能正在彻底改变网络犯罪领域,这迫使我们必须学习新的防御技巧。网络罪犯日益利用深度伪造和智能网络攻击等强大的人工智能技术进行欺诈和破坏,其规模前所未有。据报道,87%的全球企业在过去一年中都成为人工智能网络犯罪的目标。 那么,我们该如何避免成为这波智能犯罪的受害者呢?让我们探讨如何在个人和组织层面识别风险并采取防护措施。 网络罪犯如何利用人工智能 随着技术的进步,犯罪分子不断寻找新的方法来攻击个人、企业和政府。人工智能的广泛应用可能是最新的一个方面,但其潜在危害是前所未有的。 特别是,人工智

最好将人工智能(AI)与人类智力(NI)之间的复杂关系理解为反馈循环。 人类创建AI,对人类活动产生的数据进行培训,以增强或复制人类能力。 这个AI

Anthropic最近的声明强调了关于尖端AI模型缺乏了解,引发了专家之间的激烈辩论。 这是一个真正的技术危机,还是仅仅是通往更秘密的道路上的临时障碍

印度是一个多元化的国家,具有丰富的语言,使整个地区的无缝沟通成为持续的挑战。但是,Sarvam的Bulbul-V2正在帮助弥合其高级文本到语音(TTS)T


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

Dreamweaver Mac版
视觉化网页开发工具

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。

SublimeText3汉化版
中文版,非常好用

螳螂BT
Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中