導讀 | 本文簡單介紹循環神經網路RNN的發展過程,分析了梯度下降演算法、反向傳播及LSTM過程。 |
隨著科學技術的發展以及硬體運算能力的大幅提升,人工智慧已經從幾十年的幕後工作一下子躍入人們眼簾。人工智慧的背後源自於大數據、高效能的硬體與優秀的演算法的支援。 2016年,深度學習已成為Google搜尋的熱詞,隨著最近一兩年的圍棋人機大戰中,阿法狗完胜世界冠軍後,人們感覺到再也無法抵擋住AI的車輪的快速駛來。在2017年這一年中,AI已經突破天際,相關產品也出現在人們的生活中,例如智慧機器人、無人駕駛以及語音搜尋等。最近,世界智能大會在天津舉辦成功,大會上許多業內行家及企業家發表自己對未來的看法,可以了解到,大多數的科技公司及研究機構都非常看好人工智能的前景,比如百度公司將自己的全部身家壓在人工智慧上,不管破釜沉舟後是一舉成名還是一敗塗地,只要不是一無所獲就行。為什麼突然深度學習會有這麼大的效應與熱潮呢?這是因為科技改變生活,很多的職業可能在未來的時間慢慢被人工智慧取代。全民都在熱議人工智慧與深度學習,就連Yann LeCun大牛都感受到了人工智慧在中國的火熱!
#言歸正傳,人工智慧的背後是大數據、優秀的演算法以及強大運算能力的硬體支援。例如,英偉達公司憑藉自己的強大的硬體研發能力以及對深度學習框架的支持奪得世全球最聰明的五十家公司榜首。另外優秀的深度學習演算法很多,時不時就會出現一個新的演算法,真是令人眼花撩亂。但大多都是基於經典的演算法改進而來,例如卷積神經網路(CNN)、深度信念網路(DBN)、循環神經網路(RNN)等等。
本文將介紹經典的網路之循環神經網路(RNN),而此網路也是時序資料的首選網路。當涉及某些順序機器學習任務時,RNN可以達到很高的精度,沒有其他演算法可以與之一較高下。這是由於傳統的神經網路只是具有一種短期記憶,而RNN具有有限的短期記憶的優勢。然而,第一代RNNs網路並沒有引起人們著重的注意,這是由於研究人員在利用反向傳播和梯度下降演算法過程中遭受了嚴重的梯度消失問題,阻礙了RNN幾十年的發展。最後,在90年代後期出現了重大突破,導致更準確的新一代RNN的問世。基於這項突破的近二十年,直到Google Voice Search和Apple Siri等應用程式開始搶奪其關鍵流程,開發人員完善並優化了新一代的RNN。現在,RNN網路遍布各個研究領域,並且正在幫助點燃人工智慧的復興之火。
與過去有關的神經網路(RNN)#大多數人造神經網絡,如前饋神經網絡,都沒有記憶它們剛剛收到的輸入。例如,如果提供前饋神經網路的字元“WISDOM”,當它到達字元“D”時,它已經忘記了它剛剛讀過字元“S”,這是一個大問題。無論訓練該網路是多麼的辛苦,總是很難猜出下一個最有可能的字元「O」。這使得它成為某些任務的一個相當無用的候選人,例如在語音識別中,識別的好壞在很大程度上受益於預測下一個字元的能力。另一方面,RNN網路確實記住了先前的輸入,但是處於一個非常複雜的水平。
我們再次輸入“WISDOM”,並將其應用到一個複發性網路中。 RNN網路中的單元或人造神經元在接收到「D」時也將其先前接收到的字元「S」作為其輸入。換句話說,就是把剛剛過去的事情聯合現在的事情作為輸入,來預測接下來會發生的事情,這給了它有限的短期記憶的優勢。當訓練時,提供足夠的背景下,可以猜測下一個字元最有可能是“O”。
調整與重新調整就像所有人工神經網路一樣,RNN的單元為其多個輸入分配一個權重矩陣,這些權重代表各個輸入在網路層中所佔的比重;然後對這些權重應用一個函數來確定單一輸出,這個函數一般稱為損失函數(代價函數),限定實際輸出與目標輸出之間的誤差。然而,循環神經網路不僅對當前輸入分配權重,而且還從對過去時刻輸入分配權重。然後,透過使得損失函數最下來動態的調整分配給當前輸入和過去輸入的權重,這個過程涉及到兩個關鍵概念:梯度下降和反向傳播(BPTT)。
梯度下降機器學習中最著名的演算法之一就是梯度下降演算法。它的主要優點在於它顯著的迴避了「維數災難」。什麼是「維數災難」呢,是說在涉及向量的計算問題中,隨著維數的增加,計算量會呈指數倍增長。這個問題困擾著許多神經網路系統,因為太多的變數需要計算才能達到最小的損失函數。然而,梯度下降演算法透過放大多維誤差或代價函數的局部最小值來打破維數災難。這有助於系統調整分配給各個單元的權重值,以使網路變得更加精確。
透過時間的反向傳播#RNN透過反向推理微調其權重來訓練其單元。簡單的說,就是根據單元計算出的總輸出與目標輸出之間的誤差,從網路的最終輸出端反向逐層迴歸,利用損失函數的偏導調整每個單元的權重。這就是著名的BP演算法,關於BP演算法可以看本部落客之前的相關部落格。而RNN網路使用的是類似的一個版本,稱為通過時間的反向傳播(BPTT)。此版本擴展了調整過程,包括負責前一時刻(T-1)輸入值對應的每個單元的記憶的權重。
Yikes:梯度消失問題#儘管在梯度下降演算法和BPTT的幫助下享有一些初步的成功,但是許多人造神經網路(包括第一代RNNs網路),最終都遭受了嚴重的挫折——梯度消失問題。什麼是梯度消失問題呢,其基本想法其實很簡單。首先,來看一個梯度的概念,將梯度視為斜率。在訓練深層神經網路的背景中,梯度值越大代表坡度越陡峭,系統能夠越快下滑到終點線並完成訓練。但這也是研究者陷入困境的地方——當斜坡太平坦時,無法進行快速的訓練。這對於深層網路中的第一層而言特別關鍵,因為若第一層的梯度值為零,表示沒有了調整方向,無法調整相關的權重值來最下化損失函數,這一現象就是「消梯度失”。隨著梯度越來越小,訓練時間也會越來越長,類似物理學中的直線運動,光滑表面,小球會一直移動下去。
在九十年代後期,一個重大的突破解決了上述梯度消失問題,為RNN網路發展帶來了第二次研究熱潮。這種大突破的中心思想是引入了單元長短期記憶(LSTM)。
#LSTM的引進給AI領域創造了一個不同的世界。這是由於這些新單元或人造神經元(如RNN的標準短期記憶單元)從一開始就記住了它們的輸入。然而,與標準的RNN單元不同,LSTM可以掛載在它們的記憶體上,這些記憶體具有類似於常規電腦中的記憶體暫存器的讀取/寫入屬性。另外LSTM是類比的,而不是數字,使得它們的特徵可以區分。換句話說,它們的曲線是連續的,可以找到它們的斜坡的陡度。因此,LSTM特別適合反向傳播和梯度下降中所涉及的偏微積分。
#總而言之,LSTM不僅可以調整其權重,還可以根據訓練的梯度來保留、刪除、轉換和控制其儲存資料的流入和流出。最重要的是,LSTM可以長時間保存重要的錯誤訊息,以使梯度相對陡峭,從而網路的訓練時間相對較短。這解決了梯度消失的問題,並大大提高了當今基於LSTM的RNN網路的準確性。由於RNN架構的顯著改進,Google、蘋果及許多其他先進的公司現在正在使用RNN為其業務中心的應用提供推動力。
總結循環神經網路(RNN)可以記住其先前的輸入,當涉及到連續的、與情境相關的任務(如語音辨識)時,它比其他人造神經網路具有更大的優勢。
關於RNN網路的發展歷程:第一代RNNs透過反向傳播和梯度下降演算法達到了修正錯誤的能力。但梯度消失問題阻止了RNN的發展;直到1997年,引入了一個基於LSTM的架構後,取得了巨大的突破。
新的方法有效地將RNN網路中的每個單元轉變成一個模擬計算機,大大提高了網路精度。
作者資訊
Jason Roell:軟體工程師,熱愛深度學習及其可改變技術的應用。
Linkedin:http://www.linkedin.com/in/jason-roell-47830817/
以上是首選神經網路應用於時間序列數據的詳細內容。更多資訊請關注PHP中文網其他相關文章!

互聯網運行不依賴單一操作系統,但Linux在其中扮演重要角色。 Linux廣泛應用於服務器和網絡設備,因其穩定性、安全性和可擴展性受歡迎。

Linux操作系統的核心是其命令行界面,通過命令行可以執行各種操作。 1.文件和目錄操作使用ls、cd、mkdir、rm等命令管理文件和目錄。 2.用戶和權限管理通過useradd、passwd、chmod等命令確保系統安全和資源分配。 3.進程管理使用ps、kill等命令監控和控制系統進程。 4.網絡操作包括ping、ifconfig、ssh等命令配置和管理網絡連接。 5.系統監控和維護通過top、df、du等命令了解系統運行狀態和資源使用情況。

介紹 Linux是一個強大的操作系統,由於其靈活性和效率,開發人員,系統管理員和電源用戶都喜歡。但是,經常使用長而復雜的命令可能是乏味的

Linux適用於服務器、開發環境和嵌入式系統。 1.作為服務器操作系統,Linux穩定高效,常用於部署高並發應用。 2.作為開發環境,Linux提供高效的命令行工具和包管理系統,提升開發效率。 3.在嵌入式系統中,Linux輕量且可定制,適合資源有限的環境。

簡介:通過基於Linux的道德黑客攻擊數字邊界 在我們越來越相互聯繫的世界中,網絡安全至關重要。 道德黑客入侵和滲透測試對於主動識別和減輕脆弱性至關重要

Linux基礎學習從零開始的方法包括:1.了解文件系統和命令行界面,2.掌握基本命令如ls、cd、mkdir,3.學習文件操作,如創建和編輯文件,4.探索高級用法如管道和grep命令,5.掌握調試技巧和性能優化,6.通過實踐和探索不斷提陞技能。

Linux在服務器、嵌入式系統和桌面環境中的應用廣泛。 1)在服務器領域,Linux因其穩定性和安全性成為託管網站、數據庫和應用的理想選擇。 2)在嵌入式系統中,Linux因其高度定制性和高效性而受歡迎。 3)在桌面環境中,Linux提供了多種桌面環境,滿足不同用戶需求。

Linux的缺點包括用戶體驗、軟件兼容性、硬件支持和學習曲線。 1.用戶體驗不如Windows或macOS友好,依賴命令行界面。 2.軟件兼容性不如其他系統,缺乏許多商業軟件的原生版本。 3.硬件支持不如Windows全面,可能需要手動編譯驅動程序。 4.學習曲線較陡峭,掌握命令行操作需要時間和耐心。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

SublimeText3 Linux新版
SublimeText3 Linux最新版

Atom編輯器mac版下載
最受歡迎的的開源編輯器

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)