Rangkaian Neural Berulang (RNNS): Panduan Komprehensif
Rangkaian Neural Berulang (RNNs) adalah jenis rangkaian saraf buatan (ANN) yang kuat yang digunakan dalam aplikasi seperti Siri Apple dan carian suara Google. Keupayaan unik mereka untuk mengekalkan input masa lalu melalui memori dalaman menjadikannya sesuai untuk tugas -tugas seperti ramalan harga saham, penjanaan teks, transkripsi, dan terjemahan mesin. Tidak seperti rangkaian saraf tradisional di mana input dan output adalah bebas, output RNN bergantung kepada unsur -unsur sebelumnya dalam urutan. Selain itu, parameter saham RNNS merentasi lapisan rangkaian, mengoptimumkan berat badan dan pelarasan bias semasa keturunan kecerunan.
Rajah di atas menggambarkan RNN asas. Dalam senario ramalan harga saham menggunakan data seperti [45, 56, 45, 49, 50, ...], setiap input (x0 hingga XT) menggabungkan nilai masa lalu. Sebagai contoh, x0 akan menjadi 45, x1 akan menjadi 56, dan nilai -nilai ini menyumbang kepada meramalkan elemen urutan seterusnya.
Bagaimana fungsi RNN
Dalam RNN, kitaran maklumat melalui gelung, menjadikan output fungsi kedua -dua input semasa dan sebelumnya.
Lapisan input (x) memproses input awal, lulus ke lapisan tengah (a), yang terdiri daripada pelbagai lapisan tersembunyi dengan fungsi pengaktifan, berat, dan bias. Parameter ini dikongsi di lapisan tersembunyi, mewujudkan satu lapisan gelung tunggal dan bukannya pelbagai lapisan yang berbeza. RNNs menggunakan backpropagation melalui masa (BPTT) dan bukannya backpropagation tradisional untuk mengira kecerunan. Kesalahan BPTT pada setiap langkah kerana parameter bersama.
Jenis RNNs
RNN menawarkan fleksibiliti dalam panjang input dan output, tidak seperti rangkaian feedforward dengan input dan output tunggal. Kesesuaian ini membolehkan RNNs mengendalikan pelbagai tugas, termasuk penjanaan muzik, analisis sentimen, dan terjemahan mesin. Empat jenis utama wujud:
- Satu-ke-satu: Rangkaian saraf mudah yang sesuai untuk masalah input/output tunggal.
- One-to-Many: memproses input tunggal untuk menghasilkan pelbagai output (misalnya, imej imej).
- Ramai-ke-satu: Mengambil beberapa input untuk meramalkan satu output (contohnya, klasifikasi sentimen).
- Ramai-ke-banyak: Mengendalikan pelbagai input dan output (contohnya, terjemahan mesin).
Kursus pembelajaran mesin yang disyorkan
Ketahui lebih lanjut mengenai RNNS untuk pemodelan bahasa
Terokai Pengenalan Pembelajaran Deep di Python
CNNS vs RNNS
Rangkaian Neural Convolutional (CNNS) adalah pemprosesan data spatial rangkaian feedforward (seperti imej), yang biasa digunakan dalam penglihatan komputer. Rangkaian saraf mudah berjuang dengan dependensi piksel imej, manakala CNN, dengan lapisan convolutional, relu, pengumpulan, dan sepenuhnya bersambung, cemerlang di kawasan ini.
Perbezaan utama:
- CNNs mengendalikan data jarang (imej), manakala RNN menguruskan siri masa dan data berurutan.
- CNNS menggunakan backpropagation standard, RNNs menggunakan BPTT.
- CNN mempunyai input/output terhingga; RNN adalah fleksibel.
- CNNs adalah feedforward; RNNs menggunakan gelung untuk data berurutan.
- CNN digunakan untuk pemprosesan imej/video; RNNS untuk analisis pertuturan/teks.
Batasan RNN
RNN mudah menghadapi dua cabaran utama yang berkaitan dengan kecerunan:
- Kecerunan Vanishing: Kecerunan menjadi terlalu kecil, menghalang kemas kini parameter dan pembelajaran.
- Kecerunan meletup: Kecerunan menjadi terlalu besar, menyebabkan ketidakstabilan model dan masa latihan yang lebih lama.
Penyelesaian termasuk mengurangkan lapisan tersembunyi atau menggunakan seni bina canggih seperti LSTM dan GRU.
Arkitek RNN Lanjutan
RNN mudah mengalami batasan memori jangka pendek. LSTM dan GRU alamat ini dengan membolehkan pengekalan maklumat dalam tempoh yang panjang.
- Memori jangka pendek yang panjang (LSTM): RNN maju yang direka untuk mengurangkan kecerunan lenyap/meletup. Empat lapisan berinteraksi memudahkan pengekalan ingatan jangka panjang, menjadikannya sesuai untuk terjemahan mesin, sintesis pertuturan, dan banyak lagi.
- Unit berulang Gated (GRU): Variasi LSTM yang lebih mudah, menggunakan pintu kemas kini dan tetapkan semula untuk menguruskan aliran maklumat. Senibina yang diselaraskannya sering membawa kepada latihan yang lebih cepat berbanding LSTM.
Ramalan Harga Saham MasterCard Menggunakan LSTM & Gru
Bahagian ini memperincikan projek menggunakan LSTM dan GRU untuk meramalkan harga saham MasterCard. Kod ini menggunakan perpustakaan seperti pandas, numpy, matplotlib, scikit-learn, dan tensorflow.
(Contoh kod terperinci dari input asal ditinggalkan di sini untuk keringkasan. Langkah -langkah teras diringkaskan di bawah.)
- Analisis data: Import dan bersihkan dataset saham MasterCard.
- Data Preprocessing: Pecahkan data ke dalam set latihan dan ujian, skala menggunakan
MinMaxScaler
, dan Reshape untuk input model. - Model LSTM: Membina dan melatih model LSTM.
- Hasil LSTM: Menilai prestasi model LSTM menggunakan RMSE.
- Model Gru: Membina dan melatih model GRU dengan seni bina yang serupa.
- Hasil GRU: Menilai prestasi model GRU menggunakan RMSE.
- Kesimpulan: Bandingkan prestasi model LSTM dan GRU.
Kesimpulan
Rangkaian CNN-RNN hibrid semakin digunakan untuk tugas yang memerlukan pemahaman spatial dan temporal. Tutorial ini memberikan pemahaman asas tentang RNN, batasan mereka, dan penyelesaian yang ditawarkan oleh seni bina canggih seperti LSTM dan GRU. Projek ini menunjukkan permohonan LSTM dan GRU untuk ramalan harga saham, menonjolkan prestasi unggul Gru dalam kes tertentu ini. Projek lengkap boleh didapati di ruang kerja DataCamp.
https://www.php.cn/link/8708107b2ff5de15d0244471ae041fdb
ingat untuk menggantikan https://www.php.cn/link/cc6a6632b380f3f6a1c54b1222cd96c2
URL imej diandaikan betul dan boleh diakses.
Atas ialah kandungan terperinci Tutorial Rangkaian Neural Berulang (RNN). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Sejak tahun 2008, saya telah memperjuangkan van yang dikongsi bersama-pada masa yang digelar "Robotjitney," kemudian "Vansit" -dan masa depan pengangkutan bandar. Saya meramalkan kenderaan ini sebagai penyelesaian transit generasi akan datang abad ke-21, Surpas

Merevolusikan pengalaman checkout Sistem "Just Go" inovatif Sam Club membina teknologi "imbasan & pergi" yang sedia ada AI yang sedia ada, yang membolehkan ahli mengimbas pembelian melalui aplikasi Sam's Club semasa perjalanan membeli-belah mereka.

Predictability dan barisan produk baru NVIDIA di GTC 2025 Nvidia, pemain utama dalam infrastruktur AI, memberi tumpuan kepada peningkatan ramalan untuk pelanggannya. Ini melibatkan penghantaran produk yang konsisten, memenuhi jangkaan prestasi, dan

Google's Gemma 2: Model bahasa yang kuat dan cekap Model Bahasa Gemma Google, yang disambut untuk kecekapan dan prestasi, telah berkembang dengan kedatangan Gemma 2. Siaran terbaru ini terdiri daripada dua model: parameter 27 bilion ver

Ini memimpin dengan episod data yang menampilkan Dr Kirk Borne, seorang saintis data terkemuka, astrofizik, dan pembesar suara TEDX. Pakar terkenal dalam Big Data, AI, dan Pembelajaran Mesin, Dr. Borne menawarkan pandangan yang tidak ternilai ke dalam keadaan semasa dan masa depan Traje

Terdapat beberapa perspektif yang sangat berwawasan dalam maklumat ini mengenai maklumat mengenai kejuruteraan yang menunjukkan kepada kita mengapa kecerdasan buatan sangat baik untuk menyokong latihan fizikal orang. Saya akan menggariskan idea teras dari setiap perspektif penyumbang untuk menunjukkan tiga aspek reka bentuk yang merupakan bahagian penting dalam penerokaan penerokaan kecerdasan buatan dalam sukan. Peranti tepi dan data peribadi mentah Idea ini mengenai kecerdasan buatan sebenarnya mengandungi dua komponen -satu yang berkaitan dengan di mana kita meletakkan model bahasa yang besar dan yang lain berkaitan dengan perbezaan antara bahasa manusia dan bahasa yang kita tanda -tanda penting kita "menyatakan" apabila diukur dalam masa nyata. Alexander Amini tahu banyak tentang berlari dan tenis, tetapi dia masih

Ketua Pegawai Maklumat Caterpillar dan Naib Presiden Kanan IT, Jamie Engstrom, mengetuai pasukan global lebih dari 2,200 profesional IT di 28 negara. Dengan 26 tahun di Caterpillar, termasuk empat setengah tahun dalam peranannya sekarang, Engst

Alat HDR Ultra baru Google Photos: Panduan Cepat Tingkatkan foto anda dengan alat Ultra HDR baru Google Photos, mengubah imej standard ke dalam karya-karya bertenaga, tinggi dinamik. Sesuai untuk media sosial, alat ini meningkatkan kesan foto,


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Pelayar Peperiksaan Selamat
Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.

Muat turun versi mac editor Atom
Editor sumber terbuka yang paling popular

EditPlus versi Cina retak
Saiz kecil, penyerlahan sintaks, tidak menyokong fungsi gesaan kod

SecLists
SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.