Rumah  >  Artikel  >  Peranti teknologi  >  Siri semakin "popular" Apakah kejayaan yang akan ada dalam suara pintar pada masa hadapan?

Siri semakin "popular" Apakah kejayaan yang akan ada dalam suara pintar pada masa hadapan?

王林
王林ke hadapan
2023-05-06 13:07:061108semak imbas

Untuk interaksi manusia-komputer, cara menjadikan mesin mempunyai pendengaran yang baik telah menjadi matlamat yang diteruskan tanpa henti dalam bidang AI sejak beberapa tahun kebelakangan ini. Sekitar tahun 2009, aplikasi model pembelajaran mendalam mula meninggalkan dunia akademik, dan teknologi pertuturan pintar yang diwakili oleh kebangkitan pertuturan, pengecaman, peningkatan dan sintesis juga beransur-ansur matang.

Contoh awal yang biasa ialah kelahiran siri pada tahun 2011. Suara pintar telah menjadi lompatan baharu dalam cara komunikasi dan interaksi antara manusia dan mesin. Selepas lebih sepuluh tahun pembangunan, soal jawab mesin manusia gaya "Hei, Siri" tidak lagi terhad kepada peranti terminal mudah alih, ia telah memasuki ribuan isi rumah dan digunakan secara meluas dalam pelbagai senario: pembesar suara pintar teman rumah, Tmall Jin untuk membeli-belah dalam talian yang mudah, terjemahan serentak pada mesyuarat, pembantu navigasi suara kereta semasa dalam perjalanan, dsb.

Memandangkan semakin banyak syarikat Internet dan pengeluar huluan secara aktif menggunakan trek suara pintar, produk seperti perkhidmatan pelanggan suara pintar, aplikasi AI perbualan dan pembantu maya AI telah mencapai pencapaian yang hebat. Dengan peningkatan kualiti selanjutnya, suara tindak balas adalah lebih semula jadi, pemahaman soalan lebih tepat, dan ia mempunyai "emosi kecil" sendiri.

Dalam era pendigitalan, trend kesalinghubungan segala-galanya tidak dapat dihalang. Suara pintar, sebagai antara muka utama untuk interaksi manusia-komputer semasa, berada dalam tempoh penyepaduan dan perlanggaran yang mendalam dengan ekonomi sebenar. Dengan perkembangan lanjut dan pengembangan senario aplikasi, kami juga telah melihat banyak masalah yang mencabar, seperti: cara mengenal pasti identiti penutur, cara mengenal pasti dialek, cara menghapuskan kekaburan, dan lain-lain adalah titik panas penyelidikan terkini.

Di sebalik kematangan teknologi, selalunya terdapat beberapa potensi, termasuk keupayaan inovasinya dalam aplikasi praktikal dan arah evolusi yang lebih berpotensi. Melihat ke peringkat seterusnya, teknologi suara pintar juga akan melihat arah aliran evolusi baharu Sebagai contoh: Bolehkah cip suara AI bersepadu yang mendalam menggantikan model berjalan model awan? Bolehkah penyelidikan inovatif mengenai gabungan pelbagai mod, pembelajaran tanpa pengawasan, dan penyepaduan silang disiplin otak mencapai hasil kejayaan? Kita akan lihat.

Jadi, apakah masalah pengeluaran sebenar yang dihadapi dalam penerokaan praktikal teknologi suara pintar dalam perusahaan utama? Bagaimana ia diselesaikan? Apakah kemajuan yang telah dicapai? Apakah perubahan baru yang telah berlaku dalam industri? Apakah trend pembangunan seterusnya? Sesi khas teknologi suara pintar "AIsummit Global Artificial Intelligence Technology Conference" akan membawa anda pemikiran yang mendalam!

Pada 7 Ogos, "Persidangan Teknologi Kecerdasan Buatan Global AIsummit" khusus untuk suara pintar yang dilancarkan oleh 51CTO akan datang!

Apakah topik istimewa yang anda minati?

Topik 1: Amalan Teknologi Pertuturan Zuoyebang

1 Penerokaan Teknologi Pengecaman Pertuturan: Kongsi teknologi pengecaman pertuturan dalam senario aplikasi praktikal berskala besar seperti hujung ke hujung, cekap. penggunaan data, dsb. Dan penyelesaian teknikal perkataan panas berdasarkan automata awalan telah dicadangkan.

2. Amalan teknologi penilaian pertuturan: Dari segi teknologi pembetulan ralat sebutan pertuturan, digabungkan dengan senario penyelarasan tinggi bantuan kerja rumah, pemindahan pengetahuan pelbagai tugas dan ciri pelbagai mod penyelesaian gabungan dicadangkan, yang sangat besar Pada tahap tertentu, keupayaan diskriminasi faktor model dan keupayaan pengesanan ralat dalam persekitaran yang bising dipertingkatkan. Memandangkan kesukaran dalam melaksanakan penilaian suara, teknologi penilaian bersepadu berasaskan awan berprestasi tinggi telah dicadangkan.

3. Rangka kerja teknologi sintesis pertuturan: Kongsi pemikiran dan amalan Zuoyebang tentang penambahbaikan selanjutnya berdasarkan rangka kerja teknologi pertuturan volum data kecil sedia ada.

Topik 2: Aplikasi teknologi pengecaman pertuturan bait dalam Feishu

1. Proses aplikasi teknologi pengecaman pertuturan dalam senario pejabat: e-mel pejabat, pemesejan segera Input suara di pejabat. pembantu suara, sari kata masa nyata & transkripsi selepas mesyuarat.

2. Pemikiran penyelesaian: memenuhi kecerdasan dan meningkatkan kecekapan.

3 Cabaran dan peluang: Cabaran tugasan pengecaman pertuturan, cabaran yang dibawa oleh tugasan hiliran dan mesyuarat memberikan maklumat tambahan.

4. Pengenalan kepada kerja algoritma utama (sistem pengecaman pertuturan hujung ke hujung): Transduser & CIF, perkataan panas dinamik + statik, Sedar Konteks.

Topik 3: Amalan membina sistem sintesis pertuturan peringkat tinggi

1.

2. Reka bentuk pemikiran dan pelaksanaan sistem sintesis pertuturan peringkat tinggi.

3.

4.

Topik 4: Laluan kepada pelaksanaan praktikal teknologi suara pintar dalam senario sosial SOUL

1. >2. Laluan pembinaan teknologi sintesis pertuturan berbilang modal

3. Aplikasi dalam senario perniagaan seperti keselamatan suara dan interaksi suara

Topik. 5 : Penerokaan dan amalan teknologi pengecaman pertuturan hujung ke hujung dalam 58.com

1. Senario aplikasi pengecaman pertuturan dalam 58.com: Aplikasi suara pintar AI, pengenalan pautan pengecaman pertuturan, cabaran dan laluan teknikal

2. Kerja pengoptimuman model berdasarkan WeNet: latihan separa penyeliaan, Efficient Conformer, pemampatan model

3 -pelan penggunaan pengecaman pertuturan hingga akhir :Apakah tetamu penting yang akan menghadiri seni bina enjin yang dibangunkan sendiri, penggunaan perkhidmatan penyahkodan Wenet dan ujian prestasi penyahkodan penstriman/bukan penstriman

?

1. Song Yang, ketua pakar algoritma, ketua pejabat tengah pintar dan penerbit khas Zuoyebang

Song Yang telah bekerja di Baidu selama 7 tahun dan terlibat dalam penyelidikan algoritma dan pembangunan. Menyertai Zuoyebang pada tahun 2015 sebagai ketua jabatan pejabat tengah pintar Beliau menyediakan keupayaan teknikal pejabat pertengahan termasuk perlombongan data, NLP, dan suara kepada pelbagai perniagaan syarikat. penilaian suara, penjadualan perkhidmatan pintar dan arahan lain.

2. Wang Qiangqiang, ketua pasukan teknologi pertuturan Zuoyebang

Sebelum menyertai Zuoyebang, Wang Qiangqiang bekerja di Jabatan Kejuruteraan Elektronik Universiti Tsinghua dalam Pemprosesan Pertuturan dan Jentera Makmal pintar bertanggungjawab untuk melaksanakan algoritma pengecaman pertuturan dan membina penyelesaian gred industri. Menyertai Zuoyebang pada tahun 2018 dan bertanggungjawab untuk penyelidikan dan pelaksanaan algoritma berkaitan pertuturan Beliau telah mengetuai pelaksanaan pengecaman pertuturan, penilaian, sintesis dan algoritma lain di Zuoyebang, menyediakan syarikat dengan set lengkap penyelesaian teknologi suara.

3 Zhang Jun, penyelidik algoritma pengecaman pertuturan di ByteDance AI Lab

Zhang Jun telah lama terlibat dalam penyelidikan dan aplikasi algoritma pertuturan seperti pengecaman pertuturan dan suara bangun, dan mempunyai pengalaman yang kaya. Pada 2018, beliau menyertai pasukan suara pintar ByteDance AI Lab dan kini bertanggungjawab terutamanya untuk pembinaan penyelesaian teknologi suara dalam bidang pejabat pintar, perkakasan pintar dan perkhidmatan pelanggan pintar.

4 Tan Xu, Penyelidik Utama di Microsoft Research Asia

Tan Xu, bidang penyelidikan termasuk pembelajaran mendalam, bahasa semula jadi/pertuturan/muzik, penjanaan kandungan AI, dsb. . Sistem terjemahan mesin dan sintesis pertuturan yang dibangunkan telah memenangi pelbagai kejohanan pertandingan dan mencapai tahap manusia dalam set penilaian akademik Kerja penyelidikan seperti model bahasa pra-latihan MASS, model sintesis pertuturan FastSpeech/NaturalSpeech, dan projek muzik AI Muzic telah mendapat perhatian yang meluas dalam. industri.

5. Liu Zhongliang, ketua algoritma pertuturan di SOUL

Liu Zhongliang lulus dari Sekolah Siswazah Akademi Sains China dengan ijazah sarjana sebagai ketua algoritma pertuturan di SOUL Beliau pernah bekerja di Jabatan Interaksi AI Sogou dan Jabatan Data Besar Momo. Dalam 10 tahun yang lalu, beliau terlibat terutamanya dalam penyelidikan dan pembangunan sistem teknologi pertuturan seperti bangun suara, pengecaman pertuturan, sintesis pertuturan dan pemahaman muzik audio Ia digunakan terutamanya dalam senario perniagaan interaksi suara dan pemahaman pertuturan seperti kaedah input, pembantu mudah alih, perkakasan pintar dan keselamatan suara Beliau komited untuk Mencipta teknologi suara terbaik yang boleh dilaksanakan.

6 Zhou Wei, ketua jabatan algoritma pertuturan dan arkitek algoritma 58.com AI Lab

Zhou Wei, ketua jabatan algoritma pertuturan dan algoritma bagi 58.com AI Lab Architect, bertanggungjawab untuk pengecaman pertuturan dan pembangunan algoritma sintesis pertuturan. Lulus dengan ijazah sarjana dari Akademi Sains Universiti Cina pada 2016. Selepas tamat pengajian, beliau mengambil bahagian dalam keusahawanan ke arah produk AI perbualan Pada Mei 2018, beliau menyertai 58.com dan telah mengambil bahagian dalam penyelidikan dan pembangunan NLP algoritma untuk projek AI seperti perkhidmatan pelanggan pintar, panggilan keluar pintar dan penulisan pintar Pada tahun 2019 Beliau mula menumpukan pada arah algoritma pertuturan dan mengetuai pasukan untuk membangunkan algoritma pertuturan secara bebas dalam enjin pemprosesan pertuturan 58 bandar dari 0 hingga. 1.

Apakah aktiviti menarik lain yang ada?

Selain perkongsian hebat inovasi praktikal oleh pakar teknologi AI yang hebat, Persidangan Teknologi Kecerdasan Buatan Global AISummit juga menyediakan pelbagai manfaat interaktif pra-tapak dan dalam-tapak untuk peserta. Sertai acara ini, luaskan keupayaan teknikal dan sumber rangkaian anda, dan bawa pulang hadiah kejutan pada masa yang sama!

Acara ini termasuk empat permainan interaktif yang menarik seperti "Jangan mengalah", "Bekerja dengan tuah", dan "Bijak dan berkongsi matlamat yang sama akan sentiasa ada hadiah menarik untuk mengejutkan anda". Kemudian, muktamad yang legenda dan misteri Apakah yang akan menjadi hadiah utama? Menunggu anda yang suka teknologi untuk datang dan mendedahkan rahsia di tapak! (PS: Saya mendengar bahawa lebih awal anda membuat temujanji untuk mendaftar, lebih tinggi peluang anda untuk memenangi hadiah!)

Siri semakin popular Apakah kejayaan yang akan ada dalam suara pintar pada masa hadapan?

Bagaimana untuk membuat temujanji dengan cepat?

Klik untuk memasuki ​​Persidangan Teknologi Kecerdasan Buatan Global AIsummit​​ tapak web rasmi, ikut arahan untuk mengisi sepenuhnya dan menyerahkan maklumat untuk melengkapkan pendaftaran.

Imbas kod QR untuk menyertai kumpulan rasmi persidangan, sertai loteri dan menangi hadiah menarik seperti pembesar suara SONY, Bingdundun dan buku teknologi AI, serta sampul merah.

Siri semakin popular Apakah kejayaan yang akan ada dalam suara pintar pada masa hadapan?

Siri semakin popular Apakah kejayaan yang akan ada dalam suara pintar pada masa hadapan?

Atas ialah kandungan terperinci Siri semakin "popular" Apakah kejayaan yang akan ada dalam suara pintar pada masa hadapan?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam