Rumah >Peranti teknologi >industri IT >Panggilan di lif dan ruang bawah tanah adalah lancar Tencent mengetuai generasi baharu pengekodan pertuturan masa nyata standard industri AVS3P10, yang akan dikeluarkan tidak lama lagi.
Menurut berita dari laman web ini pada 27 Jun, Tencent hari ini mengumumkan bahawa generasi baharu standard industri pengekodan pertuturan masa nyata AVS3P10 yang diterajui oleh syarikat itu telah dimuktamadkan dan akan dikeluarkan secara rasmi tidak lama lagi. Kali ini, kumpulan audio AVS AVS3P10 standard mengguna pakai penyelesaian Tencent dan berdasarkan Tencent Conference yang pertama dibangunkan sendiri codec suara rangkaian saraf enjin suara Penguins AI, yang boleh meningkatkan kualiti panggilan dalam persekitaran rangkaian yang lemah.
Tencent berkata bahawa ini adalah sistem pertama di dunia yang memperkenalkan kecerdasan buatan dan mencapai standard pengekodan pertuturan berkualiti tinggi pada kadar bit yang rendah, dan prestasinya telah mencapai standard bertaraf dunia. Dengan hanya 1/3 daripada kadar bit pengekodan, ia boleh mencapai kualiti bunyi yang jelas sama seperti piawaian arus perdana sedia ada. "Walaupun kad rangkaian adalah 2G, mesyuarat itu boleh diadakan dengan lancar."Standard ini telah dimulakan, dipromosikan dan dikekalkan oleh Tencent, dengan sumbangan bersama daripada berbilang ahli kumpulan audio AVS. "Pada masa hadapan, keperluan lebar jalur untuk senario audio masa nyata seperti mesyuarat dalam talian dan panggilan suara akan dikurangkan dengan banyaknya. Walaupun dalam persekitaran dengan rangkaian yang lemah seperti lif, ruang bawah tanah dan terowong, panggilan suara yang jelas dan lancar boleh dicapai."
Menurut laporan, dalam Dalam keadaan lebar jalur yang terhad, jika anda ingin menyampaikan bunyi berkualiti tinggi kepada penerima, teknologi pengekodan pertuturan yang memampatkan data asal dan mengalih keluar maklumat berlebihan adalah kuncinya. Walau bagaimanapun, berdasarkan piawaian codec audio arus perdana sedia ada seperti EVS dan OPUS, apabila kadar bit dikurangkan di bawah 10kbps, kualiti suara menurun dengan ketara, menjejaskan pengalaman pengguna.Untuk menangani cabaran ini, Tencent Conference Tianlai Lab dan Tencent AI Lab secara bebas membangunkan codec pertuturan rangkaian saraf pertama Tencent - Penguin.
Secara khusus, Penguin menyepadukan AI dengan teknologi tradisional, melanggar had prestasi undang-undang tradisional Shannon, memperkenalkan data besar dan menyediakan had atas prestasi baharu di bawah pertambahan kuasa pengkomputeran yang boleh dikawal, sekali gus memanfaatkan sistem komunikasi generasi akan datang, terutamanya Ia adalah pengekod sumber bahagian, yang menyediakan asas teknikal dan metodologi baharu. Melalui pemodelan isyarat pertuturan AI, pengekodan parameter ciri teras diekstrak, dan kemudian dengan bantuan rangkaian pembelajaran mendalam, struktur halus dalam pertuturan diramal dan dibina semula, dan akhirnya bentuk gelombang audio yang realistik dijana.
Berbilang ujian menunjukkan bahawa piawaian AVS3P10 yang dikemukakan oleh Tencent mencapai komunikasi suara berkualiti tinggi pada 6kbps Ia boleh mencapai panggilan yang jelas walaupun di bawah rangkaian "2G", dan kualiti subjektif adalah sangat hampir dengan isyarat rujukan asal, setanding dengan isyarat. standard OPUS arus perdana antarabangsa dalam kualiti 20kbps. Pada masa yang sama, apabila kualiti subjektif dibandingkan dengan pengekodan tradisional pada kadar bit sederhana dan tinggi, kecekapan pengekodan meningkat sebanyak 200-300%.
Mulai tahun 2021, pengekod audio Penguin telah dimasukkan ke dalam aplikasi berskala besar dalam mod pemanduan persidangan Tencent, mod rangkaian lemah dan panggilan suara QQ.
Pada Mac 2023, pasukan Tencent mencadangkan dan mengambil bahagian dalam penggubalan standard dalam kumpulan audio AVS, iaitu standard pengekodan pertuturan masa nyata AVS3P10. Selepas itu, Tencent menyerahkan teknologi calon berdasarkan Penguin ia diterima pakai selepas pengesahan silang oleh kumpulan audio AVS. Pada Jun 2024, piawaian pengekodan pertuturan masa nyata AVS3P10 secara rasmi menyelesaikan kerja penyeragaman dan memasuki peringkat pengumuman awam.
Nota dari laman web ini: Sejak penubuhan kumpulan kerja AVS di negara saya pada Jun 2002, selepas lebih sepuluh tahun usaha pasukan ribuan orang, AVS dengan hak harta intelek bebas di negara saya telah wujud. AVS3 ialah standard pengekodan video yang pertama dilancarkan di dunia untuk aplikasi industri 8K dan 5G.
AVS telah memulakan perumusan standard AVS4 dan menyeru unit ahli AVS untuk terus menyokong pembangunan piawaian generasi akan datang AVS Pelbagai pengeluar akan bergabung tenaga untuk melaksanakan piawaian teknikal secara bersama dan menggalakkan penggunaan global.
Atas ialah kandungan terperinci Panggilan di lif dan ruang bawah tanah adalah lancar Tencent mengetuai generasi baharu pengekodan pertuturan masa nyata standard industri AVS3P10, yang akan dikeluarkan tidak lama lagi.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!