Rumah > Artikel > Peranti teknologi > [Asal] Gunakan model besar untuk mencatat nota secara automatik, mengekstrak PPT dan mengatur wawancara produk AI baharu Alibaba Cloud "Tongyi Listening" dibuka untuk ujian awam
Baca wartawan Chuang/Shenzhen Business Daily Chen Shu
Pada 1 Jun, Alibaba Cloud mengumumkan kemajuan model berskala besar Tongyi Produk AI baharu "Tongyi Listening" yang memfokus pada kandungan audio dan video telah dilancarkan secara rasmi, menjadi produk aplikasi model berskala besar yang pertama di China terbuka. kepada ujian awam.
Tongyi Tingwu disambungkan kepada keupayaan pemahaman dan ringkasan model besar Tongyi Qianwen, dan boleh menjadi pembantu AI yang berkuasa untuk pengguna dalam kerja dan belajar, membantu menyelesaikan transkripsi, mendapatkan semula, meringkas dan meringkaskan kandungan audio dan video dengan cekap pada bila-bila masa dan di mana-mana sahaja, seperti menggunakan model besar untuk mengambil nota secara automatik, menganjurkan temu duga, mengekstrak PPT, dsb. Semasa tempoh beta awam, pengguna boleh menerima masa transkripsi percuma selama lebih daripada 100 jam pemahaman mendengar.
"Dengan cara yang berbeza, audio dan video boleh dibaca dengan mudah, disusun dan dikongsi." CTO Awan Alibaba Zhou Jingren memperkenalkan bahawa Tingwu ialah pembantu AI kajian kerja yang menyasarkan senario kandungan audio dan video dengan nilai tambah pengetahuan yang tinggi . , seperti mesyuarat, kelas, temu bual, latihan, temu bual, siaran langsung, menonton video, mendengar podcast, dsb., boleh memperhalusi dan mempercepatkan pengetahuan dengan cepat melalui teknologi AI terkini seperti model besar.
[caption id="attachment_3846381" align="alignnone" width="1000"]
Mendengar Tongyi boleh menjana abstrak teks penuh, ringkasan bab dan ringkasan pertuturan secara automatik untuk audio dan video[/caption]
Tingwu menunjukkan demonstrasi langsung, yang merangkumi lebih daripada sepuluh fungsi kecerdasan buatan, yang boleh meningkatkan kecekapan pemindahan pengetahuan secara menyeluruh daripada audio dan video kepada grafik dan teks. Selain "pendengaran yang baik", ia boleh menjana rekod mesyuarat dengan ketepatan yang tinggi dan membezakan pembesar suara yang berbeza ini juga "sangat perseptif". teks penuh setiap penceramah Sudut pandangan, organisasi fokus dan perkara yang perlu dilakukan. Model besar akan dilancarkan dalam masa terdekat, termasuk fungsi seperti pengekstrakan satu klik PPT, AI menyoal pelbagai kandungan audio dan video, dan meringkaskan perenggan tertentu.
[caption id="attachment_3846394" align="alignnone" width="736"]
Pemalam Tongyi Tingwu Chrome akan tersedia untuk dimuat turun kepada semua pengguna dalam masa terdekat[/caption]
Untuk beberapa senario khusus, Listening juga telah menyediakan banyak "fungsi harta karun": buka pemalam Chrome, pelajar bahasa asing dan orang bermasalah pendengaran boleh menggunakan bar sari kata terapung dwibahasa untuk menonton video tanpa sari kata pada bila-bila masa dan Apabila jadual bercanggah, dengarkan Wu juga boleh menjadi "meeting stand-in" untuk profesional AI boleh merakam mesyuarat dan menyusun perkara penting apabila memasuki mesyuarat secara bisu untuk memudahkan pasca produksi video untuk pengamal media baharu Kajian semula Soal Jawab yang dianjurkan oleh Wu Ia membolehkan wartawan, penganalisis, peguam, HR dan kumpulan lain mengatur temu bual dengan lebih cekap.
Tingwu disambungkan dengan Cakera Awan Alibaba, dan kandungan audio dan video pada cakera awan boleh ditranskripsi dengan satu klik Pengguna Tingwu yang mendaftar semasa tempoh beta awam juga akan menerima ruang storan Cakera Awan Alibaba yang lebih besar, dan boleh berada dalam talian dalam cakera awan juga boleh dihasilkan secara automatik apabila memainkan video.
Zhou Jingren memperkenalkan bahawa Tingwu mengintegrasikan teknologi suara dan bahasa Alibaba yang paling canggih. Ia mempunyai model pengecaman pertuturan kelas industri generasi baharu Alibaba terbina dalam, dan ketepatan pengecaman menduduki tempat pertama dalam berbilang set data Cina yang berwibawa ia menyepadukan algoritma pembesar suara semantik pertuturan yang dibangunkan sendiri, dan boleh membezakan peranan dalam adegan di mana lebih banyak; daripada 10 orang bercakap; Selepas mengakses model besar Tongyi Qianwen, ia boleh meringkaskan puluhan ribu perkataan kandungan audio dan video, memimpin negara dalam ketepatan fakta dan kesempurnaan perkara utama, dan menyokong pemahaman soalan dan jawapan yang tepat merentas pelbagai audio dan kandungan video.
Pengulas: Tan Lugang
Atas ialah kandungan terperinci [Asal] Gunakan model besar untuk mencatat nota secara automatik, mengekstrak PPT dan mengatur wawancara produk AI baharu Alibaba Cloud "Tongyi Listening" dibuka untuk ujian awam. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!