Rumah > Artikel > Peranti teknologi > Bolehkah AI generatif panas menghidupkan semula pembesar suara pintar?
Produk seperti pembesar suara pintar, yang hampir dilupakan oleh sebilangan besar pengguna hari ini, telah lama tidak lagi menjadi tumpuan kebanyakan pengguna selepas mengalami "kegilaan" 2017 dan 2018. Hanya apabila semua orang berfikir bahawa pembesar suara pintar akan menjadi kilat dalam kuali, kemunculan ChatGPT nampaknya memberi penceramah pintar peluang kedua, dan juga memberikan industri yang semakin merosot ini peluang baharu. Jadi, bolehkah pembesar suara pintar dan AI generatif yang kini popular mencipta percikan api?
Bagi industri pembesar suara pintar, AI generatif mungkin seperti hujan selepas kemarau yang panjang. Menurut data tinjauan pasaran yang berkaitan, pada suku pertama 2023, disebabkan gabungan kesan faktor seperti kehomogenan produk yang teruk dan permintaan pengguna yang menurun, jualan runcit dalam talian yang dipantau bagi pembesar suara pintar domestik ialah 1.57 juta unit, satu lagi penurunan sebanyak 40.6% , manakala Sepanjang 2022, jualan omni-saluran domestik pembesar suara pintar ialah 26.31 juta unit, penurunan tahun ke tahun sebanyak 28%.
Mengapakah pembesar suara pintar, yang dahulunya sangat dinanti-nantikan oleh gergasi besar malah dianggap sebagai pintu masuk yang mungkin ke rumah pintar, tergelincir ke dalam jurang dalam beberapa tahun kebelakangan ini? Sebenarnya hanya ada satu sebab, dan itu ialah pembesar suara pintar sebenarnya tidak cukup pintar.
Pada tahun 2017, apabila konsep pembesar suara pintar sangat popular, terdapat perbincangan dalam industri sama ada tumpuan pembesar suara pintar harus "kecerdasan" atau "kualiti bunyi". Akhirnya, satu siri produk yang memfokuskan pada kualiti bunyi, seperti Tencent Listening dan Apple HomePod, menggunakan kegagalan tragis mereka untuk membuktikan bahawa titik jualan pembesar suara pintar hanya boleh menjadi kecerdasan.
Walau bagaimanapun, malangnya, tahap kecerdasan kebanyakan pembesar suara pintar hanya boleh digambarkan sebagai "diregangkan", manakala pengeluar utama mempunyai perhatian terhad kepada kecerdasan buatan dan kecerdasan buatan seperti ASR (pengecaman pertuturan), pemprosesan semantik semulajadi NLP dan jauh. -pickup bunyi medan Kemajuan teknologi akustik memang agak terlalu optimistik. Sebenarnya, pembesar suara pintar adalah sangat mudah dari perspektif teknikal mod kerjanya adalah untuk mengumpul suara pengguna, kemudian menghantar audio ke pelayan, kemudian mengira dan menghasilkan keputusan, dan akhirnya menghantar hasilnya kepada pembesar suara pintar untuk menghidupkan. ke dalam tingkah laku tertentu Contohnya, buka aplikasi atau balas soalan pengguna.
Ya, pembesar suara pintar itu sendiri tidak ada kaitan dengan kecerdasan buatan Identiti sebenar Xiaoai, Xiaodu dan Tmall Genie disembunyikan pada pelayan yang sepadan. Semua ini juga membawa kepada fakta bahawa kunci untuk menentukan pengalaman pembesar suara pintar ialah teknologi pikap bunyi medan jauh, iaitu keupayaan untuk menangkap arahan suara pengguna dengan tepat dalam persekitaran akustik yang kompleks Lagipun, pengguna tidak boleh mengatakan "beritahu jenaka" dan pembesar suara pintar mendengar Mari kita panggil ia "memainkan lagu".
Penyelesaian untuk pembesar suara pintar ialah menggunakan susunan mikrofon berskala besar untuk mengumpul bunyi, tetapi terdapat satu titik kesakitan yang belum diselesaikan, iaitu bangun suara (penglihatan kata kunci). Apabila anda menggunakan pembesar suara pintar, anda perlu menggunakan perkataan bangun tidur seperti "Hai, Siri", "Rakan Sekelas Xiao Ai" dan "Xiaodu Xiaodu" untuk memberitahu pembesar suara pintar itu bahawa anda sedang bercakap dengannya, yang bermaksud pintar itu pembesar suara Pembesar suara tidak mempunyai keupayaan untuk berkhidmat secara aktif. Lebih penting lagi, disebabkan oleh keterbatasan teknikal, pembesar suara pintar telah lama dapat memahami hanya arahan mudah, seperti "besarkan/turunkan kelantangan", "mainkan lagu fulan dengan fulan", dan lebih kompleks. arahan. Pengecaman ayat selalunya sukar.
Kepentingan AI generatif seperti ChatGPT dan Wen Xinyiyan kepada pembesar suara pintar ialah yang pertama boleh membantu pembesar suara pintar memahami ayat yang lebih kompleks dan menyediakan komunikasi yang lebih semula jadi. Saya percaya rakan-rakan yang telah menggunakan Microsoft Bing Chat, Baidu Wenxinyiyan atau ChatGPT harus tahu bahawa apabila bercakap dengan jenis AI generatif ini, tidak perlu menggunakan pernyataan pembukaan seperti "Hai, ChatGPT", anda boleh mula dengan menaip terus kandungan proses perbualan.
Oleh kerana AI generatif adalah berdasarkan model bahasa berskala besar (LLM, Model Bahasa Besar), ia menambahkan data anotasi manual dan teknologi pembelajaran pengukuhan daripada maklum balas manusia, dan ditambah dengan teknologi graf pengetahuan, yang merupakan pengetahuan Penulisan kepada pelbagai -gambar rajah perhubungan tripel berstruktur (termasuk entiti, konsep dan perhubungan) membolehkan AI memahami maksud arahan manusia dan akhirnya memilih kandungan daripada pangkalan data maklumat yang besar untuk dijawab.
Perubahan terbesar dalam produk seperti ChatGPT berbanding Siri dan Xiaoai ialah keupayaan untuk mengadakan berbilang pusingan perbualan. Berbanding dengan Siri, yang hampir seperti "memori ikan", ChatGPT sentiasa boleh bercakap dengan pengguna Ditambah dengan persepsi emosi yang lebih jelas, pengguna merasakan bahawa mereka benar-benar bercakap dengan orang yang hidup. Untuk produk pengguna, pengguna jelas tidak mengambil berat betapa majunya prinsip teknikal di sebaliknya, tetapi fokus pada sama ada ia boleh menyelesaikan masalah atau memenuhi keperluan.
Pesona AI generatif terletak pada had atas keupayaannya yang tinggi. Contoh biasa ialah Microsoft Copilot Pada masa yang sama, ia juga boleh memenuhi keperluan sosial pengguna pada tahap tertentu Kini terdapat pencipta di luar negara , melancarkan "sahabat maya" yang dimodelkan mengikut dirinya dan memperoleh lebih daripada 1,000 pengguna. Secara umum, menggabungkan AI generatif dengan pembesar suara pintar hampir boleh menampung kekurangan yang terakhir, memberikannya tahap kecerdasan yang boleh digunakan dalam pasaran pengguna.
Malah, beberapa pengeluar pembesar suara pintar telah pun mengambil tindakan. Sebagai contoh, pada Februari tahun ini, semasa Baidu memanaskan badan Wen Xin Yi Yan, Xiaodu telah mengumumkan bahawa ia akan menyepadukan Wen Xin Yi Yan untuk mencipta model AI "Xiaodu Lingji" untuk senario peranti pintar pada bulan April, Tmall Genie mengakses "Niaodu" "Penggantian mulut AI" yang dicipta oleh model "burung membahagikan burung" juga mengumumkan aksesnya kepada Tongyi Qianwen Alibaba.
Walau bagaimanapun, perlu ditegaskan bahawa AI generatif bukanlah "penawar". Buat masa ini, semua AI generatif menghadapi masalah yang tidak dapat dielakkan, iaitu kekurangan sumber pengkomputeran. Berita baru-baru ini bahawa siling AI generatif GPT-4 telah menjadi bodoh telah menarik banyak perhatian Berbanding dengan negeri ketika ia pertama kali dikeluarkan, ia telah menjadi konsensus di kalangan pengguna bahawa kualiti kod teks GPT-4 telah merosot. semua aspek.
Ya, sebenarnya, bukan sahaja GPT-4, tetapi juga produk yang dihadapi oleh orang ramai seperti ChatGPT dan Wenxinyiyan telah mengalami situasi yang sama Peningkatan bilangan pengguna telah menyebabkan penurunan dalam prestasi model besar.
Masalah teras yang dihadapi dalam bidang AI generatif sekarang ialah sumber pengkomputeran yang ketat dan tidak dapat menampung kemasukan pengguna Bagi memastikan pengalaman pengguna, produk tersebut hanya dapat mengurangkan prestasi model besar dan mengurangkan masa untuk menjana kandungan Untuk "mengurangkan beban" pada pelayan. Sebagai perbandingan, saiz pasaran sedia ada pembesar suara pintar sudah pasti lebih besar, jadi selepas mengakses AI generatif, hampir tidak dapat dielakkan untuk menghadapi masalah yang sama.
Apa yang mungkin berlaku pada masa hadapan ialah tahap kecerdasan pembesar suara pintar akan menunjukkan parabola Pengalaman pengguna awal akan meningkat dengan pesat, tetapi apabila bilangan pengguna terus meningkat, prestasi pintar mungkin ". merendahkan" Kembali ke tahap beberapa tahun lalu.
Atas ialah kandungan terperinci Bolehkah AI generatif panas menghidupkan semula pembesar suara pintar?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!