Bolehkah AI generatif panas menghidupkan semula pembesar suara pintar?
Produk seperti pembesar suara pintar, yang hampir dilupakan oleh sebilangan besar pengguna hari ini, telah lama tidak lagi menjadi tumpuan kebanyakan pengguna selepas mengalami "kegilaan" 2017 dan 2018. Hanya apabila semua orang berfikir bahawa pembesar suara pintar akan menjadi kilat dalam kuali, kemunculan ChatGPT nampaknya memberi penceramah pintar peluang kedua, dan juga memberikan industri yang semakin merosot ini peluang baharu. Jadi, bolehkah pembesar suara pintar dan AI generatif yang kini popular mencipta percikan api?
Bagi industri pembesar suara pintar, AI generatif mungkin seperti hujan selepas kemarau yang panjang. Menurut data tinjauan pasaran yang berkaitan, pada suku pertama 2023, disebabkan gabungan kesan faktor seperti kehomogenan produk yang teruk dan permintaan pengguna yang menurun, jualan runcit dalam talian yang dipantau bagi pembesar suara pintar domestik ialah 1.57 juta unit, satu lagi penurunan sebanyak 40.6% , manakala Sepanjang 2022, jualan omni-saluran domestik pembesar suara pintar ialah 26.31 juta unit, penurunan tahun ke tahun sebanyak 28%.
Mengapakah pembesar suara pintar, yang dahulunya sangat dinanti-nantikan oleh gergasi besar malah dianggap sebagai pintu masuk yang mungkin ke rumah pintar, tergelincir ke dalam jurang dalam beberapa tahun kebelakangan ini? Sebenarnya hanya ada satu sebab, dan itu ialah pembesar suara pintar sebenarnya tidak cukup pintar.
Pada tahun 2017, apabila konsep pembesar suara pintar sangat popular, terdapat perbincangan dalam industri sama ada tumpuan pembesar suara pintar harus "kecerdasan" atau "kualiti bunyi". Akhirnya, satu siri produk yang memfokuskan pada kualiti bunyi, seperti Tencent Listening dan Apple HomePod, menggunakan kegagalan tragis mereka untuk membuktikan bahawa titik jualan pembesar suara pintar hanya boleh menjadi kecerdasan.
Walau bagaimanapun, malangnya, tahap kecerdasan kebanyakan pembesar suara pintar hanya boleh digambarkan sebagai "diregangkan", manakala pengeluar utama mempunyai perhatian terhad kepada kecerdasan buatan dan kecerdasan buatan seperti ASR (pengecaman pertuturan), pemprosesan semantik semulajadi NLP dan jauh. -pickup bunyi medan Kemajuan teknologi akustik memang agak terlalu optimistik. Sebenarnya, pembesar suara pintar adalah sangat mudah dari perspektif teknikal mod kerjanya adalah untuk mengumpul suara pengguna, kemudian menghantar audio ke pelayan, kemudian mengira dan menghasilkan keputusan, dan akhirnya menghantar hasilnya kepada pembesar suara pintar untuk menghidupkan. ke dalam tingkah laku tertentu Contohnya, buka aplikasi atau balas soalan pengguna.
Ya, pembesar suara pintar itu sendiri tidak ada kaitan dengan kecerdasan buatan Identiti sebenar Xiaoai, Xiaodu dan Tmall Genie disembunyikan pada pelayan yang sepadan. Semua ini juga membawa kepada fakta bahawa kunci untuk menentukan pengalaman pembesar suara pintar ialah teknologi pikap bunyi medan jauh, iaitu keupayaan untuk menangkap arahan suara pengguna dengan tepat dalam persekitaran akustik yang kompleks Lagipun, pengguna tidak boleh mengatakan "beritahu jenaka" dan pembesar suara pintar mendengar Mari kita panggil ia "memainkan lagu".
Penyelesaian untuk pembesar suara pintar ialah menggunakan susunan mikrofon berskala besar untuk mengumpul bunyi, tetapi terdapat satu titik kesakitan yang belum diselesaikan, iaitu bangun suara (penglihatan kata kunci). Apabila anda menggunakan pembesar suara pintar, anda perlu menggunakan perkataan bangun tidur seperti "Hai, Siri", "Rakan Sekelas Xiao Ai" dan "Xiaodu Xiaodu" untuk memberitahu pembesar suara pintar itu bahawa anda sedang bercakap dengannya, yang bermaksud pintar itu pembesar suara Pembesar suara tidak mempunyai keupayaan untuk berkhidmat secara aktif. Lebih penting lagi, disebabkan oleh keterbatasan teknikal, pembesar suara pintar telah lama dapat memahami hanya arahan mudah, seperti "besarkan/turunkan kelantangan", "mainkan lagu fulan dengan fulan", dan lebih kompleks. arahan. Pengecaman ayat selalunya sukar.
Kepentingan AI generatif seperti ChatGPT dan Wen Xinyiyan kepada pembesar suara pintar ialah yang pertama boleh membantu pembesar suara pintar memahami ayat yang lebih kompleks dan menyediakan komunikasi yang lebih semula jadi. Saya percaya rakan-rakan yang telah menggunakan Microsoft Bing Chat, Baidu Wenxinyiyan atau ChatGPT harus tahu bahawa apabila bercakap dengan jenis AI generatif ini, tidak perlu menggunakan pernyataan pembukaan seperti "Hai, ChatGPT", anda boleh mula dengan menaip terus kandungan proses perbualan.
Oleh kerana AI generatif adalah berdasarkan model bahasa berskala besar (LLM, Model Bahasa Besar), ia menambahkan data anotasi manual dan teknologi pembelajaran pengukuhan daripada maklum balas manusia, dan ditambah dengan teknologi graf pengetahuan, yang merupakan pengetahuan Penulisan kepada pelbagai -gambar rajah perhubungan tripel berstruktur (termasuk entiti, konsep dan perhubungan) membolehkan AI memahami maksud arahan manusia dan akhirnya memilih kandungan daripada pangkalan data maklumat yang besar untuk dijawab.
Perubahan terbesar dalam produk seperti ChatGPT berbanding Siri dan Xiaoai ialah keupayaan untuk mengadakan berbilang pusingan perbualan. Berbanding dengan Siri, yang hampir seperti "memori ikan", ChatGPT sentiasa boleh bercakap dengan pengguna Ditambah dengan persepsi emosi yang lebih jelas, pengguna merasakan bahawa mereka benar-benar bercakap dengan orang yang hidup. Untuk produk pengguna, pengguna jelas tidak mengambil berat betapa majunya prinsip teknikal di sebaliknya, tetapi fokus pada sama ada ia boleh menyelesaikan masalah atau memenuhi keperluan.
Pesona AI generatif terletak pada had atas keupayaannya yang tinggi. Contoh biasa ialah Microsoft Copilot Pada masa yang sama, ia juga boleh memenuhi keperluan sosial pengguna pada tahap tertentu Kini terdapat pencipta di luar negara , melancarkan "sahabat maya" yang dimodelkan mengikut dirinya dan memperoleh lebih daripada 1,000 pengguna. Secara umum, menggabungkan AI generatif dengan pembesar suara pintar hampir boleh menampung kekurangan yang terakhir, memberikannya tahap kecerdasan yang boleh digunakan dalam pasaran pengguna.
Malah, beberapa pengeluar pembesar suara pintar telah pun mengambil tindakan. Sebagai contoh, pada Februari tahun ini, semasa Baidu memanaskan badan Wen Xin Yi Yan, Xiaodu telah mengumumkan bahawa ia akan menyepadukan Wen Xin Yi Yan untuk mencipta model AI "Xiaodu Lingji" untuk senario peranti pintar pada bulan April, Tmall Genie mengakses "Niaodu" "Penggantian mulut AI" yang dicipta oleh model "burung membahagikan burung" juga mengumumkan aksesnya kepada Tongyi Qianwen Alibaba.
Walau bagaimanapun, perlu ditegaskan bahawa AI generatif bukanlah "penawar". Buat masa ini, semua AI generatif menghadapi masalah yang tidak dapat dielakkan, iaitu kekurangan sumber pengkomputeran. Berita baru-baru ini bahawa siling AI generatif GPT-4 telah menjadi bodoh telah menarik banyak perhatian Berbanding dengan negeri ketika ia pertama kali dikeluarkan, ia telah menjadi konsensus di kalangan pengguna bahawa kualiti kod teks GPT-4 telah merosot. semua aspek.
Ya, sebenarnya, bukan sahaja GPT-4, tetapi juga produk yang dihadapi oleh orang ramai seperti ChatGPT dan Wenxinyiyan telah mengalami situasi yang sama Peningkatan bilangan pengguna telah menyebabkan penurunan dalam prestasi model besar.
Masalah teras yang dihadapi dalam bidang AI generatif sekarang ialah sumber pengkomputeran yang ketat dan tidak dapat menampung kemasukan pengguna Bagi memastikan pengalaman pengguna, produk tersebut hanya dapat mengurangkan prestasi model besar dan mengurangkan masa untuk menjana kandungan Untuk "mengurangkan beban" pada pelayan. Sebagai perbandingan, saiz pasaran sedia ada pembesar suara pintar sudah pasti lebih besar, jadi selepas mengakses AI generatif, hampir tidak dapat dielakkan untuk menghadapi masalah yang sama.
Apa yang mungkin berlaku pada masa hadapan ialah tahap kecerdasan pembesar suara pintar akan menunjukkan parabola Pengalaman pengguna awal akan meningkat dengan pesat, tetapi apabila bilangan pengguna terus meningkat, prestasi pintar mungkin ". merendahkan" Kembali ke tahap beberapa tahun lalu.
Atas ialah kandungan terperinci Bolehkah AI generatif panas menghidupkan semula pembesar suara pintar?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Permainan Upheaval: Merevolusi Pembangunan Permainan Dengan Ejen AI Upheaval, sebuah studio pembangunan permainan yang terdiri daripada veteran dari gergasi industri seperti Blizzard dan Obsidian, bersedia untuk merevolusikan penciptaan permainan dengan platfor AI yang inovatif

Strategi Robotaxi Uber: ekosistem perjalanan untuk kenderaan autonomi Pada persidangan Curbivore baru-baru ini, Uber's Richard Willder melancarkan strategi mereka untuk menjadi platform perjalanan untuk penyedia Robotaxi. Memanfaatkan kedudukan dominan mereka di

Permainan video terbukti menjadi alasan ujian yang tidak ternilai untuk penyelidikan AI canggih, terutamanya dalam pembangunan agen autonomi dan robot dunia nyata, malah berpotensi menyumbang kepada pencarian kecerdasan umum buatan (AGI). A

Kesan landskap modal teroka yang berkembang jelas dalam media, laporan kewangan, dan perbualan setiap hari. Walau bagaimanapun, akibat khusus untuk pelabur, permulaan, dan dana sering diabaikan. Venture Capital 3.0: Paradigma

Adobe Max London 2025 menyampaikan kemas kini penting kepada Awan Kreatif dan Firefly, mencerminkan peralihan strategik ke arah aksesibiliti dan AI generatif. Analisis ini menggabungkan pandangan dari taklimat pra-peristiwa dengan kepimpinan Adobe. (Nota: Adob

Pengumuman Llamacon Meta mempamerkan strategi AI yang komprehensif yang direka untuk bersaing secara langsung dengan sistem AI yang tertutup seperti OpenAI, sementara pada masa yang sama mencipta aliran pendapatan baru untuk model sumber terbuka. Pendekatan beragam ini mensasarkan bo

Terdapat perbezaan yang serius dalam bidang kecerdasan buatan pada kesimpulan ini. Ada yang menegaskan bahawa sudah tiba masanya untuk mendedahkan "pakaian baru Maharaja", sementara yang lain menentang idea bahawa kecerdasan buatan hanyalah teknologi biasa. Mari kita bincangkannya. Analisis terobosan AI yang inovatif ini adalah sebahagian daripada lajur Forbes yang berterusan yang meliputi kemajuan terkini dalam bidang AI, termasuk mengenal pasti dan menjelaskan pelbagai kerumitan AI yang berpengaruh (klik di sini untuk melihat pautan). Kecerdasan Buatan sebagai Teknologi Biasa Pertama, beberapa pengetahuan asas diperlukan untuk meletakkan asas untuk perbincangan penting ini. Pada masa ini terdapat banyak penyelidikan yang didedikasikan untuk terus membangunkan kecerdasan buatan. Matlamat keseluruhan adalah untuk mencapai kecerdasan umum buatan (AGI) dan juga kecerdasan super buatan (AS)

Keberkesanan model AI syarikat kini merupakan penunjuk prestasi utama. Sejak ledakan AI, AI generatif telah digunakan untuk segala -galanya daripada menyusun jemputan ulang tahun untuk menulis kod perisian. Ini telah membawa kepada percambahan mod bahasa


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Versi Mac WebStorm
Alat pembangunan JavaScript yang berguna

SublimeText3 versi Inggeris
Disyorkan: Versi Win, menyokong gesaan kod!

EditPlus versi Cina retak
Saiz kecil, penyerlahan sintaks, tidak menyokong fungsi gesaan kod

ZendStudio 13.5.1 Mac
Persekitaran pembangunan bersepadu PHP yang berkuasa

Muat turun versi mac editor Atom
Editor sumber terbuka yang paling popular
