注目の生成 AI はスマートスピーカーを復活させることができるでしょうか?-AI-php.cn

ホームページ

テクノロジー周辺機器

注目の生成 AI はスマートスピーカーを復活させることができるでしょうか?

王林

Jun 06, 2023 am 08:05 AM

生成AIスマートスピーカー爆発。

スマートスピーカーなどの製品は、多くの消費者からほとんど忘れ去られていますが、2017 年と 2018 年の「狂気」を経験してからは、ほとんどの消費者の注目を集めなくなって久しいです。スマートスピーカーは一瞬だろうと誰もが思っていたとき、ChatGPT の登場はスマートスピーカーに二度目のチャンスを与え、またこの衰退する業界に新たなチャンスを与えたかに見えました。では、スマートスピーカーと今人気の生成 AI は火花を散らすことができるのでしょうか?

注目の生成 AI はスマートスピーカーを復活させることができるでしょうか?

スマートスピーカー業界にとって、生成 AI は長い干ばつの後の雨のようなものかもしれません。関連する市場調査データによると、2023年第1四半期には、製品の均一性の厳しさや消費者需要の低下などの要因が重なり、国内のスマートスピーカーのオンライン監視型小売売上高は157万台となり、さらに40.6％減少した。 , 一方、2022年を通じて、スマートスピーカーの国内オムニチャネル販売台数は2,631万台で、前年比28％減少した。

かつて大手各社から大きな期待を寄せられ、スマートホームの入り口とも目されていたスマートスピーカーが、なぜ近年奈落の底に落ちてしまったのでしょうか?理由は実は 1 つだけです。それは、スマートスピーカーが実際には十分にスマートではないということです。

スマートスピーカーの概念が盛り上がっていた2017年、業界ではスマートスピーカーの焦点を「知能」にするか「音質」にするかという議論がありました。結局、Tencent Listening や Apple HomePod など、音質に重点を置いた一連の製品は、その悲劇的な失敗を利用して、スマートスピーカーのセールスポイントはインテリジェンスのみであることを証明しました。

注目の生成 AI はスマートスピーカーを復活させることができるでしょうか?

しかし、残念ながら、ほとんどのスマートスピーカーの知能レベルは「拡張されている」としか言いようがありません。しかし、大手メーカーは、ASR (音声認識)、NLP 自然意味処理、人工知能などの人工知能や人工知能に限定的に注目しています。遠方音場集音音響技術の進歩は、確かに少々楽観的すぎます。実際、スマートスピーカーは技術的な観点から見ると非常にシンプルであり、その動作モードは、ユーザーの音声を収集し、サーバーに音声を送信し、計算して結果を生成し、最後に結果をスマートスピーカーに送信して回転させることです。たとえば、アプリケーションを開いたり、ユーザーの質問に答えたりするなど、特定の動作に変換します。

はい、スマートスピーカー自体は人工知能とは何の関係もありません。Xiaoai、Xiaodu、Tmall Elf の本体は対応するサーバーに隠されています。これらすべては、スマートスピーカーのエクスペリエンスを決定する鍵は、複雑な音響環境においてユーザーの音声コマンドを正確に捕捉する能力である遠距離音収音技術であるという事実にもつながります。「冗談」とスマートスピーカーが聞きます。これを「曲の再生」と呼びましょう。

注目の生成 AI はスマートスピーカーを復活させることができるでしょうか?

スマートスピーカーの解決策は、大規模なマイクアレイを使用して音を収集することですが、まだ解決されていない問題点が 1 つあります。それは、音声ウェイクアップ (キーワードスポッティング) です。スマートスピーカーを使用する場合は、「Hi, Siri」、「Xiao Ai Classmate」、「Xiaodu Xiaodu」などのウェイクアップワードを使用して、あなたが話していることをスマートスピーカーに知らせる必要があります。スピーカースピーカーには積極的に奉仕する能力がありません。さらに重要なことは、技術的な制限により、スマートスピーカーは長い間、「音量を上げる/下げる」、「誰々の曲を誰々で再生する」などの単純な指示しか理解できず、さらに複雑な指示しか理解できませんでした。文章の認識は難しいことがよくあります。

ChatGPT や Wen Xinyiyan などの生成 AI がスマートスピーカーにとって重要なのは、前者がスマートスピーカーがより複雑な文章を理解し、より自然なコミュニケーションを提供できるようになることです。 Microsoft Bing Chat、Baidu Wenxinyiyan、または ChatGPT を使用したことのある友人なら、このタイプの生成 AI と話すときに、「こんにちは、ChatGPT」などの冒頭の文を使用する必要はなく、直接入力することで開始できることを知っているはずだと思います。コンテンツ、対話プロセス。

注目の生成 AI はスマートスピーカーを復活させることができるでしょうか?

生成 AI は大規模言語モデル (LLM、Large Language Model) に基づいているため、手動の注釈データと人間のフィードバックによる強化学習技術が追加され、知識を複数の言語に書き込むナレッジグラフ技術によって補完されます。 - 構造化されたトリプル (エンティティ、概念、関係を含む) の関係図により、AI は人間の指示の意味を理解し、最終的には巨大な情報データベースから回答するコンテンツを選択できるようになります。

Siri や Xiaoai と比較した ChatGPT のような製品の最大の変更点は、複数ラウンドの会話ができることです。「魚の記憶」に近い Siri に比べ、ChatGPT は常にユーザーと会話することができ、より明確な感情認識と相まって、ユーザーは本当に生きている人間と話しているように感じます。消費者向け製品の場合、ユーザーは明らかに、その背後にある技術原則がどれほど進んでいるかではなく、問題を解決できるか、ニーズを満たせるかどうかを気にします。

注目の生成 AI はスマートスピーカーを復活させることができるでしょうか?

生成AIの魅力は能力の上限の高さにあり、その代表例がMicrosoft Copilotであると同時に、ユーザーの社会的なニーズにもある程度応えることができる、今では海外でもChatGPTを使っているクリエイターがいるは、自身をモデルにした「バーチャルコンパニオン」を立ち上げ、1,000人以上のユーザーを獲得した。一般に、生成 AI とスマートスピーカーを組み合わせることで、後者の欠点をほぼ補うことができ、消費者市場で使用できるレベルのインテリジェンスを実現できます。

実際、一部のスマートスピーカーメーカーはすでに行動を起こしています。たとえば、今年2月にBaiduがWen Xin Yi Yanを準備していたとき、XiaoduはWen Xin Yi Yanを統合してスマートデバイスシナリオ向けのAIモデル「Xiaodu Lingji」を作成するとすでに発表しており、4月にはTmallがGenieが「Niaodu」にアクセス「鳥が鳥を分ける」モデルによって作成された「AI口置換」も、アリババのTongyi Qianwenへのアクセスを発表した。

注目の生成 AI はスマートスピーカーを復活させることができるでしょうか?

しかし、生成 AI は「万能薬」ではないことを指摘する必要があります。今のところ、すべての生成 AI はコンピューティングリソースの不足という避けられない問題に直面しています。最近、生成AIの上限であるGPT-4がバカになったというニュースが注目を集めていますが、リリース当初に比べてGPT-4のテキストコードの品質が低下しているというのがユーザーの共通認識となっています。すべての側面。

はい、実は GPT-4 だけでなく、ChatGPT や Wenxinyiyan などの一般向け製品でも同様の状況が発生しており、ユーザー数の増加により大型モデルのパフォーマンスが低下しています。

現在、生成 AI の分野が直面している中心的な問題は、コンピューティングリソースが不足しており、ユーザーの流入に対応できないことです。ユーザーエクスペリエンスを確保するために、このような製品では大規模モデルのパフォーマンスを低下させ、時間を短縮することしかできません。コンテンツを生成するため、サーバーの「負荷を軽減する」ため。それに比べて、スマートスピーカーの既存の市場規模は間違いなく大きいため、生成 AI にアクセスした後は、同様の問題に遭遇するのはほぼ避けられません。

注目の生成 AI はスマートスピーカーを復活させることができるでしょうか?

将来起こる可能性があるのは、スマートスピーカーの知能レベルが放物線を描くことです。初期のユーザーエクスペリエンスは飛躍的に向上しますが、ユーザー数が増加し続けるにつれて、知能のパフォーマンスも低下する可能性があります。劣化」数年前のレベルに戻りました。

以上が注目の生成 AI はスマートスピーカーを復活させることができるでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は搜狐で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

Microsoft Work Trend Index 2025は、職場の容量の緊張を示していますApr 24, 2025 am 11:19 AM

AIの急速な統合により悪化した職場での急成長能力の危機は、増分調整を超えて戦略的な変化を要求します。これは、WTIの調査結果によって強調されています。従業員の68％がワークロードに苦労しており、BURにつながります

AIは理解できますか？中国の部屋の議論はノーと言っていますが、それは正しいですか？Apr 24, 2025 am 11:18 AM

ジョン・サールの中国の部屋の議論：AIの理解への挑戦 Searleの思考実験は、人工知能が真に言語を理解できるのか、それとも真の意識を持っているのかを直接疑問に思っています。チャインを無知な人を想像してください

中国の「スマート」AIアシスタントは、マイクロソフトのリコールのプライバシーの欠陥をエコーしますApr 24, 2025 am 11:17 AM

中国のハイテク大手は、西部のカウンターパートと比較して、AI開発の別のコースを図っています。技術的なベンチマークとAPI統合のみに焦点を当てるのではなく、「スクリーン認識」AIアシスタントを優先しています。

Dockerは、おなじみのコンテナワークフローをAIモデルとMCPツールにもたらしますApr 24, 2025 am 11:16 AM

MCP：AIシステムに外部ツールにアクセスできるようになりますモデルコンテキストプロトコル（MCP）により、AIアプリケーションは標準化されたインターフェイスを介して外部ツールとデータソースと対話できます。人類によって開発され、主要なAIプロバイダーによってサポートされているMCPは、言語モデルとエージェントが利用可能なツールを発見し、適切なパラメーターでそれらを呼び出すことができます。ただし、環境紛争、セキュリティの脆弱性、一貫性のないクロスプラットフォーム動作など、MCPサーバーの実装にはいくつかの課題があります。 Forbesの記事「人類のモデルコンテキストプロトコルは、AIエージェントの開発における大きなステップです」著者：Janakiram MSVDockerは、コンテナ化を通じてこれらの問題を解決します。 Docker Hubインフラストラクチャに基づいて構築されたドキュメント

6億ドルのスタートアップを構築するために6つのAIストリートスマート戦略を使用するApr 24, 2025 am 11:15 AM

最先端のテクノロジーと巧妙なビジネスの洞察力を活用して、コントロールを維持しながら非常に収益性の高いスケーラブルな企業を作成する先見の明のある起業家によって採用された6つの戦略。このガイドは、建設を目指している起業家向けのためのものです

Googleフォトの更新は、すべての写真の見事なウルトラHDRのロックを解除しますApr 24, 2025 am 11:14 AM

Google Photosの新しいウルトラHDRツール：画像強化のゲームチェンジャー Google Photosは、強力なウルトラHDR変換ツールを導入し、標準的な写真を活気のある高ダイナミックレンジ画像に変換しました。この強化は写真家に利益をもたらします

Descopeは、AIエージェント統合の認証フレームワークを構築しますApr 24, 2025 am 11:13 AM

技術アーキテクチャは、新たな認証の課題を解決しますエージェントアイデンティティハブは、AIエージェントの実装を開始した後にのみ多くの組織が発見した問題に取り組んでいます。

Google Cloud Next2025と現代の仕事の接続された未来Apr 24, 2025 am 11:12 AM

（注：Googleは私の会社であるMoor Insights＆Strategyのアドバイザリークライアントです。） AI：実験からエンタープライズ財団まで Google Cloud Next 2025は、実験機能からエンタープライズテクノロジーのコアコンポーネント、ストリームへのAIの進化を紹介しました

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。