Josh.ai は、音声アシスタントを使用した概念実証の ChatGPT 統合をデモンストレーションします。 Josh システムは現在、専門の設置業者を通じてのみ入手可能です。画像出典: Josh.ai
現在、スマート ホーム ユーザーは、Alexa に照明をつけてもらうか、Siri に寝室の温度を教えてもらうことができ、場合によってはそれが正確であることもあります。または、「ライトという名前のデバイスが 15 個あります。どれを制御しますか?」または「XXX の現在の温度は摂氏 35 度です。」しかし、音声アシスタントが常に正確であるだけでなく、次のこともできる場合はどうなるでしょうか? 「今日は調子が悪いです。リラックスする良い方法は何ですか?」などの漠然としたコメントに「賢明な」反応を示していますか?たとえば、カーテンを下げ、照明を暗くし、サーモスタットを調整し、オンライン プラットフォームでグッズを購入することでしょうか? Josh.ai ホーム オートメーション システムの共同創設者、Alex Capecelatro 氏は、これが新しい AI 言語モデルを活用した音声アシスタントの可能性であると述べています。 Josh.ai は、OpenAI の ChatGPT を使用してプロトタイプの統合を開始しました。この概念実証ビデオでは、カペセラトロがジョシュのアシスタントに、カーテンを開け、音楽を消し、天気を伝えるよう依頼している様子が示されています (3 つのことを同時に制御することは、ジョシュがすでに実行できる能力です)。次に、「ビデオを撮っています。ここは少し暗いです」など、スマート ホーム向けのより自然な音声コマンドに移りました。これに音声アシスタントが、少しぎこちないながらも部屋の照明をオンにして応答しました。
AI 言語モデルを使用して自然言語を解析することで、スマート ホームの制御を改善できる可能性は興味深いものです。カペセラトロはこれが未来だと考えています。 「私たちは、より自然で直感的な方法で環境を制御できる方法を見つけようとしています」と彼は言いました。
今日の音声アシスタントは正確な言語を必要とすることが多く、基本的なスマート ホーム コマンドと情報の要求が混同されることが多く、その結果イライラしたり、場合によっては役に立たない応答が返されたりすることになります。これは、Capecelatro と Tim Gill (Quark 創設者) が 2015 年に Josh.ai を設立したときに解決しようとした問題でした。その名を冠した音声アシスタントは、要求がどのように表現されたとしても、接続されたガジェットを見事に制御するように設計されています。
「ChatGPT タイプのテクノロジーを採用しなければ、私のようなビジネスは 1 年以内に存在しなくなるでしょう。これは、自宅で音声コントロールを利用できる人の将来にとって非常に重要です。」ジョシュは、広範なナレッジ グラフ モデルを使用して、「照明をつけて」ではなく「衛星」を聞いたときに解析して適切な処理を実行できます。 「カーテンを開けて」は「ブドウを買ってきて」のように聞こえますが、ジョシュは賢いので、あなたがブドウ畑に住んでいないことを知っています。 「私たちは聞き間違いを修正したり、さまざまなアクセントに対処したり、不完全な文章を理解したりするために、内部での作業に多くの時間を費やしています。そのため、たとえ『電気をつけて』と言われても、私たちはその意味を理解しています」とカペセラトロ氏は語った。
現在、Josh は、Crestron や Control4 などの企業が提供するカスタム スマート ホーム インストールの音声制御レイヤーとしてのみ使用されています。より保護された環境では、システムは専門の設置業者によってセットアップおよび制御され、導入コストは高くなりますが、より信頼性が高くプライベートであることで知られる音声アシスタント Josh.ai の独自ハードウェアを使用します (一方、Josh にはクラウド コンポーネントがあります)。ほとんどのリクエストは Josh Core 上でローカルに処理され、クラウドベースの API を使用すると識別可能な情報は削除される、と Capecelatro 氏は述べました。)
Josh.ai このシステムには、ハブと 2 つのモデルのスマート スピーカーが含まれています。アプリと Ava スマート リモコンとの統合。画像出典: Josh.ai
最近 Amazon との提携を発表した同社は現在、ChatGPT やその他のチャットボットで使用される新世代の大規模言語モデル (LLM) に賭けています。カペセラトロ氏は、これらのシステムによって今日の音声アシスタントがさらに便利になると信じています。 「今から1年後、Alexa、Google、Siri、さらにはJoshの古いやり方を容認する人は誰もいないだろう。それだけでは十分ではない」とカペセラトロ氏は語った。 「ChatGPT タイプのテクノロジーを採用しなければ、私のようなビジネスは 1 年以内に存在しなくなるでしょう。これは、自宅で音声コントロールを利用できる人の将来にとって非常に重要です。」
# Josh.ai は競合他社ほどの深い知識を持っていないため、音声アシスタントの知識ベースに ChatGPT の統合が追加されたことは大きな進歩です。 「私たちは常にジョシュをできるだけ賢くしたいと考えていましたが、私たちは小さなチームです」とカペセラトロ氏は語った。しかし、スマート ホーム全般にとって、希望は AI 言語モデルの会話機能とホーム オートメーション システムが提供できるコンテキストを組み合わせることにあります。たとえば、家にどのようなスマート デバイスがあり、それらをどのように使用するかについて詳細を理解することで、Josh は自然言語コマンドを解析して家の中でのアクションを実行できます。 「やあジョシュ、もうすぐ子供たちが帰宅する時間だけど、もう暗くなってきた。本当に準備は万端?」 たとえば、音声アシスタントはポーチの照明をつけたり、オーブンの予熱を開始したり、カーテンを引いたりすることができます。キッチンの照明をつけます。
Josh は、スマート ホームでのメディア検出に ChatGPT を使用することにも取り組んでいます。これまで失われたリンク。 「自分が何を望んでいるのか分からない場合、音声制御は理想的ではありません」とカペセラトロ氏は言います。 「私たちは、見たいコンテンツをブラウズするために使用できる Ava Remote との統合を構築しました。ChatGPT をミックスに追加することで、『Netflix で本当に良い番組は何ですか、ロムコムや特集 (これ)』と言うことができます。」キャスト。 「ChatGPT はリストを編集し、リモコンの画面に表示できます。」 それは家族の映画の夜です。
Josh の AI アップグレードはまだ実用化されておらず、Capecelatro 氏は、同社がより優れたモデルを提供する場合に備えて、この分野での他の企業の新技術に細心の注意を払っていると述べました。 ChatGPT が現在非常に遅いという事実 (ビデオは高速化するために編集されています) に加えて、非常に現実的な AI 生成の問題があります。 (実際、ChatGPT のトレーニングに使用されたデータセットは 2021 年半ばに終了しました。注目に値するのは、デモビデオで Josh が「Netflix で視聴できる番組は何ですか?」と尋ねられたとき、リストされている最新の番組が「Debuting in」であることです。 2019年)しかし、カペセラトロ氏は、何らかの形で生成型AI音声アシスタントがスマートホームに導入されるだろうと述べている。
注意が絶対に必要です。人種差別的で同性愛嫌悪的で殺人的な音声アシスタントが自社のハードウェアを通じて人々の家庭に「意見」を広めることを望む企業はいないが、AIの生成は基本的にフィルターコンテンツなしで反芻するものであるため、その可能性は明らかだ。 「私たちは非常に慎重でした。ChatGPT 統合をすぐに使用することもできたでしょう」と Capecelatro 氏は言いました。 「私たちはそんなことはしませんでした。本当に悪いデータを人々に提供したくなかったからです。嘘をつきたくなかったのです。」カペセラトロ氏は、「マイクロソフトとグーグルは(検索チャットボットモデルで)少し行き過ぎたと思う。その結果が今見えている」と、最近の注目を集めたリリースがすぐに横道に逸れてしまったことについて語った。
Google、Apple、Amazon がすべて、新しい AI 言語モデルを音声アシスタントに組み込む方法に取り組んでいると考えるのは飛躍ではありませんが、スマートホーム愛好家はすでに Siri の使い方を理解しています。 ChatGPT のショートカットをスマート ホームに追加します。スマート スピーカーに話しかけるのは、Web ブラウザに入力するよりもはるかに簡単です。
しかし、私たちは本当にこの種の人工知能を家庭に導入したいのでしょうか? 8 歳の息子に量子物理学について教えられる音声アシスタントを喜んで手に入れるほど、「ちゃんと機能する」音声アシスタントに対する私たちの願望は大きいのでしょうか?個人的には、全知の知能が家を管理するのではなく、私が「電気を消して」と言ったときの意味を理解してくれる、信頼性の高い音声制御のスマート ホーム システムがあれば十分だと考えています。
天性の才能と直感力に優れた音声アシスタントが完璧な家庭用執事として機能するという約束は非常に魅力的ですが、現実はダウントン・アビーよりも宇宙の旅に似ているのではないかと私は心配しています。しかし、私が間違っていることが証明されるかどうか見てみましょう。
以上がChatGPT にスマート ホームを制御させてみませんか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ロボットプロセスオートメーション(RPA)を専門とする多くの企業は、繰り返しタスクを自動化するためのボットを提供しています。 一方、プロセスマイニング、オーケストレーション、インテリジェントドキュメント処理スペシャル

AIの未来は、単純な単語の予測と会話シミュレーションを超えて動いています。 AIエージェントは出現しており、独立したアクションとタスクの完了が可能です。 このシフトは、AnthropicのClaudeのようなツールですでに明らかです。 AIエージェント:研究a

急速な技術の進歩は、仕事の未来に関する将来の見通しの視点を必要とします。 AIが単なる生産性向上を超えて、私たちの社会構造の形成を開始するとどうなりますか? Topher McDougalの今後の本、Gaia Wakes:

多くの場合、Harmonized System(HS)などのシステムからの「HS 8471.30」などの複雑なコードを含む製品分類は、国際貿易と国内販売に不可欠です。 これらのコードは、すべてのINVに影響を与える正しい税申請を保証します

データセンターと気候技術投資におけるエネルギー消費の将来 この記事では、AIが推進するデータセンターのエネルギー消費の急増と気候変動への影響を調査し、この課題に対処するための革新的なソリューションと政策の推奨事項を分析します。 エネルギー需要の課題:大規模で超大規模なデータセンターは、数十万の普通の北米の家族の合計に匹敵する巨大な力を消費し、新たなAIの超大規模なセンターは、これよりも数十倍の力を消費します。 2024年の最初の8か月で、Microsoft、Meta、Google、Amazonは、AIデータセンターの建設と運用に約1,250億米ドルを投資しました(JP Morgan、2024)(表1)。 エネルギー需要の成長は、挑戦と機会の両方です。カナリアメディアによると、迫り来る電気

生成AIは、映画とテレビの制作に革命をもたらしています。 LumaのRay 2モデル、滑走路のGen-4、OpenaiのSora、GoogleのVEO、その他の新しいモデルは、前例のない速度で生成されたビデオの品質を向上させています。これらのモデルは、複雑な特殊効果と現実的なシーンを簡単に作成できます。短いビデオクリップやカメラ認知モーション効果も達成されています。これらのツールの操作と一貫性を改善する必要がありますが、進歩の速度は驚くべきものです。 生成ビデオは独立した媒体になりつつあります。アニメーション制作が得意なモデルもあれば、実写画像が得意なモデルもあります。 AdobeのFireflyとMoonvalleyのMAであることは注目に値します

ChatGptユーザーエクスペリエンスは低下します:それはモデルの劣化ですか、それともユーザーの期待ですか? 最近、多数のCHATGPT有料ユーザーがパフォーマンスの劣化について不満を述べています。 ユーザーは、モデルへの応答が遅く、答えが短い、助けの欠如、さらに多くの幻覚を報告しました。一部のユーザーは、ソーシャルメディアに不満を表明し、ChatGptは「お世辞になりすぎて」、重要なフィードバックを提供するのではなく、ユーザービューを検証する傾向があることを指摘しています。 これは、ユーザーエクスペリエンスに影響を与えるだけでなく、生産性の低下やコンピューティングリソースの無駄など、企業の顧客に実際の損失をもたらします。 パフォーマンスの劣化の証拠 多くのユーザーは、特にGPT-4などの古いモデル(今月末にサービスから廃止される)で、ChatGPTパフォーマンスの大幅な分解を報告しています。 これ

ジェネレーションアルファとAI革命 Generation Alpha(2010年から2024年生まれ)は独自に配置されています。彼らは、生成AIと一緒に成長しています。これは、日常生活に深く織り込まれています。 ただし、主にiが享受しているこの広範なアクセス


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

Dreamweaver Mac版
ビジュアル Web 開発ツール

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

SublimeText3 Linux 新バージョン
SublimeText3 Linux 最新バージョン

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

PhpStorm Mac バージョン
最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

ホットトピック









