ホームページ  >  記事  >  テクノロジー周辺機器  >  Xiaomi の AI の強さが改めて検証され、その音声認識アルゴリズムの能力は世界最高レベルにランクされています。

Xiaomi の AI の強さが改めて検証され、その音声認識アルゴリズムの能力は世界最高レベルにランクされています。

WBOY
WBOY転載
2023-09-17 22:29:011019ブラウズ

最近、Xiaomi は音声認識アルゴリズムで最新の進歩を遂げており、そのアルゴリズム モデルはパフォーマンスの点で他の機関をリードしており、国際ランキングのトップにランクされています。この画期的な進歩は、Google

がリリースした AudioSet オーディオ ラベル付けタスクで Xiaomi によって達成されました。

Google は AudioSet データ セットを 3 つのサブセットに分割し、最初の 2 つのサブセットはトレーニングに使用され、統合されて「AudioSet-2M」と呼ばれました。 Xiaomi の音声認識アルゴリズム モデルが業界で 50 mAP を突破し、オーディオ マーキングの技術指標を更新したのは、この統合されたトレーニング セットでした。さらに、Xiaomi は、リソースに制約のあるシナリオに適したモデルの Mini バージョンもリリースしました。

このテクノロジーのブレークスルーは、Xiaomi の音認識アルゴリズム機能における新たなブレークスルーを意味します。Xiaomi の多くのスマート ハードウェア デバイスがこのテクノロジーを適用した後、環境音をより鋭く捕捉および識別できるようになり、ハードウェアのインテリジェンスが大幅に向上します。これにより、より多くの機能が作成されます。ユーザーに便利なスマートライフ体験を提供します。

同時に、Xiaomi の音声認識アルゴリズムによる音声タグ付け技術機能は、業界の最先端の研究開発プロセスを効果的に促進してきました。

Xiaomi の改良された音声認識アルゴリズムは、Xiaomi のスマート デバイスで広く使用できます。音声タグ付けアルゴリズムは、赤ちゃんの泣き声、動物の鳴き声、車のエンジン、爆発音、煙警報器、ドアベル、水の流れなど、幅広い環境音を識別でき、環境内の音を次のようなモダリティで表現できます。テキストとして、音を「見て」みましょう。これにより、ハードウェア デバイスがよりスマートになり、より効率的で正確な音声認識エクスペリエンスをユーザーに提供できます。

Xiaomi 携帯電話の「Xiaomi Hearing Sound」機能は、火災警報、赤ちゃんの泣き声、やかんの沸騰音などを含む 14 の重要な環境音を監視し、携帯電話の通知バーからテキスト メッセージをプッシュできます。この機能は聴覚障害者の生活を効果的に支援し、Xiaomi ブレスレットはこれらの音情報を同時に表示および受信することもできます。

このアルゴリズムは、スマート ホーム デバイスでより広く使用されています。現在、Xiaomiの音声認識アルゴリズムは、赤ちゃんの泣き声を検出したときにユーザーの携帯電話にリアルタイムでプッシュ通知を送信できるMijiaカメラの赤ちゃんの泣き声監視機能など、多くのスマートホームデバイスで使用されています。 Xiaomi Soundスピーカーには音声認識機能も搭載されており、住宅警報音、赤ちゃんの泣き声、火災警報器、流水音、猫の鳴き声、犬の鳴き声など、ユーザーが気になる6種類の家庭環境音を識別できる。 Xiaomi Health APP の睡眠いびきモニタリングは、ユーザーのいびきと睡眠中の寝言を追跡するのに役立ちます。

このアルゴリズムの可能性をよりよく実現するために、Xiaomi は、AIoT プラットフォーム エコシステムを通じてこのアルゴリズム テクノロジーを適用するための幅広いスペースを提供します。現在、Xiaomi の音響音声チームは、自社開発した音響音声技術を、Xiaomi の携帯電話、スピーカー、テレビ、ヘッドフォン、時計、ロボットなど 79 カテゴリの 5,000 以上のスマート製品に完全に適用しています。

音声認識アルゴリズムに属する人工知能の分野では、Xiaomi が長年投資を続けてきた下位トラックの 1 つとして積極的に取り組んでいます。 Xiaomiが2016年にAIチームを設立して以来、AIチームは7年間で6倍に拡大し、3,000人以上に達したと報告されています。同時に、Xiaomi の AI 技術力は、ビジョン、音響、音声、NLP、ナレッジ グラフ、機械学習、大規模モデル、マルチモダリティなどの多くの方向をカバーしており、携帯電話などの多くのビジネス分野に十分な力を与えています。自動車、AIoT、ロボット。今年4月、Xiaomiは大規模モデルを完全に受け入れるためにAI大規模モデルチームを正式に設立し、現在いくつかのアプリケーションの試みが行われています。最初のアプリケーション モデルは、インテリジェント音声アシスタント Xiao Ai を大型モデル バージョンにアップグレードし、公開テストを行うことです。

Xiaomi の AI の強さが改めて検証され、その音声認識アルゴリズムの能力は世界最高レベルにランクされています。

以上がXiaomi の AI の強さが改めて検証され、その音声認識アルゴリズムの能力は世界最高レベルにランクされています。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はsohu.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。