ホームページ >テクノロジー周辺機器 >AI >動物の顔認識技術は何に使用されますか?

動物の顔認識技術は何に使用されますか?

PHPz
PHPz転載
2023-04-08 13:41:081109ブラウズ

動物を正確に識別できるテクノロジーは、飼い主が迷子になった動物を再会させたり、農家が家畜を監視したり、研究者が野生動物を研究したりするのに役立ちます。歴史的に、マイクロチップはこの点で動物識別の最も一般的な方法でした。ただし、チップの埋め込みには侵襲的な手術が必要です。特殊な機器がなければ読み取ることができず、窃盗犯がマイクロチップを抜き出す可能性があります。もう 1 つの方法は DNA 分析です。これは正確ですが、非常に高価で時間がかかります。

動物の顔認識技術は何に使用されますか?

コンピュータ ビジョン ソリューションを活用した動物の顔認識 (顔だけではない場合もあります) は、上記の方法に代わる実行可能な代替手段として機能します。この技術には欠点もありますが、特定の状況では高い精度を発揮します。では、動物の顔認識はどのように機能しますか?このテクノロジーの進歩を妨げている課題は何ですか?

動物の顔認識はどのように機能しますか?

動物の顔認識ソリューション一般には、次の 3 つの主なステップがあります。

画像キャプチャ: 高解像度カメラで動物の写真を撮ります。一部のアルゴリズムは事前定義されたポーズでのみ機能するため、これらの基準を満たす画像を選択する必要があります。

特徴抽出: 動物の生体データの適合性を評価し、必要に応じて前処理を実行します。次に、アルゴリズムは認識に必要な特徴セットを抽出します。

マッチング: 抽出された特徴は数学的に表現され、他の画像と照合されます。たとえば、迷子のペット データベースで犬を探している場合、その犬の固有の特徴をデータベース内のすべての動物と照合します。

マッチングを実行するにはいくつかの方法があります。 1 つの方法は、クラスタリングに KNN や DBSCAN などのアルゴリズムを使用して、ターゲット画像に非常に近い一連の画像を取得することで、ユーザーは最適な画像を手動で選択できます。あるいは、確率的手法を使用して、最終結果を信頼水準として表すこともできます。

迷子ペットの捜索

ペットを失うことは、飼い主にとって悲痛な出来事です。そして統計によると、これは人々が考えているよりもはるかに一般的です。米国では、家庭で飼われている犬や猫の 3 匹に 1 匹が生涯のある時点で行方不明になり、そのうち 80% はまだ見つかっていません。ペットの顔認識に基づいた、飼い主がいなくなった友達を見つけるのに役立つツールがいくつかあります。

ForPaws: この動物の顔認識ソリューションは、鼻の先、肌の色、毛皮の種類に基づいて犬を識別します。動物の飼い主は、動物の「個人プロフィール」を作成するために少なくとも 3 枚の写真をアップロードするよう求められます。現在、このプログラムは 90% の精度で 130 の犬種を識別できます。

PiP: この動物識別会社は、動物の飼い主が動物の写真を登録してアップロードできるアプリを開発しました。システムは彼らのユニークな顔の特徴を分析します。 PiP は、飼い主が性別、体格、体重などの詳細情報を提供すれば、迷子の猫や犬をすべて特定できると主張している。

迷子のペットを見つけた人は誰でも、アプリを使用して飼い主を見つけることもできます。また、PiP のソリューションは、ソーシャル メディアでペットの投稿を継続的にスキャンし、関連コミュニティの住民にペットの行方不明に関するアラートを送信します。

Love Lost: Petco の Love Lost は、ペットの飼い主とペット保護施設を支援するもう 1 つのアプリです。飼い主はペットのプロフィールを作成することをお勧めします。そうすれば、ペットが行方不明になったときに、ソフトウェアがその動物の生体情報を新しいシェルターのメンバーや他のペット候補と照合し始めることができます。

特定の動物を識別する

場合によっては、特定の動物を認識するようにアルゴリズムをトレーニングすることが合理的です。たとえば、動物の飼い主は、飼っている動物を正確に識別し、警報を発したり、ドアを開けて動物を中に入れるなどの適切な措置を講じるシステムから恩恵を受けることができます。 WeTransfer のフロントエンド エンジニアである Arkaitz Garro 氏は、近所の猫を識別し、その猫が玄関に現れたときに Garro に警告を送信できる動物の顔認識ソリューションを開発しました。

猫の写真を撮るために、ガロさんは小型カメラと動き検出ソフトウェアを備えた Raspberry Pi を使用しました。動物がカメラに近づくと、写真が撮影され、Garro によってアップロードされた他の猫の写真と比較するために AWS 認識プラットフォームに送信されます。一致する場合は、エンジニアに通知されます。

マイクロソフトは、動物認識を実行し、ペット ポータルに接続できるモノのインターネット (IoT) デバイスも開発しました。それがあなたのペットであることを認識すると、デバイスはドアを開けてペットを中に入れます。

科学研究の支援 - イルカの顔認識

顔認識アルゴリズムは、家庭用動物の識別に加えて、他の種の識別にも使用できます。 『Journal of Marine Mammal Science』に掲載された研究では、イルカを識別するために必要な一連の特徴を調べました。研究者らは12年間にわたって150頭のバンドウイルカを追跡し、写真を撮った。研究チームは、イルカの顔と背びれを生涯を通じて識別に使用するというアイデアを評価したいと考えていました。

150 人の実験被験者のうち、完全なプロフィール (つまり、顔の左右と背びれの鮮明な写真) を持っていたイルカは 31 頭だけでした。この研究は、人間の専門家の意見と統計的手法に基づいて、同じイルカの異なる画像間の類似性を検出しました。

実験結果は、イルカの顔の特徴は時間が経っても一貫しており、識別目的に使用できることを示しています。成体になっても子犬を識別できるため、イルカの研究が大幅に容易になりました。

農家による家畜の監視を支援

家畜の識別は困難なプロセスとなる場合があります。豚の場合は、すべての豚が同じに見えるため、さらに困難になります。でも牛は少し特殊で、白と黒で形も違います。しかし、牛の場合は、カメラをどこに設置するかという別の課題が生じます。牛は好奇心旺盛な動物で、周囲の小さな変化にも気づきます。彼らはしばしばカメラをなめたり、その他の方法でカメラと対話しようとします。

しかし、個々の牛を識別できるシステムを構築できれば、農家にとっては非常に役立つでしょう。このソリューションは、動物の健康状態と食事パターンを動物のアイデンティティに適合させます。人工知能で強化されたこのシステムは、病気や異常行動の兆候を検出し、緊急事態が発生した場合に農家に通知できるようになります。

Beijing Xiangchuang Technology の中核となるアルゴリズム プラットフォームは、豚、牛、羊、ロバなどの家畜のデータ収集と顔認識を実現し、1,000 万件を超える家畜の顔データを蓄積しました。これは、農家が洗練された繁殖管理を行うのを支援するだけでなく、銀行、保険、その他の金融機関が繁殖産業でビジネスを行う際のリスク評価と早期警告システムを確立するのにも役立ちます。

動物の顔認識技術の実装における課題

動物の顔認識技術は、現在のかなり高度な人間の顔認識技術に比べてはるかに遅れています。研究者らは約4年前に動物の顔認識の実験を始めたが、一般的な技術の精度は依然としてかなり低い。一方、特定の動物の識別など、特定の目的を持ったソリューションは正確である可能性があります。

動物の顔認識ソリューションを実装したい企業は、次の 3 つの主要な課題を考慮する必要があります。

最適な特徴セットを決定する

科学者は特徴ベクトルを指定しました。ユニークな顔認識。ただし、同じアプローチは動物には機能しません。どの特徴を使用する必要があり、それらをどのように解釈するかがわからないからです。たとえば、人々を扱う場合、科学者は変分オートエンコーダ (VAE) アーキテクチャを使用して顔から特徴を抽出できます。この方法では、人物の写真が、肌の色合いや表情などの必要な特徴を含むベクトルに圧縮されます。

動物の顔認識に関しては、現在、信頼できる特徴ベクトルはありません。信頼できる固有ベクトルの課題を解決することで、この分野の研究が大きく前進します。

これに関するオープンソースの例は、犬認識の深層学習ベースの実装である DogFaceNet です。犬の目と鼻を特徴セットとして使用します。このソリューションは、全体的な目的が犬の品種を区別することである場合にはかなりうまく機能しますが、個々の動物を区別することになると、パフォーマンスはかなり悪くなります。

動物の姿勢に依存します

別の例は、ローカル バイナリ パターン ヒストグラム (LBPH) アルゴリズムを使用することです。このアルゴリズムは、画像をピクセルに変換し、異なる画像のピクセル値を比較することで動作します。画像。この方法は動物の姿勢に依存するため、姿勢の変化に敏感になります。

人間にとって、特定のポーズをとってじっと座ることは簡単です。しかし、犬や猫を特定の位置で静止させようとすると、事態はさらに複雑になります。

包括的なトレーニング データ セットを提供する

トレーニングを効果的にするには、データが多様であり、アルゴリズムが実行すると予想されるすべてのタスクをカバーしている必要があります。たとえば、アルゴリズムがさまざまな犬種を識別することを想定している場合、データセットはさまざまな角度からキャプチャされたすべての犬種を適切にカバーし、適切にラベル付けする必要があります。ここで問題が発生する可能性があることがいくつかあります。たとえば、誰かが雑種の写真を投稿したり、誰かがその写真に間違ったラベルを付けたり、間違った品種名を割り当てたりする可能性があります。このような問題を回避するには、専門家がデータセット内のすべての写真を 1 つずつ確認して、画像の正当性とラベルの正確性を検証する必要があります。

動物の顔認識分野の進歩は、大規模な動物を正確に識別するために使用できる最適な特徴の組み合わせを研究者がまだ特定できていないために妨げられています。それでも、特定の動物や家畜や野生動物の小グループの識別など、限られたデータを操作して成功しているアプリケーションもいくつかあります。

独自の動物の顔認識システムを構築している場合は、動物は非協力的な生体認証ユーザーであることに留意してください。カメラをなめると主張する人もいれば、写真を撮るために立つことを拒否する人もいます。


以上が動物の顔認識技術は何に使用されますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。