ホームページ  >  記事  >  テクノロジー周辺機器  >  画像認識:顔認識

画像認識:顔認識

WBOY
WBOY転載
2023-04-12 18:52:101799ブラウズ

この記事は WeChat 公開アカウント「情報時代に生きる」から転載したものであり、著者は情報時代に生きています。この記事を転載するには、情報時代の暮らしの公開アカウントまでご連絡ください。

画像認識の場合、最も人気のある応用分野は顔認識です。顔認識技術の大規模な応用は、隅々にまで広がっている我が国のスカイアイプロジェクトと雪良プロジェクトにより大きな応用スペースを与え、また我が国をより安全にするものです。次に、顔認証アプリケーションの開発の歴史を見てみましょう。

2017 年 9 月。 Appleが秋のカンファレンスを開催しiPhoneを発売顔認証は基本的に画像認識の一種であり、人の顔の特徴情報に基づく識別技術です。カメラまたはビデオ カメラを使用して人間の顔を含む画像またはビデオ ストリームを収集し、画像内の顔を自動的に検出して追跡し、検出された顔に対して一連の顔関連テクノロジー (通常はポートレート認識や顔認識とも呼ばれます) を実行します。認識。

顔認識は、コンピューター技術と光学イメージング技術の発展に伴って 1960 年代に始まり、1990 年代後半に米国、日本、ドイツの技術により本格的な応用段階に入りました。人工知能の発展と処理の迅速な反復更新により、顔認識技術も大きな進歩を遂げていると同時に、顔認識は生体認証の最新の応用分野でもあります。そのコア技術の実現は、弱い人工知能から強い人工知能への変革を示しています。一般に、顔認識の原理は、ユーザーの顔データを収集してデータベースに保存し、次に機械学習を実行してロックを解除する必要があるオブジェクトの顔データを収集し、それをデータベースに入れて比較し、最後にロック解除を完了します。

画像認識:顔認識

携帯電話に顔認証が登場したのは Apple が初めてではなく、Google は Android 4.0 で顔認証機能を追加しましたが、当時の技術セキュリティ機能はありません。当時、顔認識は主に 2 つの要因によって制限されていました: 1. 携帯電話には、より高度な顔認識センサーを積み重ねるのに十分なスペースがありませんでした; 2. 重要なポイントでもあるアルゴリズムにボトルネックがあり、計算できませんでした顔の凹凸テクスチャは 2D 平面の段階にのみ留まります。 iPhoneX の小さなノッチには 8 つのセンサーが組み込まれており、そのうち 4 つは顔認識に機能します。実際、Apple はすでに 3D 深度センシング コンポーネントのレイアウトを以前から開始しており、事前にイスラエルの顔認識会社を買収していました。

新世代の iPhoneこれらの光点によって反射される深さを読み取る赤外線レンズと組み合わせることで、顔の 3D 構造を迅速にスキャンし、3D モデリング技術と組み合わせることで顔の特徴情報の収集と認識を完了できます。人間の顔は平らではないため、Face ID によって収集される 3D 人間の顔データの幾何学的精度は非常に高く、エラー率が大幅に減少します。さらに、Face ID の顔認識機能の速度は、Touch ID 指紋認識の速度よりもはるかに高速です。

海外では、Apple に加えて、ソニー、サムスンも 3D 顔認識技術を実証しています。中国ではその後、ファーウェイの携帯電話が顔認識3Dモデリング携帯電話Honor V9を発売し、シャオミのnote3にも顔認証ブラック技術が搭載されるなど、3D顔認識技術が今後の携帯電話のトレンドになっていることがわかります。発達。また、アリババはアリペイにも顔認証を適用し、指紋決済後の顔認証決済のロックを解除することに成功し、2019年3月にはドイツのハノーバーで開催されたIT展示会で、ジャック・マー氏がドイツのメルケル首相と中国の馬副首相にスピーチを行った。カイ氏は Alipay の「顔認識」による支払いを実演し、顔認識技術に関する激しい議論を巻き起こしました。

Alipay の顔認識も深層学習に基づいています。つまり、収集された画像は最初に前処理されます。つまり、重要な特徴点の検出、回転、目の間の距離の正規化、画像の切り取りなどが行われます。この方法では、顔の位置合わせを実行し、その後、マルチチャネル正規化にさまざまなスケールを使用します。複数の顔情報は、学習のための主要な特徴点でインターセプトされます。深層学習は、多層畳み込みニューラル ネットワーク学習を使用して、各顔領域のこの領域の特徴を抽出します。CNN には 3 つのコアがあります: ローカル認識、完全な値の共有、および時間または空間サブサンプリングでは、これら 3 つのアイデアを組み合わせることで、シフト、スケール、変形の不変性をある程度まで確実に取得できます。最後に、分類器を使用して、それらが同一人物であるかどうかを判断します。

Tencent Cloud Shentu・顔認識 (顔認識) は、Tencent Youtu の強力な顔分析技術に基づいており、顔の検出と分析、顔の特徴の位置決め、顔検索、顔の比較、顔認証、人事などの複数の機能を含むサービスを提供します。重複チェックと生存検出により、開発者と企業に高性能かつ高可用性の顔認識サービスを提供します。スマート リテール、スマート コミュニティ、オンライン エンターテイメント、スマート ビルディング、オンライン ID 認証などのさまざまなアプリケーション シナリオで使用でき、顔属性認識とユーザー ID 確認に対するさまざまな業界の顧客のニーズを完全に満たします。

画像認識:顔認識

その利点は次のとおりです。

(1) 正確な認識: Tencent Cloud 顔認識サービスは複数の新記録を樹立しました。 2017年のLFW評価における顔照合精度は99.80%と高く、顔検索は100万規模のMegaFaceコンペティションにおいて認識率83.29%で1位となり、認識精度において業界トップクラスの成績を収めました。

(2) アルゴリズムのリーダーシップ: 第 3 世代 Tencent Youtu 祖母モデルに基づいて、計量学習、転移学習、マルチタスク学習、その他のトレーニング方法を統合してモデルを最適化し、ユーザーの特性に応じてカスタマイズします。さまざまなビジネス シナリオ モデルの微調整または抽出は、ビジネス パフォーマンスと遅延の 2 つの要件を満たします。

(3) 安定性と信頼性: Tencent Cloud の顔認識サービスは、Tencent 社内製品の膨大なユーザーと複雑なシナリオによって検証されており、安定して堅牢に動作し、サービス可用性は 99.9% を超えています。

(4) リアルタイム応答: 顔認証は、高同時実行性、高スループット、低遅延という特徴があり、100万件規模の顔検索であってもわずか数百ミリ秒で処理でき、お客様のニーズに応えます。 . リアルタイムの使用要件。

(5) シンプルで使いやすい: 豊富で多様なオンライン API とオフライン識別 SDK を提供します。クラウドへのアクセスをサポートするだけでなく、アプリケーションやハードウェアに組み込むオフライン識別 SDK もサポートします。オフライン識別 SDK とオンライン API を組み合わせて、さまざまなシナリオのニーズを満たすデバイス クラウド ソリューションを形成します。

(6) 幅広い用途: 顔認識は、オンライン フォト アルバム、スマート リテール、機密性の高い顔レビュー、顔アクセス制御、顔出席、顔ログイン、顔特殊効果、オンライン試験などの多くのシナリオで広く使用されています。等。

さらに、Baidu、Google なども顔認識に関する多くの研究と製品を開発しています。顔認識技術はますます成熟しており、私たちの仕事や生活に大きな利便性をもたらしています。

以上が画像認識:顔認識の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。