AI を使用して、ホロコースト後に離れ離れになった愛する人を見つけます。 Googleのエンジニアが70万枚以上の第二次世界大戦の古い写真を識別できる顔認識プログラムを開発

AI を使用して、ホロコースト後に離れ離れになった愛する人を見つけます。 Googleのエンジニアが70万枚以上の第二次世界大戦の古い写真を識別できる顔認識プログラムを開発

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 08, 2023 pm 04:21 PM

aiニューラルネットワーク顔認識

AI 顔認識の分野で新しいビジネスは生まれましたか?

今回は、第二次世界大戦の古い写真から顔を特定するという内容でした。

最近、Google のソフトウェアエンジニアであるダニエルパットは、N2N (Numbers to Names) と呼ばれる AI 顔認識技術を開発しました。これは、第二次世界大戦前のヨーロッパとホロコーストの写真を識別し、現代の写真と関連付けることができます。人々。

AI を使用して長らく行方不明だった親戚を探す

2016 年、パットはワルシャワのポーランド系ユダヤ人記念博物館を訪れたときに、あるアイデアを思いつきました。

これらの奇妙な顔は彼と血がつながっている可能性がありますか?

彼の祖父母のうち 3 人はポーランド出身のホロコースト生存者であると彼は考えました。祖母がナチスに殺された家族の写真を見つけるのを手伝ってください。

第二次世界大戦中、多数のポーランド系ユダヤ人がさまざまな強制収容所に投獄されたため、その多くが行方不明になりました。

黄ばんだ写真だけでは、そこに写っている顔を特定することは困難であり、ましてや行方不明の親戚を見つけることは困難です。

そこで、彼は家に戻り、すぐにこのアイデアを現実にしました。

このソフトウェアの当初のアイデアは、データベースを通じて顔の画像情報を収集し、人工知能アルゴリズムを使用して、類似性が最も高い上位 10 個のオプションを照合することでした。

画像データのほとんどは米国ホロコースト記念博物館 (米国ホロコースト記念博物館) から提供されており、全米のデータベースから 100 万件以上の画像が収集されています。

ユーザーは、コンピューターファイル内の画像を選択してアップロードをクリックするだけで、システムが最も一致する画像を持つ上位 10 個のオプションを自動的に除外します。

さらに、ユーザーはソースアドレスをクリックして、写真の年、場所、コレクション、その他の情報を表示することもできます。

#欠点の 1 つは、現代のキャラクター画像を入力すると、とんでもない検索結果が表示される可能性があることです。

これが結果でしょうか？ (黒い疑問符)

つまり、システム機能にはまだ改善の必要があるということです。

さらに、パットは Google の他のソフトウェアエンジニアやデータサイエンティストのチームと協力して、検索の範囲と精度を向上させています。

顔認識システムにはプライバシー漏洩のリスクがあるため、パット氏は「私たちはアイデンティティの評価を行っていない。私たちが責任を負うのは、類似性スコアを使用して結果を提示し、ユーザーに独自の判断をしてもらうことだけだ」と述べた。。」

AI顔認識技術の開発

では、この技術はどのようにして顔を認識するのでしょうか?

当初、顔認識技術は「検出された画像が顔であるかどうかをどのように判断するか」からスタートする必要がありました。

2001 年、コンピュータービジョンの研究者である Paul Viola と Michael Jones は、リアルタイムで高精度に顔を検出するフレームワークを提案しました。

このフレームワークは、「何が顔で、何が顔ではないのか」を理解するためのトレーニングモデルに基づくことができます。

トレーニング後、モデルは特定の特徴を抽出し、これらの特徴をファイルに保存します。これにより、新しい画像の特徴を、さまざまな段階で以前に保存された特徴と比較できるようになります。

精度を確保するには、「数十万のポジティブ画像とネガティブ画像を含む大規模なデータセット」でアルゴリズムをトレーニングする必要があります。これにより、画像内に顔が含まれているかどうか、および顔がどこに含まれているかを判断するアルゴリズムの能力が向上します。それはそうです。

研究対象の画像が特徴比較の各段階に合格した場合、顔が検出されており、操作を続行できます。

Viola-Jones フレームワークは、リアルタイムアプリケーションでの顔認識の精度が非常に高いですが、一定の制限があります。

たとえば、顔がマスクを着用している場合、または顔の向きが正しくない場合、フレームワークは機能しない可能性があります。

Viola-Jones フレームワークの欠点を解消し、顔検出を改善するために、彼らは追加のアルゴリズムを開発しました。

プロセスの改善に役立つ領域ベースの畳み込みニューラルネットワーク (R-CNN) やシングルショット検出器 (SSD) など。

畳み込みニューラルネットワーク (CNN) は、画像の認識と処理に使用される人工ニューラルネットワークであり、特にピクセルデータを処理するように設計されています。

#R-CNN は、CNN フレームワーク上で領域提案を生成し、画像内のオブジェクトの位置を特定して分類します。

領域提案ネットワークに基づく方法 (R-CNN など) では 2 つのショット (1 つは領域提案の生成、もう 1 つは提案された各オブジェクトの検出) が必要ですが、SSD では画像内の複数のオブジェクトを検出するのに 1 つのショットのみが必要です。したがって、SSD は R-CNN よりも大幅に高速です。

近年、ディープラーニングモデルによる顔認識テクノロジーの利点は、従来のコンピュータービジョン手法よりも大幅に優れています。

初期の顔認識では、主に従来の機械学習アルゴリズムが使用されており、研究では、より識別可能な特徴を抽出する方法と、顔をより効果的に位置合わせする方法に重点が置かれていました。

研究の深化に伴い、従来の機械学習アルゴリズムによる二次元画像上の顔認識の性能向上は徐々にボトルネックに達してきました。

人々はビデオでの顔認識の問題を研究し始めたり、顔認識のパフォーマンスをさらに向上させるために 3 次元モデル手法と組み合わせたりする一方で、少数の学者が 3 次元の顔認識の問題を研究し始めました。。

最も有名な LFW パブリックライブラリでは、深層学習アルゴリズムが、2 次元画像上の顔認識パフォーマンスにおける従来の機械学習アルゴリズムのボトルネックを突破しました。初回認識率が向上し、97%以上に向上しました。

それは、「CNNネットワークが確立した高次元モデル」を用いて、入力された顔画像から有効な識別特徴を直接抽出し、顔認識用のコサイン距離を直接計算することです。

顔検出は、基本的なコンピュータービジョン技術から、機械学習 (ML) の進歩、ますます複雑な人工ニューラルネットワーク (ANN) および関連技術へと進化し、その結果、パフォーマンスが継続的に向上しています。

現在、顔追跡、顔分析、顔認識など、多くの重要なアプリケーションの最初のステップとして重要な役割を果たしています。

第二次世界大戦中、中国も戦争のトラウマに苦しみ、当時の写真に写った多くの人々はもはや身元が特定できなくなっていました。

戦争で心に傷を負った人々には、行方不明の親戚や友人がたくさんいます。

このテクノロジーの開発は、人々が埃っぽい年月を明らかにし、過去の人々にいくらかの慰めを見つけるのに役立つかもしれません。

参考: https://www.timesofisrael.com/google-engineer-identifying-anonymous-faces-in-wwii-photos-with-ai-facial-recognition/

以上がAI を使用して、ホロコースト後に離れ離れになった愛する人を見つけます。 Googleのエンジニアが70万枚以上の第二次世界大戦の古い写真を識別できる顔認識プログラムを開発の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

1つのプロンプトは、すべての主要なLLMのセーフガードをバイパスできますApr 25, 2025 am 11:16 AM

HiddenLayerの画期的な研究は、主要な大規模な言語モデル（LLMS）における重大な脆弱性を明らかにしています。彼らの発見は、ほぼすべての主要なLLMSを回避できる「政策の人形劇」と呼ばれる普遍的なバイパス技術を明らかにしています

5つの間違いほとんどの企業が今年持続可能性を備えていますApr 25, 2025 am 11:15 AM

環境責任と廃棄物の削減の推進は、企業の運営方法を根本的に変えています。この変革は、製品開発、製造プロセス、顧客関係、パートナーの選択、および新しいものの採用に影響します

H20チップバンジョルツチャイナ企業ですが、彼らはインパクトのために長い間支えられてきましたApr 25, 2025 am 11:12 AM

高度なAIハードウェアに関する最近の制限は、AI優位のためのエスカレートする地政学的競争を強調し、中国の外国半導体技術への依存を明らかにしています。 2024年、中国は3,850億ドル相当の半導体を大量に輸入しました

OpenaiがChromeを購入すると、AIはブラウザ戦争を支配する場合がありますApr 25, 2025 am 11:11 AM

GoogleからのChromeの強制的な売却の可能性は、ハイテク業界での激しい議論に火をつけました。 Openaiが65％の世界市場シェアを誇る大手ブラウザを取得する見込みは、THの将来について重要な疑問を提起します

AIが小売メディアの成長する痛みをどのように解決できるかApr 25, 2025 am 11:10 AM

全体的な広告の成長を上回っているにもかかわらず、小売メディアの成長は減速しています。この成熟段階は、生態系の断片化、コストの上昇、測定の問題、統合の複雑さなど、課題を提示します。ただし、人工知能

「aiは私たちであり、それは私たち以上のものです」Apr 25, 2025 am 11:09 AM

古いラジオは、ちらつきと不活性なスクリーンのコレクションの中で静的なパチパチと鳴ります。簡単に不安定になっているこの不安定な電子機器の山は、没入型展示会の6つのインスタレーションの1つである「e-waste land」の核心を形成しています。

Google Cloudは、次の2025年にインフラストラクチャについてより深刻になりますApr 25, 2025 am 11:08 AM

Google Cloudの次の2025年：インフラストラクチャ、接続性、およびAIに焦点を当てています Google Cloudの次の2025年の会議では、多くの進歩を紹介しました。特定の発表の詳細な分析については、私の記事を参照してください

Baby Ai Meme、Arcanaの550万ドルのAI映画パイプライン、IRの秘密の支援者が明らかにした話Apr 25, 2025 am 11:07 AM

今週はAIとXR：AIを搭載した創造性の波が、音楽の世代から映画制作まで、メディアとエンターテイメントを席巻しています。見出しに飛び込みましょう。 AIに生成されたコンテンツの影響力の高まり：テクノロジーコンサルタントのShelly Palme

See all articles

ホットAIツール

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、