AI 얼굴인식 분야에 새로운 사업이 열렸나요?
이번에는 제2차 세계 대전의 오래된 사진에서 얼굴을 식별하는 것입니다.
최근 구글의 소프트웨어 엔지니어인 다니엘 패트(Daniel Patt)는 제2차 세계대전과 홀로코스트 이전 유럽의 사진을 식별하고 연결된 현대인과 비교할 수 있는 N2N(Numbers to Names)이라는 AI 얼굴 인식 기술을 개발했습니다.
2016년 Pat은 바르샤바에 있는 폴란드 유대인 기념 박물관을 방문했을 때 아이디어를 떠올렸습니다.
이 이상한 얼굴들이 그와 혈연관계가 있을 수 있을까요?
그의 조부모 중 세 명은 폴란드 출신의 홀로코스트 생존자였고, 그는 할머니가 나치 사진에 의해 살해된 가족을 찾는 것을 돕고 싶었습니다.
제2차 세계 대전 중에 여러 강제 수용소에 갇힌 수많은 폴란드 유대인으로 인해 그들 중 많은 수가 실종되었습니다.
누렇게 변한 사진만으로는 얼굴을 식별하기 어렵고, 잃어버린 친척을 찾는 것도 어렵습니다.
그래서 그는 집으로 돌아와 즉시 이 아이디어를 현실로 만들었습니다.
이 소프트웨어의 원래 아이디어는 데이터베이스를 통해 얼굴의 이미지 정보를 수집하고 인공 지능 알고리즘을 사용하여 상위 10개 옵션과 가장 높은 유사성을 일치시키는 것입니다.
대부분의 이미지 데이터는 미국 홀로코스트 기념 박물관에서 가져온 것이며, 전국의 데이터베이스에는 백만 개가 넘는 이미지가 있습니다.
사용자는 컴퓨터 파일에서 이미지를 선택하고 업로드를 클릭하기만 하면 시스템이 가장 일치하는 이미지가 있는 상위 10개 옵션을 자동으로 필터링합니다.
또한 사용자는 원본 주소를 클릭하여 사진의 연도, 위치, 컬렉션 및 기타 정보를 볼 수도 있습니다.
한 가지 단점은 현대인의 이미지를 입력하면 검색 결과가 엉뚱할 수 있다는 것입니다.
이게 결과인가요? (검은색 물음표)
요컨대, 시스템 기능은 아직 개선이 필요합니다.
또한 Patt는 Google의 다른 소프트웨어 엔지니어 및 데이터 과학자 팀과 협력하여 검색 범위와 정확성을 개선합니다.
안면인식 시스템의 개인정보 유출 위험으로 인해 Patt는 "우리는 신원에 대한 어떠한 평가도 하지 않습니다. 우리는 유사성 점수를 사용하여 결과를 제시하고 사용자가 스스로 판단할 수 있도록 하는 책임만 집니다."라고 말했습니다.
그렇다면 이 기술은 어떻게 얼굴을 인식하는 걸까요?
처음에 얼굴 인식 기술은 "감지된 이미지가 얼굴인지 어떻게 판단하는가"부터 시작되어야 합니다.
2001년 컴퓨터 비전 연구자인 Paul Viola와 Michael Jones는 높은 정확도로 실시간으로 얼굴을 감지하는 프레임워크를 제안했습니다.
이 프레임워크는 훈련 모델을 기반으로 "무엇이 얼굴이고 무엇이 얼굴이 아닌지"를 이해할 수 있습니다.
훈련 후 모델은 특정 특징을 추출한 다음 이러한 특징을 파일에 저장하므로 새 이미지의 특징을 다양한 단계에서 이전에 저장된 특징과 비교할 수 있습니다.
정확성을 보장하려면 알고리즘을 "수십만 개의 긍정적 이미지와 부정적 이미지가 포함된 대규모 데이터 세트"에 대해 훈련해야 합니다. 이를 통해 이미지에 얼굴이 있는지, 어디에 있는지 판단하는 알고리즘의 능력이 향상됩니다.
연구 중인 이미지가 특징 비교의 각 단계를 통과하면 얼굴이 감지되었으며 계속 진행할 수 있습니다.
Viola-Jones 프레임워크는 실시간 애플리케이션의 얼굴 인식에 있어 매우 정확하지만 특정 제한 사항이 있습니다.
예를 들어 얼굴이 마스크를 착용하고 있거나 얼굴 방향이 올바르지 않은 경우 프레임이 작동하지 않을 수 있습니다.
Viola-Jones 프레임워크의 단점을 제거하고 얼굴 감지 기능을 향상시키기 위해 추가 알고리즘을 개발했습니다.
지역 기반 컨벌루션 신경망(R-CNN) 및 싱글 샷 감지기(SSD) 등을 사용하여 프로세스를 개선할 수 있습니다.
CNN(Convolutional Neural Network)은 이미지 인식 및 처리에 사용되는 인공 신경망으로, 픽셀 데이터를 처리하도록 특별히 설계되었습니다.
R-CNN은 CNN 프레임워크에서 지역 제안을 생성하여 이미지의 개체를 지역화하고 분류합니다.
R-CNN과 같은 지역 제안 네트워크 기반 방법에는 지역 제안을 생성하는 샷과 제안된 각 객체를 감지하는 샷, 두 개의 샷이 필요한 반면, SSD는 여러 객체의 이미지에서 객체를 감지하는 데 한 번의 샷만 필요합니다. 따라서 SSD는 R-CNN보다 훨씬 빠릅니다.
최근 몇 년 동안 딥 러닝 모델을 기반으로 한 얼굴 인식 기술의 장점은 기존 컴퓨터 비전 방법보다 훨씬 뛰어납니다.
초기 얼굴 인식은 주로 전통적인 기계 학습 알고리즘을 사용했으며, 연구는 더 식별 가능한 특징을 추출하는 방법과 얼굴을 더 효과적으로 정렬하는 방법에 더 중점을 두었습니다.
연구가 심화됨에 따라 2차원 이미지에 대한 기존 기계 학습 알고리즘의 얼굴 인식 성능 향상이 점차 병목 현상에 도달했습니다.
사람들은 얼굴 인식 성능을 더욱 향상시키기 위해 영상 속 얼굴 인식 문제를 연구하거나 3차원 모델 방법과 결합하기 시작했고, 일부 학자들은 3차원 얼굴 인식 문제를 연구하기 시작했습니다.
가장 유명한 LFW 공공도서관에서 딥러닝 알고리즘은 2차원 이미지의 얼굴 인식 성능에서 기존 머신러닝 알고리즘의 병목 현상을 뚫고 인식률을 처음으로 97% 이상으로 높였습니다.
즉, "CNN 네트워크에서 구축한 고차원 모델"을 사용하여 입력된 얼굴 이미지에서 효과적인 식별 특징을 직접 추출하고, 얼굴 인식을 위한 코사인 거리를 직접 계산하는 것입니다.
얼굴 인식은 기본 컴퓨터 비전 기술에서 기계 학습(ML)의 발전, 점점 더 복잡해지는 인공 신경망(ANN) 및 관련 기술로 발전했으며 그 결과 지속적인 성능 향상이 이루어졌습니다.
이제는 얼굴 추적, 얼굴 분석, 얼굴 인식 등 여러 중요한 애플리케이션의 첫 번째 단계로서 중요한 역할을 합니다.
2차 세계대전 당시 중국도 전쟁의 트라우마를 겪었고, 당시 사진 속 인물 중 상당수는 더 이상 신원을 확인할 수 없게 되었습니다.
조부모 세대가 전쟁 트라우마를 겪은 사람들에게는 행방불명된 친척과 친구가 많습니다.
이 기술의 개발은 사람들이 먼지가 많은 세월을 발견하고 과거 사람들에게 위안을 찾는 데 도움이 될 수 있습니다.
참조: https://www.timesofisrael.com/google-engineer-identifying-anonymous-faces-in-wwii-photos-with-ai-facial-recognition/
위 내용은 AI를 사용해 홀로코스트 이후 헤어진 사랑하는 사람을 찾아보세요! Google 엔지니어가 70만 장 이상의 오래된 제2차 세계 대전 사진을 식별할 수 있는 얼굴 인식 프로그램을 개발했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!