>  기사  >  기술 주변기기  >  CV는 고유한 2D 재료와 기계 학습을 사용하여 인간처럼 수백만 가지 색상을 '봅니다'

CV는 고유한 2D 재료와 기계 학습을 사용하여 인간처럼 수백만 가지 색상을 '봅니다'

WBOY
WBOY앞으로
2023-04-12 14:13:05844검색

인간의 눈은 수백만 가지 색상을 볼 수 있으며 이제 인공 지능도 볼 수 있습니다.

최근 미국 노스이스턴 대학의 학제간 연구팀은 새로운 인공지능 기술을 사용해 수백만 가지 색상을 인식할 수 있는 새로운 장치 A-Eye를 구축했는데, 이는 머신 비전 분야에 큰 진전을 가져왔습니다. 이 단계에서는 자율주행차, 농업 분류, 원격 위성 영상 촬영 등 일련의 기술에 널리 활용될 예정이다.

"Materials Today"에 연구 논문이 게재되었습니다.

CV는 고유한 2D 재료와 기계 학습을 사용하여 인간처럼 수백만 가지 색상을 봅니다

논문 주소: https://www.sciencedirect.com/science/article/abs/pii/S1369702122002255

Swastik Kar, 해당 연구의 교신저자이자 물리학 부교수 Northeastern University의 연구진은 "자동화가 널리 보급됨에 따라 물체의 색상과 모양을 인식하는 기계의 능력이 점점 더 중요해지고 있습니다."라고 말했습니다.

이 연구는 빛을 물질에 포함시키는 특별한 양자 특성을 가진 2D 재료를 설계했습니다. Eye Machine의 광학 창은 전례 없는 "매우 높은 정밀도"로 풍부하고 다양한 색상을 처리할 수 있습니다.

또한 A-Eye는 원래 스펙트럼에서 0의 편차 없이 "보이는" 색상을 정확하게 식별하고 재현할 수 있습니다. 이는 노스이스턴 대학교 전기 및 컴퓨터 공학과 조교수 Sarah Ostadabbas가 이끄는 AI 연구팀이 개발한 기계 학습 알고리즘 덕분에 가능합니다.

전체 연구의 주요 기술은 전이 금속 디칼코게나이드라고 불리는 물질 종류의 양자 및 광학 특성에 중점을 두고 있습니다. 이 독특한 물질은 특히 감지 및 에너지 저장 응용 분야에서 항상 무한한 잠재력을 가진 것으로 간주되어 왔습니다. .

연구 개요

색상을 식별할 때 기계는 일반적으로 전통적인 RGB(빨간색, 녹색, 파란색) 필터를 사용하여 색상을 구성 요소로 분해한 다음 해당 정보를 사용하여 기본 색상을 추측하고 재현합니다. 디지털 카메라로 색상이 있는 물체를 가리키고 사진을 찍으면 물체에서 나오는 빛은 필터가 앞에 있는 감지기 세트를 통과하여 빛을 원시 RGB 색상으로 분리합니다.

Kar는 "컬러 필터를 시각적 정보나 데이터를 별도의 상자에 보내는 깔때기로 생각할 수 있으며, 그 깔때기는 자연스러운 색상에 인위적인 숫자를 할당합니다."라고 말했습니다. 하지만 색상을 세 가지 구성 요소로 분해하면( 빨간색, 녹색, 파란색)에는 몇 가지 제한 사항이 있습니다.

그러나 Kar와 그의 팀은 컬러 필터를 사용하는 대신 독특한 2D 소재로 만들어진 "투과형 창"을 사용했습니다.

Kar는 기계(예: A-Eye)가 완전히 다른 방식으로 색상을 인식하도록 하고 있다고 말합니다. 유색광이 검출기에 도달하면 연구자들은 이를 주요 빨간색, 녹색 및 파란색 구성 요소로 분해하거나 해당 구성 요소만 찾는 것이 아니라 전체 정보 스펙트럼을 사용합니다.

게다가 연구원들은 몇 가지 기술을 사용하여 이러한 성분을 수정 및 인코딩하고 다양한 방식으로 저장했습니다. 그래서 그들에게는 일련의 숫자가 주어졌고 기존과는 매우 다른 방식으로 원색을 식별할 수 있었습니다.

아래 사진의 왼쪽 상단은 A-Eye 제작에 사용된 2D 소재, 오른쪽 상단은 A-Eye의 작업 흐름, 사진 하단은 테스트 컬러와 A-Eye의 색상 비교를 보여줍니다. 눈의 견적입니다.

CV는 고유한 2D 재료와 기계 학습을 사용하여 인간처럼 수백만 가지 색상을 봅니다

또 다른 저자인 Sarah Ostadabbas는 빛이 이러한 투과창을 통과할 때 A-Eye가 색상을 데이터로 처리한다고 말했습니다. 그리고 내장된 기계 학습 모델은 A-Eye가 분석한 해당 색상을 더 잘 식별하기 위해 패턴을 찾습니다.

동시에 A-Eye는 훈련 데이터 세트에 정확한 추측을 추가하여 색상 추정 결과를 지속적으로 개선할 수도 있습니다.

제1저자 소개

이 연구의 제1저자인 Davoud Hejazi는 현재 Titan Advanced Energy Solutions의 선임 데이터 과학자로 통계 모델링, 기계 학습, 신호 처리, 이미지 처리, 클라우드 컴퓨팅 및 데이터 시각화에 주력하고 있습니다.

올해 5월 노스이스턴 대학교에서 물리학 박사 학위를 취득했으며, 졸업 논문은 "계층 여기성 2D 재료 및 기계 학습을 사용한 분산 없는 정확한 색상 추정"이었습니다.

CV는 고유한 2D 재료와 기계 학습을 사용하여 인간처럼 수백만 가지 색상을 봅니다

문서 주소: https://repository.library.northeastern.edu/files/neu:4f171c96c

위 내용은 CV는 고유한 2D 재료와 기계 학습을 사용하여 인간처럼 수백만 가지 색상을 '봅니다'의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제