찾다
기술 주변기기일체 포함CV는 고유한 2D 재료와 기계 학습을 사용하여 인간처럼 수백만 가지 색상을 '봅니다'

인간의 눈은 수백만 가지 색상을 볼 수 있으며 이제 인공 지능도 볼 수 있습니다.

최근 미국 노스이스턴 대학의 학제간 연구팀은 새로운 인공지능 기술을 사용해 수백만 가지 색상을 인식할 수 있는 새로운 장치 A-Eye를 구축했는데, 이는 머신 비전 분야에 큰 진전을 가져왔습니다. 이 단계에서는 자율주행차, 농업 분류, 원격 위성 영상 촬영 등 일련의 기술에 널리 활용될 예정이다.

"Materials Today"에 연구 논문이 게재되었습니다.

CV는 고유한 2D 재료와 기계 학습을 사용하여 인간처럼 수백만 가지 색상을 봅니다

논문 주소: https://www.sciencedirect.com/science/article/abs/pii/S1369702122002255

Swastik Kar, 해당 연구의 교신저자이자 물리학 부교수 Northeastern University의 연구진은 "자동화가 널리 보급됨에 따라 물체의 색상과 모양을 인식하는 기계의 능력이 점점 더 중요해지고 있습니다."라고 말했습니다.

이 연구는 빛을 물질에 포함시키는 특별한 양자 특성을 가진 2D 재료를 설계했습니다. Eye Machine의 광학 창은 전례 없는 "매우 높은 정밀도"로 풍부하고 다양한 색상을 처리할 수 있습니다.

또한 A-Eye는 원래 스펙트럼에서 0의 편차 없이 "보이는" 색상을 정확하게 식별하고 재현할 수 있습니다. 이는 노스이스턴 대학교 전기 및 컴퓨터 공학과 조교수 Sarah Ostadabbas가 이끄는 AI 연구팀이 개발한 기계 학습 알고리즘 덕분에 가능합니다.

전체 연구의 주요 기술은 전이 금속 디칼코게나이드라고 불리는 물질 종류의 양자 및 광학 특성에 중점을 두고 있습니다. 이 독특한 물질은 특히 감지 및 에너지 저장 응용 분야에서 항상 무한한 잠재력을 가진 것으로 간주되어 왔습니다. .

연구 개요

색상을 식별할 때 기계는 일반적으로 전통적인 RGB(빨간색, 녹색, 파란색) 필터를 사용하여 색상을 구성 요소로 분해한 다음 해당 정보를 사용하여 기본 색상을 추측하고 재현합니다. 디지털 카메라로 색상이 있는 물체를 가리키고 사진을 찍으면 물체에서 나오는 빛은 필터가 앞에 있는 감지기 세트를 통과하여 빛을 원시 RGB 색상으로 분리합니다.

Kar는 "컬러 필터를 시각적 정보나 데이터를 별도의 상자에 보내는 깔때기로 생각할 수 있으며, 그 깔때기는 자연스러운 색상에 인위적인 숫자를 할당합니다."라고 말했습니다. 하지만 색상을 세 가지 구성 요소로 분해하면( 빨간색, 녹색, 파란색)에는 몇 가지 제한 사항이 있습니다.

그러나 Kar와 그의 팀은 컬러 필터를 사용하는 대신 독특한 2D 소재로 만들어진 "투과형 창"을 사용했습니다.

Kar는 기계(예: A-Eye)가 완전히 다른 방식으로 색상을 인식하도록 하고 있다고 말합니다. 유색광이 검출기에 도달하면 연구자들은 이를 주요 빨간색, 녹색 및 파란색 구성 요소로 분해하거나 해당 구성 요소만 찾는 것이 아니라 전체 정보 스펙트럼을 사용합니다.

게다가 연구원들은 몇 가지 기술을 사용하여 이러한 성분을 수정 및 인코딩하고 다양한 방식으로 저장했습니다. 그래서 그들에게는 일련의 숫자가 주어졌고 기존과는 매우 다른 방식으로 원색을 식별할 수 있었습니다.

아래 사진의 왼쪽 상단은 A-Eye 제작에 사용된 2D 소재, 오른쪽 상단은 A-Eye의 작업 흐름, 사진 하단은 테스트 컬러와 A-Eye의 색상 비교를 보여줍니다. 눈의 견적입니다.

CV는 고유한 2D 재료와 기계 학습을 사용하여 인간처럼 수백만 가지 색상을 봅니다

또 다른 저자인 Sarah Ostadabbas는 빛이 이러한 투과창을 통과할 때 A-Eye가 색상을 데이터로 처리한다고 말했습니다. 그리고 내장된 기계 학습 모델은 A-Eye가 분석한 해당 색상을 더 잘 식별하기 위해 패턴을 찾습니다.

동시에 A-Eye는 훈련 데이터 세트에 정확한 추측을 추가하여 색상 추정 결과를 지속적으로 개선할 수도 있습니다.

제1저자 소개

이 연구의 제1저자인 Davoud Hejazi는 현재 Titan Advanced Energy Solutions의 선임 데이터 과학자로 통계 모델링, 기계 학습, 신호 처리, 이미지 처리, 클라우드 컴퓨팅 및 데이터 시각화에 주력하고 있습니다.

올해 5월 노스이스턴 대학교에서 물리학 박사 학위를 취득했으며, 졸업 논문은 "계층 여기성 2D 재료 및 기계 학습을 사용한 분산 없는 정확한 색상 추정"이었습니다.

CV는 고유한 2D 재료와 기계 학습을 사용하여 인간처럼 수백만 가지 색상을 봅니다

문서 주소: https://repository.library.northeastern.edu/files/neu:4f171c96c

위 내용은 CV는 고유한 2D 재료와 기계 학습을 사용하여 인간처럼 수백만 가지 색상을 '봅니다'의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
신속한 엔지니어링에서 생각의 그래프는 무엇입니까?신속한 엔지니어링에서 생각의 그래프는 무엇입니까?Apr 13, 2025 am 11:53 AM

소개 신속한 엔지니어링에서 "Thought of Thought"는 그래프 이론을 사용하여 AI의 추론 과정을 구성하고 안내하는 새로운 접근법을 나타냅니다. 종종 선형 S와 관련된 전통적인 방법과 달리

Genai 에이전트와 함께 조직의 이메일 마케팅을 최적화하십시오Genai 에이전트와 함께 조직의 이메일 마케팅을 최적화하십시오Apr 13, 2025 am 11:44 AM

소개 축하해요! 당신은 성공적인 사업을 운영합니다. 웹 페이지, 소셜 미디어 캠페인, 웹 세미나, 컨퍼런스, 무료 리소스 및 기타 소스를 통해 매일 5000 개의 이메일 ID를 수집합니다. 다음 명백한 단계는입니다

Apache Pinot을 사용한 실시간 앱 성능 모니터링Apache Pinot을 사용한 실시간 앱 성능 모니터링Apr 13, 2025 am 11:40 AM

소개 오늘날의 빠르게 진행되는 소프트웨어 개발 환경에서 최적의 애플리케이션 성능이 중요합니다. 응답 시간, 오류율 및 자원 활용과 같은 실시간 메트릭 모니터링 메인이 도움이 될 수 있습니다.

Chatgpt가 10 억 명의 사용자를 쳤습니까? Openai CEO는'몇 주 만에 두 배가되었습니다Chatgpt가 10 억 명의 사용자를 쳤습니까? Openai CEO는'몇 주 만에 두 배가되었습니다Apr 13, 2025 am 11:23 AM

"얼마나 많은 사용자가 있습니까?" 그는 자극했다. Altman은“마지막으로 우리가 마지막으로 말한 것은 매주 5 억 명의 행위자이며 매우 빠르게 성장하고 있다고 생각합니다. 앤더슨은 계속해서“당신은 나에게 몇 주 만에 두 배가되었다고 말했습니다. “저는 그 개인이라고 말했습니다

Pixtral -12B : Mistral AI의 첫 번째 멀티 모드 모델 -Anuctics VidhyaPixtral -12B : Mistral AI의 첫 번째 멀티 모드 모델 -Anuctics VidhyaApr 13, 2025 am 11:20 AM

소개 Mistral은 최초의 멀티 모드 모델, 즉 Pixtral-12B-2409를 발표했습니다. 이 모델은 Mistral의 120 억 개의 매개 변수 인 NEMO 12B를 기반으로합니다. 이 모델을 차별화하는 것은 무엇입니까? 이제 이미지와 Tex를 모두 가져갈 수 있습니다

생성 AI 응용 프로그램을위한 에이전트 프레임 워크 - 분석 Vidhya생성 AI 응용 프로그램을위한 에이전트 프레임 워크 - 분석 VidhyaApr 13, 2025 am 11:13 AM

쿼리에 응답 할뿐만 아니라 자율적으로 정보를 모으고, 작업을 실행하며, 여러 유형의 데이터 (텍스트, 이미지 및 코드를 처리하는 AI 구동 조수가 있다고 상상해보십시오. 미래처럼 들리나요? 이것에서

금융 부문에서 생성 AI의 응용금융 부문에서 생성 AI의 응용Apr 13, 2025 am 11:12 AM

소개 금융 산업은 효율적인 거래 및 신용 가용성을 촉진함으로써 경제 성장을 주도하기 때문에 모든 국가 개발의 초석입니다. 거래가 발생하는 용이성 및 신용

온라인 학습 및 수동 공격 알고리즘 안내온라인 학습 및 수동 공격 알고리즘 안내Apr 13, 2025 am 11:09 AM

소개 소셜 미디어, 금융 거래 및 전자 상거래 플랫폼과 같은 소스에서 전례없는 속도로 데이터가 생성되고 있습니다. 이 지속적인 정보 스트림을 처리하는 것은 어려운 일이지만

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
3 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25 : Myrise에서 모든 것을 잠금 해제하는 방법
4 몇 주 전By尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

DVWA

DVWA

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

VSCode Windows 64비트 다운로드

VSCode Windows 64비트 다운로드

Microsoft에서 출시한 강력한 무료 IDE 편집기

MinGW - Windows용 미니멀리스트 GNU

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

ZendStudio 13.5.1 맥

ZendStudio 13.5.1 맥

강력한 PHP 통합 개발 환경

WebStorm Mac 버전

WebStorm Mac 버전

유용한 JavaScript 개발 도구