MIT와 IBM Watson AI Lab의 연구원들은 청취자가 3D 공간 내의 다양한 위치에서 무엇을 듣게 될지 예측하기 위해 기계 학습 모델을 만들었습니다.
연구원들은 사람들이 소리를 통해 환경을 이해하는 것과 같은 방식으로 방 안의 소리가 어떻게 공간을 통해 이동하는지 이해하기 위해 이 기계 학습 모델을 사용하여 3D 방의 그림을 구축했습니다.
MIT 전기 공학 및 컴퓨터 과학부(EECS) 대학원생인 Yilun Du가 공동 집필한 논문에서 연구자들은 시각적 3D 모델링과 유사한 기술이 음향학에 어떻게 적용될 수 있는지 보여줍니다.
하지만 소리와 빛 전파의 차이에 직면해야 합니다. 예를 들어, 장애물, 방의 모양, 사운드 특성으로 인해 방의 서로 다른 위치에 있는 청취자는 사운드에 대해 매우 다른 인상을 받을 수 있으므로 결과를 예측할 수 없습니다.
이 문제를 해결하기 위해 연구원들은 모델에 음향 기능을 구축했습니다. 첫째, 다른 모든 조건이 동일하다면 음원과 청취자의 위치를 바꿔도 청취자가 듣는 내용은 바뀌지 않습니다. 사운드는 특히 청취자와 사운드 소스 사이의 장애물과 같은 지역적 조건의 영향을 받습니다.
Du는 "지금까지 대부분의 연구자들은 시각적 모델링에만 집중해 왔습니다. 하지만 인간으로서 우리는 여러 가지 인식 모드를 가지고 있습니다. 시각뿐만 아니라 소리도 중요합니다. 이번 작업이 새로운 가능성을 열어준다고 생각합니다. 소리를 더 잘 사용하여 세상을 모델링하는 연구 방향입니다."
이 접근 방식을 사용하면 생성된 신경음향장(NAF) 모델이 그리드의 점을 무작위로 샘플링하여 위치별 특징을 학습할 수 있습니다. . 예를 들어, 문 가까이에 있으면 청취자가 방 반대편에서 듣는 내용에 큰 영향을 미칠 수 있습니다.
모델은 방에서 청취자의 상대적 위치를 기반으로 특정 음향 자극으로부터 청취자가 무엇을 들을 가능성이 있는지 예측할 수 있습니다.
논문에서는 다음과 같이 설명합니다. "선형 시불변 시스템으로 장면의 음향 전파를 모델링함으로써 NAF는 방출기와 청취자의 위치를 임의의 사운드에 적용할 수 있는 신경 임펄스 응답 함수에 지속적으로 매핑하는 방법을 학습합니다." NAF의 연속성을 통해 어떤 위치의 청취자에게 공간 사운드를 렌더링하고 새로운 위치에서 소리의 전파를 예측할 수 있음을 입증했습니다."
MIT-IBM Watson AI Lab 수석 연구원인 Chuang Gan도 프로젝트에 참여했습니다. , 그는 "이 새로운 기술은 메타버스 애플리케이션에서 다중 모드 몰입형 경험을 창출할 수 있는 새로운 기회를 가져올 수 있습니다."라고 말했습니다.
모든 Reg 독자가 이 사용 사례에 흥미를 느끼는 것은 아닙니다.
위 내용은 음향학의 기계 학습 연구를 통해 다중 모드 메타버스를 열 수 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

소개 신속한 엔지니어링에서 "Thought of Thought"는 그래프 이론을 사용하여 AI의 추론 과정을 구성하고 안내하는 새로운 접근법을 나타냅니다. 종종 선형 S와 관련된 전통적인 방법과 달리

소개 축하해요! 당신은 성공적인 사업을 운영합니다. 웹 페이지, 소셜 미디어 캠페인, 웹 세미나, 컨퍼런스, 무료 리소스 및 기타 소스를 통해 매일 5000 개의 이메일 ID를 수집합니다. 다음 명백한 단계는입니다

소개 오늘날의 빠르게 진행되는 소프트웨어 개발 환경에서 최적의 애플리케이션 성능이 중요합니다. 응답 시간, 오류율 및 자원 활용과 같은 실시간 메트릭 모니터링 메인이 도움이 될 수 있습니다.

"얼마나 많은 사용자가 있습니까?" 그는 자극했다. Altman은“마지막으로 우리가 마지막으로 말한 것은 매주 5 억 명의 행위자이며 매우 빠르게 성장하고 있다고 생각합니다. 앤더슨은 계속해서“당신은 나에게 몇 주 만에 두 배가되었다고 말했습니다. “저는 그 개인이라고 말했습니다

소개 Mistral은 최초의 멀티 모드 모델, 즉 Pixtral-12B-2409를 발표했습니다. 이 모델은 Mistral의 120 억 개의 매개 변수 인 NEMO 12B를 기반으로합니다. 이 모델을 차별화하는 것은 무엇입니까? 이제 이미지와 Tex를 모두 가져갈 수 있습니다

쿼리에 응답 할뿐만 아니라 자율적으로 정보를 모으고, 작업을 실행하며, 여러 유형의 데이터 (텍스트, 이미지 및 코드를 처리하는 AI 구동 조수가 있다고 상상해보십시오. 미래처럼 들리나요? 이것에서

소개 금융 산업은 효율적인 거래 및 신용 가용성을 촉진함으로써 경제 성장을 주도하기 때문에 모든 국가 개발의 초석입니다. 거래가 발생하는 용이성 및 신용

소개 소셜 미디어, 금융 거래 및 전자 상거래 플랫폼과 같은 소스에서 전례없는 속도로 데이터가 생성되고 있습니다. 이 지속적인 정보 스트림을 처리하는 것은 어려운 일이지만


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

WebStorm Mac 버전
유용한 JavaScript 개발 도구

VSCode Windows 64비트 다운로드
Microsoft에서 출시한 강력한 무료 IDE 편집기

에디트플러스 중국어 크랙 버전
작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

맨티스BT
Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.
