"유일하고 진정한 탐험 여행은 낯선 땅을 방문하는 것이 아니라 다른 사람의 눈을 통해 우주를 관찰하는 것입니다." - 마르셀 프루스트
다른 사람의 눈으로 세상을 바라보는 이 공상과학, 시적인 (그리고 무서운) 아이디어가 실현되었습니다!
'블랙미러' 시즌1 '너의 모든 역사'
이제 눈의 반사만으로 사람이 관찰하고 있는 사물을 입체적으로 재구성할 수 있다. .
네, 이게 바로 블랙미러입니다.
최근 메릴랜드 대학의 한 팀은 눈 반사가 포함된 인물 사진을 사용하여 카메라로 포착할 수 없는 장면을 포착하는 새로운 방법을 제안했습니다. 카메라를 사용하여 3차원 재구성을 수행합니다.
논문 주소: https://arxiv.org/abs/2306.09348
프로젝트 주소: https://world-from-eyes.github.io/
고전 SF의 모든 장면이 현실로 이루어졌나요?
눈 반사를 사용하여 방사선장 재구성을 생성하시겠습니까? 이 아이디어는 미친 것처럼 보일 수도 있지만 실제로는 충분한 이론적 근거를 가지고 있습니다.
저자는 인간의 눈은 반사율이 높기 때문에 머리의 움직임을 포착하는 일련의 프레임에서 눈의 반사만을 이용하여 사람들이 관찰하는 3D 장면을 재구성하고 렌더링하는 것이 가능하다고 말했습니다.
이 컨셉이 그야말로 '블랙미러'이고, 이 글이 공개된 지 불과 몇 시간 만에 '블랙미러'의 새 시즌이 예고된 점을 감안하면, 이러한 우연은 단순히 '블랙미러'의 존재를 의심하게 만든다. 거울" 》감독님도 이 논문을 눈치채셨나요? (개머리)
오늘 블랙미러 시즌6가 시작됩니다
이 연구 결과가 나오자마자 네티즌들은 열광했습니다.
자 이제 거의 다 왔네요?
이게 2000년대 공각기동대의 한 장면 아닌가요? 이 모든 상상이 현실이 되었습니다!
100% 블레이드 러너, 지금 사본을 주세요.
Jules Verne의 "Brother Kip"이 실현됩니다!
물론 일부 사람들은 이에 대해 공포감을 표명했습니다. 이 기술은 수사 및 증거 수집과 같은 용도로 사용되어서는 안됩니다.
오늘날 우리는 이미 Varjo 시선 추적 카메라, Apple의 VisionPro 및 기타 헤드셋을 보유하고 있습니다. 이러한 장치는 이 신기술과 결합하여 수많은 새로운 공상 과학 소설을 포착할 수 있습니다. 곧 현실이 될지도...
연구팀은 인간의 눈에 나타나는 작은 빛의 반사를 이용하여 고정된 카메라 위치에서 촬영한 이미지를 사용할 수 있는 방법을 개발했습니다. 이미지 시퀀스는 인간이 관찰한(직접 본 것이 아닌) 장면을 재구성하는 데 사용됩니다.
그러나 관찰된 반사에 대한 방사선장을 단순히 훈련시키는 것만으로는 다음과 같은 여러 가지 이유로 충분하지 않습니다. 1) 각막 위치 지정에 내재된 노이즈, 2) 홍채 질감의 복잡성, 3) 각 이미지에 캡처된 방사선의 양 저해상도 반사.
이러한 과제를 해결하기 위해 팀은 인간 홍채를 기반으로 한 방사형 텍스처 정규화 손실의 도움을 받아 훈련 과정 중에 각막 자세 최적화 및 홍채 텍스처 분해를 도입했습니다.
카메라를 움직여야 하는 기존의 신경장 훈련 방법과 달리 카메라를 고정된 시점에 배치하고 전적으로 사용자의 움직임에 의존하는 방식입니다.
사람의 눈 반사를 사용하여 장면 재구성
이 작업은 눈의 자세와 홍채와 장면 반사 사이에 얽힌 텍스처를 정확하게 추정하기 어렵기 때문에 어렵습니다.
이 문제를 해결하기 위해 저자는 눈 자세, 장면을 설명하는 방사선장, 관찰자의 눈 홍채 질감을 공동으로 최적화했습니다.
구체적으로 주요 기여는 세 가지입니다.
1. 새로운 3차원 재구성
은 눈 이미지에서 관찰자의 세계를 재구성하는 3D 장면을 제안합니다. 이전의 기초 작업과 신경 렌더링의 최근 발전을 결합한 것입니다.
2. 홍채의 방사형 사전
홍채 텍스처 분해의 방사형 사전이 도입되어 재구성된 방사선장의 품질이 크게 향상됩니다.
3. 각막 자세 최적화
눈 자세 추정의 노이즈를 완화하고 인간의 눈에서 특징을 추출하는 고유한 과제를 극복하기 위해 각막 자세 최적화 프로세스가 개발되었습니다.
결과는 이 새로운 방법을 사용하면 사진을 이동하여 눈의 반사에서 장면의 다양한 관점을 얻을 수 있으며 최종적으로 완전한 장면 재구성을 달성할 수 있음을 보여줍니다.
더 놀라운 점은 마일리 사이러스와 레이디 가가의 뮤직비디오도 활용해 그들의 눈에 보이는 장면을 재현하려 했다는 점입니다.
저자들은 마일리의 눈에 나타난 물체를 성공적으로 재구성했으며, 레이디 가가의 눈을 통해 사람의 상체가 보이는 것 같다고 말했습니다.
그러나 이러한 영상의 품질이 충분히 높지 않기 때문에 재구성 결과의 정확성을 단정할 수는 없습니다.
레이디 가가
마일리 사이러스
어떻게 할까요?
건강한 성인의 각막 기하학은 거의 동일하다는 것은 잘 알려져 있습니다.
따라서 영상 속 사람의 각막 픽셀 크기만 계산하면 눈 위치를 정확하게 계산할 수 있습니다.
다음으로 저자는 카메라에서 광선을 가져와 반사하여 눈의 기하학적 구조에 근접하게 하여 눈에 반사되는 방사선장을 훈련합니다.
재구성에 나타나는 인간 눈의 홍채를 피하기 위해 저자는 홍채 텍스처를 학습한 2차원 텍스처 매핑도 훈련하여 텍스처 분해를 수행했습니다. ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
실험 평가먼저, 저자 통과 인간의 눈 모델을 블렌더 장면에 배치하고 합성 데이터를 평가했습니다.
실생활에서 각막을 완벽하게 추정할 수 없기 때문에 저자는 추정된 각막 반경 노이즈에 대한 각막 위치 최적화의 견고성을 평가했습니다.
아래 그림은 다양한 소음 수준에 따른 성능 변화를 보여줍니다.
노이즈가 증가함에 따라 저자가 제안한 포즈 최적화 재구성은 포즈 최적화가 없는 재구성에 비해 재구성된 기하학 및 색상 측면에서 더 강력하다는 점에 주목할 가치가 있습니다.
투영된 각막에서 이미지의 초기 타원까지의 적합성이 완벽하지 않기 때문에 이는 실제 시나리오에서 포즈 최적화가 중요하다는 것을 증명합니다.
또한 텍스처 분해가 있는 경우와 없는 경우의 정량적 비교를 통해 SSIM 및 LPIPS 측면에서 저자의 방법이 텍스처 분해에서 더 나은 성능을 발휘하는 것으로 나타났습니다.
설정에서 반사와 장면 자체 사이의 조명 차이가 매우 크기 때문에 작성자가 PSNR을 계산하지 않았다는 점은 주목할 가치가 있습니다.
실제 평가
저자는 시야의 사실성을 보장하기 위해 촬영에 Sony RX IV 카메라를 선택하고 Adobe Lightroom을 사용하여 이미지를 후처리하여 이미지를 줄였습니다. 각막 반사. 동시에 작가는 캐릭터의 양쪽에 광원을 추가하여 대상 물체를 조명했다.
이 과정에서 팀이 각 장면에서 5~15프레임의 이미지를 캡처할 수 있도록 사진을 찍는 사람은 카메라 시야 내에서 움직여야 합니다.
장면 조명의 넓은 동적 범위로 인해 저자는 관찰된 반사에서 정보 손실을 방지하기 위해 모든 실험에서 16비트 이미지를 사용합니다.
평균적으로 각막은 각 이미지 영역의 약 0.1%만 차지하는 반면 대상 물체는 홍채 텍스처와 인터리브된 약 20x20픽셀을 차지합니다.
데이터 처리
저자는 먼저 이미지의 각막 중심과 반경을 추정하여 각막의 초기 위치 추정치를 얻습니다.
그런 다음 카메라의 평균 깊이와 초점 거리의 직접적인 근사치를 사용하여 각막의 3차원 위치를 계산하고 표면 법선을 계산합니다.
이 프로세스를 자동화하기 위해 저자는 Grounding Dino를 사용하여 눈의 경계 상자를 찾고 ELLSeg를 사용하여 홍채에 타원 맞춤을 수행합니다.
각막은 일반적으로 폐색되어 있지만 폐색되지 않은 영역만 필요하므로 Segment Anything을 사용하여 홍채에 대한 분할 마스크를 얻을 수 있습니다.
Real Results
아래 그림의 결과에서 볼 수 있듯이 저자의 방법은 실제 인물 사진에서 3D 장면을 재구성할 수 있습니다. 각막 위치 및 부정확성의 기하학적 추정.
각막 경계가 흐릿하기 때문에 이미지에서 정확한 위치를 지정하는 것이 매우 어렵습니다.
또한 녹색, 파란색과 같은 특정 눈 색상의 경우 홍채 질감이 더 밝아지기 때문에 3D 재구성도 더 어렵습니다.
또한 명시적인 모델링 텍스처가 없으면 재구성된 그림에 "떠다니는 개체"가 더 많이 나타납니다.
이러한 문제를 해결하려면 방사형 정규화 정도를 높여 재구성 품질을 향상할 수 있습니다.
그러나 이 방법에는 여전히 두 가지 주요 제한 사항이 있습니다.
우선, 현재 실제 결과는 얼굴 확대, 장면 조명을 위한 추가 광원 사용 등과 같은 "실험실 설정"을 기반으로 합니다. 보다 자유로운 환경에서는 낮은 센서 해상도, 더 작은 동적 범위, 모션 블러와 같은 더 큰 문제에 직면해야 합니다.
두 번째로, 홍채 질감(예: 일정한 질감, 방사형으로 일정한 색상)에 대한 현재 가정이 지나치게 단순화될 수 있으므로 눈이 크게 회전하면 방법이 실패할 수 있습니다.
저자 소개
공저자 Kevin Zhang은 현재 메릴랜드 대학교에서 박사 과정을 밟고 있습니다.
Brandon Y. Feng은 메릴랜드 대학교에서 컴퓨터 과학 박사 학위를 받았으며 그의 연구 관심 분야는 컴퓨터 이미징, 중간 수준 비전 및 컴퓨터 사진 분야입니다. 그는 혼합 현실에서 자연 과학에 이르기까지 다양한 응용 분야를 통해 이미지 및 3D 데이터 처리를 위한 기계 학습 알고리즘을 개발했습니다.
Jia-Bin Huang은 메릴랜드 대학의 부교수이며 이전에 UIUC에서 박사 학위를 받았습니다. 연구 관심 분야는 컴퓨터 비전, 컴퓨터 그래픽 및 기계 학습의 교차점에 중점을 두고 있습니다.
위 내용은 안구 반사를 통해 3D 세계가 잠금 해제되어 Black Mirror가 현실이 됩니다! 메릴랜드 차이니즈의 신작, SF 팬들을 놀라게 하다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

写在前面&笔者的个人理解三维Gaussiansplatting(3DGS)是近年来在显式辐射场和计算机图形学领域出现的一种变革性技术。这种创新方法的特点是使用了数百万个3D高斯,这与神经辐射场(NeRF)方法有很大的不同,后者主要使用隐式的基于坐标的模型将空间坐标映射到像素值。3DGS凭借其明确的场景表示和可微分的渲染算法,不仅保证了实时渲染能力,而且引入了前所未有的控制和场景编辑水平。这将3DGS定位为下一代3D重建和表示的潜在游戏规则改变者。为此我们首次系统地概述了3DGS领域的最新发展和关

您一定记得,尤其是如果您是Teams用户,Microsoft在其以工作为重点的视频会议应用程序中添加了一批新的3DFluent表情符号。在微软去年宣布为Teams和Windows提供3D表情符号之后,该过程实际上已经为该平台更新了1800多个现有表情符号。这个宏伟的想法和为Teams推出的3DFluent表情符号更新首先是通过官方博客文章进行宣传的。最新的Teams更新为应用程序带来了FluentEmojis微软表示,更新后的1800表情符号将为我们每天

0.写在前面&&个人理解自动驾驶系统依赖于先进的感知、决策和控制技术,通过使用各种传感器(如相机、激光雷达、雷达等)来感知周围环境,并利用算法和模型进行实时分析和决策。这使得车辆能够识别道路标志、检测和跟踪其他车辆、预测行人行为等,从而安全地操作和适应复杂的交通环境.这项技术目前引起了广泛的关注,并认为是未来交通领域的重要发展领域之一。但是,让自动驾驶变得困难的是弄清楚如何让汽车了解周围发生的事情。这需要自动驾驶系统中的三维物体检测算法可以准确地感知和描述周围环境中的物体,包括它们的位置、

当八卦开始传播新的Windows11正在开发中时,每个微软用户都对新操作系统的外观以及它将带来什么感到好奇。经过猜测,Windows11就在这里。操作系统带有新的设计和功能更改。除了一些添加之外,它还带有功能弃用和删除。Windows11中不存在的功能之一是Paint3D。虽然它仍然提供经典的Paint,它对抽屉,涂鸦者和涂鸦者有好处,但它放弃了Paint3D,它提供了额外的功能,非常适合3D创作者。如果您正在寻找一些额外的功能,我们建议AutodeskMaya作为最好的3D设计软件。如

ChatGPT给AI行业注入一剂鸡血,一切曾经的不敢想,都成为如今的基操。正持续进击的Text-to-3D,就被视为继Diffusion(图像)和GPT(文字)后,AIGC领域的下一个前沿热点,得到了前所未有的关注度。这不,一款名为ChatAvatar的产品低调公测,火速收揽超70万浏览与关注,并登上抱抱脸周热门(Spacesoftheweek)。△ChatAvatar也将支持从AI生成的单视角/多视角原画生成3D风格化角色的Imageto3D技术,受到了广泛关注现行beta版本生成的3D模型,

对于自动驾驶应用来说,最终还是需要对3D场景进行感知。道理很简单,车辆不能靠着一张图像上得到感知结果来行驶,就算是人类司机也不能对着一张图像来开车。因为物体的距离和场景的和深度信息在2D感知结果上是体现不出来的,而这些信息才是自动驾驶系统对周围环境作出正确判断的关键。一般来说,自动驾驶车辆的视觉传感器(比如摄像头)安装在车身上方或者车内后视镜上。无论哪个位置,摄像头所得到的都是真实世界在透视视图(PerspectiveView)下的投影(世界坐标系到图像坐标系)。这种视图与人类的视觉系统很类似,

一些原神“奇怪”的关键词,在这两天很有关注度,明明搜索指数没啥变化,却不断有热议话题蹦窜。例如了龙王、钟离等“转变”立绘激增,虽在网络上疯传了一阵子,但是经过追溯发现这些是合理、常规的二创同人。如果单是这些,倒也翻不起多大的热度。按照一部分网友的说法,除了原神自身就有热度外,发现了一件格外醒目的事情:原神3d同人作者shirakami已经被捕。这引发了不小的热议。为什么被捕?关键词,原神3D动画。还是越过了线(就是你想的那种),再多就不能明说了。经过多方求证,以及新闻报道,确实有此事。自从去年发

原标题:Radocc:LearningCross-ModalityOccupancyKnowledgethroughRenderingAssistedDistillation论文链接:https://arxiv.org/pdf/2312.11829.pdf作者单位:FNii,CUHK-ShenzhenSSE,CUHK-Shenzhen华为诺亚方舟实验室会议:AAAI2024论文思路:3D占用预测是一项新兴任务,旨在使用多视图图像估计3D场景的占用状态和语义。然而,由于缺乏几何先验,基于图像的场景


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

PhpStorm 맥 버전
최신(2018.2.1) 전문 PHP 통합 개발 도구

Dreamweaver Mac版
시각적 웹 개발 도구

SecList
SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

MinGW - Windows용 미니멀리스트 GNU
이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.
