신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다.-일체 포함-php.cn

집

기술 주변기기

일체 포함

신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 18, 2023 am 10:52 AM

ai비전

초고해상도는 고품질 이미지와 비디오를 녹화하고 표시하기 위한 표준으로 많은 연구자들이 환영합니다. 낮은 해상도(1K HD 형식)에 비해 일반적으로 고해상도로 캡처한 장면은 픽셀 정보가 매우 명확합니다. 작은 패치로 증폭됩니다. 하지만 이 기술을 영상처리와 컴퓨터 비전에 적용하는 데는 여전히 많은 과제가 남아있습니다.

이 기사에서는 Alibaba의 연구원들이 새로운 뷰 합성 작업에 중점을 두고 4K-NeRF라는 프레임워크를 제안합니다. NeRF 기반 볼륨 렌더링 방법은 4K 초고해상도에서 높은 충실도를 달성할 수 있습니다. 주소 : https://arxiv.org/abs/2212.04701 홈페이지 : https://github.com/frozoul/4k-nerf

신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다.

없이 더 자세한 내용은 먼저 효과를 살펴보겠습니다(다음 동영상은 다운샘플링되었습니다. 원본 4K 동영상은 원본 프로젝트를 참조하세요).

Methods

다음으로 연구가 어떻게 진행되었는지 살펴보겠습니다.

4K-NeRF 파이프라인(아래 참조): 패치 기반 광선 샘플링 기술을 사용하여 VC-Encoder(View-Consistency)(DEVO 기반)를 공동 훈련하여 저해상도 공간에서 3차원 기하학적 정보를 인코딩합니다. 그런 다음 VC-Decoder를 통해 고주파수, 고품질 및 고품질 렌더링과 뷰 일관성 향상이 달성됩니다.

이 연구는 DVGO [32]에 정의된 공식을 기반으로 인코더를 인스턴스화하고 복셀 그리드 기반 표현을 학습하여 형상을 명시적으로 인코딩합니다.

각 샘플링 포인트에 대해, 밀도 추정의 삼선형 보간에는 점의 부피 밀도 값을 생성하는 소프트플러스 활성화 함수가 장착되어 있습니다.

신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다.

색상은 작은 MLP를 사용하여 추정됩니다.

신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다.

여기서 방식으로 각 광선(또는 픽셀)의 특성 값은 설정된 선 r을 따라 샘플링 점의 특성을 누적하여 얻을 수 있습니다.

신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다.

VC-인코더 속성에 포함된 기하학을 더 잘 활용하려면, 이 연구는 또한 샘플링된 광선 축을 따라 각 광선 r의 깊이를 추정하여 깊이 맵을 생성했습니다. 추정된 깊이 맵은 위 인코더에 의해 생성된 장면의 3차원 구조에 대한 강력한 가이드를 제공합니다.

신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다.

그 이후에 전달된 네트워크는 여러 개의 컨볼루션 블록을 쌓아서 얻어집니다(비모수적 정규화를 사용하지도 않고, 다운샘플링 작업) 및 인터리브된 업샘플링 작업을 사용하여 생성됩니다. 특히, 본 연구에서는 단순히 특징 F와 깊이 맵 M을 연결하는 대신 깊이 맵의 깊이 신호를 결합하고 이를 학습된 변환을 통해 각 블록에 주입하여 블록 활성화를 변조합니다.

신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다.

기존 NeRF 방법의 픽셀 수준 메커니즘과 달리 본 연구에서 연구하는 방법은 광선(픽셀) 사이의 공간 정보를 캡처하는 것을 목표로 합니다. 따라서 NeRF의 무작위 광선 샘플링 전략은 여기에 적합하지 않습니다. 따라서 본 연구에서는 광선 특징 간의 공간적 의존성을 포착하기 위한 패치 기반 광선 샘플링 훈련 전략을 제안합니다. 훈련 중에 훈련 뷰의 이미지는 먼저 픽셀의 샘플링 확률이 균일하도록 보장하기 위해 N_p×N_p 크기의 패치 p로 나뉩니다. 이미지 공간 차원을 패치 크기로 정확하게 나눌 수 없는 경우 트레이닝 패치 세트를 얻기 위해 패치를 가장자리까지 잘라야 합니다. 그런 다음 하나 이상의 패치가 세트에서 무작위로 선택되고 패치의 픽셀 광선이 각 반복에 대한 미니 배치를 형성합니다.

세부 디테일의 시각적 효과가 흐려지거나 지나치게 스무딩되는 문제를 해결하기 위해 이 연구에서는 적대적 손실과 지각 손실을 추가하여 세밀한 디테일 합성을 정규화합니다. 지각 손실 신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다. 은 미리 훈련된 19계층 VGG 네트워크를 통해 특징 공간에서 예측된 패치 와 실제 진실 p 사이의 유사성을 추정합니다. 손실 고주파수 세부 사항의 재구성을 감독하기 위한 MSE 대신

신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다.

또한 연구에서는 보조 MSE 손실도 추가했으며 최종 총 손실 함수는 다음과 같은 형식을 갖습니다. 신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다.

실험 효과

신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다.

정성적 분석

신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다. 실험에서는 4K-NeRF를 다른 모델과 비교했는데, 일반 NeRF를 기반으로 한 방법은 디테일 손실과 블러링 정도가 다양하다는 것을 알 수 있습니다. 이와 대조적으로 4K-NeRF는 훈련 시야가 제한된 장면에서도 이러한 복잡하고 고주파수 세부 사항에 대한 고품질의 사실적인 렌더링을 제공합니다.

정량 분석

신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다.

이 연구는 Plenoxels, DVGO, JaxNeRF, MipNeRF-360 및 NeRF-SR을 포함하여 4k 데이터를 기반으로 하는 여러 가지 현재 방법과 비교되었습니다. 실험에서는 이미지 복구의 평가 지표를 비교로 사용할 뿐만 아니라 종합적인 평가 참조를 위한 추론 시간과 캐시 메모리도 제공합니다. 결과는 다음과 같습니다.

신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다.

일부 지표에서는 일부 방법의 결과와 크게 다르지 않지만 복셀 기반 방법 덕분에 추론 효율성과 메모리 비용 모두에서 놀라운 성능을 달성했습니다. , 300ms 안에 4K 이미지를 렌더링할 수 있습니다.

요약 및 향후 전망

이 연구에서는 미세한 디테일 모델링에서 NeRF의 기능을 탐구하고, 극도로 높은 해상도의 장면에서 뷰 일관성이 있는 미세한 디테일을 복구하는 표현력을 향상시키는 새로운 프레임워크를 제안합니다. 또한, 이 연구에서는 기하학적 일관성을 유지하고, 하부 공간에서 기하학적 속성을 효과적으로 모델링하고, 기하학적 인식 기능 간의 로컬 상관 관계를 활용하여 전체 공간에서 뷰를 달성하는 한 쌍의 인코더-디코더 모듈도 도입합니다. 향상된 일관성 및 패치- 기반 샘플링 훈련 프레임워크를 사용하면 퍼셉트론 중심 정규화의 감독을 통합하는 방법도 가능합니다. 본 연구는 프레임워크의 효과를 동적 장면 모델링뿐만 아니라 신경 렌더링 작업에 향후 방향으로 통합하기를 희망합니다.

위 내용은 신은 복잡한 물체와 고주파 세부 정보를 복원합니다. 4K-NeRF 고화질 뷰 합성이 여기에 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

ai合并图层的快捷键是什么Jan 07, 2021 am 10:59 AM

ai合并图层的快捷键是“Ctrl+Shift+E”，它的作用是把目前所有处在显示状态的图层合并，在隐藏状态的图层则不作变动。也可以选中要合并的图层，在菜单栏中依次点击“窗口”-“路径查找器”，点击“合并”按钮。

ai橡皮擦擦不掉东西怎么办Jan 13, 2021 am 10:23 AM

ai橡皮擦擦不掉东西是因为AI是矢量图软件，用橡皮擦不能擦位图的，其解决办法就是用蒙板工具以及钢笔勾好路径再建立蒙板即可实现擦掉东西。

谷歌超强AI超算碾压英伟达A100！TPU v4性能提升10倍，细节首次公开Apr 07, 2023 pm 02:54 PM

虽然谷歌早在2020年，就在自家的数据中心上部署了当时最强的AI芯片——TPU v4。但直到今年的4月4日，谷歌才首次公布了这台AI超算的技术细节。论文地址：https://arxiv.org/abs/2304.01433相比于TPU v3，TPU v4的性能要高出2.1倍，而在整合4096个芯片之后，超算的性能更是提升了10倍。另外，谷歌还声称，自家芯片要比英伟达A100更快、更节能。与A100对打，速度快1.7倍论文中，谷歌表示，对于规模相当的系统，TPU v4可以提供比英伟达A100强1.

ai可以转成psd格式吗Feb 22, 2023 pm 05:56 PM

ai可以转成psd格式。转换方法：1、打开Adobe Illustrator软件，依次点击顶部菜单栏的“文件”-“打开”，选择所需的ai文件；2、点击右侧功能面板中的“图层”，点击三杠图标，在弹出的选项中选择“释放到图层（顺序）”；3、依次点击顶部菜单栏的“文件”-“导出”-“导出为”；4、在弹出的“导出”对话框中，将“保存类型”设置为“PSD格式”，点击“导出”即可；

ai顶部属性栏不见了怎么办Feb 22, 2023 pm 05:27 PM

ai顶部属性栏不见了的解决办法：1、开启Ai新建画布，进入绘图页面；2、在Ai顶部菜单栏中点击“窗口”；3、在系统弹出的窗口菜单页面中点击“控制”，然后开启“控制”窗口即可显示出属性栏。

GPT-4的研究路径没有前途？Yann LeCun给自回归判了死刑Apr 04, 2023 am 11:55 AM

Yann LeCun 这个观点的确有些大胆。「从现在起 5 年内，没有哪个头脑正常的人会使用自回归模型。」最近，图灵奖得主 Yann LeCun 给一场辩论做了个特别的开场。而他口中的自回归，正是当前爆红的 GPT 家族模型所依赖的学习范式。当然，被 Yann LeCun 指出问题的不只是自回归模型。在他看来，当前整个的机器学习领域都面临巨大挑战。这场辩论的主题为「Do large language models need sensory grounding for meaning and u

ai移动不了东西了怎么办Mar 07, 2023 am 10:03 AM

ai移动不了东西的解决办法：1、打开ai软件，打开空白文档；2、选择矩形工具，在文档中绘制矩形；3、点击选择工具，移动文档中的矩形；4、点击图层按钮，弹出图层面板对话框，解锁图层；5、点击选择工具，移动矩形即可。

强化学习再登Nature封面，自动驾驶安全验证新范式大幅减少测试里程Mar 31, 2023 pm 10:38 PM

引入密集强化学习，用 AI 验证 AI。自动驾驶汽车 (AV) 技术的快速发展，使得我们正处于交通革命的风口浪尖，其规模是自一个世纪前汽车问世以来从未见过的。自动驾驶技术具有显着提高交通安全性、机动性和可持续性的潜力，因此引起了工业界、政府机构、专业组织和学术机构的共同关注。过去 20 年里，自动驾驶汽车的发展取得了长足的进步，尤其是随着深度学习的出现更是如此。到 2015 年，开始有公司宣布他们将在 2020 之前量产 AV。不过到目前为止，并且没有 level 4 级别的 AV 可以在市场

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.