찾다
기술 주변기기일체 포함CVPR 2023 논문 요약! CV의 가장 인기 있는 분야는 다중 모드 및 확산 모델에 수여됩니다.

연례 CVPR은 6월 18일부터 22일까지 캐나다 밴쿠버에서 공식적으로 개최됩니다.

매년 전 세계 수천 명의 이력서 연구원과 엔지니어가 함께 모여 서밋에 참여합니다. 이 권위 있는 컨퍼런스는 1983년으로 거슬러 올라가며 컴퓨터 비전 개발의 정점을 나타냅니다.

현재 CVPR의 h5 지수는 모든 학회나 출판물 중에서 'Nature', 'Science', 'New England Journal of Medicine'에 이어 4위를 차지하고 있습니다.

CVPR 2023论文总结!CV最热领域颁给多模态、扩散模型

얼마 전 CVPR에서 논문 게재 결과를 발표했습니다. 공식 홈페이지 통계에 따르면 총 9,155편의 논문이 접수됐고, 2,359편이 접수돼 합격률은 25.8%를 기록했다.

이 외에도 12개의 수상 후보 논문이 발표되었습니다.

CVPR 2023论文总结!CV最热领域颁给多模态、扩散模型

그렇다면 올해 CVPR의 하이라이트는 무엇일까요? 합격된 논문을 보면 CV 분야에서 어떤 경향을 볼 수 있나요?

다음에 공지하겠습니다.

CVPR 개요

스타트업 Voxel51은 모든 채택 논문 목록을 분석했습니다.

먼저, 논문 제목의 요약 다이어그램을 살펴보겠습니다. 각 단어의 크기는 데이터 세트의 발생 빈도에 비례합니다. ㅋㅋㅋ - 다른 주소로 제출된 문서 68개

CVPR 2023论文总结!CV最热领域颁给多模态、扩散模型

각 논문의 저자

- CVPR 논문의 평균 저자는 약 5.4명입니다.

- 가장 많이 작성된 논문은 "왜 우승자가 최고입니까?"입니다.

- 저자가 1명인 논문은 13편입니다.

Arxiv 주요 카테고리

1724년 Arxiv 논문 중 1545편, 즉 거의 90%의 논문이 cs.CV를 주요 카테고리로 나열합니다.

cs.LG는 101개의 기사로 2위를 차지했습니다. eess.IV(26) 및 cs.RO(16)도 파이를 공유합니다.

CVPR 논문의 기타 카테고리에는 cs.HC, cs.CV, cs.AR, cs.DC, cs.NE, cs.SD, cs.CL, cs.IT, cs.CR, cs.AI가 있습니다. , cs.MM, cs.GR, eess.SP, eess.AS, math.OC, math.NT, 물리.데이터-an 및 stat.ML.

"메타" 데이터

- "데이터세트"와 "모델"이라는 두 단어가 567개의 초록에 함께 등장했습니다. "데이터세트"는 265개의 논문 초록에 단독으로 나타나는 반면, "모델"은 613번만 나타납니다. CVPR이 승인한 논문 중 16.2%만이 이 두 단어를 포함하지 않았습니다.

- CVPR 논문 초록에 따르면 올해 가장 인기 있는 데이터 세트는 ImageNet(105), COCO(94), KITTI(55) 및 CIFAR(36)입니다.

- 28개의 논문이 새로운 "벤치마크"를 제안합니다.

약어가 풍부합니다

약어가 없는 머신러닝 프로젝트는 없는 것 같습니다. 논문 2,359편 중 대문자로 된 복수의 약어나 복합어를 사용한 제목이 1,487편으로 63%를 차지한다.

이 두문자어 중 일부는 기억하기 쉽고 심지어 입에서 굴러다니기도 합니다.

- CLAMP: 언어와 동물 포즈 연결을 위한 프롬프트 기반 대조 학습CLAMP

- PATS: 로컬 기능에 대한 세분화를 통한 패치 영역 이동 Matching

- CIRCLE: 풍부한 상황별 환경에서 캡처

일부는 훨씬 더 복잡합니다.

- SIEDOB: 객체와 배경을 분리하여 의미론적 이미지 편집

- FJMP: Factorized Joint Multi-Agent 학습된 방향성 비순환 상호 작용 그래프에 대한 동작 예측FJMP

그 중 일부는 약어 구성 측면에서 다른 사람의 아이디어를 빌린 것 같습니다.

- SCOTCH 및 SODA: A Transformer Video ShadowDetection Framework(인기 네덜란드 브랜드 Scotch & Soda) )

- EXCALIBUR: 체화된 탐구 장려 및 평가 (Ex 카레 스틱, 웃음)

무엇이 가장 핫해요?

2023년 논문 제목 외에도 2022년에 승인된 모든 논문 제목을 크롤링했습니다. 이 두 목록에서 우리는 상승 추세와 하락 추세가 무엇인지에 대한 더 깊은 이해를 제공하기 위해 다양한 키워드의 상대 빈도를 계산했습니다.

Model

2023년에는 확산 모델이 대세입니다. Stable Diffusion, Midjourney 등의 이미지 생성 모델이 인기를 끌면서 확산 모델의 개발이 뜨거운 추세라는 것은 놀라운 일이 아닙니다.

확산 모델에는 노이즈 제거, 이미지 편집 및 스타일 전송에도 적용할 수 있습니다. 이 모든 것을 합산하면 모든 카테고리를 통틀어 전년 대비 573% 증가한 가장 큰 승리를 거두었습니다. CVPR 2023论文总结!CV最热领域颁给多模态、扩散模型

Radiation Field

Neural Radiation Field(NERF) 또한 논문에서 "radiance"라는 단어의 사용이 80% 증가하고 "NERF"라는 단어의 사용이 39% 증가했습니다. NeRF는 개념 증명에서 편집, 적용 및 교육 프로세스 최적화로 전환했습니다.

Transformers

"Transformer" 및 "ViT"의 사용 감소는 Transformer 모델이 더 이상 사용되지 않는다는 의미가 아니라 2022년에 이러한 모델의 지배력을 반영합니다. 2021년에는 '트랜스포머'라는 단어가 37개 논문에만 등장했다. 2022년에는 이 숫자가 201명으로 치솟을 것이다. 트랜스포머는 조만간 사라지지 않을 것입니다.

CNN

CNN은 한때 컴퓨터 비전의 사랑을 받았지만 2023년에는 사용량이 68% 감소하면서 우위를 잃은 것 같습니다. CNN을 언급하는 많은 헤드라인에서는 다른 모델도 언급합니다. 예를 들어 다음 문서에서는 CNN 및 Transformer에 대해 언급합니다.

- Lite-Mono: 자체 감독 단안 깊이 추정을 위한 경량 CNN 및 Transformer 아키텍처Lite-Mono

- 혼합 Transformer-CNN 아키텍처를 사용한 학습된 이미지 압축 Task

마스킹된 이미지 모델링과 결합된 마스크 작업이 CVPR을 지배합니다.

생성

탐지, 분류, 분할과 같은 전통적인 판별 작업은 선호도가 떨어지지 않았지만, "편집", "합성" 및 "생성"의 증가를 포함한 생성 응용 프로그램의 일련의 발전으로 인해 CV에서 차지하는 비중이 줄어들고 있습니다. ". 이 점.

Mask

'마스크'라는 키워드는 전년 동기 대비 263% 증가해 2023년 게재 논문에 92회 등장했고, 제목에 2회 등장하기도 했다.

- SIM: Box 감독 인스턴스 분할을 위한 의미 인식 인스턴스 마스크 생성SIM

- DynaMask: 인스턴스 분할을 위한 동적 마스크 선택DynaMask

그러나 대다수(64%)는 실제로 "마스크" 코딩을 참조합니다. 8개의 "마스크 이미지 모델링" 및 15개의 "마스크 자동 인코더" 작업을 포함한 " 작업입니다. 이 밖에도 '마스크'가 8개 기사에 등장했다.

"마스크"라는 단어가 포함된 3개의 논문 제목이 실제로는 "마스크 없음" 작업을 의미한다는 점도 주목할 가치가 있습니다.

Zero-shot vs. Small-shot

전이 학습, 생성 방법, 힌트 및 일반 모델의 등장으로 "제로 샷" 학습이 주목받고 있습니다. 동시에 '소표본' 학습은 작년보다 감소했습니다. 그러나 원시 숫자 측면에서 적어도 현재로서는 "작은 표본"(45)이 "0 표본"(35)에 비해 약간의 이점을 갖습니다.

Modal

2023년에는 다중 모드 및 교차 모드 애플리케이션의 개발이 가속화될 것입니다.

CVPR 2023论文总结!CV最热领域颁给多模态、扩散模型

흐릿한 경계

"이미지" 및 "비디오"와 같은 전통적인 컴퓨터 비전 키워드의 빈도는 상대적으로 변하지 않는 반면, "텍스트"/"언어" 및 "오디오"가 발생합니다. 더 자주.

논문 제목에 "멀티모달"이라는 단어 자체가 나오지 않더라도 컴퓨터 비전이 멀티모달의 미래를 향하고 있다는 점은 부정하기 어렵습니다.

이는 개방성, 프롬프트 및 어휘의 급격한 증가에서 알 수 있듯이 시각적 언어 작업에서 특히 분명합니다.

이런 상황의 가장 극단적인 예는 2022년에는 3번만 등장했지만, 2023년에는 18번 등장한 복합어 "openvocabulary"입니다. cvpr 2023 종이 타이틀 클라우드 9

CVPR 2023论文总结!CV最热领域颁给多模态、扩散模型3d 컴퓨터 비전 응용 프로그램의 키워드를 가볍게 파헤쳐 서 3D 정보를 유추하고 있습니다 ( "깊이"및 "깊이"). 2D 이미지 "입체")에서 3D 포인트 클라우드 데이터에서 직접 작동하는 컴퓨터 비전 시스템으로 전환되었습니다.

CV 제목을 통한 창의성

ChatGPT를 혼합에 포함하지 않으면 2023년 기계 학습 관련 주제에 대한 포괄적인 내용은 불완전할 것입니다. 우리는 흥미로운 내용을 유지하기로 결정하고 ChatGPT를 사용하여 CVPR 2023에서 가장 창의적인 헤드라인을 찾았습니다.

Arxiv에 업로드된 각 논문에 대해 우리는 초록을 스크랩하고 ChatGPT(GPT-3.5 API)에 해당 CVPR 논문의 제목을 생성하도록 요청했습니다.

그런 다음 ChatGPT에서 생성된 제목과 실제 ​​논문 제목을 가져와서 OpenAI의 text-embedding-ada-002 모델을 사용하여 임베딩 벡터를 생성하고 ChatGPT에서 생성된 제목과 저자가 생성한 제목 간의 코사인을 계산합니다. .

이것은 우리에게 무엇을 말해 줄 수 있나요? ChatGPT가 실제 논문 제목에 가까울수록 제목을 더 예측하기 쉬워집니다. 즉, ChatGPT의 예측이 "편향적"일수록 저자가 논문 이름을 지정하는 데 있어 더 "창의적"입니다.

임베딩 및 코사인 유사성은 비록 완벽하지는 않지만 흥미로운 정량화 방법을 제공합니다.

우리는 이 측정 기준에 따라 논문을 분류했습니다. 더 이상 고민하지 않고 가장 창의적인 제목은 다음과 같습니다.

실제 제목: Tracking Every Thing in the Wild

예상 제목: 추적에서 분류 분리: 다중 범주 다중 객체 추적의 종합 벤치마킹을 위한 TETA 소개

실제 제목: 라벨 노이즈 방지를 위한 부트스트랩 학습

예상 제목: 심층 신경망의 공동 인스턴스 및 라벨 재가중화를 위한 학습 가능한 손실 목표

실제 제목: 5천 가지 방법으로 장미 보기

예상 제목: 우수한 시각적 렌더링 및 합성을 위한 단일 인터넷 이미지에서 객체 본질 학습

실제 제목: 승자가 최고인 이유는 무엇입니까?

예상 제목: 이미지 분석을 위한 국제 벤치마킹 대회의 승리 전략 분석: Insights from Image Analysis IEEE ISBI 및 MICCAI 2021

에 대한 다중 센터 연구

위 내용은 CVPR 2023 논문 요약! CV의 가장 인기 있는 분야는 다중 모드 및 확산 모델에 수여됩니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
외삽에 대한 포괄적 인 가이드외삽에 대한 포괄적 인 가이드Apr 15, 2025 am 11:38 AM

소개 매일 몇 주 만에 작물의 진행 상황을 관찰하는 농부가 있다고 가정합니다. 그는 성장률을보고 몇 주 안에 식물이 얼마나 키가 커질 수 있는지에 대해 숙고하기 시작합니다. Th

소프트 AI의 부상과 오늘날 비즈니스의 의미소프트 AI의 부상과 오늘날 비즈니스의 의미Apr 15, 2025 am 11:36 AM

Soft AI-대략적인 추론, 패턴 인식 및 유연한 의사 결정을 사용하여 구체적이고 좁은 작업을 수행하도록 설계된 AI 시스템으로 정의 된 것은 모호성을 수용하여 인간과 같은 사고를 모방하려고합니다. 그러나 이것이 바이러스의 의미는 무엇입니까?

AI 국경을위한 진화 보안 프레임 워크AI 국경을위한 진화 보안 프레임 워크Apr 15, 2025 am 11:34 AM

클라우드 컴퓨팅이 클라우드 네이티브 보안 도구로의 전환이 필요했기 때문에 AI는 AI의 고유 한 요구를 위해 특별히 설계된 새로운 유형의 보안 솔루션을 요구합니다. 클라우드 컴퓨팅 및 보안 수업의 상승이 배웠습니다 th

3 가지 방법 생성 AI 기업가를 증폭시킵니다 : 평균을 조심하십시오!3 가지 방법 생성 AI 기업가를 증폭시킵니다 : 평균을 조심하십시오!Apr 15, 2025 am 11:33 AM

기업가와 AI 및 생성 AI를 사용하여 비즈니스를 개선합니다. 동시에, 모든 기술과 마찬가지로 생성 AI를 기억하는 것이 중요합니다. 앰프는 앰프입니다. 엄격한 2024 연구 o

Andrew Ng의 모델 임베딩에 대한 새로운 단기 과정Andrew Ng의 모델 임베딩에 대한 새로운 단기 과정Apr 15, 2025 am 11:32 AM

임베딩 모델의 힘 잠금 해제 : Andrew Ng의 새로운 코스에 대한 깊은 다이빙 기계가 완벽한 정확도로 질문을 이해하고 응답하는 미래를 상상해보십시오. 이것은 공상 과학이 아닙니다. AI의 발전 덕분에 R이되었습니다

대형 언어 모델 (LLMS)에서 환각이 불가피합니까?대형 언어 모델 (LLMS)에서 환각이 불가피합니까?Apr 15, 2025 am 11:31 AM

대형 언어 모델 (LLM) 및 환각의 피할 수없는 문제 Chatgpt, Claude 및 Gemini와 같은 AI 모델을 사용했을 것입니다. 이들은 대규모 텍스트 데이터 세트에 대해 교육을받은 강력한 AI 시스템의 대형 언어 모델 (LLM)의 예입니다.

60% 문제 - AI 검색이 트래픽을 배출하는 방법60% 문제 - AI 검색이 트래픽을 배출하는 방법Apr 15, 2025 am 11:28 AM

최근의 연구에 따르면 AI 개요는 산업 및 검색 유형에 따라 유기 트래픽이 15-64% 감소 할 수 있습니다. 이러한 급격한 변화로 인해 마케팅 담당자는 디지털 가시성에 관한 전체 전략을 재고하게합니다. 새로운

AI R & D의 중심에 인간 번성을하는 MIT Media LabAI R & D의 중심에 인간 번성을하는 MIT Media LabApr 15, 2025 am 11:26 AM

Elon University의 Digital Future Center를 상상 한 최근 보고서는 거의 300 명의 글로벌 기술 전문가를 조사했습니다. 결과적인 보고서 인‘2035 년에 인간이되는 것’은 대부분 AI 시스템의 심화가 T에 대한 우려가 있다고 결론지었습니다.

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
4 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
4 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
4 몇 주 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 채팅 명령 및 사용 방법
4 몇 주 전By尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

mPDF

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

WebStorm Mac 버전

WebStorm Mac 버전

유용한 JavaScript 개발 도구

MinGW - Windows용 미니멀리스트 GNU

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

VSCode Windows 64비트 다운로드

VSCode Windows 64비트 다운로드

Microsoft에서 출시한 강력한 무료 IDE 편집기