>  기사  >  기술 주변기기  >  CVPR 2023 논문 요약! CV의 가장 인기 있는 분야는 다중 모드 및 확산 모델에 수여됩니다.

CVPR 2023 논문 요약! CV의 가장 인기 있는 분야는 다중 모드 및 확산 모델에 수여됩니다.

WBOY
WBOY앞으로
2023-05-25 15:10:351295검색

연례 CVPR은 6월 18일부터 22일까지 캐나다 밴쿠버에서 공식적으로 개최됩니다.

매년 전 세계 수천 명의 이력서 연구원과 엔지니어가 함께 모여 서밋에 참여합니다. 이 권위 있는 컨퍼런스는 1983년으로 거슬러 올라가며 컴퓨터 비전 개발의 정점을 나타냅니다.

현재 CVPR의 h5 지수는 모든 학회나 출판물 중에서 'Nature', 'Science', 'New England Journal of Medicine'에 이어 4위를 차지하고 있습니다.

CVPR 2023论文总结!CV最热领域颁给多模态、扩散模型

얼마 전 CVPR에서 논문 게재 결과를 발표했습니다. 공식 홈페이지 통계에 따르면 총 9,155편의 논문이 접수됐고, 2,359편이 접수돼 합격률은 25.8%를 기록했다.

이 외에도 12개의 수상 후보 논문이 발표되었습니다.

CVPR 2023论文总结!CV最热领域颁给多模态、扩散模型

그렇다면 올해 CVPR의 하이라이트는 무엇일까요? 합격된 논문을 보면 CV 분야에서 어떤 경향을 볼 수 있나요?

다음에 공지하겠습니다.

CVPR 개요

스타트업 Voxel51은 모든 채택 논문 목록을 분석했습니다.

먼저, 논문 제목의 요약 다이어그램을 살펴보겠습니다. 각 단어의 크기는 데이터 세트의 발생 빈도에 비례합니다. ㅋㅋㅋ - 다른 주소로 제출된 문서 68개

CVPR 2023论文总结!CV最热领域颁给多模态、扩散模型

각 논문의 저자

- CVPR 논문의 평균 저자는 약 5.4명입니다.

- 가장 많이 작성된 논문은 "왜 우승자가 최고입니까?"입니다.

- 저자가 1명인 논문은 13편입니다.

Arxiv 주요 카테고리

1724년 Arxiv 논문 중 1545편, 즉 거의 90%의 논문이 cs.CV를 주요 카테고리로 나열합니다.

cs.LG는 101개의 기사로 2위를 차지했습니다. eess.IV(26) 및 cs.RO(16)도 파이를 공유합니다.

CVPR 논문의 기타 카테고리에는 cs.HC, cs.CV, cs.AR, cs.DC, cs.NE, cs.SD, cs.CL, cs.IT, cs.CR, cs.AI가 있습니다. , cs.MM, cs.GR, eess.SP, eess.AS, math.OC, math.NT, 물리.데이터-an 및 stat.ML.

"메타" 데이터

- "데이터세트"와 "모델"이라는 두 단어가 567개의 초록에 함께 등장했습니다. "데이터세트"는 265개의 논문 초록에 단독으로 나타나는 반면, "모델"은 613번만 나타납니다. CVPR이 승인한 논문 중 16.2%만이 이 두 단어를 포함하지 않았습니다.

- CVPR 논문 초록에 따르면 올해 가장 인기 있는 데이터 세트는 ImageNet(105), COCO(94), KITTI(55) 및 CIFAR(36)입니다.

- 28개의 논문이 새로운 "벤치마크"를 제안합니다.

약어가 풍부합니다

약어가 없는 머신러닝 프로젝트는 없는 것 같습니다. 논문 2,359편 중 대문자로 된 복수의 약어나 복합어를 사용한 제목이 1,487편으로 63%를 차지한다.

이 두문자어 중 일부는 기억하기 쉽고 심지어 입에서 굴러다니기도 합니다.

- CLAMP: 언어와 동물 포즈 연결을 위한 프롬프트 기반 대조 학습CLAMP

- PATS: 로컬 기능에 대한 세분화를 통한 패치 영역 이동 Matching

- CIRCLE: 풍부한 상황별 환경에서 캡처

일부는 훨씬 더 복잡합니다.

- SIEDOB: 객체와 배경을 분리하여 의미론적 이미지 편집

- FJMP: Factorized Joint Multi-Agent 학습된 방향성 비순환 상호 작용 그래프에 대한 동작 예측FJMP

그 중 일부는 약어 구성 측면에서 다른 사람의 아이디어를 빌린 것 같습니다.

- SCOTCH 및 SODA: A Transformer Video ShadowDetection Framework(인기 네덜란드 브랜드 Scotch & Soda) )

- EXCALIBUR: 체화된 탐구 장려 및 평가 (Ex 카레 스틱, 웃음)

무엇이 가장 핫해요?

2023년 논문 제목 외에도 2022년에 승인된 모든 논문 제목을 크롤링했습니다. 이 두 목록에서 우리는 상승 추세와 하락 추세가 무엇인지에 대한 더 깊은 이해를 제공하기 위해 다양한 키워드의 상대 빈도를 계산했습니다.

Model

2023년에는 확산 모델이 대세입니다. Stable Diffusion, Midjourney 등의 이미지 생성 모델이 인기를 끌면서 확산 모델의 개발이 뜨거운 추세라는 것은 놀라운 일이 아닙니다.

확산 모델에는 노이즈 제거, 이미지 편집 및 스타일 전송에도 적용할 수 있습니다. 이 모든 것을 합산하면 모든 카테고리를 통틀어 전년 대비 573% 증가한 가장 큰 승리를 거두었습니다. CVPR 2023论文总结!CV最热领域颁给多模态、扩散模型

Radiation Field

Neural Radiation Field(NERF) 또한 논문에서 "radiance"라는 단어의 사용이 80% 증가하고 "NERF"라는 단어의 사용이 39% 증가했습니다. NeRF는 개념 증명에서 편집, 적용 및 교육 프로세스 최적화로 전환했습니다.

Transformers

"Transformer" 및 "ViT"의 사용 감소는 Transformer 모델이 더 이상 사용되지 않는다는 의미가 아니라 2022년에 이러한 모델의 지배력을 반영합니다. 2021년에는 '트랜스포머'라는 단어가 37개 논문에만 등장했다. 2022년에는 이 숫자가 201명으로 치솟을 것이다. 트랜스포머는 조만간 사라지지 않을 것입니다.

CNN

CNN은 한때 컴퓨터 비전의 사랑을 받았지만 2023년에는 사용량이 68% 감소하면서 우위를 잃은 것 같습니다. CNN을 언급하는 많은 헤드라인에서는 다른 모델도 언급합니다. 예를 들어 다음 문서에서는 CNN 및 Transformer에 대해 언급합니다.

- Lite-Mono: 자체 감독 단안 깊이 추정을 위한 경량 CNN 및 Transformer 아키텍처Lite-Mono

- 혼합 Transformer-CNN 아키텍처를 사용한 학습된 이미지 압축 Task

마스킹된 이미지 모델링과 결합된 마스크 작업이 CVPR을 지배합니다.

생성

탐지, 분류, 분할과 같은 전통적인 판별 작업은 선호도가 떨어지지 않았지만, "편집", "합성" 및 "생성"의 증가를 포함한 생성 응용 프로그램의 일련의 발전으로 인해 CV에서 차지하는 비중이 줄어들고 있습니다. ". 이 점.

Mask

'마스크'라는 키워드는 전년 동기 대비 263% 증가해 2023년 게재 논문에 92회 등장했고, 제목에 2회 등장하기도 했다.

- SIM: Box 감독 인스턴스 분할을 위한 의미 인식 인스턴스 마스크 생성SIM

- DynaMask: 인스턴스 분할을 위한 동적 마스크 선택DynaMask

그러나 대다수(64%)는 실제로 "마스크" 코딩을 참조합니다. 8개의 "마스크 이미지 모델링" 및 15개의 "마스크 자동 인코더" 작업을 포함한 " 작업입니다. 이 밖에도 '마스크'가 8개 기사에 등장했다.

"마스크"라는 단어가 포함된 3개의 논문 제목이 실제로는 "마스크 없음" 작업을 의미한다는 점도 주목할 가치가 있습니다.

Zero-shot vs. Small-shot

전이 학습, 생성 방법, 힌트 및 일반 모델의 등장으로 "제로 샷" 학습이 주목받고 있습니다. 동시에 '소표본' 학습은 작년보다 감소했습니다. 그러나 원시 숫자 측면에서 적어도 현재로서는 "작은 표본"(45)이 "0 표본"(35)에 비해 약간의 이점을 갖습니다.

Modal

2023년에는 다중 모드 및 교차 모드 애플리케이션의 개발이 가속화될 것입니다.

CVPR 2023论文总结!CV最热领域颁给多模态、扩散模型

흐릿한 경계

"이미지" 및 "비디오"와 같은 전통적인 컴퓨터 비전 키워드의 빈도는 상대적으로 변하지 않는 반면, "텍스트"/"언어" 및 "오디오"가 발생합니다. 더 자주.

논문 제목에 "멀티모달"이라는 단어 자체가 나오지 않더라도 컴퓨터 비전이 멀티모달의 미래를 향하고 있다는 점은 부정하기 어렵습니다.

이는 개방성, 프롬프트 및 어휘의 급격한 증가에서 알 수 있듯이 시각적 언어 작업에서 특히 분명합니다.

이런 상황의 가장 극단적인 예는 2022년에는 3번만 등장했지만, 2023년에는 18번 등장한 복합어 "openvocabulary"입니다. cvpr 2023 종이 타이틀 클라우드 9

CVPR 2023论文总结!CV最热领域颁给多模态、扩散模型3d 컴퓨터 비전 응용 프로그램의 키워드를 가볍게 파헤쳐 서 3D 정보를 유추하고 있습니다 ( "깊이"및 "깊이"). 2D 이미지 "입체")에서 3D 포인트 클라우드 데이터에서 직접 작동하는 컴퓨터 비전 시스템으로 전환되었습니다.

CV 제목을 통한 창의성

ChatGPT를 혼합에 포함하지 않으면 2023년 기계 학습 관련 주제에 대한 포괄적인 내용은 불완전할 것입니다. 우리는 흥미로운 내용을 유지하기로 결정하고 ChatGPT를 사용하여 CVPR 2023에서 가장 창의적인 헤드라인을 찾았습니다.

Arxiv에 업로드된 각 논문에 대해 우리는 초록을 스크랩하고 ChatGPT(GPT-3.5 API)에 해당 CVPR 논문의 제목을 생성하도록 요청했습니다.

그런 다음 ChatGPT에서 생성된 제목과 실제 ​​논문 제목을 가져와서 OpenAI의 text-embedding-ada-002 모델을 사용하여 임베딩 벡터를 생성하고 ChatGPT에서 생성된 제목과 저자가 생성한 제목 간의 코사인을 계산합니다. .

이것은 우리에게 무엇을 말해 줄 수 있나요? ChatGPT가 실제 논문 제목에 가까울수록 제목을 더 예측하기 쉬워집니다. 즉, ChatGPT의 예측이 "편향적"일수록 저자가 논문 이름을 지정하는 데 있어 더 "창의적"입니다.

임베딩 및 코사인 유사성은 비록 완벽하지는 않지만 흥미로운 정량화 방법을 제공합니다.

우리는 이 측정 기준에 따라 논문을 분류했습니다. 더 이상 고민하지 않고 가장 창의적인 제목은 다음과 같습니다.

실제 제목: Tracking Every Thing in the Wild

예상 제목: 추적에서 분류 분리: 다중 범주 다중 객체 추적의 종합 벤치마킹을 위한 TETA 소개

실제 제목: 라벨 노이즈 방지를 위한 부트스트랩 학습

예상 제목: 심층 신경망의 공동 인스턴스 및 라벨 재가중화를 위한 학습 가능한 손실 목표

실제 제목: 5천 가지 방법으로 장미 보기

예상 제목: 우수한 시각적 렌더링 및 합성을 위한 단일 인터넷 이미지에서 객체 본질 학습

실제 제목: 승자가 최고인 이유는 무엇입니까?

예상 제목: 이미지 분석을 위한 국제 벤치마킹 대회의 승리 전략 분석: Insights from Image Analysis IEEE ISBI 및 MICCAI 2021

에 대한 다중 센터 연구

위 내용은 CVPR 2023 논문 요약! CV의 가장 인기 있는 분야는 다중 모드 및 확산 모델에 수여됩니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제