7월의 가장 인기 있는 AI 연구 목록 제2탄이 나왔습니다!
이전 목록은 트위터 좋아요, 리트윗, Github 별을 기준으로 정렬되었습니다. 그러나 일부 네티즌들은 트위터 좋아요 수가 기계로 브러싱될 수 있으며 트위터를 좋아하는 사용자는 반드시 조사 방법을 모를 수도 있다고 불평했습니다.
이번에는 @bycloudai 작가가 경험을 통해 배웠습니다. 이번에는 지표가 트위터의 좋아요 수가 아니라 Github의 별 수가 되어야 합니다.
이번 지표는 그다지 전문적이지는 않지만 트위터에 비하면 Github을 방문할 수 있는 사람의 수는 AI 연구와 더 밀접한 관련이 있다고 볼 수 있습니다.
또한 작성자는 이 목록이 재미로 만든 와일드 목록이며 오락용임을 목록 시작 부분에서 분명히 밝혔습니다.
이 "속편 목록"은 기본적으로 이전 호의 스타일을 유지합니다. 상위 10개에는 자료 라이브러리 주소, 논문 링크, 제목, 저자 및 출판 단위가 지정됩니다.
이 "개선 버전"에서 7월 가장 뜨거운 AI 연구 목록에 어떤 연구가 있는지 살펴보겠습니다~
Top1: YOLOv7: 훈련 가능한 공짜 가방이 새로운 경지를 설정합니다. 실시간 물체 감지기를 위한 예술
작성자: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao 기관: "Academia Sinica" 정보 과학 연구소 Github 별 수: 3.8k
요약: YOLOv7은 5FPS~160FPS의 속도와 정확도에서 알려진 모든 물체 감지기보다 성능이 뛰어나며 56.8% AP의 GPU V100에서 30FPS 이상의 모든 실시간 물체 감지기 중 가장 높은 정확도를 갖습니다. YOLOv7-E6 객체 감지기(56FPS V100, 55.9% AP)는 Transformer 기반 감지기 SWIN-L Cascade-Mask R-CNN(9.2FPS A100, 53.9% AP)보다 509% 더 빠르고 정확합니다.
이 논문의 저자 중 한 명인 Chien-Yao Wang은 Columbia University의 기계 공학 대학원생이며 현재 Intel의 Chrome 소프트웨어 엔지니어라는 점을 언급할 가치가 있습니다. : 2Top2: 검색 증강 확산 모델을 사용한 예술적 이미지의 텍스트 기반 합성
저자: Robin Rombach, Andreas Blatmann 및 Bjorn Ommer 메커니즘: Ludwig Maxici Ludwig-Maximilians-Universität München
Gith ub 별: 2.4 k
요약: 최근 새로운 아키텍처는 생성적 이미지 합성을 개선하여 다양한 작업 품질에서 우수한 비전을 가능하게 했습니다. 특히 주목할 만한 분야는 'AI-Art' 분야다. 음성 및 이미지 합성 모델을 결합함으로써 합성된 이미지에서 특정 시각적 스타일을 달성하기 위해 신중하게 선택하고 결합된 문장을 사용하는 소위 "큐 엔지니어링"이 확립되었습니다.이 논문에서는 RDM(Retrieval Enhanced Diffusion Model)을 기반으로 한 대체 접근 방식을 제안합니다. RDM에서는 각 훈련 인스턴스에 대한 훈련 중에 외부 데이터베이스에서 가장 가까운 이웃 세트가 검색되고 확산 모델은 이러한 정보 샘플을 조건으로 합니다.
AI-Art 작품의 효과를 논문으로 살펴보겠습니다~
Top3: NUWA-Infinity: Autoregressive over AutoregressiveGeneration for Infinite Visual Synesis
작성자: Wu Chenfei, Liang Jian, Xiaowei Hu 및 기타 기관: Microsoft Research Asia, Peking University, Microsoft Azure AIGithub 별 수: 2.4k
3위는 이전에도 많은 주목을 받았던 중국 전역 AI 대작 누와 인피니티(NUWA INFINITY)입니다.
4, 함께 훈련하는 트랜스포머(1,000개 별)
저자: Alexander Borzunov, Max Ryabinin, Tim Dettmers 및 기타 기관: Russian State Higher School of Economics, University of Washington 등
5. 테세우스: 미분 비선형 최적화를 위한 라이브러리(별 791개)
저자: Luis Pineda, Taosha Fan, Maurizio Monge 조직: Meta AI, Reality Labs Research
6, k-means Mask Transformer(별 704개)
출판 단위: Johns Hopkins University, Google Research Resource library : https://github . com/google-research/deeplab2 문서: https://arxiv.org/abs/2207.04044v1
7, XMem: Atkinson-Shiffrin 메모리 모델을 사용한 장기 비디오 객체 분할(별 699개)
발행 단위: University of Illinois at Urbana-Champaign 자원 라이브러리: https://github.com/hkchengrex/XMem 논문: https://arxiv.org/abs/2207.07115v2
8. TinyViT: 소형 비전 변환기를 위한 빠른 사전 훈련 증류(별 656개)
출판 단위: Microsoft Research, Microsoft Cloud + AI 리소스 라이브러리: https://github.com/microsoft/ 크림 페이퍼: https://arxiv.org/abs/2207.10666v1
9, 객체 추적 대통일을 향하여(별 644개)
출판 단위: Dalian University of Technology, 글 Jie Doi, University of Hong Kong, Pengcheng Laboratory
자료실: ttps://github.com/masterbin-iiau/unicorn 논문: https://arxiv.org/abs/2207.07078v3
10, 다중 얼굴: 신경 얼굴 렌더링을 위한 데이터 세트(별 337개)
출판 단위: Meta Reality Laboratory 리소스 라이브러리: https://github.com/facebookresearch/multiface 논문: https://arxiv.org/abs/2207.11243v1
위 내용은 Github의 7월 인기 AI 프로젝트 목록에 속편이 있습니다! 누와 언리미티드 에디션은 3위만 가능한가요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!