ChatGPT와 Stable Diffusion이 출시된 이후 다양한 관련 오픈소스 프로젝트가 활발하게 진행되고 있는데 정말 압도적이네요.
오늘은 우리의 일상 업무, 공부, 생활에 큰 도움이 될 몇 가지 고품질 오픈 소스 프로젝트를 선택하여 여러분과 공유하는 데 중점을 두었습니다.
이것은 Microsoft의 오픈 소스 프로젝트로 불과 일주일 만에 23.6k 이상의 별을 얻었습니다.
간단히 요약하면 멀티모달 질의응답 시스템입니다.
AI 업계의 최근 핫스팟 3개를 통합해 AI 그림, 언어 질의응답, 그림 질의응답을 지원합니다.
효과 표시:
시스템 구현 프레임워크는 다음과 같습니다.
이것은 "큰 노력으로 기적을 만드는" 오픈 소스 프로젝트입니다. BLIP, CLIP, ChatGPT, pix2pix, inpainting, vqa 등 여러 당사자의 연구 결과를 하나로 통합합니다.
솔직하게 말하면, 이러한 프로젝트를 사용하여 다중 모드 질문 및 답변 시스템을 구축하는 방법을 가르치는 것입니다. 이 시스템 아키텍처는 훌륭한 참고 가치가 있습니다.
프로젝트 주소:
https://github.com/microsoft/visual-chatgpt
2023 CVPR 논문에 해당하는 오픈 소스 프로젝트입니다.
오픈 소스, 신선하고 핫해요~
기능은 다음과 같습니다: 사진과 오디오 조각을 기반으로 이 목소리를 말하는 얼굴의 비디오를 합성합니다.
ChatGPT, AIGC 및 오디오-텍스트 변환을 결합하면 가상 2차원 또는 3차원 이미지가 "실시간"이 될 수 있습니다.
또한 프로젝트는 안정확산에서 직접 사용할 수 있는 안정확산 webui용 플러그인으로도 만들어졌습니다.
생성된 사진을 오디오와 직접 연결하여 합성된 비디오를 생성할 수 있습니다.
프로젝트 주소:
https://github.com/winfredy/sadtalker
텍스트를 편집하여 이미지를 생성할 수 있나요? 영상 편집이 가능한가요?
FateZero: 할 수 있어요!
왼쪽 이미지는 원본 이미지, 오른쪽 이미지는 생성된 효과, 입력 텍스트는 다음과 같습니다.
포켓몬 애니메이션 스타일 추가:
수묵화 스타일 추가:
스타일 외에 비디오 마이그레이션과 함께 콘텐츠 내부 수정도 지원합니다.
예: 다람쥐는 당근을 먹고, 토끼는 가지를 먹습니다.
이 프로젝트 역시 SD를 기반으로 하고 있어 클릭 한 번으로 영상 생성에 한발 더 가까워졌습니다.
프로젝트 주소:
https://github.com/chenyangqiqi/fatezero
arXiv 전 세계의 과학자와 연구가 참여하는 가장 인기 있는 논문 호스팅 웹사이트라는 것을 모두가 알고 있다고 믿습니다. .학자.
arXiv 사용자의 논문 읽기 효율성을 높이기 위해 누군가 ChatGPT를 사용하여 arXiv 논문을 요약하는 오픈 소스 도구인 ChatPaper를 오픈 소스로 공개했습니다.
개발자의 동기에 대해 그는 다음과 같이 말했습니다.
간단히 말하면, 이 프로젝트는 ChatGPT3.5 API의 강력한 요약 기능을 사용하여 사용자 키워드를 기반으로 arXiv의 최신 논문을 다운로드할 수 있으며 이를 압축합니다. 단어가 적고 읽기 쉬운 고정된 형식으로 작성되었습니다.
동시에 프로젝트는 개인이 직접 배포하거나 Hugge Face에 직접 가서 경험할 수 있도록 지원합니다.
프로젝트 주소:
https://github.com/kaixindelele/ChatPaper
https://huggingface.co/spaces/wangrongsheng/ChatPaper
최근 ChatGPT에 너무 많은 회사가 있습니다. 다양한 관련 오픈소스 프로젝트도 끝없이 등장하고 있습니다.
이 프로젝트가 도움이 되기를 바랍니다.