ChatGPT と Stable Diffusion のリリース以来、関連するさまざまなオープンソース プロジェクトが繁栄しました。これには本当に圧倒されます。
今日は、私たちの日々の仕事、勉強、生活に大いに役立つ、高品質のオープンソース プロジェクトをいくつか選んで皆さんと共有することに焦点を当てます。
これは Microsoft のオープンソース プロジェクトで、わずか 1 週間で 23,600 個のスターを獲得しました。
簡単に要約すると、マルチモーダルな質問と回答のシステムです。
AI ペイント、言語の質問と回答、画像の質問と回答をサポートし、AI 業界の最近の 3 つのホットスポットを統合します。
エフェクト表示:
システム実装枠組みは以下の通りです:
これは、BLIP、CLIP、 ChatGPT、pix2pix、修復、vqa など。
端的に言えば、これらのプロジェクトを使用してマルチモーダルな質問と回答システムを構築する方法を教えることです。このシステム アーキテクチャは非常に参考になります。
プロジェクト アドレス:
https://github.com/microsoft/visual-chatgpt
これ2023 年の CVPR 論文に対応するオープンソース プロジェクトです。
まさにオープンソース、新鮮でホット~
機能は次のとおりです: 写真と音声に基づいて、顔が話しているビデオを合成します。この声。
ChatGPT、AIGC、音声からテキストへの変換と組み合わせると、仮想の 2 次元または 3 次元画像を「ライブ」にすることができます。
さらに、このプロジェクトは安定拡散 Webui 用のプラグインも作成しました。これは安定拡散で直接使用できます。
#生成された画像を音声と直接照合して、合成ビデオを生成できます。
プロジェクト アドレス:
https://github.com/winfredy/sadtalker
テキストは次のとおりです。編集しました 画像を生成しますか?動画は編集できますか?
FateZero: できるよ!
左の画像は元の画像、右の画像は生成されたエフェクト、入力テキストは次のとおりです:
ポケモン アニメ スタイルの追加:
水墨画スタイルの追加:
# ビデオのスタイルの移行に加えて、内部のコンテンツの変更もサポートしています。
例: リスはニンジンを食べると、ウサギはナスを食べるようになります。
このプロジェクトも SD に基づいており、ワンクリックでビデオを生成することに一歩近づいています。
プロジェクトアドレス:
https://github.com/chenyangqiqi/fatezero
arXiv だと思います皆さんご存知のとおり、現在最も人気のある論文ホスティング Web サイトには世界中の科学者や研究者が参加しています。
arXiv ユーザーが論文を読む効率を向上させるために、誰かが ChatPaper をオープンソース化しました。ChatPaper は、ChatGPT を使用して arXiv 論文を要約するオープンソース ツールです。
開発者のモチベーションは次のように語られました。
つまり、プロジェクトのベースとなるのは次のとおりです。 on User キーワードは、arXiv で最新の論文をダウンロードし、ChatGPT3.5 API の強力な要約機能を使用して、テキストが少なく読みやすい固定フォーマットに論文を圧縮します。
同時に、このプロジェクトは、個人が自分で導入したり、Hugge Face に直接行って体験したりすることをサポートします。
プロジェクトアドレス:
https://github.com/kaixindelele/ChatPaper
https://huggingface.co/spaces/wangrongsheng/ChatPaper
最近、ChatGPT を利用する企業が多すぎて、関連するさまざまなオープンソース プロジェクトも際限なく登場しています。
これらのプロジェクトがお役に立てば幸いです。