首頁 >科技週邊 >人工智慧 >ControlNet作者又出爆款!一張圖生成繪畫全過程,兩天狂攬1.4k Star

ControlNet作者又出爆款!一張圖生成繪畫全過程,兩天狂攬1.4k Star

王林
王林原創
2024-07-17 01:56:08388瀏覽
同樣是圖生視頻,PaintsUndo 走出了不一樣的路線。

ControlNet 作者 Lvmin Zhang 又開始整活了!這次瞄準繪畫領域。

新計畫 PaintsUndo 剛上線不久,就收穫 1.4k star(還在瘋狂漲)。

ControlNet作者又出爆款!一张图生成绘画全过程,两天狂揽1.4k Star

項目地址:https://github.com/lllyasviel/Paints-UNDO

透過該項目,用戶輸入一張靜態圖像,PaintsUndo 就能自動幫你生成整個繪畫的全過程視頻,從線稿到成品都有跡可循。

ControlNet作者又出爆款!一张图生成绘画全过程,两天狂揽1.4k Star

繪製過程,線條變化多端甚是神奇,最終視頻結果和原始圖像非常相似:

ControlNet作者又出爆款!一张图生成绘画全过程,两天狂揽1.4k Star

我們再來看一個完整的繪畫過程。 PaintsUndo 先用簡單的線條勾勒出人物主體,然後畫出背景,塗上顏色,最後精調成和原圖相似。 ControlNet作者又出爆款!一张图生成绘画全过程,两天狂揽1.4k Star

PaintsUndo 不只限於單一圖像風格,對於不同類型的圖像,也會產生相應的繪畫過程影片。

ControlNet作者又出爆款!一张图生成绘画全过程,两天狂揽1.4k Star

戴著頭巾的​​柯基犬眼神溫柔地望向遠方:

ControlNet作者又出爆款!一张图生成绘画全过程,两天狂揽1.4k Star

用戶也可以輸入單張圖像,輸出多個視頻:

ControlNet作者又出爆款!一张图生成绘画全过程,两天狂揽1.4k Star

處理複雜的構圖有困難,作者表示專案仍在不斷改進。

ControlNet作者又出爆款!一张图生成绘画全过程,两天狂揽1.4k Star

PaintsUndo 之所以如此強大,背後是一系列模型的支持,它們以圖像作為輸入,然後輸出該圖像的繪製序列。模型復現了各種人類行為,包括但不限於素描、上墨、著色、陰影、變換、左右翻轉、顏色曲線調整、更改圖層的可見性,甚至在繪製過程中更改整體思路。

本地部署過程非常簡單,幾行程式碼就能完成:

git clone https://github.com/lllyasviel/Paints-UNDO.gitcd Paints-UNDOconda create -n paints_undo python=3.10conda activate paints_undopip install xformerspip install -r requirements.txtpython gradio_app.py

模型介紹

專案作者在 Nvidia 4090 和 3090TI 上使用 24GB VRAM 進行推理測試。作者估計,在極端優化(包括權重卸載和注意力切片)的情況下,理論上 VRAM 需求最小約為 10-12.5 GB。 PaintsUndo 預計可以在大約 5 到 10 分鐘內處理一張影像,具體取決於相關設置,通常會得到 25 秒,解析度為 320x512、512x320、384x448 或 448x384 的影片。

目前該專案發布了兩個模型:單幀模型 paints_undo_single_frame 和多幀模型 paints_undo_multi_frame。

單幀模型採用 SD1.5 的修改架構,以一幅影像和一個操作步驟作為輸入,輸出一幅影像。假設一件藝術品通常需要經過 1000 次人工操作才能創作出來(例如一筆是一次操作),那麼操作步長是 0-999 之間的整數。數字 0 是最終完成的藝術品,數字 999 是在純白畫布上繪製的第一筆。

多幀模型基於 VideoCrafter 系列模型,但沒有使用原始 Crafter 的 lvdm,所有訓練 / 推理程式碼完全從頭開始實現。計畫作者對神經網路的拓撲進行了許多修改,經過大量訓練後,神經網路的行為與原始 Crafter 有很大不同。

多幀模型的整體架構類似 Crafter,包含 5 個元件:3D-UNet、VAE、CLIP、CLIP-Vision、Image Projection。

多幀模型以兩張影像作為輸入,輸出兩個輸入影像之間的 16 個中間幀。多幀模型的結果比單幀模型更加一致,但速度也慢得多,“創意”更少,並且僅限於 16 幀。

PaintsUndo 預設一起使用單幀模型和多幀模型。首先會用單幀模型推斷大約 5-7 次,得到 5-7 個「關鍵影格」,然後使用多幀模型對這些關鍵影格進行「插值」,最終產生一個相對較長的影片。

參考連結:https://lllyasviel.github.io/pages/paints_undo/

以上是ControlNet作者又出爆款!一張圖生成繪畫全過程,兩天狂攬1.4k Star的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn