搜尋
首頁科技週邊人工智慧ControlNet star量破萬! 2023年,AI繪畫殺瘋了?

從騎馬的太空人到三次元小姐姐,在不到一年的時間裡,AI 繪畫似乎已經取得了革命性的進展。

ControlNet star量破萬! 2023年,AI繪畫殺瘋了?

這個「騎馬的太空人」由OpenAI 2022 年4 月推出的文生圖模型DALL・E 2 繪製。它的前輩 ——DALL・E 在 2021 年向人們展示了直接用文字生成圖像的能力,打破了自然語言與視覺的次元壁。在此基礎上,DALL・2 更進一步,讓人們可以對原始影像進行編輯,例如在畫面中加入一隻柯基。這一個看似簡單的操作其實體現了 AI 繪畫模型可控性的提升。

不過,就影響力而言,2022 年最火的文生圖模型並不是 DALL・E 2,而是另一個和它功能相似的模型 ——Stable Diffusion。和 DALL・E 2 一樣,Stable Diffusion 也允許創作者對生成的圖像進行編輯,但優點在於,這個模型是開源的,而且可以在消費級 GPU 上運行。因此,在 2022 年 8 月發布之後,Stable Diffusion 迅速走紅,短短幾個月就成了最火的文生圖模型。


在此期間,人們也在進一步探索各種控制這類模型的方法,例如Stable Diffusion 背後團隊之一的Runway 公司發布了一個圖像擦除和替換(Erase and Replace)工具,該工具可以修改圖像任何部分。使用者需要做的就是擦除該區域並編寫自然語言描述,剩下的交給程式就可以了。

Google和波士頓大學的研究者則提出了一種「個人化」的文本到圖像擴散模型  #DreamBooth,使用者只需提供3~5 個樣本一句話,AI 就能自訂照片級影像。

ControlNet star量破萬! 2023年,AI繪畫殺瘋了?

此外,來自UC 柏克萊的研究團隊也提出了一種根據人類指令編輯圖像的新方法 InstructPix2Pix#,這個模型結合了GPT-3 和Stable Diffusion。給定輸入圖像和告訴模型要做什麼的文字描述,模型就能遵循描述指令來編輯圖像。例如,要把畫中的向日葵換成玫瑰,你只需要直接對模型說「把向日葵換成玫瑰」。

ControlNet star量破萬! 2023年,AI繪畫殺瘋了?

進入 2023 年,一個名為 ControlNet 的模式將這類控制的彈性度推向了高峰。

ControlNet 的核心思想是在文字描述之外添加一些額外條件來控制擴散模型(如Stable Diffusion),從而更好地控制生成圖像的人物姿態、深度、畫面結構等資訊。

這裡的額外條件以影像的形式來輸入,模型可以基於這張輸入影像進行Canny 邊緣偵測、深度偵測、語意分割、霍夫變換直線偵測、整體嵌套邊緣偵測(HED)、人體姿態辨識等,然後在生成的影像中保留這些資訊。利用這個模型,我們可以直接把線稿或塗鴉轉換成全彩圖,產生具有相同深度結構的圖等等,透過手部關鍵點還能優化人物手部的生成。

ControlNet star量破萬! 2023年,AI繪畫殺瘋了?

ControlNet star量破萬! 2023年,AI繪畫殺瘋了?

這個模型在 AI 繪畫領域掀起了巨浪,相關項目 GitHub star 量已破萬。

ControlNet star量破萬! 2023年,AI繪畫殺瘋了?

專案連結:https://github.com/lllyasviel/ControlNet

雖然目前很多人只是用它來產生二次元、三次元小姐姐,但其更廣泛的用途也被逐漸挖掘出來,例如房屋設計、攝影攝影、影視製作、廣告設計等。在這些場景中,ControlNet 被拿來和之前的一些工具一起使用,例如處理大模型微調問題的 LoRA、影片 - 動畫轉換工具 EbSynth 等。這些工具的組合應用加速了 AI 繪畫模型與生產過程的整合。


利用 ControlNet 和 EbSynth 等工具重新進行室內裝潢設計。圖來源:https://creativetechnologydigest.substack.com/p/controlling-artistic-chaos-with-controlnet  (內附完整教學)

ControlNet star量破萬! 2023年,AI繪畫殺瘋了?

#利用ControlNet 與Houdini 工具產生3D 模型。圖來源:https://www.reddit.com/r/StableDiffusion/comments/115eax6/im_working_on_api_for_the_a1111_controlnet/

ControlNet star量破萬! 2023年,AI繪畫殺瘋了?

ControlNet star量破萬! 2023年,AI繪畫殺瘋了?

ControlNet star量破萬! 2023年,AI繪畫殺瘋了?

#############用Dreambooth 和ControlNet 改變2D 影像光照,可用於照片、影片的後製。圖源:https://www.reddit.com/r/StableDiffusion/comments/1175id9/when_i_say_mindblowing_i_mean_it_new_experiments/######################## #####################用ControlNet 和EbSynth 實作動畫轉真人。雖然效果還不太好,但已經顯示出了把動漫改編成真人版但無需演員出鏡的潛力。圖表來源https://www.reddit.com/r/StableDiffusion/comments/117ewr9/anime_to_live_action_with_controlnet_ebsynth_not/###################設計師利用ControlNet 生成的著名品牌「新logo」。圖源:https://twitter.com/fofrAI/status/1628882166900744194##################驚喜之餘,這些技術的進展也讓繪畫等領域的實踐者陷入焦慮和憤怒。焦慮的是,AI 可能會奪走自己的飯碗。憤怒的是,AI 產生的圖像很多是對當前畫師的抄襲和模仿,畫師的智慧財產權受到了侵犯。 ########################圖來源:https://www.zhihu.com/question/583294094########## #####在這些問題尚未解決的情況下,AI 繪畫在畫師圈成了一個尖銳的問題。很多人認為大家應該一起抵制 AI 繪畫,共同捍衛自己的權益。因此,當某知名畫師疑似採用 AI 繪畫為某遊戲工作室供稿的消息傳開後,其他畫師們被徹底激怒。 ############同時被激怒的還有遊戲玩家。由於目前AI 繪畫還存在一些限制,例如處理不好手部細節(仔細觀察本文第一張圖的小姐姐可以看出來),達不到玩家所要求的美術視覺效果精湛、人物富有個性和創意等要求,很多玩家產生了「被糊弄」的感覺。因此,上述遊戲工作室只能緊急發布聲明,稱「不會在產品中使用 AI 作畫」。 ######

但這種情況會持續多久呢?當 AI 繪畫的程度達到肉眼難以分辨的程度,你怎麼知道你玩的遊戲究竟出自畫師還是 AI,亦或二者組成的「團隊」?

ControlNet star量破萬! 2023年,AI繪畫殺瘋了?

圖來源:https://m .weibo.cn/2268335814/4870844515358190

或許再過幾個月,AI 繪畫工具就會像程式設計師使用的Copilot 一樣,成為繪畫師日常工作必不可少的工具。當然,這也在無形中提高了這一行業的門檻,正如已經被 AI「入侵」的其他行業一樣。如何在這樣的浪潮中保持自己的競爭力可能是每個人都應該思考的問題。

ControlNet star量破萬! 2023年,AI繪畫殺瘋了?

以上是ControlNet star量破萬! 2023年,AI繪畫殺瘋了?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7?擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7?Apr 23, 2025 am 11:49 AM

擁抱Face的OlympicCoder-7B:強大的開源代碼推理模型 開發以代碼為中心的語言模型的競賽正在加劇,擁抱面孔與強大的競爭者一起參加了比賽:OlympicCoder-7B,一種產品

4個新的雙子座功能您可以錯過4個新的雙子座功能您可以錯過Apr 23, 2025 am 11:48 AM

你們當中有多少人希望AI可以做更多的事情,而不僅僅是回答問題?我知道我有,最近,我對它的變化感到驚訝。 AI聊天機器人不僅要聊天,還關心創建,研究

Camunda為經紀人AI編排編寫了新的分數Camunda為經紀人AI編排編寫了新的分數Apr 23, 2025 am 11:46 AM

隨著智能AI開始融入企業軟件平台和應用程序的各個層面(我們必須強調的是,既有強大的核心工具,也有一些不太可靠的模擬工具),我們需要一套新的基礎設施能力來管理這些智能體。 總部位於德國柏林的流程編排公司Camunda認為,它可以幫助智能AI發揮其應有的作用,並與新的數字工作場所中的準確業務目標和規則保持一致。該公司目前提供智能編排功能,旨在幫助組織建模、部署和管理AI智能體。 從實際的軟件工程角度來看,這意味著什麼? 確定性與非確定性流程的融合 該公司表示,關鍵在於允許用戶(通常是數據科學家、軟件

策劃的企業AI體驗是否有價值?策劃的企業AI體驗是否有價值?Apr 23, 2025 am 11:45 AM

參加Google Cloud Next '25,我渴望看到Google如何區分其AI產品。 有關代理空間(此處討論)和客戶體驗套件(此處討論)的最新公告很有希望,強調了商業價值

如何為抹布找到最佳的多語言嵌入模型?如何為抹布找到最佳的多語言嵌入模型?Apr 23, 2025 am 11:44 AM

為您的檢索增強發電(RAG)系統選擇最佳的多語言嵌入模型 在當今的相互聯繫的世界中,建立有效的多語言AI系統至關重要。 強大的多語言嵌入模型對於RE至關重要

麝香:奧斯汀的機器人需要每10,000英里進行干預麝香:奧斯汀的機器人需要每10,000英里進行干預Apr 23, 2025 am 11:42 AM

特斯拉的Austin Robotaxi發射:仔細觀察Musk的主張 埃隆·馬斯克(Elon Musk)最近宣布,特斯拉即將在德克薩斯州奧斯汀推出的Robotaxi發射,最初出於安全原因部署了一支小型10-20輛汽車,並有快速擴張的計劃。 h

AI震驚的樞軸:從工作工具到數字治療師和生活教練AI震驚的樞軸:從工作工具到數字治療師和生活教練Apr 23, 2025 am 11:41 AM

人工智能的應用方式可能出乎意料。最初,我們很多人可能認為它主要用於代勞創意和技術任務,例如編寫代碼和創作內容。 然而,哈佛商業評論最近報導的一項調查表明情況並非如此。大多數用戶尋求人工智能的並非是代勞工作,而是支持、組織,甚至是友誼! 報告稱,人工智能應用案例的首位是治療和陪伴。這表明其全天候可用性以及提供匿名、誠實建議和反饋的能力非常有價值。 另一方面,營銷任務(例如撰寫博客、創建社交媒體帖子或廣告文案)在流行用途列表中的排名要低得多。 這是為什麼呢?讓我們看看研究結果及其對我們人類如何繼續將

公司競爭AI代理的採用公司競爭AI代理的採用Apr 23, 2025 am 11:40 AM

AI代理商的興起正在改變業務格局。 與雲革命相比,預計AI代理的影響呈指數增長,有望徹底改變知識工作。 模擬人類決策的能力

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中