搜尋
首頁科技週邊人工智慧大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

還記得前幾天發布的DragGAN嗎?

沒錯,就是那個「輕輕點兩下」1秒修圖的工具。

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

拍的照片表情不好?修!臉型不夠瘦?修!臉沖鏡頭的角度不對?修!

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

#搞不好,「讓大象轉個身」這個遠古PS段子,可能就要成真了 

這個AI修圖工具示範影片一經發布,瞬間在國內外火得一塌糊塗。

許多網友紛紛直呼,「PS不存在了」。

還沒幾天,DragGAN非官方實作竟能上手試用了。這項功能已經被整合到InternGPT中,介面長這樣↓

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

##體驗位址:https:/ /igpt.opengvlab.com/

沒想到,示範入口一開放,直接被擠爆。

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

官方示範

從官方放出的示範影片來看,再現的DragGAN效果絕了。

咧嘴笑

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

#先是怎麼把一個沒笑的人p笑。只要選兩個嘴角,直接Drag就好了。

可以看到,最終產生的結果毫無違和感。因為臉部肌肉也在一起變化,不是單純的咧嘴。

合上嘴巴

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

臉編輯

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

##這個瘦臉功能大家就太熟悉了,選取兩個臉蛋往裡面擠,輸出還是很自然的。

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

男性瘦臉。不過這個有點瘦過了,輸出結果一眼假,下巴太尖了。

############這個必須強推!植髮!多少禿頭人士的福音。 ############不過從輸出結果看,就算選中額頭那裡,也是全部地方的毛髮等比例增長,最後的結果有點像美猴王。 ######

轉臉

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

#臉部轉動也是很實用的功能,補齊的部分非常自然。

其它功能

除了小範圍的修圖,InternGPT本身還有很多其它可以進行的亮眼操作。

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

移除遮蓋的物件

#點擊想要在圖片中進行操作的部分,在prompt中輸入「移除」就可以了。

圖片產生

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

#這個功能比較有意思,先上傳一張圖片,輸入prompt讓DragGAN分割,然後再輸入一個prompt產生想要的圖片。

露出黑腳了? (不是)

影片高光解說

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

#用prompt也可以一鍵剪輯影片。

互動式視覺問答

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

#甚至辨識完圖片上的信息還能連網直接查詢。

互動式影像產生

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

#隨手的塗鴉都能一鍵變成美圖。

反正看完這些功能小編是真震驚了。所有功能就突顯兩個特點:「傻瓜式操作,且究極好用」。

這誰能不愛?

技術實作

看了這麼多酷炫的功能,那麼這個InternGPT到底是什麼?

InternGPT(簡稱iGPT)/InternChat(簡稱iChat)是一種基於指向語言驅動的視覺互動系統,使用者可以透過點擊、拖曳和繪製與ChatGPT進行互動。

與依賴純語言的現有互動系統不同,透過整合指向指令,iGPT顯著提高了使用者與聊天機器人之間的溝通效率,以及聊天機器人在視覺為中心任務中的準確性,尤其在複雜的視覺場景中更是如此。

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

論文網址:https://arxiv.org/pdf/2305.05662.pdf

#下圖就是InternGPT的整體架構。

我們可以看到,這個GPT既可以處理圖像、視頻,也可以處理語音、文字。

對於影像或視訊輸入,InternGPT就會用SAM(影像分割模型)、OCR(影像辨識模型)等等來處理。

在辨識出地理位置、物品或線條之後,還有一整個工具箱進行進一步處理,其中都是我們耳熟能詳的工具。

例如BLIP(音訊)、Stable Diffusion(圖像)、Pix2Pix(圖像翻譯)等等。

同樣地,對於文字或語音輸入,InternGPT就會呼叫GPT-4、LLaMA等模型或工具進行處理,後續同樣有一整個工具箱。

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

InternGPT的整體架構

使用提示

而在使用過程中,整個流程也是非常方便的。

用戶在圖片上傳成功後,可以發送以下訊息與iGPT進行多模態相關的對話:

"what is it in the image?" or "what is the background color of image?".

同樣,用戶也可以互動式地操作、編輯或產生圖片,如下:

· 點擊圖片上的任何位置,然後按下Pick 按鈕,預覽分割區域。也可以按下OCR 按鈕,識別具體位置處存在的所有單字;

· 要在圖像中刪除掩碼區域,可以發送以下訊息:##

“remove the masked region”

· 若要在影像中取代遮罩的物體為其他物體,可以傳送下列訊息:

“replace the masked region with {your prompt}”

· 想產生新影像,可以傳送下列訊息:

“generate a new image based on its segmentation describing {your prompt}”

· 想透過塗鴉建立新影像,按下Whiteboard 並在白板上繪製。繪製完成後,需要按下儲存按鈕並發送以下訊息:

“generate a new image based on this scribble describing {your prompt}”
網友評論

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

那個令人震驚的DragGAN現在有一個非官方的版本。正式版本將在6月發布,這只是未來的預覽。

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

DragGAN已經整合到InternGPT了,這麼快就出來了,修圖神器。

大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN

以上是大象P轉身開箱即用!港大、南大、清華等搶先開源「復刻」版DragGAN的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
大多數使用的10個功率BI圖 - 分析Vidhya大多數使用的10個功率BI圖 - 分析VidhyaApr 16, 2025 pm 12:05 PM

用Microsoft Power BI圖來利用數據可視化的功能 在當今數據驅動的世界中,有效地將復雜信息傳達給非技術觀眾至關重要。 數據可視化橋接此差距,轉換原始數據i

AI的專家系統AI的專家系統Apr 16, 2025 pm 12:00 PM

專家系統:深入研究AI的決策能力 想像一下,從醫療診斷到財務計劃,都可以訪問任何事情的專家建議。 這就是人工智能專家系統的力量。 這些系統模仿Pro

三個最好的氛圍編碼器分解了這項代碼中的AI革命三個最好的氛圍編碼器分解了這項代碼中的AI革命Apr 16, 2025 am 11:58 AM

首先,很明顯,這種情況正在迅速發生。各種公司都在談論AI目前撰寫的代碼的比例,並且這些代碼的比例正在迅速地增加。已經有很多工作流離失所

跑道AI的Gen-4:AI蒙太奇如何超越荒謬跑道AI的Gen-4:AI蒙太奇如何超越荒謬Apr 16, 2025 am 11:45 AM

從數字營銷到社交媒體的所有創意領域,電影業都站在技術十字路口。隨著人工智能開始重塑視覺講故事的各個方面並改變娛樂的景觀

如何註冊5天ISRO AI免費課程? - 分析Vidhya如何註冊5天ISRO AI免費課程? - 分析VidhyaApr 16, 2025 am 11:43 AM

ISRO的免費AI/ML在線課程:通向地理空間技術創新的門戶 印度太空研究組織(ISRO)通過其印度遙感研究所(IIR)為學生和專業人士提供了絕佳的機會

AI中的本地搜索算法AI中的本地搜索算法Apr 16, 2025 am 11:40 AM

本地搜索算法:綜合指南 規劃大規模活動需要有效的工作量分佈。 當傳統方法失敗時,本地搜索算法提供了強大的解決方案。 本文探討了爬山和模擬

OpenAI以GPT-4.1的重點轉移,將編碼和成本效率優先考慮OpenAI以GPT-4.1的重點轉移,將編碼和成本效率優先考慮Apr 16, 2025 am 11:37 AM

該版本包括三種不同的型號,GPT-4.1,GPT-4.1 MINI和GPT-4.1 NANO,標誌著向大語言模型景觀內的特定任務優化邁進。這些模型並未立即替換諸如

提示:chatgpt生成假護照提示:chatgpt生成假護照Apr 16, 2025 am 11:35 AM

Chip Giant Nvidia週一表示,它將開始製造AI超級計算機(可以處理大量數據並運行複雜算法的機器),完全是在美國首次在美國境內。這一消息是在特朗普總統SI之後發布的

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
1 個月前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它們
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具