兩年前,在美國科羅拉多州博覽會藝術比賽上,一幅名為《太空歌劇院》的作品拿了第一名。
此畫氣勢恢弘、明暗有致,頗有法國象徵主義畫家古斯塔夫・莫羅的味道。只不過,它不是人類畫的,而是由一位沒有任何繪畫基礎的參賽者,借助 AI 繪圖工具完成的。
我們再把時間撥回 2018 年。彼時,一幅名為《埃德蒙・貝拉米畫像》的 AI 畫作在紐約佳士得拍賣行,拍出了 40 多萬美元的高價。這是第一幅被拍賣的人工智慧作品,也標誌著 AI 藝術作品開始被市場認可。
如今,AI 繪畫早已司空見慣,國內外的 AI 玩家紛紛下場,都要把這一賽道捲冒煙了。
例如國外赫赫有名的 AI 生圖應用 Midjourney、Stable Diffusion、DALL-E,動不動就上演神仙打架;國內的字節、阿里、騰訊等企業也隔三差五推出新產品、新功能。
可是,AI 繪畫應用五花八門,對於 AI 愛好者來說,如何實現更強的圖文匹配?如何生成更具美感的影像?如何有效率地部署文生圖模型呢?
《AIGC 體驗派》第六期節目就來嘮嘮這件事兒。
《AIGC 體驗派》影片節目由火山引擎、NVIDIA 聯手本站和 CMO CLUB 共同推出,匯集了眾多行銷領域的專業人士,共同探討 AIGC 技術的應用、思考與實踐。
在本集節目中,兩位業界資深嘉賓將深入剖析高美感文生圖背後的技術鏈路,手把手教大家如何實現更強的圖文匹配。
直播時間:8月6日19:00-19:40
直播主題:
隨著 AIGC 技術的迭代,生成式 AI 的多模態能力正在迅速擴展和深化。作為大模型最火熱的應用領域之一,文生圖近年來也取得了突破性進展,大大豐富了內容創作者的武器庫。
使用者只要輸入幾句簡單的提示詞,AI 就能自動產生逼真細膩的畫作。無論是古典油畫的細膩質感,或是現代抽象藝術的自由表達,抑或是東方水墨畫的深遠意境,它都能游刃有餘地進行創作。它不僅能學習和模仿歷史上著名畫家的風格,也能創造出全新的藝術流派,為使用者帶來前所未有的創作和互動體驗。
時至今日,AI 繪畫更是進化「成精」,甚至到了真假難辨的地步。
例如,這樣的:
或這樣的:
也正是因為獨特的創作力與沉浸式的互動體驗,AI 文生圖成了各大 AI 廠商競相爭取的「香餑餑」。
例如,位元組一口氣推出了剪映、星繪、即夢等AI 產品,無一例外,它們都包含了文生圖能力,而這些產品的背後,都離不開字節的豆包文生圖大模型。
對於文生圖模型來說,要想討得使用者「歡心」,無外乎三點:更強的圖文匹配、更美的影像效果和更快的生成體驗。
那麼,豆包文生圖大模型是如何實現更強的圖文匹配來滿足使用者的想法設計?如何產生更具美感的影像來提供更極致的使用者體驗?如何更快速地出圖來滿足超大規模的服務呼叫?
上期回顧
在第五期《AIGC 體驗派》的直播中,火山引擎內容安全與風控負責人張建洋、 NVIDIA 企業級開發者社群資深經理何琨深入剖析AIGC 在行銷領域的創新與安全議題,分享如何在變革中實現業務的持續成長與穩健發展。
眾所周知,AIGC 技術正逐漸成為企業行銷一大創新利器。它可以幫助行銷人以前所未有的速度創作天馬行空的行銷素材,只需簡單輸入幾個關鍵字或提示詞,就可以在短時間內自動產生引人入勝的行銷文案、圖片、以及行銷影片。
然而,正如任何技術革新一樣,AIGC 在提升行銷創意和效率的同時,也帶來了許多安全問題。
火山引擎內容安全與風控負責人張建洋以實際案例,展示了火山引擎的 AI 技術如何為行銷人「保駕護航」。
張建洋表示,大模型的幻覺讓輸出結果不完全可控,由此導致行銷內容存在各種潛在的內容風險。例如,AIGC 技術創作的行銷文案含有「最好」、「第一」、「世界級」、「全網首發」等「絕對化」的用語,產生的行銷圖片或影片中可能含有低俗低質的不良內容,它們一旦出現在廣告中,不僅會損害品牌形象,還會引起大眾的反感。
對此,火山引擎提供了一整套有針對性的內容風險檢測引擎,透過其多模態內容支援、多樣化的風險模型和即時風險評估功能,為企業打造了一個全面、高效率的風險管理解決方案。
其中,針對行銷素材風險多樣性的問題,偵測引擎內建了上百個風險模型。例如,適用於行銷文案的廣告用語檢測模型,可以準確判斷文案中是否含有絕對化用語、虛假宣傳、以及誘導消費的違規內容;而適用於行銷影片的畫面品質和版權檢測模型,可以判斷影片中是否包含不良畫面和低質內容,以及是否有侵權可能。
此外,為了有效轉換目標用戶,企業往往不惜投入重金開展各種行銷活動,如新人獎勵、任務獎勵等,以期提升用戶黏性。然而,這些充滿誘惑的獎勵機制,也可能成為黑產眼中的「肥肉」,他們利用漏洞作弊,將企業的行銷資金佔為己有。
例如,一家車企在進行線上行銷活動時,遇到虛假助力和虛假試駕這兩大棘手問題。接上火山引擎智慧風控產品後,短短兩個月,他們就有效辨識出異常行為108 萬次、異常帳戶超3 萬個,異常設備2 萬餘台,直接停損金額達50 萬元,不僅有效降低了行銷費用的浪費,也大大提升了業務轉換率。
NVIDIA 企業級開發者社群資深經理何琨則介紹了一款超酷的工具 ——NeMo Guardrails,它就像是大語言模型的「保鑣」,避免它們胡言亂語。
據何琨介紹,NeMo Guardrails 是一個開源工具庫,透過添加可程式護欄來控制大型語言模型的輸出,防止敏感話題、不當言論和惡意攻擊。它包括話題限定、對話安全和攻擊防禦三大護欄,支援自訂對話邏輯,確保對話機器人的回應符合特定請求和預先定義邏輯。
NeMo Guardrails 的工作流程包括接收使用者輸入、配對生成護欄、執行對話邏輯流和產生機器人答案。它使用 Colang 語言定義對話邏輯,這是一種用於對話式 AI 建模的語言,具有高度可讀性和可擴展性。此外,NeMo Guardrails 可以與 LangChain 結合使用,支援多種大語言模型對話引擎,實現更安全的對話系統輸出。
第五期回顧觀看網址:https://vtizr.xetlk.com/s/7CjTy(或辨識下方二維碼)。
以上是AI助攻人類畫家拿下藝術大賽第一名,背後有啥獨家秘籍?的詳細內容。更多資訊請關注PHP中文網其他相關文章!