話說這兩年,「文字生成圖像的擴散模型」著實大火了一把,DALL·E 2和Imagen都是基於此開發出來的應用。
本文經AI新媒體量子位元(公眾號ID:QbitAI)授權轉載,轉載請聯絡來源。
這是一份看似平平無奇的日式便當。
但你敢信,其實每一格食物都是P上去的,而且原圖還是醬嬸兒的:
△直接摳圖貼上去,效果一眼假
背後操作者並不是什麼PS大佬,而是一隻AI,名字很直白:拼圖擴散(Collage Diffusion)。
隨便找幾張小圖拿給它,AI就能自己看懂圖片內容,再把各元素非常自然地拼成一張大圖——完全不存在一眼假。
其效果驚艷了不少網友。
甚至還有PS愛好者直呼:
這簡直是天賜之物…希望很快能在Automatic1111( Stable Diffusion用戶常用的網路UI,也有整合在PS中的插件版)中看到它。
為什麼效果這麼自然?
實際上,此AI生成的「日式便當」還有好幾個生成版本——都很自然有木有。
#至於為啥還有多種版本?問就是因為使用者還能自訂,在整體不變得太離譜的前提下,他們可以微調各種細節。
除了“日式便當”,它還有不少出色的作品。
例如,這是拿給AI的素材,P圖痕跡明顯:
這是AI拼好的圖,反正我愣是沒看出什麼P圖痕跡:
話說這兩年,「文字生成影像的擴散模型」著實大火了一把,DALL·E 2和Imagen都是基於此開發出來的應用。這種擴散模型的優點,是生成圖片多樣化、品質較高。
不過,文字終究對於目標圖像,最多只能起到模糊的規範作用,所以用戶通常要花大量時間調整提示(prompt),還得搭配上額外的控制組件,才可以得到不錯的效果。
就拿前文展示的日式便當來說:
如果用戶只輸入“一個裝有米飯、毛豆、生薑和壽司的便當盒”,那就既沒描述哪種食物放到哪一格,也沒有說明每種食物的外觀。但如果非要講清楚的話,使用者恐怕得寫一篇小作文了…
有鑑於此,史丹佛團隊決定從別的角度出發。
他們決定參考傳統思路,透過拼圖來產生最終影像,並由此開發出了一種新的擴散模型。
有趣的是,說白了,這種模型也算是用經典技術「拼」出來的。
首先是分層:使用基於圖層的影像編輯UI,將來源影像分解成一個個RGBA圖層(R、G、B分別代表紅、綠、藍, A代表透明度),然後將這些圖層排列在畫布上,並將每個圖層和文字提示配對。
透過分層,可以修改影像中的各種元素。
到目前為止,分層已經是電腦圖形領域中成熟的技術,不過先前分層資訊一般是作為單張圖片輸出結果使用的。
而在這個新型「拼圖擴散模型」中,分層資訊成了後續操作的輸入。
除了分層,還搭配了現有的基於擴散的影像協調技術,提升影像視覺品質。
總而言之,演算法不僅限制了物件的某些屬性(如視覺特徵)的變化,同時允許屬性(方向、光照、透視、遮蔽)發生改變。
——從而平衡了還原度和自然度之間的關係,產生「神似」且毫無違和感的圖片。
操作過程也很easy,在互動編輯模式下,使用者在幾分鐘內就能創作一幅拼貼畫。
他們不僅可以自訂場景中的空間排列順序(就是把從別處扣出來的圖放到適當的位置);還能調整生成影像的各個元件。用同樣的來源圖,可以得到不同的效果。
△最右邊列是這個AI的輸出結果
而在非互動模式下(即使用者不拼圖,直接把一堆小圖丟給AI),AI也能根據拿到的小圖,自動拼出一張效果自然的大圖。
研究團隊
最後,來說說背後的研究團隊,他們是史丹佛大學電腦科學系的一群師生。
論文一作,Vishnu Sarukkai現為史丹佛電腦科學系研究生,還是碩博連讀的那種。
他的主要研究方向為:電腦圖形學、電腦視覺和機器學習。
此外,論文的共同作者Linden Li,也是史丹佛計算機科學系研究生。
在校求學期間,他曾到英偉達實習4個月,與英偉達深度學習研究小組合作,參與訓練了增加100M 參數的視覺轉換器模型。
論文網址:https://arxiv.org/abs/2303.00262
以上是不會PS沒關係,AI拼圖技巧已經能以假亂真的詳細內容。更多資訊請關注PHP中文網其他相關文章!

ai合并图层的快捷键是“Ctrl+Shift+E”,它的作用是把目前所有处在显示状态的图层合并,在隐藏状态的图层则不作变动。也可以选中要合并的图层,在菜单栏中依次点击“窗口”-“路径查找器”,点击“合并”按钮。

ai橡皮擦擦不掉东西是因为AI是矢量图软件,用橡皮擦不能擦位图的,其解决办法就是用蒙板工具以及钢笔勾好路径再建立蒙板即可实现擦掉东西。

虽然谷歌早在2020年,就在自家的数据中心上部署了当时最强的AI芯片——TPU v4。但直到今年的4月4日,谷歌才首次公布了这台AI超算的技术细节。论文地址:https://arxiv.org/abs/2304.01433相比于TPU v3,TPU v4的性能要高出2.1倍,而在整合4096个芯片之后,超算的性能更是提升了10倍。另外,谷歌还声称,自家芯片要比英伟达A100更快、更节能。与A100对打,速度快1.7倍论文中,谷歌表示,对于规模相当的系统,TPU v4可以提供比英伟达A100强1.

ai可以转成psd格式。转换方法:1、打开Adobe Illustrator软件,依次点击顶部菜单栏的“文件”-“打开”,选择所需的ai文件;2、点击右侧功能面板中的“图层”,点击三杠图标,在弹出的选项中选择“释放到图层(顺序)”;3、依次点击顶部菜单栏的“文件”-“导出”-“导出为”;4、在弹出的“导出”对话框中,将“保存类型”设置为“PSD格式”,点击“导出”即可;

Yann LeCun 这个观点的确有些大胆。 「从现在起 5 年内,没有哪个头脑正常的人会使用自回归模型。」最近,图灵奖得主 Yann LeCun 给一场辩论做了个特别的开场。而他口中的自回归,正是当前爆红的 GPT 家族模型所依赖的学习范式。当然,被 Yann LeCun 指出问题的不只是自回归模型。在他看来,当前整个的机器学习领域都面临巨大挑战。这场辩论的主题为「Do large language models need sensory grounding for meaning and u

ai顶部属性栏不见了的解决办法:1、开启Ai新建画布,进入绘图页面;2、在Ai顶部菜单栏中点击“窗口”;3、在系统弹出的窗口菜单页面中点击“控制”,然后开启“控制”窗口即可显示出属性栏。

ai移动不了东西的解决办法:1、打开ai软件,打开空白文档;2、选择矩形工具,在文档中绘制矩形;3、点击选择工具,移动文档中的矩形;4、点击图层按钮,弹出图层面板对话框,解锁图层;5、点击选择工具,移动矩形即可。

引入密集强化学习,用 AI 验证 AI。 自动驾驶汽车 (AV) 技术的快速发展,使得我们正处于交通革命的风口浪尖,其规模是自一个世纪前汽车问世以来从未见过的。自动驾驶技术具有显着提高交通安全性、机动性和可持续性的潜力,因此引起了工业界、政府机构、专业组织和学术机构的共同关注。过去 20 年里,自动驾驶汽车的发展取得了长足的进步,尤其是随着深度学习的出现更是如此。到 2015 年,开始有公司宣布他们将在 2020 之前量产 AV。不过到目前为止,并且没有 level 4 级别的 AV 可以在市场


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

Dreamweaver CS6
視覺化網頁開發工具

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具