搜尋
首頁科技週邊人工智慧未知物體也能輕易辨識分割,效果可遷移

從來沒有見過的新物體,它也能被很好地分割。

這是DeepMind研究出的一個新的學習框架:目標發現和表示網絡(Object discovery and representation networks,簡稱Odin)

未知物體也能輕易辨識分割,效果可遷移

以往的自我監督學習(SSL)方法能夠很好地描述整個大的場景,但是很難區分出單一的物體。

現在,Odin方法做到了,而且是在沒有任何監督的情況下做到的。

區分出影像中的單一物體可不是很容易的事,它是怎麼做到的呢?

方法原理

能夠很好地區分出影像中的各個物體,主要歸功於Odin學習框架的「自我循環」。

Odin學習了兩組協同工作的網絡,分別是目標發現網絡和目標表示網絡。

目標發現網路以影像的一個裁剪部分作為輸入,裁剪的部分應該包含影像的大部分區域,而這部分影像並沒有在其他方面進行增強處理。

接著對輸入影像產生的特徵圖進行聚類分析,根據不同的特徵對影像中各個物體的進行分割。

未知物體也能輕易辨識分割,效果可遷移

目標表示網路的輸入視圖是目標發現網路中所產生的分割影像。

視圖輸入之後,分別對它們進行隨機預處理,包括翻轉、模糊和點級色彩轉換等。

這樣就能夠獲得兩組掩模,它們除了剪裁之外的差異,其他資訊都和底層圖像內容相同。

而後兩個掩模會透過對比損失,進而學習能夠更好地表示影像中物體的特徵。

具體來說,就是透過對比偵測,訓練一個網路來辨識不同目標物體的特徵,同時還有許多來自其他不相干物體的「負面」特徵。

然後,最大化不同掩模中同一目標物體的相似性,最小化不同目標物體之間的相似性,進而更好地進行分割以區別不同目標物體。

未知物體也能輕易辨識分割,效果可遷移

同時,目標發現網路會定期根據目標表示網路的參數進行對應的更新。

最終的目的是確保這些物件層級的特性在不同的視圖中大致不變,換句話說就是將影像中的物件分隔開來。

那麼Odin學習框架的效果究竟如何呢?

能夠很好地區分未知物體

Odin方法在場景分割時,沒有先驗知識的情況下遷移學習的效能也很強大。

首先,使用Odin方法在ImageNet資料集上進行預訓練,然後評估其在COCO資料集以及PASCAL和Cityscapes語意分割上的效果。

已經知道目標物體,也就是獲得先驗知識的方法在進行場景分割時,效果要明顯優於其他未獲得先驗知識的方法。

而Odin方法即使未獲得先驗知識,其效果也要優於獲得先驗知識的DetCon和ReLICv2。

未知物體也能輕易辨識分割,效果可遷移

未知物體也能輕易辨識分割,效果可遷移

除此之外,Odin方法不僅可以應用在ResNet模型中,還可以應用到更複雜的模型中,如Swim Transformer。

未知物體也能輕易辨識分割,效果可遷移

在資料上,Odin框架學習的優勢很明顯,那在視覺化的影像中,Odin的優勢在何處體現了呢?

將使用Odin產生的分割影像與隨機初始化的網路(第3列),ImageNet監督的網路(第4列)中獲得的分割影像進行比較。

第3、4列都未能清楚地描繪出物體的邊界,或缺乏現實世界物體的一致性與局部性,而Odin所產生的影像效果很明顯較好。

未知物體也能輕易辨識分割,效果可遷移

參考連結:

[1] https://twitter.com/DeepMind/status/1554467389290561541

[2] https://arxiv.org/abs/2203.08777

以上是未知物體也能輕易辨識分割,效果可遷移的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
及時工程中的思想圖是什麼及時工程中的思想圖是什麼Apr 13, 2025 am 11:53 AM

介紹 在迅速的工程中,“思想圖”是指使用圖理論來構建和指導AI的推理過程的新方法。與通常涉及線性S的傳統方法不同

優化您的組織與Genai代理商的電子郵件營銷優化您的組織與Genai代理商的電子郵件營銷Apr 13, 2025 am 11:44 AM

介紹 恭喜!您經營一家成功的業務。通過您的網頁,社交媒體活動,網絡研討會,會議,免費資源和其他來源,您每天收集5000個電子郵件ID。下一個明顯的步驟是

Apache Pinot實時應用程序性能監視Apache Pinot實時應用程序性能監視Apr 13, 2025 am 11:40 AM

介紹 在當今快節奏的軟件開發環境中,確保最佳應用程序性能至關重要。監視實時指標,例如響應時間,錯誤率和資源利用率可以幫助MAIN

Chatgpt擊中了10億用戶? Openai首席執行官說:'短短幾週內翻了一番Chatgpt擊中了10億用戶? Openai首席執行官說:'短短幾週內翻了一番Apr 13, 2025 am 11:23 AM

“您有幾個用戶?”他扮演。 阿爾特曼回答說:“我認為我們上次說的是每週5億個活躍者,而且它正在迅速增長。” “你告訴我,就像在短短幾週內翻了一番,”安德森繼續說道。 “我說那個私人

pixtral -12b:Mistral AI'第一個多模型模型 - 分析Vidhyapixtral -12b:Mistral AI'第一個多模型模型 - 分析VidhyaApr 13, 2025 am 11:20 AM

介紹 Mistral發布了其第一個多模式模型,即Pixtral-12b-2409。該模型建立在Mistral的120億參數Nemo 12B之上。是什麼設置了該模型?現在可以拍攝圖像和Tex

生成AI應用的代理框架 - 分析Vidhya生成AI應用的代理框架 - 分析VidhyaApr 13, 2025 am 11:13 AM

想像一下,擁有一個由AI驅動的助手,不僅可以響應您的查詢,還可以自主收集信息,執行任務甚至處理多種類型的數據(TEXT,圖像和代碼)。聽起來有未來派?在這個a

生成AI在金融部門的應用生成AI在金融部門的應用Apr 13, 2025 am 11:12 AM

介紹 金融業是任何國家發展的基石,因為它通過促進有效的交易和信貸可用性來推動經濟增長。交易的便利和信貸

在線學習和被動攻擊算法指南在線學習和被動攻擊算法指南Apr 13, 2025 am 11:09 AM

介紹 數據是從社交媒體,金融交易和電子商務平台等來源的前所未有的速度生成的。處理這種連續的信息流是一個挑戰,但它提供了

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器