搜尋
首頁科技週邊人工智慧背景與前景控制更加精細,編輯更加快速:BEVControl的兩階段方法

本文將介紹一種透過BEV Sketch佈局來精確產生多視角街景圖片的方法

背景與前景控制更加精細,編輯更加快速:BEVControl的兩階段方法

#在自動駕駛領域,影像合成被廣泛應用於提升下游感知任務的表現

在電腦視覺領域,提升感知模型表現的一個長期存在的研究難題是透過合成圖像來實現。在以視覺為中心的自動駕駛系統中,使用多視角攝像頭,這個問題變得更加突出,因為有些長尾場景是永遠無法收集到的

背景與前景控制更加精細,編輯更加快速:BEVControl的兩階段方法

根據圖1(a)所示,現有的生成方法將語義分割風格的BEV結構輸入生成網絡,並輸出合理的多視角影像。僅根據場景層級指標進行評估時,現有方法似乎能合成照片般逼真的街景影像。然而,一旦放大,我們發現它無法產生準確的物件層級的細節。圖中,我們展示了目前最先進生成演算法的一個常見錯誤,即生成的車輛與目標3D邊界框相比方向完全相反。此外,編輯語意分割樣式的BEV結構是一項艱鉅的任務,需要大量人力

因此,我們提出了一種名為BEVControl的兩階段方法,用於提供更精細的背景和前景幾何控制,如圖1(b)所示。 BEVControl支援草圖風格的BEV結構輸入,可以實現快速簡單的編輯。此外,我們的BEVControl將視覺一致性分解為兩個子目標:透過控制器(Controller)實現街道視圖和鳥瞰視圖之間的幾何一致性;透過協調器(Coordinator)實現街道視圖之間的外觀一致性

背景與前景控制更加精細,編輯更加快速:BEVControl的兩階段方法

論文連結:https://www.php.cn/link/1531beb762df4029513ebf9295e0d34f

背景與前景控制更加精細,編輯更加快速:BEVControl的兩階段方法

# #方法框架

背景與前景控制更加精細,編輯更加快速:BEVControl的兩階段方法

  • BEVControl 是一個UNet 結構的生成網絡,由一系列模組組成。每個模組有兩個元素,分別是控制器(Controller )和協調器(Coordinator )。
輸入:方便編輯的 BEV 草圖、多視圖雜訊影像和文字提示;

背景與前景控制更加精細,編輯更加快速:BEVControl的兩階段方法#輸出:產生的多視圖影像。

  • 方法細節

#BEV草圖到相機條件的相機投影過程。輸入為BEV草圖。輸出為多視角的前景條件和背景條件。
  • 控制器: 以自註意力的方式接收相機視圖草圖的前景和背景訊息,並輸出與BEV草圖具有幾何一致性的街景特徵。

協調器:利用一種新穎的跨視圖、跨元素的注意力機制,實現跨視圖的上下文交互,輸出具有外觀一致性的街景特徵。 背景與前景控制更加精細,編輯更加快速:BEVControl的兩階段方法

提出的評估指標

  • 最近的街景影像產生工作僅根據場景層級指標(如FID、road mIoU 等)來評估生成品質. 背景與前景控制更加精細,編輯更加快速:BEVControl的兩階段方法
  • 我們發現僅使用這些指標無法評估生成網路的真正生成能力,如下圖所示。報告的定性和定量結果同時表明,兩組產生的街景影像雖然具有相似的 FID 分數,但對前景和背景的細粒度控制能力卻大相徑庭。
  • 因此,我們提出一套用於精細衡量生成網路控制能力的評估指標。

背景與前景控制更加精細,編輯更加快速:BEVControl的兩階段方法

#########定量結果#############BEVControl與最先進的方法在提出的評估指標上的比較。 #########應用BEVControl做資料增強,在目標偵測任務上的提升。 ################

定性結果

  • BEVControl與最先進的方法在NuScenes驗證集上的比較。

背景與前景控制更加精細,編輯更加快速:BEVControl的兩階段方法

背景與前景控制更加精細,編輯更加快速:BEVControl的兩階段方法

Demo效果

背景與前景控制更加精細,編輯更加快速:BEVControl的兩階段方法

背景與前景控制更加精細,編輯更加快速:BEVControl的兩階段方法

需要重寫的內容是:參考文獻

需要重寫的內容是:[1] Swerdlow A, Xu R, Zhou B. 從鳥瞰佈局產生街景圖像[ J]. arXiv預印本arXiv:2301.04634, 2023.

以上是背景與前景控制更加精細,編輯更加快速:BEVControl的兩階段方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:机器之心。如有侵權,請聯絡admin@php.cn刪除
擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7?擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7?Apr 23, 2025 am 11:49 AM

擁抱Face的OlympicCoder-7B:強大的開源代碼推理模型 開發以代碼為中心的語言模型的競賽正在加劇,擁抱面孔與強大的競爭者一起參加了比賽:OlympicCoder-7B,一種產品

4個新的雙子座功能您可以錯過4個新的雙子座功能您可以錯過Apr 23, 2025 am 11:48 AM

你們當中有多少人希望AI可以做更多的事情,而不僅僅是回答問題?我知道我有,最近,我對它的變化感到驚訝。 AI聊天機器人不僅要聊天,還關心創建,研究

Camunda為經紀人AI編排編寫了新的分數Camunda為經紀人AI編排編寫了新的分數Apr 23, 2025 am 11:46 AM

隨著智能AI開始融入企業軟件平台和應用程序的各個層面(我們必須強調的是,既有強大的核心工具,也有一些不太可靠的模擬工具),我們需要一套新的基礎設施能力來管理這些智能體。 總部位於德國柏林的流程編排公司Camunda認為,它可以幫助智能AI發揮其應有的作用,並與新的數字工作場所中的準確業務目標和規則保持一致。該公司目前提供智能編排功能,旨在幫助組織建模、部署和管理AI智能體。 從實際的軟件工程角度來看,這意味著什麼? 確定性與非確定性流程的融合 該公司表示,關鍵在於允許用戶(通常是數據科學家、軟件

策劃的企業AI體驗是否有價值?策劃的企業AI體驗是否有價值?Apr 23, 2025 am 11:45 AM

參加Google Cloud Next '25,我渴望看到Google如何區分其AI產品。 有關代理空間(此處討論)和客戶體驗套件(此處討論)的最新公告很有希望,強調了商業價值

如何為抹布找到最佳的多語言嵌入模型?如何為抹布找到最佳的多語言嵌入模型?Apr 23, 2025 am 11:44 AM

為您的檢索增強發電(RAG)系統選擇最佳的多語言嵌入模型 在當今的相互聯繫的世界中,建立有效的多語言AI系統至關重要。 強大的多語言嵌入模型對於RE至關重要

麝香:奧斯汀的機器人需要每10,000英里進行干預麝香:奧斯汀的機器人需要每10,000英里進行干預Apr 23, 2025 am 11:42 AM

特斯拉的Austin Robotaxi發射:仔細觀察Musk的主張 埃隆·馬斯克(Elon Musk)最近宣布,特斯拉即將在德克薩斯州奧斯汀推出的Robotaxi發射,最初出於安全原因部署了一支小型10-20輛汽車,並有快速擴張的計劃。 h

AI震驚的樞軸:從工作工具到數字治療師和生活教練AI震驚的樞軸:從工作工具到數字治療師和生活教練Apr 23, 2025 am 11:41 AM

人工智能的應用方式可能出乎意料。最初,我們很多人可能認為它主要用於代勞創意和技術任務,例如編寫代碼和創作內容。 然而,哈佛商業評論最近報導的一項調查表明情況並非如此。大多數用戶尋求人工智能的並非是代勞工作,而是支持、組織,甚至是友誼! 報告稱,人工智能應用案例的首位是治療和陪伴。這表明其全天候可用性以及提供匿名、誠實建議和反饋的能力非常有價值。 另一方面,營銷任務(例如撰寫博客、創建社交媒體帖子或廣告文案)在流行用途列表中的排名要低得多。 這是為什麼呢?讓我們看看研究結果及其對我們人類如何繼續將

公司競爭AI代理的採用公司競爭AI代理的採用Apr 23, 2025 am 11:40 AM

AI代理商的興起正在改變業務格局。 與雲革命相比,預計AI代理的影響呈指數增長,有望徹底改變知識工作。 模擬人類決策的能力

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)