背景與前景控制更加精細，編輯更加快速：BEVControl的兩階段方法-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

背景與前景控制更加精細，編輯更加快速：BEVControl的兩階段方法

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Sep 07, 2023 pm 11:21 PM

理論場景生成bevcontrol

本文將介紹一種透過BEV Sketch佈局來精確產生多視角街景圖片的方法

背景與前景控制更加精細，編輯更加快速：BEVControl的兩階段方法

#在自動駕駛領域，影像合成被廣泛應用於提升下游感知任務的表現

在電腦視覺領域，提升感知模型表現的一個長期存在的研究難題是透過合成圖像來實現。在以視覺為中心的自動駕駛系統中，使用多視角攝像頭，這個問題變得更加突出，因為有些長尾場景是永遠無法收集到的

背景與前景控制更加精細，編輯更加快速：BEVControl的兩階段方法

根據圖1(a)所示，現有的生成方法將語義分割風格的BEV結構輸入生成網絡，並輸出合理的多視角影像。僅根據場景層級指標進行評估時，現有方法似乎能合成照片般逼真的街景影像。然而，一旦放大，我們發現它無法產生準確的物件層級的細節。圖中，我們展示了目前最先進生成演算法的一個常見錯誤，即生成的車輛與目標3D邊界框相比方向完全相反。此外，編輯語意分割樣式的BEV結構是一項艱鉅的任務，需要大量人力

因此，我們提出了一種名為BEVControl的兩階段方法，用於提供更精細的背景和前景幾何控制，如圖1(b)所示。 BEVControl支援草圖風格的BEV結構輸入，可以實現快速簡單的編輯。此外，我們的BEVControl將視覺一致性分解為兩個子目標：透過控制器（Controller）實現街道視圖和鳥瞰視圖之間的幾何一致性；透過協調器（Coordinator）實現街道視圖之間的外觀一致性

背景與前景控制更加精細，編輯更加快速：BEVControl的兩階段方法

論文連結：https://www.php.cn/link/1531beb762df4029513ebf9295e0d34f

# #方法框架

背景與前景控制更加精細，編輯更加快速：BEVControl的兩階段方法

BEVControl 是一個UNet 結構的生成網絡，由一系列模組組成。每個模組有兩個元素，分別是控制器(Controller )和協調器(Coordinator )。

輸入：方便編輯的 BEV 草圖、多視圖雜訊影像和文字提示；

背景與前景控制更加精細，編輯更加快速：BEVControl的兩階段方法 #輸出：產生的多視圖影像。

方法細節

#BEV草圖到相機條件的相機投影過程。輸入為BEV草圖。輸出為多視角的前景條件和背景條件。

控制器: 以自註意力的方式接收相機視圖草圖的前景和背景訊息，並輸出與BEV草圖具有幾何一致性的街景特徵。

協調器：利用一種新穎的跨視圖、跨元素的注意力機制，實現跨視圖的上下文交互，輸出具有外觀一致性的街景特徵。背景與前景控制更加精細，編輯更加快速：BEVControl的兩階段方法

提出的評估指標

最近的街景影像產生工作僅根據場景層級指標（如FID、road mIoU 等）來評估生成品質.
因此，我們提出一套用於精細衡量生成網路控制能力的評估指標。

背景與前景控制更加精細，編輯更加快速：BEVControl的兩階段方法

#########定量結果#############BEVControl與最先進的方法在提出的評估指標上的比較。 #########應用BEVControl做資料增強，在目標偵測任務上的提升。 ################

定性結果

BEVControl與最先進的方法在NuScenes驗證集上的比較。

背景與前景控制更加精細，編輯更加快速：BEVControl的兩階段方法

Demo效果

背景與前景控制更加精細，編輯更加快速：BEVControl的兩階段方法

需要重寫的內容是：參考文獻

需要重寫的內容是：[1] Swerdlow A, Xu R, Zhou B. 從鳥瞰佈局產生街景圖像[ J]. arXiv預印本arXiv:2301.04634, 2023.

以上是背景與前景控制更加精細，編輯更加快速：BEVControl的兩階段方法的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：机器之心。如有侵權，請聯絡admin@php.cn刪除

擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7？Apr 23, 2025 am 11:49 AM

擁抱Face的OlympicCoder-7B：強大的開源代碼推理模型開發以代碼為中心的語言模型的競賽正在加劇，擁抱面孔與強大的競爭者一起參加了比賽：OlympicCoder-7B，一種產品

4個新的雙子座功能您可以錯過Apr 23, 2025 am 11:48 AM

你們當中有多少人希望AI可以做更多的事情，而不僅僅是回答問題？我知道我有，最近，我對它的變化感到驚訝。 AI聊天機器人不僅要聊天，還關心創建，研究

Camunda為經紀人AI編排編寫了新的分數Apr 23, 2025 am 11:46 AM

隨著智能AI開始融入企業軟件平台和應用程序的各個層面（我們必須強調的是，既有強大的核心工具，也有一些不太可靠的模擬工具），我們需要一套新的基礎設施能力來管理這些智能體。總部位於德國柏林的流程編排公司Camunda認為，它可以幫助智能AI發揮其應有的作用，並與新的數字工作場所中的準確業務目標和規則保持一致。該公司目前提供智能編排功能，旨在幫助組織建模、部署和管理AI智能體。從實際的軟件工程角度來看，這意味著什麼？確定性與非確定性流程的融合該公司表示，關鍵在於允許用戶（通常是數據科學家、軟件

策劃的企業AI體驗是否有價值？Apr 23, 2025 am 11:45 AM

參加Google Cloud Next '25，我渴望看到Google如何區分其AI產品。有關代理空間（此處討論）和客戶體驗套件（此處討論）的最新公告很有希望，強調了商業價值

如何為抹布找到最佳的多語言嵌入模型？Apr 23, 2025 am 11:44 AM

為您的檢索增強發電（RAG）系統選擇最佳的多語言嵌入模型在當今的相互聯繫的世界中，建立有效的多語言AI系統至關重要。強大的多語言嵌入模型對於RE至關重要

麝香：奧斯汀的機器人需要每10,000英里進行干預Apr 23, 2025 am 11:42 AM

特斯拉的Austin Robotaxi發射：仔細觀察Musk的主張埃隆·馬斯克（Elon Musk）最近宣布，特斯拉即將在德克薩斯州奧斯汀推出的Robotaxi發射，最初出於安全原因部署了一支小型10-20輛汽車，並有快速擴張的計劃。 h

AI震驚的樞軸：從工作工具到數字治療師和生活教練Apr 23, 2025 am 11:41 AM

人工智能的應用方式可能出乎意料。最初，我們很多人可能認為它主要用於代勞創意和技術任務，例如編寫代碼和創作內容。然而，哈佛商業評論最近報導的一項調查表明情況並非如此。大多數用戶尋求人工智能的並非是代勞工作，而是支持、組織，甚至是友誼！報告稱，人工智能應用案例的首位是治療和陪伴。這表明其全天候可用性以及提供匿名、誠實建議和反饋的能力非常有價值。另一方面，營銷任務（例如撰寫博客、創建社交媒體帖子或廣告文案）在流行用途列表中的排名要低得多。這是為什麼呢？讓我們看看研究結果及其對我們人類如何繼續將