微軟AR/VR專利提出利用角落、線條特徵進行多相機影像對齊-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

微軟AR/VR專利提出利用角落、線條特徵進行多相機影像對齊

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Sep 26, 2023 pm 10:01 PM

微軟ar/vr多攝像頭影像對齊

MR系統可以使用多個鏡頭，但在呈現影像時需要對齊影像。然而，影像對齊是一個具有挑戰性的問題。因此，在名為「利用角點和線條特徵進行影像對齊的方法」的專利申請中，微軟提出了一種解決方案

當然，業界早已存在利用角落特徵來進行影像對齊的方法。然而，在圖像中識別角並根據識別的角對齊圖像是一個耗時且計算密集型的操作。

微軟提出的是一種更有效的改進技術，可以實現更好的特徵匹配。發明主要介紹了使用角特徵和線特徵來執行視覺對齊的混合方法，而這種解決方案導致對齊過程中所需的約束更少，從而改進計算效率和特徵匹配。

微軟AR/VR專利提出利用角落、線條特徵進行多相機影像對齊

圖11示出一個範例環境1100，其中使用者正在使用頭顯相機1105和外部相機1110。如前所述，需要對齊從這兩個相機產生的影像內容。但環境1100可能是一個弱光環境，也可能是一個在熱梯度或對比方面具有低對比的環境。

例如，在深夜物體冷卻後，環境的溫度梯度可能通常是均勻的。在這種情況下，環境的溫度曲線或梯度可能低於特定的等溫閾值1115。在這種情況下，用於對齊內容的傳統技術可能會失效。微軟所描述的實施例為這類場景提供了解決方案。

微軟AR/VR專利提出利用角落、線條特徵進行多相機影像對齊

圖12示出可用於對齊影像的範例角檢測1200過程。圖12示出了由圖11的頭顯相機1105產生的第一影像1205，以及由外部相機1110產生的第二影像1210。

進行角檢測操作以識別影像中存在的「角」。舉例來說，可以透過實施例來辨識第一張影像中的角特徵。換句話說，可以在圖像中識別一組像素，確定這些像素集合對應於一個角

「角」是指具有非均勻強度的一個或多個像素，其具有相對於所述一個或多個像素水平定位的第一附近像素塊和相對於所述一個或多個像素垂直定位的第二個附近像素塊。換句話說，角定義為一組一個或多個與相對於像素集在X和Y方向相鄰角形成對比的像素。

辨識第一影像1205中的角特徵1215，也辨識第二影像1210中的角特徵。因此，成功辨識出角特徵1225。需要注意的是，角特徵1225與角特徵1215是相對應的

為了對齊影像內容，此實施例的任務是辨識1230個角的閾值。角的閾值數量必須相互對應。換句話說，必須識別在第一張影像1205中識別的多個角，並且必須與在第二張影像1210中識別的多個角相對應

如果滿足這些閾值，則實施例可以執行影像對齊操作以產生疊加影像1235，所述影像1235是其中對齊來自第二影像1210的內容，然後與來自第一個影像1205的相應內容覆蓋的影像。

進行角點偵測和對齊是一項計算密集型操作，如果偵測到的角點與影像之間的匹配不夠好，整個過程可能會失敗。例如，僅使用角點的方法，需要從一張影像中辨識出至少5個角點，然後與第二張影像中的對應角點進行比對。在低對比條件下，即使辨識出5個對應的角點也可能是一項挑戰

在識別足夠數量的角落之後，實施例然後使用運動模型識別3D旋轉，以便透過執行各種旋轉和轉換以使5個角落彼此對齊來將圖像內容從第一或第二圖像適配到另一圖像。執行這樣的對齊是計算密集型。

因此，我們需要減少只使用角方法時所存在的約束，而圖13則描述了這樣一種技術。

微軟AR/VR專利提出利用角落、線條特徵進行多相機影像對齊

在圖13中展示了角點和線點檢測1300的過程，這個過程包括了圖12中的角點檢測1200操作和線點檢測操作的組合。需要注意的是，角點偵測操作和線偵測操作是同時進行的

通常情況下，辨識影像中的對應的「線」比辨識角點更簡單，因此線偵測過程通常比角點偵測過程更快。由於這兩個過程可以並行運行，並且線檢測過程更快，因此添加線檢測過程不會對整體對齊過程的速度產生負面影響

透過合併使用線條來對齊影像，可以在對齊過程中使用更少的角，從而導致放鬆的約束和通常更容易對齊。特別是在低溫條件下，要求使用較少的角是非常有益的，因為很難找到和匹配角

「線」被定義為一組一個或多個像素，它們具有相對於一組或多個像素集的水平定位的第一附近像素塊的均勻強度，並且具有相對於一組或多個像素集的垂直定位的第二個附近像素塊的不均勻強度。或者，它們具有相對於一組或多個像素集的水平定位的第一個附近像素塊的不均勻強度，並且具有相對於一組或多個像素集的垂直定位的第二附近像素塊的均勻強度

在圖13中，展示了代表圖12中影像的第一個影像1305和第二個影像1310。圖13也展示了一種實作方法，可以偵測第一影像1305中的角特徵1315

在對第一影像1305進行角特徵的例檢測時，同時也會進行線特徵的檢測，就像線特徵1320和線特徵1325所示的那樣。一般來說，相較於可以偵測到的角的數量，我們能夠偵測到更多的線

對第二個影像1310執行角和線操作。為了說明，所述實施例識別角特徵1330。與角檢測操作並行，實施例同時檢測第二影像1310中的線，如線特徵1335和線特徵1340。

請注意，角特徵1330與角特徵1315相對應；線特徵1335與線特徵1320相對應。線特徵1340與線特徵1325相對應。實施例可以識別這些對應關係，然後產生或使用適合將這些特徵點彼此對齊的運動模型

根據發明原理，我們定義了第一個閾值為1345。第一個閾值是指必須在兩個影像中識別的相應角特徵的數量，以便對它們進行對齊。同時，我們也定義了第二個閾值為1350。第二個閾值是指必須在兩個影像中識別的相應行特徵的數量，以使它們對齊

第一閾值1345和第二閾值1350的滿足使實施例能夠對齊來自第一個影像1305和第二個影像1310的內容以產生疊加影像1355。值得注意的是，閾值通常是指必須識別的角和線的總數。

在了解執行線特徵檢測的便利性和速度之後，你可能會質疑為什麼實施例不僅依賴線檢測操作而避免執行角檢測操作。原因是因為在影像中偵測線條會導致孔徑問題。

微軟AR/VR專利提出利用角落、線條特徵進行多相機影像對齊

以下是重寫後的內容：根據圖14，我們可以看到孔徑問題，即孔徑模糊度為1400。在圖14中，線段1405是整條線的一部分。孔徑模糊度1400指的是一條線的多個不同部分可能（但不正確地）與已識別的線段1405相關

例如，儘管線段1410實際上位於錯誤的位置或位置，但線段1410可能是與線段1405匹配的像素區塊。類似地，線段1415或線段1420可能包含可能映射或匹配線段1405中的像素的像素區塊。這樣的場景在對齊過程中引入了模糊性。

因此，依靠線檢測過程本身是不夠的技術。換句話說，依靠線和角的組合可以使實施例使用寬鬆的約束，從而提高計算效率。

微軟AR/VR專利提出利用角落、線條特徵進行多相機影像對齊

範例流程流程1500在圖15中展示。最初，會取得一組影像，如頭戴式相機影像1505和外部相機影像1510。這些圖像可能是熱圖像。影像中的溫度梯度或對比度1520可能低於特定的對比度閾值1525。因此，在圖像中識別足夠數量的角可能相當困難。在這種情況下，可以利用混合方法檢測角和線的組合以實現對齊

將頭戴式相機影像1505和外部相機影像1510傳送到角度偵測器1530和線條偵測器1535中，這兩個偵測器同時運行，彼此之間沒有依賴關係

請注意，線偵測器1535在偵測線條時通常比角偵測器1530在偵測角度時更快。換句話說，線偵測器1535的延遲時間較角偵測器1530的延遲時間要短

角點偵測器1530分析所述兩個影像並辨識所述影像中的角點1545。類似地，線偵測器1535分析這兩個影像並識別影像中的線1550。然後，實施例透過在兩個影像內識別相應的角和線來執行對齊1555。

為了執行對齊，需要確定線和角的閾值數量。匹配閾值比識別角的數量或線的閾值更相關。然後，實施例將所辨識的角和線擬合到諸如運動模型的3D模型1560中。然後對模型1560進行模型擬合1565操作，以旋轉、平移和/或變換一幅影像，從而匹配或對齊另一幅影像中的對應角和線。

換句話說，當執行重投影操作時，實施例使用已識別的角落和線來對齊來自一個影像的內容與來自另一個影像的內容

相關專利：Microsoft Patent | Image alignment using corner and line features

名為「Image alignment using corner and line features」的微軟專利申請最初在2022年2月提交，並在日前由美國專利商標局公佈。

以上是微軟AR/VR專利提出利用角落、線條特徵進行多相機影像對齊的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：搜狐。如有侵權，請聯絡admin@php.cn刪除

AI技能差距正在減慢供應鏈Apr 26, 2025 am 11:13 AM

經常使用“ AI-Ready勞動力”一詞，但是在供應鏈行業中確實意味著什麼？供應鏈管理協會（ASCM）首席執行官安倍·埃什肯納齊（Abe Eshkenazi）表示，它表示能夠評論家的專業人員

一家公司如何悄悄地努力改變AIApr 26, 2025 am 11:12 AM

分散的AI革命正在悄悄地獲得動力。本週五在德克薩斯州奧斯汀，Bittensor最終遊戲峰會標誌著一個關鍵時刻，將分散的AI（DEAI）從理論轉變為實際應用。與閃閃發光的廣告不同

NVIDIA釋放NEMO微服務以簡化AI代理開發Apr 26, 2025 am 11:11 AM

企業AI面臨數據集成挑戰企業AI的應用面臨一項重大挑戰：構建能夠通過持續學習業務數據來保持準確性和實用性的系統。 NeMo微服務通過創建Nvidia所描述的“數據飛輪”來解決這個問題，允許AI系統通過持續接觸企業信息和用戶互動來保持相關性。這個新推出的工具包包含五個關鍵微服務： NeMo Customizer 處理大型語言模型的微調，具有更高的訓練吞吐量。 NeMo Evaluator 提供針對自定義基準的AI模型簡化評估。 NeMo Guardrails 實施安全控制，以保持合規性和適當的

AI為藝術與設計的未來描繪了一幅新圖片Apr 26, 2025 am 11:10 AM

AI：藝術與設計的未來畫卷人工智能(AI)正以前所未有的方式改變藝術與設計領域，其影響已不僅限於業餘愛好者，更深刻地波及專業人士。 AI生成的藝術作品和設計方案正在迅速取代傳統的素材圖片和許多交易性設計活動中的設計師，例如廣告、社交媒體圖片生成和網頁設計。然而，專業藝術家和設計師也發現AI的實用價值。他們將AI作為輔助工具，探索新的美學可能性，融合不同的風格，創造新穎的視覺效果。 AI幫助藝術家和設計師自動化重複性任務，提出不同的設計元素並提供創意輸入。 AI支持風格遷移，即將一種圖像的風格應用

Zoom如何徹底改變與Agent AI的合作：從會議到里程碑Apr 26, 2025 am 11:09 AM

Zoom最初以其視頻會議平台而聞名，它通過創新使用Agentic AI來引領工作場所革命。最近與Zoom的CTO XD黃的對話揭示了該公司雄心勃勃的願景。定義代理AI 黃d

對大學的存在威脅Apr 26, 2025 am 11:08 AM

AI會徹底改變教育嗎？這個問題是促使教育者和利益相關者的認真反思。 AI融入教育既提出了機遇和挑戰。正如科技Edvocate的馬修·林奇（Matthew Lynch）所指出的那樣

原型：美國科學家正在國外尋找工作Apr 26, 2025 am 11:07 AM

美國科學研究和技術發展或將面臨挑戰，這或許是由於預算削減導致的。據《自然》雜誌報導，2025年1月至3月期間，美國科學家申請海外工作的數量比2024年同期增加了32%。此前一項民意調查顯示，75%的受訪研究人員正在考慮前往歐洲和加拿大尋找工作。過去幾個月，數百項NIH和NSF的撥款被終止，NIH今年的新撥款減少了約23億美元，下降幅度接近三分之一。洩露的預算提案顯示，特朗普政府正在考慮大幅削減科學機構的預算，削減幅度可能高達50%。基礎研究領域的動盪也影響了美國的一大優勢：吸引海外人才。 35