請我喝杯咖啡☕
*我的文章解釋了影像分類(辨識)、物件定位、物件偵測和影像分割。
電腦視覺是使電腦能夠理解和分析圖像、視訊等視覺事物的技術。
(1) 關鍵點偵測(地標偵測):
- 可以定位影像中物件或興趣區域的特徵點:
*備註:
- 影像可以是影片中的一格。
-
使用物件局部化或影像分類和物件局部化(物件偵測)。
- 可以用來辨識人臉、表情、人的姿勢、衣服等
(2) 影像匹配:
- 透過比較特徵點,可以判斷多幅影像中的物體和興趣區域相同或相似。
- 是關鍵點偵測的先進技術。
- 可用來搭配人臉、指紋等
(3) 物件追蹤:
- 可以使用邊界框追蹤影片中的物件和興趣區域(按順序擷取的多個影格)。 *影片可以是連續拍攝的多張影像。
- 是物件偵測的先進技術。
- 用於監控、自動駕駛汽車、虛擬實境、製造、無人商店等
(4) 光流:
- 可以偵測和視覺化影片中物件和感興趣區域的運動(速度)(按順序擷取的多個影格):
*備註:
- 速度是運動物體的速度和方向。
- 影片可以是連續拍攝的多張影像。
- 是物件追蹤的分支技術。
- 用於監控、交通監控、運動分析等
(5) 立體匹配:
- 可以透過計算視差從兩個或多個 2D 立體影像創建 3D 場景:
*備註:
- 2D 立體影像是從不同位置拍攝的相似影像。
- 視差是立體影像中兩個或多個對應像素之間的距離。
- 用於機器人技術。
(6) 視訊預測可以根據過去的視訊幀預測未來的視訊幀。
(7) 圖片說明:
- 可以產生影像的文字描述。
- 是生成式人工智慧,它是電腦視覺和自然語言處理(NLP)的結合。
以上是什麼是電腦視覺? (2)的詳細內容。更多資訊請關注PHP中文網其他相關文章!