首頁  >  文章  >  科技週邊  >  電腦視覺幫助解決業務挑戰的五種方法

電腦視覺幫助解決業務挑戰的五種方法

王林
王林轉載
2023-04-08 15:11:061612瀏覽

電腦視覺幫助解決業務挑戰的五種方法

自動駕駛汽車、交通標誌偵測、臉部辨識和自助結帳。將所有這些先進解決方案結合在一起的是電腦視覺。

電腦視覺允許電腦從原始圖像中提取訊息,並為更有效的業務數位化開闢了許多機會。

讓我們來看看電腦視覺如何顛覆各個產業,以及它為幫助業主解決關鍵業務挑戰帶來了哪些獨特的好處。

1、物件偵測

傳統的電腦視覺實作使用對輸入和輸出的深入分析。老式 CV 的典型流程依賴於邊緣檢測等影像處理技術來識別和標記影像中的物件。

電腦科學中深度學習架構的出現導致了從經典的CV 技術(如基於定義的特徵結構)到AI 驅動的影像神經網路分析的巨大轉變,這使得影像中資料的提取和分類幾乎完全自動化。簡單來說,人工智慧將程式設計從畫面中剔除,取而代之的是一種監督較少的方法,在這種方法中,電腦解釋輸入資料並訓練自己識別圖像的內容。

用例

當 AI 進入醫學影像等領域時,電腦會利用卓越的模式識別來識別原始影像中的細微元素,例如 X 光或 MRI 中是否存在微量癌細胞。儘管仍然需要人工解釋和專業知識來檢查機器的推斷,但額外的閃電般的快速分析層有助於補充人類智慧並挽救生命。

隨著自動駕駛汽車在美國和其他許多國家上路,CV 領域將迎來爆發性成長。沒有電腦視覺,自動駕駛汽車就無法存在。由於車輛的車載電腦需要對道路上的潛在障礙物做出快速決策,因此它依賴一套高度最佳化的基於 CV 的技術。

值得注意的是,在醫學、安全、製造等領域,人工智慧驅動系統如何做出決策的透明度至關重要。這就是可解釋的人工智慧發揮作用的地方。該技術允許以人類可以理解的方式解釋系統的發現,並顯示人工智慧演算法做出的特定決策的可靠性。

使用電腦視覺解決以下業務挑戰:

  • 公安(車輛辨識、武器類型辨識、可疑物件定位等)。
  • 銷售自動化和庫存管理(識別貨架上的低庫存或錯放物品、檢測空貨架、執行品質控制、自助結帳的產品識別等)。
  • 消除人為錯誤並防止工作流程中的重複計算。

2、光學字元辨識(OCR)

光學字元辨識 (OCR) 是電腦視覺的獨特實現,可解決各種特定領域的任務。 OCR 旨在從輸入影像中偵測和提取字母、數字和其他字元。

用例

Google Lens 使用 OCR 讓客戶從照片中翻譯外語,並從圖像或 Google 搜尋中提取文字。 OCR 技術也使傳統媒體的數位化變得簡單,從報紙、雜誌和書籍的掃描中提取文字。以前,大學很難將藏傳佛教宗教文本等更晦澀的文件數位化,但現代 OCR 技術使得從非標準語言文件中提取文本變得簡單。

金融機構使用OCR 來改善客戶的生活質量,例如讓客戶從文件中提取他們的國際銀行帳號(IBAN) 或掃描支票圖像,這樣就不必去銀行存款.一些應用程式可以掃描借記卡或信用卡以輸入付款詳情,因此您不必在結帳視窗繁瑣地輸入所有付款資訊。

政府通常使用 OCR 來縮短國家邊境的處理時間或識別和登記文件。現代護照和駕駛執照上的機器可讀區域與政府和商業環境中的 OCR 系統相容。

3、臉部辨識

與物件辨識類似,臉部辨識旨在使用電腦視覺辨識影像中的人類臉部特徵。經典的電腦視覺方法利用「Haar-like features」來計算臉部特徵之間的片段,但現代臉部辨識實現依賴於人工智慧,就像人工智慧用於物體辨識一樣。

用例

臉部辨識技術對於安全應用程式至關重要,因為它有助於防止行動和 Web 應用程式漏洞。無數 Apple iPhone 用戶依靠 Apple 的 Face ID 技術進行生物辨識來解鎖他們的手機。

零售商已經部署了類似的實作來識別已知的商店扒手。即時掃描器從安全攝影機串流中抓取客戶的臉部,並交叉引用已知犯罪分子的資料庫。同樣的技術透過從執法資料庫中提取來幫助尋找失蹤兒童。

臉部辨識還可以幫助您完成以下任務:

  • 安全與存取控制。
  • 身份驗證。
  • 員工追蹤。
  • 醫療保健中的病患篩檢程序。
  • 辨識和追蹤犯罪分子。

下一代臉部辨識軟體甚至可以查看姿勢、手勢和臉部表情,以確定客戶是否可能在賭場作弊。與相同的安全軟體捆綁的步態分析還可以幫助根據他們獨特的腳步和步幅模式來檢測犯罪分子,因為許多犯罪分子會透過戴口罩來躲避臉部辨識。

4、影像復原和場景重建

電腦視覺技術還可以恢復嚴重退化的檔案鏡頭和影像,這可能是一項關鍵的商業技術。與從照片中去除雜訊就足夠的簡單情況不同,電腦視覺可以幫助處理更多損壞的影像,這些影像需要進行重大更改和詳細分析。影像的損壞部分通常使用評估照片廣播內容的生成模型來填充。

用例

除了恢復影像和影片之外,現代神經網路還可以僅透過掃描照片中的物件來重建 3D 場景。考古學家、法醫專家、環境科學家和許多其他專業人士使用場景重建,這是一種改變遊戲規則的電腦視覺範例。 RetrievalFuse 等專案能夠從單一 RGB 影像建立全景 3D 場景。

5、人體姿勢估計

姿勢估計旨在模擬人類視覺能力,特別是識別圖像和影片中的姿勢和手勢。一些最早的高級人體姿勢估計範例出現在大預算電影中,例如彼得傑克森的《魔戒》。隨著計算資源隨著時間的推移而擴大,姿勢估計將在許多不同的產品中發揮作用。

用例

在安全應用程式中,姿勢估計透過分析臉部辨識不可行的步態來幫助識別潛在的麻煩製造者。電腦視覺可以透過分析身體姿勢來幫助即時偵測入店行竊。該系統可以區分正常的購物行為和可疑行為,例如拿走物品並將其藏在口袋或外套中。當偵測到可疑行為時,管理人員會收到警報,並可以在小偷離開商店之前迅速做出反應。

以下是在您的業務中使用姿勢估計的一些方法:

  • 復健措施分析。
  • 開發基於人工智慧的健身教練應用程式。
  • 辨識人體在空間中的位置以改善擴增實境的應用。
  • 遊戲角色動畫。
  • 人在商店和購物中心的活動分析。

儘管姿態估計曾經是一項巨大的運算挑戰,但雲端運算和硬體的創新使更多公司能夠接觸到這項技術。

一切都是可能的

物件偵測、臉部辨識、場景重建、影像復原和人體姿態估計只是電腦視覺技術的幾種不同實現方式。由於下一代 AI 的強大功能,無論您的企業從事何種行業,電腦視覺都可以提供獨特的優勢,使您的公司在競爭中處於領先地位。從重建犯罪現場照片的全深度 3D 模型到識別工廠線上量產產品的缺陷,電腦視覺不斷改變每個人的業務方式。

以上是電腦視覺幫助解決業務挑戰的五種方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除