#早期的方法主要著重於與電腦視覺專家合作,提取手工特徵,並使用傳統的機器學習演算法訓練有效的分類器進行檢測。然而,這些方法的局限性在於需要專家製作有效的特徵,並且每個組件都需要單獨優化,導致整個檢測管道不夠優化。為了解決這個問題,人們提出了更複雜的特徵,如HOG、SIFT、SURF和ACF。為了增強檢測的穩健性,也開發了針對不同視圖或姿勢訓練的多個偵測器的組合。然而,這些模型的訓練和測試時間較長,對偵測性能的提升有限。
近年來,臉部辨識方面的研究取得了重大進展,尤其是深度卷積神經網路(CNN)的應用。深度學習方法在電腦視覺任務中取得了顯著的成功,與傳統的方法相比具有許多優勢。深度學習方法避免了手工製作的設計管道,這使得模型更加靈活和適應不同的資料集。此外,深度學習方法在許多基準評估中都表現出色,例如ImageNet大規模視覺辨識挑戰(ILSVRC)。這些進展使得臉部辨識在各個領域得到了廣泛應用,從安全監控到人臉解鎖等。
最近,研究人員在通用物件偵測領域取得了令人欣喜的進展,其中應用了Faster R-CNN,這是一種先進的物件偵測器。透過結合CNN cascade、region proposal network(RPN)以及Faster R-CNN的聯合訓練,研究人員實現了端到端的優化,取得了令人鼓舞的結果。 在人臉偵測方面,Faster R-CNN演算法與hard negative mining和ResNet結合,大大提升了其在FDDB等人臉偵測基準上的效能。這種結合的方法使得人臉偵測演算法更加準確可靠。 總之,Faster R-CNN以及與其相關的聯合訓練和結合演算法,為物件偵測和人臉偵測領域帶來了顯著的進步,為深度學習技術的發展開闢了新的方向。
AFW資料集:AFW資料集是使用Flickr影像建構的。它包括205張圖像和473張標記的臉。對於每張臉,圖像註釋包括一個矩形邊界框、6個地標和姿勢角度。
PASCAL FACE資料集:此資料集用於臉部辨識和人臉辨識;它是PASCAL VOC的一個子集,在851張具有較大臉部外觀和姿勢變化的影像中包含1335個標記臉部。
MIT CBCL人臉資料庫:MIT-CBCL人臉辨識資料庫包含訓練集(2429張人臉,4548張非人臉)和估計集(472張人臉,23573張非人臉)。
FDDB資料集:此資料集包含5,171張人臉,在2845張影像中註釋,例如遮擋、困難姿勢和低影像解析度。這些圖像用於訓練大的外觀變化、嚴重的遮擋和嚴重的模糊退化,這些在無約束的現實生活場景中檢測人臉時很普遍。
CMU PIE資料庫:CMU Multi-PIE Face資料庫包含68個人的41368張影像,每個人的13種不同的姿勢、43種不同的光照條件和4種不同的表情。
SCface資料集:SCface是一個人臉靜態影像資料庫。這些影像是在不受控制的室內環境中使用五個不同品質的視訊監控攝影機拍攝的。此資料集包含130名受試者的4160張靜態影像(可見光和紅外光譜)。
WIDER FACE資料集:人臉偵測基準資料集包括32203張影像和393703張標記的人臉,這些人臉在尺度、姿勢和遮擋方面具有高度可變性,這使得人臉偵測極具挑戰性。此外,WIDER FACE資料集是根據61個事件類別組織的。
以上是人臉辨識發展歷程及常用資料集的詳細內容。更多資訊請關注PHP中文網其他相關文章!