Hình 2.15. Việc sáp nhập nhiều phát hiện.7 hiệu suất đánh giáKết quả của phát hiện khuôn mặt từ một hình ảnh bị ảnh hưởng bởi hai thành phần cơ bản: classifier mặt/nonface và postprocessing (sáp nhập). Để hiểu làm thế nào hệ thống hoạt động, đó khuyến cáo rằng hai thành phần là evaluateed một cách riêng biệt [1], với hai loại dữ liệu thử nghiệm. Chính bao gồm khuôn mặt biểu tượng của một kích thước fixed (như được sử dụng cho đào tạo). Quá trình này nhằm mục đích để đánh giá hiệu suất của classifier mặt/nonface (tiền xử lý bao gồm), mà không bị ảnh hưởng bởi việc sáp nhập. Loại thứ hai của dữ liệu thử nghiệm bao gồm hình ảnh bình thường. Trong trường hợp này, kết quả phát hiện khuôn mặt bị ảnh hưởng bởi classifier được đào tạo và sáp nhập; hiệu suất tổng thể của hệ thống được đánh giá.Hình 2.16. Kết quả của phát hiện khuôn mặt phía trước.7.1 các biện pháp hiệu suấtHiệu suất phát hiện khuôn mặt chủ yếu được đo bằng hai mức giá: mức độ phát hiện chính xác (mà là 1 trừ mức phát hiện Hoa hậu) và mức báo động giả. Hiệu suất có thể được quan sát thấy do âm mưu trên người nhận hoạt động đường cong ROC đặc trưng. Con số 2,18 cho thấy một đường cong ROC điển hình cho phát hiện khuôn mặt. Một hệ thống phát hiện khuôn mặt lý tưởng nên có một tỷ lệ phát hiện 100%, với một tỷ lệ báo động giả 0, mặc dù không ai trong số các hệ thống hiện tại có thể đạt điều này nói chung. Trong các hệ thống thực tế, tăng tỷ lệ phát hiện được thường đi kèm với sự gia tăng mức báo động giả. Trong trường hợp nơi một chức năng confidence được sử dụng để phân biệt giữa mặt và nonface subwindows, với giá trị sản lượng cao chỉ ra phát hiện khuôn mặt và giá trị thấp nonface, một sự đánh đổi giữa hai mức giá có thể được thực hiện bằng cách điều chỉnh ngưỡng decisional. Trong trường hợp của AdaBoost học phương pháp, ngưỡng cho Eq.(1) học được từ đào tạo khuôn mặt biểu tượng và biểu tượng bootstrapped nonface, do đó, một tỷ lệ specified (thường mức báo động giả) là dưới sự kiểm soát cho các thiết lập đào tạo. Hãy nhớ rằng các con số hiệu suất của một hệ thống là luôn luôn đối với các bộ dữ liệu sử dụng (người đọc được gọi chương 13 cho cơ sở dữ liệu phát hiện khuôn mặt); hai thuật toán hoặc hệ thống không thể được so sánh trực tiếp trừ khi các bộ dữ liệu tương tự được sử dụng.Hình 2,17. Kết quả của phát hiện khuôn mặt multiview.Hình 2,18. Đường cong ROC điển hình cho phát hiện khuôn mặt.7.2 so sánh các thuật toán dựa trên thúc đẩyNhư AdaBoost dựa trên phương pháp (với địa phương Haar bề mặt tính năng) đã cho đến nay cung cấp bộ mặt tốt nhất phát hiện các giải pháp về tỷ giá thống kê và tốc độ, sau đây cung cấp một đánh giá so sánh về thuật toán thúc đẩy khác nhau (THOA: Adaboost rời rạc; RAB: thực sự Adaboost; và GAB: nhẹ nhàng Adaboost), khác nhau, đào tạo bộ chuẩn bị, và khác nhau yếu classifiers [22]. Kết quả cung cấp tài liệu tham khảo thực nghiệm cho các kỹ sư phát hiện khuôn mặt. Thúc đẩy các thuật toánBa 20 tầng thác classifiers được đào tạo với THOA, RAB và dông dài bằng cách sử dụng bộ tính năng giống như Haar Viola và Jones [46, 47] và stumps là yếu classifiers. Đây là báo cáo rằng dông dài tốt hơn các hai thúc đẩy các thuật toán khác [22]; Ví dụ, ở mức báo động giả tuyệt đối của 10 ngày CMU kiểm tra thiết lập, RAB phát hiện chỉ 75.4% và THOA chỉ 79.5% của tất cả các khuôn mặt phía trước, và đạt được GAB 82.7% tại một yếu tố rescale 1,1. Ngoài ra, một yếu tố nhỏ hơn rescaling 1,1 để quét hình ảnh là beneficial cho một tỷ lệ phát hiện cao. Ví dụ, tại 10 báo động sai ngày thử nghiệm CMU thiết lập, GAB cải thiện từ một tỷ lệ phát hiện 68.8% của 82.7% khi các yếu tố rescaling được giảm từ 1.2 để 1.1.Yếu Classifiers: Cây so với StumpsStumps là loại cây đơn giản nhất của yếu classifiers (WCs) có thể được sử dụng trong AdaBoost rời rạc. Một gốc, như trong Eq.(6), là một cây duy nhất-nút mà không cho phép học phụ thuộc giữa các tính năng. Nói chung, n tách nút là cần thiết để mô hình phụ thuộc giữa n − 1 biến. 2.1 bảng so sánh giỏ hàng cây yếu classifiers số khác nhau của các nút trong điều khoản của hiệu quả của từ chối nonface subwindows. Nó được quan sát thấy rằng RAB là hiệu quả nhất.2.1 bảng. Số trung bình tính năng đánh giá cho nonface subwindow của kích thước 20 × 20 (Reproduced từ Lienhart et al. [22]).Cơ bản so với mở rộng các tính năng giống như HaarHai khuôn mặt phát hiện hệ thống đã được huấn luyện: một với các thiết lập tính năng cơ bản giống như Haar Viola và Jones [46, 47], và một với các tính năng giống như haar mở rộng nằm trong đó xoay Phiên bản tính năng Haar cơ bản được bổ sung. Trung bình, mức báo động giả là khoảng 10% thấp hơn cho các tính năng giống như haar mở rộng thiết lập mức giá so sánh hit. Cùng một lúc sự phức tạp tính toán được so sánh. Điều này cho thấy rằng trong khi thiết lập các tính năng giống như Haar lớn hơn làm cho nó phức tạp hơn trong thời gian và bộ nhớ trong thúc đẩy học tập giai đoạn, đạt được thu được trong giai đoạn phát hiện.Subwindow kích thướcKích thước khác nhau subwindow, khác nhau, từ 16 × 16 lên đến 32 × 32, đã được sử dụng trên phát hiện khuôn mặt. Thí nghiệm [22] Hiển thị kích thước subwindow 20 × 20 đạt được tỷ lệ phát hiện cao nhất tại một số lượng tuyệt đối của báo động sai từ 5 đến 100 trên các thiết lập thử nghiệm CMU của phía trước khuôn mặt. Subwindow kích thước 24 x 24 làm việc tốt hơn cho báo động sai ít hơn five.
đang được dịch, vui lòng đợi..