Vả. 2.15. . Cắt nhiều phát hiện
7 Đánh giá thực hiện
Kết quả phát hiện khuôn mặt từ một hình ảnh bị ảnh hưởng bởi hai thành phần cơ bản: mặt / nonface classi fi er và xử lý sau (sáp nhập). Để hiểu làm thế nào hệ thống hoạt động, đó là khuyến cáo rằng hai thành phần được evaluateed riêng [1], với hai loại dữ liệu thử nghiệm. Việc đầu tiên fi bao gồm các biểu tượng khuôn mặt của một kích thước cố định fi (như được sử dụng để đào tạo). Quá trình này nhằm mục đích đánh giá hiệu quả của các khuôn mặt / nonface classi er fi (tiền xử lý bao gồm), mà không bị ảnh hưởng bởi việc sáp nhập. Loại thứ hai của dữ liệu thử nghiệm bao gồm các hình ảnh bình thường. Trong trường hợp này, kết quả phát hiện khuôn mặt bị ảnh hưởng bởi cả hai huấn luyện er fi classi và sáp nhập; hiệu suất của toàn hệ thống được đánh giá. Fig. 2.16. Kết quả phát hiện khuôn mặt phía trước. Các biện pháp 7.1 Hiệu suất Hiệu suất phát hiện khuôn mặt chủ yếu được đo bằng hai mức: tỷ lệ chính xác phát hiện (đó là 1 trừ đi tỷ lệ phát hiện lỡ) và tỷ lệ báo động sai. Hiệu suất có thể được quan sát bằng cách vẽ trên máy thu hoạt động đường cong ROC đặc trưng. Hình 2.18 cho thấy một đường cong ROC điển hình cho nhận diện khuôn mặt. Một hệ thống phát hiện khuôn mặt lý tưởng phải có một tỷ lệ phát hiện 100%, với một tỷ lệ báo động sai lầm về 0, mặc dù không ai trong số các hệ thống hiện tại có thể đạt được điều này nói chung. Trong hệ thống thực tế, tăng tỷ lệ phát hiện là thường đi kèm với sự gia tăng tỷ lệ báo động sai. Trong trường hợp một con chức năng fi dence được sử dụng để phân biệt giữa mặt và nonface subwindows, với giá trị sản lượng cao cho thấy sự phát hiện của khuôn mặt và nonface giá trị thấp, một thương mại-off giữa hai tỷ giá có thể được thực hiện bằng cách điều chỉnh các ngưỡng decisional. Trong trường hợp của các phương pháp học tập AdaBoost, ngưỡng cho Eq. (1) là học được từ các biểu tượng mặt đào tạo và biểu tượng nonface bootstrapped, do đó, một tỷ lệ fi ed đặc hiệu (thường là tỷ lệ báo động giả) là dưới sự kiểm soát đối với các tập huấn luyện. Hãy nhớ rằng con số thực hiện một hệ thống luôn luôn liên quan đến các bộ dữ liệu được sử dụng (người đọc được gọi Chương 13 cho cơ sở dữ liệu nhận diện khuôn mặt) với; Hai thuật toán hoặc hệ thống không thể so sánh trực tiếp trừ khi các bộ dữ liệu tương tự được sử dụng. Hình. 2.17. Kết quả phát hiện MultiView mặt. Fig. 2.18. Đường cong ROC điển hình cho nhận diện khuôn mặt. 7.2 So sánh Boosting-Dựa Algorithms Là phương pháp dựa trên AdaBoost (với tính năng wavelet Haar địa phương) đến nay đã cung cấp các giải pháp phát hiện mặt tốt nhất về tỷ lệ thống kê và tốc độ, sau đây cung cấp một so sánh đánh giá về các thuật toán khác nhau thúc đẩy (DAB: AdaBoost rời rạc; RAB: thực AdaBoost và GAB: nhẹ nhàng AdaBoost), đào tạo khác nhau đặt ra chuẩn bị, và khác nhau yếu ers fi classi [22]. Các kết quả cung cấp tài liệu tham khảo kinh nghiệm đối với các kỹ sư phát hiện khuôn mặt. Boosting Algorithms Ba 20 tầng thác classi ers fi đã được đào tạo với DAB, RAB, và GAB sử dụng các tính năng thiết lập Haar-like của Viola và Jones [46, 47] và gốc cây là những người đối fi classi yếu. Đây là báo cáo rằng GAB vượt trội so với hai thuật toán tăng khác [22]; Ví dụ, với một tốc độ báo động giả tuyệt đối của 10 về kiểm tra thiết lập CMU, RAB phát hiện chỉ 75,4% và DAB chỉ 79,5% của tất cả các khuôn mặt phía trước, và GAB đạt 82,7% ở một yếu tố rescale 1,1. Ngoài ra, một yếu tố rescaling nhỏ hơn 1,1 cho hình ảnh quét là lợi ích tài fi cho một tỷ lệ phát hiện cao. Ví dụ, tại 10 cảnh báo sai về các bài kiểm tra tập CMU, GAB cải thiện từ một tỷ lệ phát hiện 68,8% cho rằng các 82,7% khi các yếu tố rescaling đã giảm 1,2-1,1. Yếu phân loại ers fi: Tree so Gốc Gốc là loại cây đơn giản nhất các yếu ers classi fi (WC) có thể được sử dụng trong AdaBoost rời rạc. Một gốc cây, như trong phương trình. (6), là một cây duy nhất-nút đó không cho phép học phụ thuộc giữa các tính năng. Nói chung, n nút chia là cần thiết để mô hình phụ thuộc giữa các n - 1 biến. Bảng 2.1 so sánh cây Toán yếu ers fi classi của số lượng các nút khác nhau về hiệu quả của việc từ chối subwindows nonface. Nó được quan sát thấy rằng RAB là hiệu quả nhất. Bảng 2.1. (. Sao chép từ Lienhart et al [22]) số trung bình của các tính năng được đánh giá mỗi nonface subwindow kích thước 20 × 20. Mở rộng tính năng cơ bản so với Haar-like Hai hệ thống phát hiện khuôn mặt đã được đào tạo: một với các tính năng Haar-like thiết lập cơ bản của Viola và Jones [46, 47], và một với các tính năng mở rộng như haar-thiết lập trong đó xoay các phiên bản của các tính năng cơ bản Haar được thêm vào. Trung bình tỷ lệ báo động sai là thấp hơn khoảng 10% đối với các tính năng mở rộng như haar-đặt ở thể so sánh tỷ lệ hit. Đồng thời các tính toán phức tạp có thể so sánh. Điều này cho thấy rằng trong khi các tính năng thiết lập Haar-like lớn hơn làm cho nó phức tạp hơn cả về thời gian và bộ nhớ trong giai đoạn đẩy mạnh học tập, tăng thu được trong giai đoạn phát hiện. Subwindow Kích cỡ subwindow khác nhau, dao động từ 16 × 16 đến 32 × 32 , đã được sử dụng vào việc phát hiện khuôn mặt. Các thí nghiệm [22] cho thấy rằng một kích thước subwindow 20 × 20 đạt tỷ lệ phát hiện cao nhất với số lượng tuyệt đối của các báo động sai từ 5 đến 100 trên các kiểm tra bộ khuôn mặt trán CMU. Một kích thước subwindow 24 × 24 làm việc tốt hơn cho các báo động sai ít hơn fi ve.
đang được dịch, vui lòng đợi..
