Chúng tôi trình bày số liệu thống kê khác nhau của cơ sở dữ liệu khuôn mặt hiện tại của chúng tôi trong Bảng 1, chia theo nguồn hình ảnh. Chúng tôi muốn thu hút sự chú ý đến ba quan sát về dữ liệu của chúng tôi. Thứ nhất, từ các số liệu thống kê của các hình ảnh được tải về một cách ngẫu nhiên, nó xuất hiện rằng một phần đáng kể trong số họ có khuôn mặt (25,7%), và trung bình, mỗi hình ảnh có chứa 0,5 khuôn mặt. Thứ hai, bộ sưu tập của chúng ta về mặt phù hợp là bộ sưu tập lớn nhất như vậy mà chúng tôi được biết. Nó thực sự là một tập dữ liệu "thế giới thực", với ánh sáng và môi trường hoàn toàn không kiểm soát được, chụp bằng máy ảnh không rõ và trong những điều kiện chụp không rõ, với một loạt các nghị quyết hình ảnh. Ở khía cạnh này, cơ sở dữ liệu của chúng tôi cũng tương tự như các bộ dữ liệu LFW [15], mặc dù chúng ta là lớn hơn bởi 2 đơn đặt hàng của các cường độ và không có mục tiêu cụ thể cho nhận dạng khuôn mặt. Ngược lại, bộ dữ liệu khuôn mặt hiện có như Yale mặt A & B [16], CMU PIE [17], và Feret [6] là một trong hai nhỏ hơn nhiều kích thước và / hoặc thực hiện trong các thiết lập kiểm soát chặt chẽ. Thậm chí mở rộng hơn phiên bản 2.0 FRGC bộ dữ liệu [18] có một số lượng hạn chế của các đối tượng, địa điểm thu nhận hình ảnh, và tất cả các hình ảnh được chụp với các loại máy ảnh tương tự. Cuối cùng, chúng tôi đã có nhãn một số lượng đáng kể của những hình ảnh này cho 10 thuộc tính của chúng tôi, được liệt kê trong Bảng 2. Tổng cộng, chúng tôi có hơn 17.000 nhãn thuộc tính
đang được dịch, vui lòng đợi..
