Đó cũng là quan trọng để lựa chọn phương pháp xác nhận (loại chính xác) cho loại lựa chọn. Phương pháp này được gọi là cross-xác nhận trong đó các dữ liệu đầu vào được chia thành huấn luyện và thử nghiệm bộ và thử nghiệm thiết lập (không nhìn thấy bởi phương pháp hoặc loại) xác nhận chống lại việc đào tạo thiết lập để kiểm tra nếu loại có thể tái sản xuất đầu ra được biết đến. Một số loại hình của cross-xác nhận được sử dụng trong văn học. Một trong những phương pháp đơn giản nhất là đường 2-fold-xác nhận trong đó các dữ liệu ngẫu nhiên được chia thành đào tạo và kiểm tra bộ. Một phần mở rộng của đường 2-fold, xác nhận là đường K-gấp-xác nhận trong đó các dữ liệu ngẫu nhiên được phân chia thành tập con K. Đối với đào tạo K À 1 tập con được lựa chọn và tập con còn lại được sử dụng để thử nghiệm. Quá trình này được lặp đi lặp lại cho đến khi tất cả các tập con được sử dụng để thử nghiệm. Một phiên bản của K-gấp cross-xác nhận là người để lại trongCross-xác nhận (LOOCV) trong đó K là tương đương với số lượng mẫu tức là mỗi mẫu được sử dụng để thử nghiệm và phần còn lại của các mẫu được sử dụng để huấn luyện. Quá trình này được thực hiện cho đến khi tất cả các mẫu được thử nghiệm. Cho mô hình lựa chọn (lựa chọn tính năng hoặc loại) tập hợp đào tạo có thể được tiếp tục phân chia thành đào tạo và xác nhận bộ. Dự đoán của các thiết lập xác nhận là được sử dụng đểcủng cố việc lựa chọn mô hình. Năm [34] các tác giả giải quyết vấn đề của hơn phù hợp tìm thấy khi so sánh các lựa chọn tính năng được thực hiện. Các tác giả cho các phương pháp xác nhận đường có thể góp phần trên ước tính hiệu suất mô hình. Tác giả kiểm tra phương pháp SFS và SFFS trên datasets khác nhau với k-NN [18,6] loại như wrapper. Họ sử dụng các 2-fold và LOOCV xác nhận qua phương pháp để so sánh kết quả của hai tính năng lựa chọn thuật toán.
đang được dịch, vui lòng đợi..
