Đầu tiên, chúng ta hãy làm rõ làm thế nào để đánh giá hiệu suất của một tập hợp các tính năng đầu vào. Trong chương này, chúng tôi
sử dụng một hình thức rất bảo thủ của việc đánh giá tính năng thiết lập để tránh overfitting. Điều này là quan trọng. Ngay cả khi bộ tính năng được đánh giá bởi testset cross-validation hoặc để lại-one-out chéo
xác nhận, tìm kiếm toàn diện có thể tính năng bộ là khả năng tìm thấy một cách sai lạc cũng ghi tính năng thiết lập bởi cơ hội. Để ngăn chặn điều này, chúng tôi sử dụng các thủ tục qua xác nhận phân tầng ở Hình 7-1, trong đó lựa chọn từ bộ ngày càng lớn các tính năng (và do đó từ lớp mô hình ngày càng lớn). Điểm số cho tính năng thiết lập tốt nhất của một kích thước nhất định được tính bằng một cross-validation độc lập với tỷ số cho kích thước tốt nhất của tính năng thiết lập.
đang được dịch, vui lòng đợi..