Trước tiên, hãy để chúng tôi làm rõ làm thế nào để đánh giá hiệu suất của một tập hợp các tính năng đầu vào. Trong chương này, chúng tôi sử dụng một hình thức rất bảo thủ của tính năng thiết lập đánh giá để tránh overfitting. Điều này là quan trọng. Ngay cả khi bộ tính năng được đánh giá bởi testset cross-xác nhận hoặc để lại một ra qua xác nhận, một tìm kiếm đầy đủ của bộ tính năng có thể có khả năng để tìm một thoảng cũng ghi tính năng thiết lập bởi cơ hội. Để ngăn chặn điều này, chúng tôi sử dụng các thủ tục xác nhận đường ghép tầng trong hình 7-1, mà chọn từ bộ ngày càng lớn của tính năng (và vì thế ngày càng lớn mô hình học). Số điểm cho bộ tính năng tốt nhất của một kích thước nhất định được tính bởi một đường xác nhận độc lập từ các điểm kích thước tốt nhất của tính năng thiết lập.
đang được dịch, vui lòng đợi..