1. Shuffle tập dữ liệu và phân chia thành một tập huấn luyện của 70% dữ liệu và một testset, còn lại 30%.
2. Hãy j khác nhau giữa kích cỡ bộ những tính năng: j = (0, 1, 2, ..., m)
a. Hãy fsj = Tính năng thiết lập tốt nhất của kích thước j, nơi "tốt nhất" được đo lường bằng sự minimizer của để lại-một-ra lỗi cross-validation trên tập huấn luyện.
B. Hãy Testscore j = các lỗi dự báo RMS của tính năng thiết lập fsj trên tập kiểm tra.
Kết thúc vòng lặp của (j).
3. Chọn fsj tính năng thiết lập mà số điểm thử nghiệm thiết lập được giảm thiểu.
Hình 7-1: Cascaded thủ tục qua xác nhận cho việc tìm kiếm các thiết lập tốt nhất lên đến m tính năng.
đang được dịch, vui lòng đợi..
