. Trong phần này, chúng ta so sánh các thuật toán tham lam với các phương pháp thông thường theo kinh nghiệm
Chúng tôi chạy mười thí nghiệm; cho mỗi thí nghiệm, chúng tôi cố gắng hai tập dữ liệu với kích thước khu đầu vào khác nhau; và đối với mỗi bộ dữ liệu, chúng tôi sử dụng ba xấp xỉ hàm khác nhau.
Để đánh giá ảnh hưởng của sự tham lam về tính chính xác và hiệu quả của các tính năng trình lựa chọn, chúng tôi sử dụng mười hai bộ dữ liệu thực tế từ StatLib / CMU và kho lưu trữ dữ liệu máy học UCI của. Những bộ dữ liệu đến từ các lĩnh vực khác nhau, chẳng hạn như sinh học, xã hội học, robot, vv
Các tập dữ liệu mỗi chứa 62-1601 điểm, và mỗi điểm gồm một vector đầu vào và một đầu ra vô hướng. Số chiều của đầu vào thay đổi từ 3 đến 13. Trong tất cả các ví dụ này, chúng tôi thiết lập m (tính năng được thiết lập kích thước tối đa) là 10.
đang được dịch, vui lòng đợi..
