Trong hình. 5 kết quả cho các phương pháp xếp hạng đầu tiên được đưa ra. Trục x là số lượng tính năng và trục y là hiệu suất của các tập con chứa số quy định của các tính năng. Vả. 6 cho kết quả cho các tiêu chí MI (4), hình. 7 cung cấp cho các kết quả của việc áp dụng thuật toán SFFS với SVM là wrapper và Fig. 8 cung cấp cho các kết quả của việc áp dụng SFFS với RBF là wrapper. Trong hình. 5, chúng ta có thể thấy rằng hiệu suất cho các tính năng xếp hạng đầu tiên của ung thư và Ionosphere cho hiệu suất thấp do sự tính toán của MI. Vì chúng ta đang xấp xỉ PDF của một tính năng duy nhất và sự phân bố lớp đầu ra, tính MI sẽ không được chính xác và dễ bị ảnh hưởng bởi mật độ biên [22]. Đồ thị đột xuất đối với các phương pháp lọc này cũng chứng tỏ rằng các phương pháp xếp hạng là tầm thường. Kể từ SFFS có thể sản xuất chỉ có một tập hợp con, chúng tôi tạo ra các tập con của kích thước thấp hơn bằng cách
loại bỏ lạc hậu hoặc một nhóm nhỏ với số lượng lớn các tính năng bằng cách thêm về phía trước để các tập con được lựa chọn bởi SFFS. Bằng cách này chúng ta có thể thấy rằng hiệu suất tối đa là luôn luôn thu được từ các thuật toán SFFS và hiệu suất của tất cả các tập con khác là tương đương hoặc thấp hơn so với hiệu suất tối đa. Vả. 8 cung cấp cho các kết quả của việc áp dụng SFFS sử dụng phân loại RBF với các thủ tục tối ưu hóa đã nêu ở trên. Nó có thể được nhìn thấy trong hình. 8 rằng đồ thị không đưa ra một ý tưởng rõ ràng về việc lựa chọn tính năng do tối ưu hóa các thông số RBF cho mỗi tập hợp con. Nếu các giá trị mẫu là gần trung tâm của hạt nhân, sự đóng góp trọng lượng sẽ cao hơn. Nó có thể được nhận thấy trong hình. 7 mà cho dữ liệu Rối loạn gan hiệu suất là như nhau cho bất kỳ tập con đó là thú vị vì cùng một kết quả không thu được từ RBF do sự tối ưu hóa của RBF
phân loại.
đang được dịch, vui lòng đợi..