Trọng tâm của lựa chọn tính năng này là để chọn một tập hợp con của các biến từ đầu vào mà hiệu quả có thể mô tả các dữ liệu đầu vào trong khi giảm các hiệu ứng từ tiếng ồn hoặc biến không thích hợp và vẫn cung cấp các kết quả dự báo tốt [1]. Một trong những ứng dụng này sẽ được phân tích microarray gen [1-5]. Các dữ liệu biểu hiện gen tiêu chuẩn có thể chứa hàng trăm biến của
mà nhiều người trong số họ có thể có liên quan với các biến số khác (ví dụ như khi hai tính năng có tương quan hoàn toàn, chỉ có một tính năng là đủ để mô tả dữ liệu). Các biến phụ thuộc không cung cấp thêm thông tin về các lớp học và do đó phục vụ như là tiếng ồn cho các dự báo. Điều này có nghĩa rằng tổng số nội dung thông tin có thể được lấy từ ít tính năng độc đáo có chứa các thông tin phân biệt đối xử tối đa về các lớp học. Do đó bằng cách loại bỏ các biến phụ thuộc,
số lượng dữ liệu có thể được giảm mà có thể dẫn đến cải tiến trong việc thực hiện phân loại. Trong một số ứng dụng, các biến mà không có sự tương quan với các lớp học phục vụ tiếng ồn như tinh khiết có thể giới thiệu sai lệch trong việc dự báo và làm giảm hiệu suất phân loại. Điều này có thể xảy ra khi có một thiếu thông tin về tiến trình đang được nghiên cứu. Bằng cách áp dụng các kỹ thuật lựa chọn tính năng chúng ta có thể đạt được một số sâu vào quá trình này và có thể cải thiện các yêu cầu tính toán và
độ chính xác dự đoán.
đang được dịch, vui lòng đợi..
