Phương pháp lựa chọn tính năng tự động bao gồm việc loại bỏ các điều kiện không chứa thông tin theo thống kê corpus, và xây dựng các tính năng mới mà kết hợp các tính năng cấp thấp hơn (ví dụ, các điều khoản) vào chiều trực giao cấp cao hơn. Lewis & Ringuette [13] sử dụng một biện pháp tăng thông tin để tích cực giảm từ vựng tài liệu trong một mô hình Bayes ngây thơ và một cách tiếp cận cây quyết định nhị phân để phân loại cation. Wiener et al. [21, 19] sử dụng thông tin lẫn nhau và một? 2 số liệu thống kê để chọn tính năng cho đầu vào mạng nơron. Yang [24] và Schutze et al. [19, 21, 19] sử dụng phân tích thành phần chính để tìm kích thước trực giao trong không gian vector của tài liệu. Yang & Wilbur [28] sử dụng kỹ thuật phân nhóm tài liệu để ước tính xác suất "sức mạnh hạn", và sử dụng nó để giảm các biến trong hồi quy tuyến tính và lân cận gần nhất phân loại cation. Moulinier et al. [16] sử dụng một thuật toán học quy nạp để có được các tính năng trong hình thức bình thường rời rạc cho câu chuyện tin tức phân loại. Lang [11] sử dụng một nguyên tắc mô tả chiều dài tối thiểu để chọn điều kiện cho Netnews phân loại
đang được dịch, vui lòng đợi..