Tính năng tự động lựa chọn phương pháp bao gồm việc loại bỏ các điều khoản không thông tin theo số liệu thống kê corpus, và việc xây dựng các tính năng mới mà kết hợp các tính năng cấp thấp hơn (tức là, điều khoản) vào kích thước cao hơn cấp trực giao. Lewis & Ringuette [13] sử dụng một biện pháp đạt được thông tin để tích cực giảm từ vựng tài liệu trong một mô hình Bayes ngây thơ và một phương pháp quyết định-cây để phân loại nhị phân. Wiener et al.[21, 19] sử dụng chung thông tin và số liệu thống kê 2 để chọn các tính năng cho đầu vào cho mạng nơ-ron. Yang [24] và Schutze et al. [19, 21, 19] sử dụng phân tích thành phần chủ yếu để tìm thấy trực giao kích thước trong không gian vectơ của tài liệu. Yang & tài liệu Wilbur [28] sử dụng cụm các kỹ thuật để ước tính xác suất "hạn sức mạnh", và sử dụng nó để giảm các biến trong hồi quy tuyến tính và gần nhất hàng xóm cơ cation. Moulinier et al. [16] được sử dụng một thuật toán học quy nạp để có được các tính năng ở dạng chuẩn ly phản đối với tin tức câu chuyện phân loại. Lang [11] sử dụng một nguyên tắc chiều dài tối thiểu mô tả để chọn các điều khoản cho máy phân loại
đang được dịch, vui lòng đợi..