Trong khi nhiều người lựa chọn kỹ thuật tính năng đã được thử nghiệm, đánh giá kỹ lưỡng hiếm khi được thực hiện cho các vấn đề phân loại văn bản lớn. Đây là một phần do thực tế là nhiều thuật toán học không mở rộng đến một không gian đặc trưng chiều cao. Đó là, nếu một er phân loại chỉ có thể được thử nghiệm trên một nhóm nhỏ các không gian bản địa, người ta có thể không sử dụng nó để đánh giá đầy đủ các tiềm năng của phương pháp lựa chọn tính năng. Một sự so sánh lý thuyết gần đây, ví dụ, dựa trên hiệu suất của thuật toán cây quyết định trong giải quyết vấn đề với 6-180 tính năng trong không gian Nativ e [10] phân tích .An trên thang điểm này là xa thực tế của phân loại văn bản.
đang được dịch, vui lòng đợi..