Đây là một đánh giá về tính năng lựa chọn phương pháp trong chiều giảm để phân loại văn bản ở tất cả các đơn vị giảm gây hấn, từ việc sử dụng từ vựng đầy đủ (ngoại trừ dừng từ) như là không gian tính năng, để loại bỏ 98% của các điều khoản duy nhất. Chúng tôi tìm thấy IG và chí đặt hiệu quả trong việc loại bỏ thuật ngữ e aggressiv mà không làm mất phân loại chính xác trong các thí nghiệm của chúng tôi với kNN và LLSF. DF thresholding được tìm thấy so sánh với hiệu suất của IG và chí với lên đến 90% loại bỏ thuật ngữ, trong khi TS là tương đương với lên tới 50-60% hạn xoá bỏ. Thông tin chung có hiệu suất kém hơn so với các phương pháp khác do một thiên vị mà ủng hộ điều khoản hiếm và một nhạy cảm mạnh mẽ với xác suất ước lượng lỗi.
đang được dịch, vui lòng đợi..
