We computed the document frequency for each unique term in the training corpus and removed from the feature space those terms whose document frequency was less than some predetermined threshold
Chúng tôi tính toán tần số tài liệu cho mỗi cụm từ duy nhất trong các văn thể đào tạo và loại bỏ từ không gian tính năng những cụm từ có tần số tài liệu là ít hơn một số ngưỡng định trước
Chúng tôi tính toán tần số tài liệu cho từng kỳ hạn duy nhất trong corpus đào tạo và loại bỏ khỏi không gian đặc trưng những điều khoản có tần số tài liệu ít hơn một số ngưỡng định trước