Cho một corpus đào tạo, với từng kỳ hạn duy nhất chúng tôi tính toán đạt thông tin, và loại bỏ khỏi không gian đặc trưng những điều khoản có lợi thông tin là ít hơn so với một số ngưỡng định trước. Việc tính toán bao gồm việc ước tính các xác suất có điều kiện của một thể loại nhất định có thời hạn, và các tính toán entropy trong de Định nghĩa. Việc lập dự toán probabilit y có độ phức tạp thời gian O (N) và một không gian phức tạp của O (VN) trong đó N là số lượng tài liệu đào tạo, và V là kích thước từ vựng. Các tính toán entropy có độ phức tạp thời gian O (V m).
đang được dịch, vui lòng đợi..