Thuật ngữ sức mạnh ban đầu được đề xuất và đánh giá bởi Wilbur và Sirotkin [22] từ vựng giảm thu hồi văn bản, và sau đó được áp dụng bởi Yang và Wilbur để phân loại văn bản [24, 28]. Phương pháp này ước tính tầm quan trọng của thuật ngữ dựa trên như thế nào thường một thuật ngữ có khả năng xuất hiện trong các tài liệu "chặt chẽ liên quan". Nó sử dụng một tập hợp đào tạo các tài liệu để lấy được cặp tài liệu có tương tự (đo bằng cách sử dụng giá trị cô sin của hai tài liệu vectơ) là trên một ngưỡng. "Thuật ngữ sức mạnh" sau đó được tính dựa trên xác suất có điều kiện ước tính một thuật ngữ xuất hiện trong nửa thứ hai của một cặp tài liệu liên quan cho rằng nó xảy ra trong nửa đầu. Cho x và y là một cặp tùy ý của riêng biệt nhưng liên quan đến tài liệu, và t là một thuật ngữ, sau đó, sức mạnh của thuật ngữ được định nghĩa là:
đang được dịch, vui lòng đợi..