Luật Zipf là một đạo luật về sự phân bố tần số của các từ trong một ngôn ngữ (hoặc trong một bộ sưu tập đó là
đủ lớn để nó là đại diện của ngôn ngữ). Để minh họa luật Zipf của chúng ta hãy giả sử chúng ta có
một bộ sưu tập và để có được V từ duy nhất trong bộ sưu tập (từ vựng).
Đối với mỗi từ trong bộ sưu tập chúng ta cần phải tính toán freq (word) = bao nhiêu lần từ xảy ra trong
các bộ sưu tập . Sau đó, chúng tôi xếp hạng các từ giảm dần theo tần số của họ (từ thông dụng nhất có cấp bậc
1, từ thường xuyên tới đã cấp bậc 2, ...)
Các trang trình bày cung cấp một ví dụ, mà chúng sinh sản ở đây:
đang được dịch, vui lòng đợi..