Hãy r được thứ hạng của từ, Prob (r) là xác suất của một từ ở bậc r. Chúng tôi không quan tâm về các
tên của các từ, chúng ta chỉ quan tâm đến cấp bậc và tần số của họ. By Prob định nghĩa (r) = freq (r) / N
nơi
freq (r) = số lần chữ ở bậc r xuất hiện trong các bộ sưu tập và
N = tổng số từ trong các bộ sưu tập (không phải số của các từ duy nhất)
đang được dịch, vui lòng đợi..
