nơi kp là tần số-chỉ số của một đỉnh quang phổ và L xác định số lượng
các thành phần của quang phổ ở mỗi bên xung quanh các đỉnh được so sánh (giá trị 2 được
sử dụng). Phổ của tín hiệu, S (k), và khung cửa sổ, W (k), được chuẩn hóa có
giá trị độ lớn bằng 1 ở đỉnh cao trước khi sử dụng chúng trong phương. 1. lồng tiếng, khoảng cách cho
các thành phần tần số xung quanh các đỉnh được thiết lập để thì giọng nói xa ở đỉnh cao, tức là,
vd (k) = vd (kp) cho k∈ [kp-L, kp + L]. Lưu ý rằng nếu thông tin về tần số cơ bản
có sẵn, thì giọng nói khoảng cách có thể được tính ở tần số chỉ số tương ứng với
bội số của tần số cơ bản thay vì các đỉnh núi của quang phổ. Cũng lưu ý rằng
các ước tính của tần số cơ bản có thể đạt được trên cơ sở tối thiểu
tích lũy bày tỏ khoảng cách tính theo bội số của tần số cơ bản được coi là
giá trị (Jančovič & Köküer, 2007a).
đang được dịch, vui lòng đợi..