Cách tiếp cận BIC cơ bản: (mô tả trong phần 2.2)
các dữ liệu âm thanh đã được đại diện bởi các tính năng MFCC, mà được sáng tác đầu tiên
12 hệ số Cepstral (không có hệ số 0) và một năng lượng ngắn hạn với việc bổ sung các tính năng ΔMFCC. Các tính năng ΔMFCC được tính toán bằng cách ước lượng
các hệ số hồi quy bậc nhất từ các tính năng MFCC tĩnh. Các tính năng đã được
bắt nguồn từ các tín hiệu âm thanh mỗi 10 ms bằng cách sử dụng cửa sổ phân tích 32-ms, (Young et
al., 2004). Đối với các ước tính của các biện pháp ΔBIC từ phương trình (4) mỗi cụm được
mô phỏng bằng toàn hiệp phương sai phân phối Gaussian, và λ yếu tố hình phạt đã được thiết lập
để 3,0, được chọn theo hiệu suất phân nhóm tối ưu trên các
tập dữ liệu phát triển.
Cách tiếp cận này là được gọi là phương pháp tiếp cận clust_REF_BIC trong các thí nghiệm của chúng tôi.
đang được dịch, vui lòng đợi..