Cách tiếp cận BIC cơ bản: (mô tả trong phần 2.2)
các dữ liệu âm thanh đã được đại diện bởi các tính năng MFCC, mà được sáng tác đầu tiên
12 hệ số Cepstral (không có hệ số 0) và một năng lượng ngắn hạn với việc bổ sung các tính năng ΔMFCC. Các tính năng ΔMFCC được tính toán bằng cách ước lượng các hệ số hồi quy bậc nhất từ các tính năng MFCC tĩnh. Các tính năng đã được bắt nguồn từ các tín hiệu âm thanh mỗi 10 ms bằng cách sử dụng cửa sổ phân tích 32-ms, (Young et al., 2004). Đối với các ước tính của các biện pháp ΔBIC từ phương trình (4) mỗi cụm được mô hình hóa sử dụng đầy đủ các hiệp phương sai phân phối Gaussian, và λ yếu tố hình phạt đã được đặt là 3.0, được chọn theo hiệu suất phân nhóm tối ưu trên các số liệu phát triển.
Cách tiếp cận này là được gọi là phương pháp tiếp cận clust_REF_BIC trong các thí nghiệm của chúng tôi.
đang được dịch, vui lòng đợi..