2005) hoặc một tiêu chí khả năng bị phạt, dựa trên BIC (Žibert, 2006b).
Chúng tôi thực hiện phương pháp này bằng cách áp dụng tính năng cong vênh bình thường trước khi
phân nhóm, trong khi chỉ một UBM chung đã được sử dụng cho tất cả sự thích nghi MAP của GMMs.
Các UBM được đào tạo trực tiếp từ các dữ liệu xử lý âm thanh, và các GMMs nguồn gốc đã được
đại diện bởi đường chéo-hiệp phương sai Gaussian với 32 hỗn hợp. Chúng tôi quyết định sử dụng các
GMMs hỗn hợp có kích thước khá nhỏ (trong cách tiếp cận ban đầu (Barras et al., 2006) 128 hỗn hợp
được sử dụng), vì chúng tôi đã không đạt được bất kỳ sự cải thiện trong các cụm loa trên
số liệu phát triển bằng cách tăng số lượng hỗn hợp trong GMMs. Lý do thứ hai
là bằng cách sử dụng GMMs với một số lượng tương đối nhỏ các thông số, chúng tôi loại bỏ sự cần thiết
để chạy các giai đoạn ban đầu của các phân nhóm BIC để có được nhiều dữ liệu ban đầu cho mỗi
cụm.
đang được dịch, vui lòng đợi..