3.4 đánh giá thực nghiệm về công nhận loa
Các thí nghiệm được thực hiện trên cơ sở dữ liệu TIMIT (Garofolo et al., 1993), xuống lấy mẫu
8 kHz. Trăm loa (gồm 64 nam và 36 nữ) từ các tập con thử nghiệm đã được
chọn trong một thứ tự chữ cái. Dữ liệu huấn luyện cho mỗi loa bao gồm tám
câu ( 'si' và 'sx'). Các thử nghiệm được thực hiện bằng hai ( 'sa') câu hỏng bởi
tiếng ồn trắng Gaussian và tiếng ồn điện ngầm từ cơ sở dữ liệu Aurora 2, tại SNRs toàn cầu bằng
20, 15, 10, và 5 dB, tương ứng. Các đại diện tính năng nói là giống như được sử dụng
trong các thí nghiệm nhận dạng giọng nói trong phần trước. Việc công nhận loa
hệ thống được dựa trên mô hình Gaussian hỗn hợp (GMM) với 32 hỗn hợp phần cho mỗi
loa, được xây dựng bằng cách sử dụng phần mềm HTK (Young et al., 1999). Các GMM cho
đang được dịch, vui lòng đợi..
