Cả hai phương pháp tiếp cận loa-clustering được trình bày trước đây thực hiện các phân nhóm bằng
cách đo sự tương tự giữa dữ liệu loa, chỉ dựa trên âm thanh
đại diện. Những đại âm thanh được lựa chọn thực hiện đáng tin cậy trong hầu hết speakerrecognition
hệ thống, và họ là một sự lựa chọn rõ ràng trong cách tiếp cận loa phân nhóm.
Gần đây, tuy nhiên, một số hệ thống loa công nhận đã cố gắng để bao gồm các điệu tính
thông tin cũng như âm thanh cho các đại diện của các loa (Kajarekar et al, 2003;.
Reynolds et al, 2003;. Shriberg et al, 2005;.. Baker et al, 2005). Các nung chảy của cả hai
đại diện là một nỗ lực để giảm nhu cầu đối với mô hình loa âm thanh khác nhau
môi trường và cung cấp thêm thông tin về bài phát biểu của người nói
đặc điểm.
đang được dịch, vui lòng đợi..
