Sung. 2. Kết quả Speaker-diarization trên cơ sở dữ liệu SiBN khi sử dụng các thủ tục phân nhóm khác nhau. Các giá trị DER thấp hơn tương ứng với hiệu suất tốt hơn các kết quả loa diarization trong hình 2 tương ứng với hiệu suất loa phân nhóm trong các phương pháp thử nghiệm trên các dữ liệu SiBN. Hiệu suất tổng thể của phương pháp tiếp cận loa-clustering nhau giữa 13,5% và 16%, được đo bằng cách sử dụng DER tổng thể. Các phương pháp tiếp cận clust_UBM_MAP_CLR và clust_FUSION thực hiện tốt hơn một chút so với phương pháp clust_REF_BIC cơ sở trên toàn bộ phạm vi của các điểm đánh giá. Khi clust_FUSION và các phương pháp tiếp cận clust_REF_BIC được so sánh, rõ ràng là kết quả SiBN hiển thị sự khác biệt đáng kể trong việc thực hiện loa diarization của cả hai phương pháp, đó là ủng hộ cách tiếp cận clust_FUSION. Điều này chỉ ra rằng việc thêm các đặc điểm điệu tính của loa với những thông tin âm thanh cơ bản có thể cải thiện các cụm loa. Điều tương tự cũng có thể được kết luận từ so sánh clust_UBM_MAP_CLR
cách tiếp cận với các phương pháp tiếp cận BIC đường cơ sở. Hiệu suất của phương pháp tiếp cận clust_UBM_MAP_CLR cải thiện khi đủ phân cụm dữ liệu đã có sẵn cho các ước tính GMM, dẫn đến các rối thấp hơn so với các phương pháp tiếp cận BIC đường cơ sở, khi số lượng các cụm co lại (kết quả DER hiển thị một hiệu suất tốt hơn cho phương pháp clust_UBM_MAP_CLR trong phạm vi dưới điểm đánh giá 10 trong hình 2) Nó cũng là thú vị để lưu ý rằng các quỹ đạo DER của tất cả các phương pháp đạt được giá trị tối thiểu DER của họ xung quanh các điểm đánh giá 0. Điều này có nghĩa rằng nếu tất cả các phương pháp phân nhóm đã được ngừng lại khi số lượng các cụm là bằng với số lượng loa thực tế trong các dữ liệu, tất cả các phương pháp tiếp cận sẽ triển lãm hiệu suất loa diarization tối ưu của họ. Vào thời điểm đó các kết quả phân nhóm tốt nhất đã đạt được với các phương pháp tiếp cận clust_FUSION.
đang được dịch, vui lòng đợi..