4.2 thiết lập thí nghiệm
Chúng tôi đánh giá tất cả ba cách tiếp cận loa-clustering: một hệ thống cơ sở với BIC, một
cách tiếp cận GMM và dựa trên một phương pháp tiếp cận tổng hợp dựa trên, trình bày tại mục 2.2, 2.3, và
mục 3, tương ứng.
Vì chúng ta chỉ muốn đánh giá hiệu suất của loa-clustering phương pháp tiếp cận, chúng tôi
sử dụng các thủ tục cùng nói / không-nói-phát hiện và nghe sự phân hóa trong tất cả các
thí nghiệm đánh giá. Việc phát hiện nói / phi ngôn luận sử dụng phương pháp trình bày trong
(Žibert et al., 2007), trong khi các phân khúc âm thanh sử dụng phương pháp trình bày trong (Chen &
Gopalakrishnan, 1999).
Speech Recognition, công nghệ và ứng dụng
354
Trong tất cả các loa kiểm tra phương pháp tiếp cận -clustering chúng ta cần phải thiết lập các thông số mở khác nhau.
các thông số đã được lựa chọn theo hiệu suất loa diarization tối ưu của
các phân nhóm tương ứng phương pháp tiếp cận trên các số liệu phát triển, được sáng tác
trong 7 giờ của dữ liệu âm thanh BN từ các cơ sở dữ liệu SiBN. Thông tin chi tiết về các
thiết lập thử nghiệm cho mỗi phương pháp phân nhóm cá nhân được thể hiện trong danh sách sau đây:
đang được dịch, vui lòng đợi..
