Một đánh giá của tất cả ba phương pháp phân nhóm được trình bày đã được thực hiện trong hai speakerdiarization
nhiệm vụ trên dữ liệu tin tức phát sóng. Các thí nghiệm đánh giá được tiến hành bằng
phương pháp tiếp cận tiểu thuyết ra loa Clustering cho loa Diarization trong Audio Broadcast tin dữ liệu
353
sau NIST Giàu Transcription Đánh giá, đã được các đánh giá chính
kỹ thuật cho diarization loa của dữ liệu tin tức phát sóng (Fiscus et al., 2004) . Một tương tự
đánh giá cũng đã được thực hiện trong đánh giá Ester sử dụng tin tức phát sóng đài phát thanh Pháp
dữ liệu (Galliano et al., 2005).
Thí nghiệm của chúng tôi được thực hiện trên hai cơ sở dữ tin tức phát sóng. Việc đầu tiên bao gồm 33
giờ chương trình BN trong tiếng Slovenia và được gọi là cơ sở dữ liệu SiBN (Žibert & Mihelič, 2004). Việc
thứ hai là một cơ sở dữ liệu nói đa ngôn ngữ, COST278, trong đó gồm 30 giờ BN
cho thấy trong chín ngôn ngữ châu Âu (Vandecatseye et al., 2004), và đã được sử dụng cho một
đánh giá các thủ tục vào ngôn ngữ và dữ liệu độc lập khác nhau trong chế biến của
chương BN âm thanh, (Žibert et al., 2005).
đang được dịch, vui lòng đợi..
