This chapter addresses the problem

This chapter addresses the problem of structuring the audio data in terms of speakers, i.e.,
finding the regions in the audio streams that belong to a single speaker and then joining
each region of the same speaker together. The task of organizing the audio data in this way
is known as speaker diarization and was first introduced in the NIST project of Rich
Transcription in the “Who spoke when” evaluations (Fiscus et al., 2004; Tranter & Reynolds,
2006). The speaker-diarization problem is composed of several stages, in which the three
main tasks are performed: speech detection, speaker- and background-change detection,
and speaker clustering. While the aim of the speech detection and the speaker- and acoustic segmentation
procedures is to provide the proper segmentation of the audio data streams,
the purpose of the speaker clustering is to join or connect together segments that belong to
the same speakers, and this is usually applied in the last stage of the speaker-diarization
process. In this chapter we focus on speaker-clustering methods, concentrating on
developing proper representations of the speaker segments for clustering, and research
different similarity measures for joining the speaker segments and explore different
stopping criteria for the clustering that result in a minimization of the overall diarization
error of such systems.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Chương này các địa chỉ các vấn đề về cấu trúc dữ liệu âm thanh về loa, ví dụ,việc tìm kiếm các khu vực trong các dòng suối âm thanh thuộc về một người duy nhất và sau đó tham giamỗi khu vực của loa cùng với nhau. Nhiệm vụ của tổ chức các dữ liệu âm thanh bằng cách nàyđược gọi là loa diarization và đã được giới thiệu lần đầu tiên trong dự án NIST của người giàuPhiên mã vào đánh giá "Những người đã nói chuyện khi" (Fiscus et al., năm 2004; Tranter & Reynolds,Năm 2006). các vấn đề diarization loa bao gồm nhiều giai đoạn, trong đó banhiệm vụ chủ yếu được thực hiện: bài phát biểu phát hiện, phát hiện loa và nền thay đổi,và loa clustering. Trong khi mục đích của bài phát biểu phát hiện và phân khúc loa và âm thanhthủ tục là cung cấp đúng phân khúc của dòng dữ liệu âm thanh,mục đích của loa clustering là tham gia hoặc kết nối với nhau mà thuộc về các phân đoạnCác diễn giả cùng, và điều này thường được áp dụng trong giai đoạn cuối của loa-diarizationquá trình. Trong chương này, chúng tôi tập trung vào phương pháp cụm loa, tập trung vàoCác đại diện thích hợp của các phân đoạn loa cho các cụm, nghiên cứu và phát triểnkhác nhau tương tự các biện pháp để gia nhập các đoạn loa và khám phá khác nhaungừng các tiêu chí cho các cụm mà kết quả trong một giảm thiểu tổng thể diarizationlỗi hệ thống như vậy.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Chương này đề cập đến các vấn đề về cơ cấu lại các dữ liệu âm thanh về loa, tức là,
việc tìm kiếm các vùng trong dòng suối âm thanh mà thuộc về một loa đơn duy nhất và sau đó tham gia vào
từng khu vực của người nói với nhau. Các nhiệm vụ tổ chức các dữ liệu âm thanh theo cách này
được gọi là loa diarization và lần đầu tiên được giới thiệu trong dự án NIST của Rich
Transcription trong "Ai đã nói khi" đánh giá (Fiscus et al, 2004;. Tranter & Reynolds,
2006). Các vấn đề loa diarization gồm nhiều giai đoạn, trong đó ba
nhiệm vụ chính được thực hiện: phát hiện lời nói, phát hiện speaker- và nền thay đổi,
và loa clustering. Trong khi mục tiêu của phát hiện ngôn luận và speaker- và phân đoạn acoustic
thủ tục là cung cấp cho các phân khúc thích hợp của các dòng dữ liệu âm thanh,
mục đích của các phân nhóm loa là để tham gia hoặc kết nối với nhau đoạn thuộc
các loa cùng, và điều này là thường được áp dụng trong giai đoạn cuối cùng của loa diarization
quá trình. Trong chương này, chúng tôi tập trung vào các phương pháp loa-clustering, tập trung vào
phát triển các cơ quan đại diện thích hợp của phân khúc loa cho clustering, và nghiên cứu
các biện pháp tương tự khác nhau để gia nhập phân khúc loa và khám phá khác nhau
tiêu chí dừng chân của các phân nhóm mà kết quả trong một giảm thiểu các diarization tổng thể
lỗi của hệ thống như vậy.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.