Fig. 3. Speaker-diarization results on the COST278 BN database when us dịch - Fig. 3. Speaker-diarization results on the COST278 BN database when us Việt làm thế nào để nói

Fig. 3. Speaker-diarization results

Fig. 3. Speaker-diarization results on the COST278 BN database when using different clustering procedures. The lower DER values correspond to a better performance. Another interesting conclusion can be drawn from observing the flatness of the DER trajectories. Since the proposed evaluation measure aimed to compute the DER values at the relative numbers of clusters in each file, no stopping criteria needed to be applied; however, in practice the proper stopping of the clustering should be ensured. The optimum stopping criteria should end the merging process at the point with the lowest DER, which should coincide with the evaluation point 0, where the number of clusters is equal to the number of actual speakers in the data. Around this point it is better for the approaches to produce relatively flat DER trajectories, which would result in a small loss of speaker-diarization erformance, when the stopping criteria would not find the exact position for ending the merging process. In the case of the SiBN results, the DER trajectory, produced by the clust_FUSION approach, is flatter around the evaluation point 0 than the DER trajectories, produced by the clust_REF_BIC and clust_UBM_MAP_CLR approaches.
The speaker-diarization results in Figure 3 were produced by running the tested clustering
approaches on the COST278 BN database. The results demonstrate the similar clustering performance of the approaches as in the case of the SiBN data, even though the overall DERs are higher than in the SiBN case. This was expected, since the COST278 BN data includes many more speakers in various acoustic environments than the SiBN data, and thus the clustering problem was more complex. In this situation the clust_FUSION approach produced the best overall speaker-diarization results, while the clust_REF_BIC approach performed slightly better than the clust_UBM_MAP_CLR approach. This means that in the case of adverse acoustic conditions it is better to model the cluster data by adding prosodic information to the cluster representations rather than modeling them just with acoustic representations (the clust_REF_BIC approach) or by a more precise acoustic modeling with the GMMs (the clust_UBM_MAP_CLR approach).
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
Hình 3. Loa-diarization các kết quả trên cơ sở dữ liệu COST278 BN khi sử dụng các thủ tục kết cụm khác nhau. Các giá trị DER thấp tương ứng với một hiệu suất tốt hơn. Một kết luận thú vị có thể được rút ra từ quan sát độ phẳng của DER hnăm. Kể từ khi các biện pháp được đề nghị thẩm định nhằm mục đích tính toán giá trị DER vào những con số tương đối của cụm trong mỗi tập tin, không ngừng tiêu chí cần thiết để được áp dụng; Tuy nhiên, trong thực tế dừng thích hợp của các cụm nên được đảm bảo. Tối ưu ngăn chặn tiêu chí nên kết thúc tiến trình merging tại điểm với DER thấp nhất, đó phải trùng với thời điểm đánh giá 0, nơi mà số lượng các cụm là tương đương với số lượng thực tế loa trong dữ liệu. Quanh thời điểm này, nó là tốt hơn cho các phương pháp tiếp cận để sản xuất tương đối bằng phẳng DER hnăm sẽ cho kết quả trong một lỗ nhỏ của loa-diarization erformance, khi các tiêu chuẩn dừng sẽ không tìm thấy vị trí chính xác để kết thúc quá trình merging. Trong trường hợp kết quả SiBN, quỹ đạo DER, được sản xuất bằng phương pháp tiếp cận clust_FUSION, là phẳng hơn xung quanh đánh giá điểm 0 so với hnăm DER, được sản xuất bởi các phương pháp tiếp cận clust_REF_BIC và clust_UBM_MAP_CLR.Kết quả loa-diarization trong hình 3 đã được sản xuất bằng cách chạy thử nghiệm clusteringphương pháp tiếp cận trên cơ sở dữ liệu COST278 BN. Kết quả đã chứng minh hiệu suất kết cụm tương tự như phương pháp tiếp cận như trường hợp dữ liệu SiBN, mặc dù DERs tổng thể là cao hơn trong trường hợp SiBN. Điều này đã được dự kiến, vì dữ liệu COST278 BN bao gồm nhiều thêm loa ở môi trường âm thanh khác nhau hơn so với các dữ liệu SiBN, và do đó vấn đề kết cụm là phức tạp hơn. Trong tình huống này là cách tiếp cận clust_FUSION sản xuất các kết quả loa-diarization tổng thể tốt nhất, trong khi thực hiện phương pháp tiếp cận clust_REF_BIC một chút tốt hơn so với phương pháp tiếp cận clust_UBM_MAP_CLR. Điều này có nghĩa rằng trong trường hợp các điều kiện bất lợi của âm thanh đó là tốt hơn để mô hình dữ liệu cụm sao bằng cách thêm prosodic thông tin cho đại diện nhóm thay vì mô hình hóa chúng chỉ với đại diện âm thanh (phương pháp tiếp cận clust_REF_BIC) hoặc bởi một âm thanh chính xác hơn mô hình hóa với GMMs (phương pháp tiếp cận clust_UBM_MAP_CLR).
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
Sung. 3. Kết quả Speaker-diarization trên cơ sở dữ liệu COST278 BN khi sử dụng các thủ tục phân nhóm khác nhau. Các giá trị DER thấp hơn tương ứng với một hiệu suất tốt hơn. Một kết luận thú vị có thể được rút ra từ việc quan sát độ phẳng của quỹ đạo DER. Kể từ khi các biện pháp đánh giá đề xuất nhằm tính toán các giá trị DER vào những con số tương đối của các cụm trong mỗi tập tin, không có tiêu chí dừng cần thiết để áp dụng; Tuy nhiên, trên thực tế dừng thích hợp của các phân nhóm phải được đảm bảo. Các tiêu chí dừng tối ưu nên kết thúc quá trình hợp nhất tại thời điểm với DER thấp nhất, mà phải trùng với điểm đánh giá 0, nơi mà số lượng cụm là bằng với số lượng loa thực tế trong các dữ liệu. Khoảng thời điểm này nó là tốt hơn cho các phương pháp tiếp cận để tạo quỹ đạo DER tương đối bằng phẳng, mà sẽ dẫn đến một sự mất mát nhỏ của loa diarization erformance, khi các tiêu chí dừng sẽ không tìm được vị trí chính xác để kết thúc quá trình sáp nhập. Trong trường hợp kết quả SiBN, quỹ đạo DER, được sản xuất bởi các phương pháp tiếp cận clust_FUSION, là phẳng hơn xung quanh các điểm đánh giá 0 so với quỹ đạo DER, được sản xuất bởi các clust_REF_BIC và cách tiếp cận clust_UBM_MAP_CLR.
Kết quả loa diarization trong hình 3 được sản xuất bằng cách chạy các phân nhóm thử nghiệm
phương pháp tiếp cận trên cơ sở dữ liệu COST278 BN. Các kết quả cho việc thực hiện phân nhóm tương tự của phương pháp tiếp cận như trong trường hợp dữ liệu SiBN, mặc dù các rối tổng thể là cao hơn trong trường hợp SiBN. Điều này đã được dự kiến, kể từ khi COST278 BN dữ liệu bao gồm nhiều diễn giả hơn trong môi trường âm thanh khác nhau hơn so với các dữ liệu SiBN, và do đó vấn đề phân nhóm là phức tạp hơn. Trong tình huống này, các phương pháp tiếp cận clust_FUSION sản xuất các kết quả loa diarization tổng thể tốt nhất, trong khi phương pháp clust_REF_BIC thực hiện tốt hơn một chút so với phương pháp clust_UBM_MAP_CLR. Điều này có nghĩa là trong trường hợp các điều kiện bất lợi acoustic nó là tốt hơn để mô hình dữ liệu cluster bằng cách thêm thông tin điệu tính để cơ quan đại diện cụm chứ không phải mô hình hóa chúng chỉ với đại diện âm (cách tiếp cận clust_REF_BIC) hoặc bởi một mô hình âm thanh chính xác hơn với các GMMs ( cách tiếp cận clust_UBM_MAP_CLR).
đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2024 I Love Translation. All reserved.

E-mail: