Fig. 1. Flowchart for proposed comb

Fig. 1. Flowchart for proposed combination of DUET source separation and missing data
speech recognition.
This chapter presents a scheme which combines BSS with robust ASR through the
systematic application of T-F masking for both speech separation and speech recognition
(Fig. 1). The outlined approach summarizes our previous work reported in Kühne et al.
(2007; 2007a). In particular, we investigate the performance of a recently proposed BSS
method called DUET (Yilmaz & Rickard, 2004) as front-end for missing data speech
recognition. Since DUET relies on T-F masking for source demixing, this combination arises
as a natural choice and is straightforward to implement. In Kühne et al. (2007) an approach
was presented that avoids DUET’s source reconstruction step and directly uses the mask
together with the spectral mixture as input for the speech decoder. In subsequent work
(Kühne et al., 2007a), a simple but effective mask post-processing step was introduced in
order to remove spurious T-F points that can cause insertion errors during decoding. Our
proposed combination fits seamlessly into standard feature extraction schemes (Young et al,
2006), but requires a modification of the decoding algorithm to account for missing feature
components. It is particularly attractive for ASR scenarios where only limited space and
resources for multi-channel processing are available (e.g., mobile phones).

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Hình 1. Sơ đồ cho kết hợp đề xuất của song CA nguồn chia ly và thiếu dữ liệunhận dạng tiếng nói.Chương này trình bày một sơ đồ kết hợp BSS với ASR mạnh mẽ thông qua cácCác ứng dụng hệ thống của T-F che cho cả hai bài phát biểu chia tách và nhận dạng tiếng nói(Hình 1). Vạch ra cách tiếp cận tóm tắt các công việc trước đây của chúng tôi báo cáo ở Kühne et al.(năm 2007; 2007a). Đặc biệt, chúng tôi điều tra hiệu suất của BSS mới được đề xuấtphương pháp gọi là song CA (Yilmaz & Rickard, 2004) như là kết thúc cho thiếu dữ liệu phát biểucông nhận. Kể từ khi song CA dựa trên T-F che cho nguồn demixing, sự kết hợp này phát sinhnhư là một sự lựa chọn tự nhiên và đơn giản để thực hiện. Trong Kühne et al. (2007) một cách tiếp cậnđược giới thiệu mà tránh song CA của nguồn tái tạo bước và trực tiếp sử dụng mặt nạcùng với hỗn hợp quang phổ như là đầu vào cho các bộ giải mã lời nói. Trong công việc tiếp theo(Kühne et al., 2007a), một mặt nạ đơn giản nhưng hiệu quả sau khi xử lý bước được giới thiệu vàođể loại bỏ các điểm T-F giả mạo có thể gây chèn lỗi trong quá trình giải mã. Của chúng tôiđề xuất kết hợp phù hợp liền mạch với đề án khai thác tính năng tiêu chuẩn (Young và ctv,năm 2006), nhưng đòi hỏi một sửa đổi của các thuật toán giải mã vào tài khoản cho các tính năng còn thiếuCác thành phần. Nó là đặc biệt hấp dẫn cho các kịch bản ASR nơi duy nhất không gian hạn chế vàCác nguồn lực cho xử lý đa kênh có sẵn (ví dụ: điện thoại di động).

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Sung. 1. Flowchart cho sự kết hợp đề xuất tách nguồn DUET và thiếu dữ liệu
nhận dạng giọng nói.
Chương này trình bày một chương trình kết hợp với BSS ASR mạnh mẽ thông qua các
ứng dụng hệ thống của TF che cho cả hai tách lời nói và nhận dạng giọng nói
(Hình. 1). Các cách tiếp cận nêu tóm tắt công việc trước đây của chúng tôi báo cáo trong Kühne et al.
(2007; 2007a). Đặc biệt, chúng tôi điều tra việc thực hiện một đề xuất gần đây BSS
DUET phương pháp gọi là (Yilmaz & Rickard, 2004) như front-end cho thiếu bài phát biểu dữ liệu
nhận dạng. Kể từ DUET dựa vào TF mặt nạ cho nguồn demixing, sự kết hợp này phát sinh
như là một sự lựa chọn tự nhiên và đơn giản để thực hiện. Trong Kühne et al. (2007) là một phương pháp
đã được trình bày mà tránh bước nguồn tái DUET và trực tiếp sử dụng mặt nạ
cùng với hỗn hợp quang phổ là đầu vào cho các bộ giải mã ngôn luận. Trong công việc tiếp theo
(Kühne et al., 2007a), một bước mặt nạ đơn giản nhưng hiệu quả sau chế biến đã được giới thiệu trong
để loại bỏ các điểm TF giả mà có thể gây ra lỗi chèn trong giải mã. Của chúng tôi
kết hợp đề xuất phù hợp hoàn toàn với các chương trình khai thác tính năng tiêu chuẩn (Young et al,
2006), nhưng đòi hỏi một sự thay đổi của thuật toán giải mã để giải thích cho thiếu tính năng
thành phần. Nó là đặc biệt hấp dẫn cho các kịch bản ASR, nơi chỉ có không gian hạn chế và
nguồn lực để xử lý đa kênh có sẵn (ví dụ điện thoại di động).

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.