Sung. 1. Flowchart cho sự kết hợp đề xuất tách nguồn DUET và thiếu dữ liệu
nhận dạng giọng nói.
Chương này trình bày một chương trình kết hợp với BSS ASR mạnh mẽ thông qua các
ứng dụng hệ thống của TF che cho cả hai tách lời nói và nhận dạng giọng nói
(Hình. 1). Các cách tiếp cận nêu tóm tắt công việc trước đây của chúng tôi báo cáo trong Kühne et al.
(2007; 2007a). Đặc biệt, chúng tôi điều tra việc thực hiện một đề xuất gần đây BSS
DUET phương pháp gọi là (Yilmaz & Rickard, 2004) như front-end cho thiếu bài phát biểu dữ liệu
nhận dạng. Kể từ DUET dựa vào TF mặt nạ cho nguồn demixing, sự kết hợp này phát sinh
như là một sự lựa chọn tự nhiên và đơn giản để thực hiện. Trong Kühne et al. (2007) là một phương pháp
đã được trình bày mà tránh bước nguồn tái DUET và trực tiếp sử dụng mặt nạ
cùng với hỗn hợp quang phổ là đầu vào cho các bộ giải mã ngôn luận. Trong công việc tiếp theo
(Kühne et al., 2007a), một bước mặt nạ đơn giản nhưng hiệu quả sau chế biến đã được giới thiệu trong
để loại bỏ các điểm TF giả mà có thể gây ra lỗi chèn trong giải mã. Của chúng tôi
kết hợp đề xuất phù hợp hoàn toàn với các chương trình khai thác tính năng tiêu chuẩn (Young et al,
2006), nhưng đòi hỏi một sự thay đổi của thuật toán giải mã để giải thích cho thiếu tính năng
thành phần. Nó là đặc biệt hấp dẫn cho các kịch bản ASR, nơi chỉ có không gian hạn chế và
nguồn lực để xử lý đa kênh có sẵn (ví dụ điện thoại di động).
đang được dịch, vui lòng đợi..