ông phần thứ hai của chương trình bày một việc làm của quang phổ bày tỏ ước tính
thông tin trong các bài phát biểu và diễn giả công nhận dựa trên các thiếu-tính năng lý thuyết
(MFT) để cải thiện tiếng ồn mạnh mẽ. Đã có cách tiếp cận khác nhau để
cải thiện mạnh mẽ chống lại tiếng ồn. Giả sử sẵn có của một số kiến thức về
tiếng ồn, chẳng hạn như đặc tính quang phổ hoặc mô hình ngẫu nhiên của tiếng ồn, tín hiệu tiếng nói có thể được
tăng cường trước khi làm việc của nó trong recogniser, ví dụ như, (Boll, 1979; Vaseghi, 2005; Zou et
al., 2007) hoặc các kỹ thuật tiếng ồn bồi thường có thể được áp dụng trong các tính năng hoặc mô hình tên miền
để giảm sự không phù hợp giữa đào tạo và kiểm tra dữ liệu, ví dụ như, (Gales & Young, 1996).
Gần đây, các tính năng còn thiếu thuyết (MFT) đã được sử dụng để đối phó với tham nhũng nhiễu
trong bài phát biểu và công nhận loa, ví dụ như, (Lippmann & Carlson, 1997; Cooke et al 2001;.
. Drygajlo & El-Maliki, 1998). Trong phương pháp này, các vector đặc trưng được chia thành tiểu vector của các
tính năng đáng tin cậy và không đáng tin cậy (xem xét độ tin cậy nhị phân). Các tính năng đáng tin cậy được
coi là bị chi phối bởi tiếng ồn và do đó hiệu quả của chúng được loại bỏ trong quá trình
công nhận, ví dụ, bởi marginalizing chúng ra. Hiệu suất của phương pháp MFT
phụ thuộc rất nhiều vào độ chính xác của ước lượng tính năng độ tin cậy. Độ tin cậy của
các tính năng phổ dựa trên có thể được ước tính dựa trên việc đo địa phương tín hiệu-to-noise ratio
(SNR) (Drygajlo & El-Maliki, 1998;. Renevey & Drygajlo, 2000) hoặc sử dụng riêng biệt
hệ thống phân loại (Seltzer et al ., 2004). Chúng tôi chứng minh rằng việc làm của các
thông tin lên tiếng phổ có thể đóng một vai trò quan trọng trong vấn đề ước lượng độ tin cậy.
Đánh giá thực nghiệm được trình bày cho bài phát biểu MFT-dựa và công nhận loa và
cải thiện độ chính xác nhận đáng kể được chứng minh.
đang được dịch, vui lòng đợi..