Phần thứ ba của chương trình bày một kết hợp của các thông tin quang phổ lồng tiếng để nâng cao mô hình của bài phát biểu tín hiệu trong các ứng dụng để nhận dạng giọng nói trong điều kiện ồn ào. Lồng tiếng-thông tin được tích hợp trong một khuôn khổ thống kê dựa trên HMM cuối trở lại hệ thống ASR. Trong mô hình được đề xuất, một xác suất lồng tiếng được ước tính cho mỗi hỗn hợp ở mỗi tiểu bang HMM và nó phục vụ như là một hình phạt trong sự công nhận cho những hỗn hợp/tiểu bang mà lồng tiếng thông tin không tương ứng với thông tin lồng tiếng của các tín hiệu. Các đánh giá được thực hiện trong mô hình chuẩn và các mô hình tính năng thiếu có đền bù cho ảnh hưởng của tiếng ồn và kết quả thực nghiệm đã chứng minh cải tiến độ chính xác đáng kể công nhận trong điều kiện ồn ào mạnh thu được bằng các mô hình kết hợp các thông tin lồng tiếng.
đang được dịch, vui lòng đợi..
