Cơ sở dữ liệu thí nghiệm nghe nhìn liên tục đã được ghi nhận với các tập lệnh từ cơ sở dữ liệu TIMIT. 6 người 600 câu chứa 1693 từ đơn vị đã được sử dụng trong thí nghiệm của chúng tôi. Hoàn toàn có 76 điện thoại đơn vị (bao gồm cả "im lặng" và ngắn tạm dừng "sp") thu được bằng cách sao chép lại câu lệnh vào chuỗi điện thoại bằng cách sử dụng TIMIT từ điển. Kể từ khi cơ sở dữ liệu là tương đối nhỏ cho bài phát biểu nghe nhìn lớn từ vựng công nhận. Để kiểm tra hiệu suất của các mô hình MM-ADBN, chúng tôi sử dụng thủ tục jackknife, 600 câu được tách trong sáu phần bằng nhau, và sự công nhận sáu thí nghiệm được tiến hành. Trong mỗi thử nghiệm công nhận, 500 câu được sử dụng như đào tạo tập hợp, còn lại 100 câu như thử nghiệm các thiết lập. Báo cáo kết quả kiểm tra mức trung bình của các kết quả trong sáu thí nghiệm. Trong khi đối với MS-ADBN mô hình, vì nó là từ mô hình, để tránh trường hợp mà một số từ ở các kiểm tra câu không thể xuất hiện trong bộ đào tạo, tất cả 600 câu được sử dụng như đào tạo và thử nghiệm các thiết lập. Môi trường ồn ào cũng được coi là bằng cách thêm các tiếng ồn trắng với SNRs khác nhau, từ 0dB 30dB như thử nghiệm các thiết lập.
đang được dịch, vui lòng đợi..