Để tập trung sự chú ý về vấn đề OOV, chúng tôi sử dụng các thiết lập dữ liệu được xây dựng bởi có thể et al. [16], ban đầu được thiết kế để evalu-ăn nói hạn phát hiện (STD) của OOVs (OOVCORP.) Các văn thể chứa 100 giờ sao chép lại tin tức Anh phát sóng bài phát biểu nhấn mạnh OOVs. 1290 duy nhất OOVs trong các văn thể, mà đã được lựa chọn với một mini-mum của 5 trường hợp âm thanh cho một từ có. Ví dụ OOVs bao gồm: PUTIN, QAEDA, HOLLOWAY, COROLLARIES, HYPERLINKED, NATALIE.ShortOOVs(lessthan4phones) không thích hợp cho STD đã bị loại trừ một cách rõ ràng. Điều này dẫn đến khoảng 24K (2%) OOV thẻ.
đang được dịch, vui lòng đợi..