Chúng tôi đã trình bày một cách tiếp cận mới cho OOV nhạy cảm thực thể được đặt tên công nhận trong tự động sao chép lại bài phát biểu nhất, nhắm mục tiêu theo NEs có chứa từ mà không phải là hiện diện trong LVCSR sys-tem của từ vựng. Chúng tôi tăng cường các tính năng được sử dụng bởi một tagger CRF NER để cho biết có thể OOVs trong bảng điểm. Hệ thống của chúng tôi lấy được một thống kê significant cải tiến hiệu suất tổng thể bằng cách sử dụng tự động OOV phát hiện và các kết quả tự động đạt được một gần như 60% lỗi giảm trên đường cơ sở so với oracle kết quả. Ngoài ra, chúng tôi cho rằng oracle OOV tính năng đóng khoảng cách giữa IV và OOV NER một-formance. Cuối cùng, chúng tôi giới thiệu tin tức phát sóng bài phát biểu dữ liệu bộ mới chú thích cho tên thực thể bằng cách sử dụng Amazon cơ khí Turk (có sẵn trực tuyến tại thời điểm công bố.
đang được dịch, vui lòng đợi..
