Tên là Entity Recognition (NER), một nhiệm vụ khai thác thông tin, thường được áp dụng cho các tài liệu văn nói của tầng một vốn từ vựng lớn recognizer bài phát biểu liên tục (LVCSR) và một thực thể tagger tên. Nhận thức được thực thể có tên trong bài phát biểu matically việc tự động giải mã là dif fi giáo phái kể từ khi lỗi LVCSR có thể gây nhầm lẫn cho tagger. Điều này đặc biệt đúng với (OOV) từ out-of-từ vựng, mà là các đơn vị thường được đặt tên và luôn luôn ducetranscriptionerrors trình. Inthiswork, weimprovespeechNER bằng cách bao gồm các tính năng chỉ định của OOVs dựa trên một OOV triển tector, cho phép các fi cation identi của khu vực ngôn luận con- taining tên thực thể, ngay cả khi họ đang sao chép không chính xác. Chúng tôi xây dựng một tập hợp dữ liệu bài phát biểu NER mới và chứng minh cải tiến fi không thể ni hãng Sigma cho nhiệm vụ này.
đang được dịch, vui lòng đợi..
