(A) Acoustic tính năng trích xuất: Các tính năng âm thanh ưa thích làm việc trong thiếu dữ liệu
nhận dạng giọng nói dựa trên những thể hiện phổ chứ không phải là phổ biến hơn mel-
tần số Cepstral hệ số (MFCCs). Điều này là do thực tế là một mặt nạ quang phổ
có chứa thông tin bản địa hóa về độ tin cậy của mỗi thành phần quang phổ, một khái niệm
không tương thích với các tính năng orthogonalized, chẳng hạn như hệ số Cepstral (xem thêm de veth
et al. (2001) cho một cuộc thảo luận thêm). Đối với phạm vi của nghiên cứu này, phổ chiết xuất
tính năng cho thiếu nhận dữ liệu theo sau việc thực hiện tính năng FBANK của
chấp nhận rộng rãi Toolkit Hidden Markov Model (trẻ et al., 2006).
đang được dịch, vui lòng đợi..