3.1 âm thanh mô tả cơ sở dữ liệu trực quan
Cơ sở dữ liệu nghe nhìn liên tục chữ số đã được ghi nhận với các kịch bản từ các
cơ sở dữ liệu AURORA 2.0 (Hirsch & Pearce 2000), trong đó có chuỗi chữ số từ
điện thoại quay số. Mỗi chuỗi có chứa một vài chữ số từ các bộ chữ số {không, một, ...,
chín, oh}. 22 đơn vị điện thoại thu được bằng cách sao chép các chữ số thiết lập với các TIMIT
từ điển. 100 câu nghe nhìn sạch đã được chọn là tập huấn luyện, và một
50 câu nghe nhìn như kiểm tra bộ. Tiếng ồn trắng với tín hiệu để tiếng ồn tỷ lệ (SNR) khác nhau,
từ 0dB đến 30dB đã được thêm vào để có được tiếng nói ồn ào.
đang được dịch, vui lòng đợi..
