3.4 Experimental evaluations on spe

3.4 Experimental evaluations on speaker recognition
Experiments were performed on the TIMIT database (Garofolo et al., 1993), down sampled
to 8 kHz. Hundred speakers (consisting of 64 male and 36 female) from the test subset were
selected in an alphabetical order. The training data for each speaker comprised of eight
sentences (’si’ and ‘sx’). The testing was performed using two (‘sa’) sentences corrupted by
Gaussian white noise and Subway noise from the Aurora 2 database, at global SNRs equal
to 20, 15, 10, and 5 dB, respectively. The speech feature representation was the same as used
in the speech recognition experiments in the previous section. The speaker recognition
system was based on Gaussian mixture model (GMM) with 32 mixture-components for each
speaker, which was constructed using the HTK software (Young et al., 1999). The GMM for

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

3.4 nghiệm đánh giá về loa công nhận Thí nghiệm đã được thực hiện trên cơ sở dữ liệu TIMIT (Garofolo et al., 1993), xuống lấy mẫu đến 8 kHz. Trăm loa (bao gồm 64 Nam và 36 nữ) từ tập hợp bài kiểm tra lựa chọn theo một thứ tự chữ cái. Dữ liệu đào tạo cho mỗi loa bao gồm tám câu ('si' và 'sx'). Các thử nghiệm đã được thực hiện bằng cách sử dụng hai ('sa') câu bị hỏng bởi Gaussian trắng tiếng ồn và tiếng ồn tàu điện ngầm từ cơ sở dữ liệu Aurora 2, tại toàn cầu SNRs bằng 20, 15, 10 và 5 dB, tương ứng. Đại diện các tính năng giọng nói là giống như sử dụng trong các thí nghiệm nhận dạng giọng nói trong phần trước. Nhận dạng loa Hệ thống dựa trên mô hình hỗn hợp Gaussian (GMM) với hỗn hợp 32-các thành phần cho mỗi loa, mà đã được xây dựng bằng cách sử dụng phần mềm HTK (Young và ctv., 1999). GMM cho

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

3.4 đánh giá thực nghiệm về công nhận loa
Các thí nghiệm được thực hiện trên cơ sở dữ liệu TIMIT (Garofolo et al., 1993), xuống lấy mẫu
8 kHz. Trăm loa (gồm 64 nam và 36 nữ) từ các tập con thử nghiệm đã được
chọn trong một thứ tự chữ cái. Dữ liệu huấn luyện cho mỗi loa bao gồm tám
câu ( 'si' và 'sx'). Các thử nghiệm được thực hiện bằng hai ( 'sa') câu hỏng bởi
tiếng ồn trắng Gaussian và tiếng ồn điện ngầm từ cơ sở dữ liệu Aurora 2, tại SNRs toàn cầu bằng
20, 15, 10, và 5 dB, tương ứng. Các đại diện tính năng nói là giống như được sử dụng
trong các thí nghiệm nhận dạng giọng nói trong phần trước. Việc công nhận loa
hệ thống được dựa trên mô hình Gaussian hỗn hợp (GMM) với 32 hỗn hợp phần cho mỗi
loa, được xây dựng bằng cách sử dụng phần mềm HTK (Young et al., 1999). Các GMM cho

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.