The third part of the chapter prese

The third part of the chapter presents an incorporation of the spectral voicing information to
improve speech signal modelling. Up to date, the spectral voicing information of speech has
been mainly exploited in the context of speech coding and speech synthesis research. In
speech/speaker recognition research, the authors in (Thomson & Chengalvarayan, 2002;
Ljolje, 2002; Kitaoka et al., 2002; Zolnay et al., 2003; Graciarena et al., 2004) investigated the use of various measures for estimating the voicing-level of an entire speech frame and
appended these voicing features into the feature representation. In addition to voicing
features, the information on F0 was employed in (Ljolje, 2002; Kitaoka et al., 2002). In
(Thomson & Chengalvarayan, 2002), the effect of including the voicing features under
various training procedures was also studied. Experiments in the above papers were
performed only on speech signals not corrupted by an additional noise and modest
improvements have been reported. In (Jackson et al., 2003), the voicing information was
included by decomposing speech signal into simultaneous periodic and aperiodic streams
and weighting the contribution of each stream during the recognition. This method requires
information about the fundamental frequency. Significant improvements on noisy speech
recognition on Aurora 2 connected-digit database have been demonstrated, however, these
results were achieved by using the F0 estimated from the clean speech. The authors in

The third part of the chapter presents an incorporation of the spectral voicing information to 
improve speech signal modelling. Up to date, the spectral voicing information of speech has 
been mainly exploited in the context of speech coding and speech synthesis research. In 
speech/speaker recognition research, the authors in (Thomson & Chengalvarayan, 2002; 
Ljolje, 2002; Kitaoka et al., 2002; Zolnay et al., 2003; Graciarena et al., 2004) investigated the use of various measures for estimating the voicing-level of an entire speech frame and 
appended these voicing features into the feature representation. In addition to voicing 
features, the information on F0 was employed in (Ljolje, 2002; Kitaoka et al., 2002). In 
(Thomson & Chengalvarayan, 2002), the effect of including the voicing features under 
various training procedures was also studied. Experiments in the above papers were 
performed only on speech signals not corrupted by an additional noise and modest 
improvements have been reported. In (Jackson et al., 2003), the voicing information was 
included by decomposing speech signal into simultaneous periodic and aperiodic streams 
and weighting the contribution of each stream during the recognition. This method requires 
information about the fundamental frequency. Significant improvements on noisy speech 
recognition on Aurora 2 connected-digit database have been demonstrated, however, these 
results were achieved by using the F0 estimated from the clean speech. The authors in

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Phần thứ ba của chương trình bày một kết hợp những thông tin quang phổ lồng tiếng cải thiện phát biểu tín hiệu mô hình. Đến nay, thông tin quang phổ lồng tiếng của bài phát biểu có được chủ yếu là khai thác trong bối cảnh của bài phát biểu tổng hợp nghiên cứu và mã hóa giọng nói. Ở bài diễn văn/loa công nhận nghiên cứu, các tác giả (Thomson & Chengalvarayan, 2002; Ljolje, 2002; Kitaoka et al., 2002; Zolnay et al., 2003; Graciarena et al, 2004) điều tra việc sử dụng các biện pháp khác nhau để ước tính mức lồng tiếng của một bài phát biểu toàn bộ khung và nối thêm các tính năng lồng tiếng vào đại diện tính năng. Ngoài lồng tiếng tính năng, thông tin về F0 được sử dụng trong (Ljolje, 2002; Kitaoka et al., 2002). Ở (Thomson & Chengalvarayan, 2002), có hiệu lực bao gồm cả lồng tiếng tính năng dưới quy trình đào tạo khác nhau cũng được nghiên cứu. Các thí nghiệm trong các giấy tờ nêu trên thực hiện chỉ trên các tín hiệu phát biểu không bị hỏng bởi một tiếng ồn bổ sung và khiêm tốn cải tiến đã được báo cáo. Ở (Jackson et al., 2003), thông tin lồng tiếng bao gồm phân hủy phát biểu tín hiệu vào đồng thời định kỳ và aperiodic dòng và hệ số đóng góp của mỗi dòng trong sự công nhận. Phương pháp này đòi hỏi thông tin về tần suất cơ bản. Các cải tiến đáng kể trên ồn ào phát biểu sự công nhận trên Aurora 2 chữ số kết nối cơ sở dữ liệu đã được chứng minh, Tuy nhiên, những kết quả đã đạt được bằng cách sử dụng F0 ước tính từ các bài phát biểu sạch. Các tác giả theo

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Phần thứ ba của chương trình bày một kết hợp của các quang phổ bày tỏ thông tin để
cải thiện mô hình tín hiệu tiếng nói. Đến nay, các thông tin lên tiếng phổ của bài phát biểu đã
được khai thác chủ yếu trong bối cảnh của mã hóa ngôn luận và nghiên cứu tổng hợp giọng nói. Trong
nghiên cứu nói / công nhận loa, các tác giả trong (Thomson & Chengalvarayan, 2002;
Ljolje, 2002;. Kitaoka et al, 2002; Zolnay et al, 2003;.. Graciarena et al, 2004) đã nghiên cứu việc sử dụng các biện pháp khác nhau để ước lượng sự bày tỏ cấp của toàn bộ một khung tiếng nói và
nối thêm các tính năng lồng tiếng vào các đại diện tính năng. Ngoài lồng tiếng cho
các tính năng, các thông tin về F0 được sử dụng trong (Ljolje, 2002; Kitaoka et al., 2002). Trong
(Thomson & Chengalvarayan, 2002), tác dụng của bao gồm các tính năng bày tỏ dưới
quy trình đào tạo khác nhau cũng đã được nghiên cứu. Các thí nghiệm trong các giấy tờ nêu trên được
thực hiện chỉ trên tín hiệu phát biểu không bị hỏng bởi một tiếng ồn bổ sung và khiêm tốn
cải tiến đã được báo cáo. Trong (Jackson et al., 2003), các thông tin nói lên được
tính bằng cách phân hủy tín hiệu tiếng nói vào dòng tuần hoàn và không tuần hoàn đồng thời
và nặng từ sự đóng góp của mỗi dòng trong việc công nhận. Phương pháp này đòi hỏi
thông tin về tần số cơ bản. Cải tiến đáng kể về ngôn luận ồn ào
công nhận trên cơ sở dữ liệu Aurora 2 kết nối chữ số đã được chứng minh, tuy nhiên, những
kết quả đã đạt được bằng cách sử dụng các F0 ước tính từ các bài phát biểu sạch. Các tác giả trong

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.