(O’Shaughnessy & Tolba, 1999) divided phoneme-based models of speech i dịch - (O’Shaughnessy & Tolba, 1999) divided phoneme-based models of speech i Việt làm thế nào để nói

(O’Shaughnessy & Tolba, 1999) divid

(O’Shaughnessy & Tolba, 1999) divided phoneme-based models of speech into a subset of
voiced and unvoiced models and used this division to restrict the Viterbi search during the
recognition. The effect of such division of models itself was not presented. In (Jančovič &
Ming, 2002) an HMM model was estimated based only on high-energy frames, which
effectively corresponds to the voiced speech. This was observed to improve the performance
in noisy conditions. The incorporation of the voicing information we present here differs
from the above works in the following: i) the voicing information employed is estimated by
a novel method that can provide this information for each filter-bank channel, while
requiring no information about the F0; ii) the voicing-information is incorporated within an
HMM-based statistical framework in the back-end of the ASR system; iii) the evaluation is
performed on noisy speech recognition. In the proposed model, having the trained HMMs,
with each mixture at each HMM state is associated a voicing-probability, which is estimated
by a separate Viterbi-style training procedure (without altering the trained HMMs). The
incorporation of the voicing-probability serves as a penalty during recognition for those
mixtures/states whose voicing information does not correspond to the voicing information
of the signal. The incorporation of the voicing information is evaluated in a standard model
and in a missing-feature model that had compensated for the effect of noise. Experiments
are performed on the Aurora 2 database. Experimental results show significant
improvements in recognition performance in strong noisy conditions obtained by the
models incorporating the voicing information.
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
(O'Shaughnessy & Tolba, 1999) chia một tập hợp con của âm vị dựa trên mô hình của bài phát biểu lồng tiếng và unvoiced mô hình và sử dụng phân này để hạn chế việc tìm Viterbi trong các công nhận. Tác dụng của bộ phận của mô hình chính nó không được trình bày. Trong (Jančovič & Minh, 2002) một mô hình HMM ước tính chỉ dựa trên khung năng lượng cao, mà có hiệu quả tương ứng với các bài phát biểu lồng tiếng. Điều này quan sát để cải thiện hiệu suất trong điều kiện ồn ào. Sự kết hợp của lồng tiếng thông tin chúng tôi trình bày ở đây khác với từ trên hoạt động trong những điều sau đây: i) các thông tin lồng tiếng làm việc được ước tính bằng một phương pháp mới lạ mà có thể cung cấp thông tin này cho mỗi kênh ngân hàng bộ lọc, trong khi đòi hỏi phải có thông tin về F0; II) lồng tiếng-thông tin được tích hợp trong vòng một HMM dựa trên khuôn khổ thống kê trong back-end của hệ thống ASR; III) việc đánh giá là phẫu thuật nhận dạng giọng nói ồn ào. Trong mô hình được đề xuất, có HMMs được đào tạo, với mỗi hỗn hợp tại HMM mỗi nhà nước là liên quan đến một lồng tiếng-xác suất, đó ước tính bởi một riêng biệt Viterbi-phong cách đào tạo quy trình (mà không thay đổi HMMs được đào tạo). Các kết hợp khả năng lồng tiếng phục vụ như là một hình phạt trong sự công nhận cho những người thông tin lồng tiếng mà không tương ứng với các thông tin lồng tiếng hỗn hợp/tiểu bang của tín hiệu. Sự kết hợp của lồng tiếng thông tin được đánh giá trong một mô hình chuẩn và trong một mô hình thiếu tính năng đó có đền bù cho ảnh hưởng của tiếng ồn. Thí nghiệm được thực hiện trên cơ sở dữ liệu Aurora 2. Kết quả thử nghiệm cho thấy quan trọng những cải tiến về công nhận hoạt động trong điều kiện ồn ào mạnh thu được bằng các Mô hình kết hợp các thông tin lồng tiếng.
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
(O'Shaughnessy & Tolba, 1999) mô hình âm vị dựa trên chia của bài phát biểu vào một tập hợp con của
mô hình lên tiếng và phát âm không được sử dụng và phân chia này để hạn chế việc tìm kiếm Viterbi trong
công nhận. Hiệu quả của việc phân chia như vậy của các mô hình chính nó đã không được trình bày. Trong (Jančovič &
Ming, 2002) là một mô hình HMM được ước tính chỉ dựa trên khung năng lượng cao, trong đó
có hiệu quả tương ứng với các bài phát biểu lên tiếng. Điều này đã được quan sát thấy để cải thiện hiệu suất
trong điều kiện ồn ào. Việc đưa thông tin lên tiếng, chúng tôi trình bày ở đây khác
từ các công trình nêu trên trong những điều sau đây: i) các thông tin bày tỏ việc làm được ước tính bằng
một phương pháp mới có thể cung cấp thông tin này cho mỗi kênh lọc ngân hàng, trong khi
đòi hỏi không có thông tin về F0; ii) thì giọng nói-thông tin được kết hợp trong một
hệ thống thống kê HMM-trụ sở tại phía sau của hệ thống ASR; iii) đánh giá được
thực hiện trên nhận dạng giọng nói ồn ào. Trong mô hình đề xuất, có HMMs đào tạo,
với mỗi hỗn hợp ở mỗi tiểu bang HMM được kết hợp một lồng tiếng xác suất, đó là ước tính
của một thủ tục đào tạo Viterbi phong cách riêng biệt (mà không thay đổi HMMs được đào tạo). Việc
kết hợp thì giọng nói xác suất phục vụ như là một quả phạt đền trong sự công nhận cho những
hỗn hợp / tiểu bang có thông tin bày tỏ không tương ứng với các thông tin lồng tiếng
của các tín hiệu. Việc đưa thông tin lên tiếng được đánh giá trong một mô hình chuẩn
và trong một mô hình còn thiếu tính năng để đã bù đắp cho sự ảnh hưởng của tiếng ồn. Các thí nghiệm
được thực hiện trên cơ sở dữ liệu Aurora 2. Kết quả thử nghiệm cho thấy đáng kể
cải thiện hiệu suất công nhận trong điều kiện ồn ào mạnh thu được từ các
mô hình kết hợp các thông tin bày tỏ.
đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2024 I Love Translation. All reserved.

E-mail: