Multi-Stream hidden Markov model (MSHMM) was a popular method within a dịch - Multi-Stream hidden Markov model (MSHMM) was a popular method within a Việt làm thế nào để nói

Multi-Stream hidden Markov model (M

Multi-Stream hidden Markov model (MSHMM) was a popular method within audio-visual
model fusion framework. The MSHMM linearly combines the class log-likelihoods based on
the audio-only and video-only observations at a number of possible stages (such as state,
phone et al). In early most cases, the synchronous point of audio stream and visual stream is
at the HMM state level, and we name it State Synchronous MSHMM (SS-MSHMM). To take
asynchrony of audio and visual stream into account, the synchronous point should be taken
to a coarser level, such as phone, syllable, or word level. However, on one hand, for middle
and large vocabulary speech recognition, the phone recognition unit must be used; on the
other hand, to implement easily, previous popular works often use the state asynchrony
multi-stream HMM (SA-MSHMM) (Gravier, 2002; Nefian et al, 2002), and the synchronous
points are taken to the phonemic boundaries. Because of the limitation of HMM expression
ability, such a model can be implemented as a product HMM (PHMM), as illustrated in Fig.
1. Typically, SA-MSHMM with four audio and four video HMM states is given in Fig. 1 (a),
and its corresponding product HMM is given in Fig. 1(b).
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
Mô hình Markov ẩn nhiều dòng (MSHMM) là một phương pháp phổ biến trong nghe Mô hình kết hợp khung. MSHMM linearly kết hợp các lớp đăng nhập-likelihoods dựa trên quan sát chỉ có âm thanh và video-chỉ có tại một số giai đoạn có thể (như nhà nước, điện thoại et al). Trong hầu hết trường hợp đầu, đồng bộ của dòng suối âm thanh và hình ảnh dòng là tại HMM cấp tiểu bang, và chúng tôi tên là trạng thái đồng bộ MSHMM (SS-MSHMM). Để có asynchrony của dòng âm thanh và hình ảnh vào tài khoản, đồng bộ điểm cần được thực hiện đến một mức độ thô, chẳng hạn như điện thoại, âm tiết, hoặc từ cấp độ. Tuy nhiên, một mặt, cho Trung và nhận dạng tiếng nói lớn từ vựng, các đơn vị nhận dạng điện thoại phải được sử dụng; trên các mặt khác, để thực hiện một cách dễ dàng, trước tác phẩm phổ biến thường sử dụng nhà nước asynchrony nhiều dòng HMM (SA-MSHMM) (Gravier, 2002; Nefian et al, 2002), và sự đồng bộ điểm được đưa đến ranh giới âm. Vì hạn chế biểu hiện HMM khả năng, một mô hình có thể được thực hiện như một sản phẩm HMM (PHMM), như minh họa trong hình. 1. thông thường, SA-MSHMM với bốn âm thanh và bốn tiểu bang HMM video được đưa ra trong hình 1 (một), và sản phẩm tương ứng HMM được đưa ra trong hình 1(b).
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
Multi-Suối ẩn mô hình Markov (MSHMM) là một phương pháp phổ biến trong phạm vi nghe nhìn
khuôn khổ mô hình hợp nhất. Các MSHMM tuyến tính kết hợp các lớp đăng nhập các khả năng dựa trên
các quan sát chỉ có âm thanh và video chỉ ở một số giai đoạn có thể (chẳng hạn như nhà nước,
điện thoại và cộng sự). Vào đầu năm hầu hết trường hợp, các điểm đồng bộ của dòng âm thanh và hình ảnh là dòng suối
ở cấp tiểu bang HMM, và chúng tôi đặt tên là Nhà nước đồng bộ MSHMM (SS-MSHMM). Chịu
sự không đồng bộ của dòng âm thanh và hình ảnh vào tài khoản, các điểm đồng bộ nên được đưa
đến một mức độ thô hơn, chẳng hạn như điện thoại, âm tiết, hoặc cấp từ. Tuy nhiên, một mặt, cho trung
và lớn nhận dạng giọng nói từ vựng, bộ phận nhận dạng điện thoại phải được sử dụng; trên
Mặt khác, để thực hiện một cách dễ dàng, tác phẩm nổi tiếng trước đó thường sử dụng không đồng bộ của nhà nước
đa luồng HMM (SA-MSHMM) (Gravier, 2002; Nefian et al, 2002), và đồng bộ
các điểm được đưa đến ranh giới âm vị. Do giới hạn của biểu HMM
khả năng, một mô hình như vậy có thể được thực hiện như một HMM sản phẩm (PHMM), như minh họa trong hình.
1. Thông thường, SA-MSHMM bốn trạng thái HMM âm thanh và bốn video được đưa ra trong hình. 1 (a),
và HMM sản phẩm tương ứng của nó được đưa ra trong hình. 1 (b).
đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2024 I Love Translation. All reserved.

E-mail: