In recent years, it was an active r

In recent years, it was an active research topic to adopt Dynamic Bayesian Network (DBN)
for speech recognition (Bilmes, 2002; Murphy, 2002; Zweig, 1998). DBN model is a statistic
model that can represent multiple collections of random variables as they evolve over time.
It is appropriate to describe complex variables and conditional relationship among the
variables, since it can automatically learn the conditional probability distribution among the
variables, with better extensible performance. Bilmes, Zweig et al, used single stream DBN
model for isolated words and small vocabulary speech recognition (Bilmes et al, 2001; Lv et
al, 2007). Zhang YM proposed a multi-stream DBN model for speech recognition by
combining different audio features (MFCC, PLP, RASTA) (Zhang et al, 2003), although the
model described the asynchrony of audio and visual streams by sharing the same word
node, while in fact, there are not asynchrony for different audio features from the same
voice. N. Gowdy expanded this model for audio-visual speech recognition (Gowdy et al,
2003), an improvement was obtained in word accuracy, while between the word nodes, and
each stream is not complete independence, which affected the asynchrony of both streams to
some extent. Bimes proposed a general multi-stream asynchrony DBN model structure
(Bilmes & Bartels, 2005), in this model, the word transition probability is determined by the
state transitions and the state positions both in the audio stream and in the visual stream.

In recent years, it was an active research topic to adopt Dynamic Bayesian Network (DBN) 
for speech recognition (Bilmes, 2002; Murphy, 2002; Zweig, 1998). DBN model is a statistic 
model that can represent multiple collections of random variables as they evolve over time. 
It is appropriate to describe complex variables and conditional relationship among the 
variables, since it can automatically learn the conditional probability distribution among the 
variables, with better extensible performance. Bilmes, Zweig et al, used single stream DBN 
model for isolated words and small vocabulary speech recognition (Bilmes et al, 2001; Lv et 
al, 2007). Zhang YM proposed a multi-stream DBN model for speech recognition by 
combining different audio features (MFCC, PLP, RASTA) (Zhang et al, 2003), although the 
model described the asynchrony of audio and visual streams by sharing the same word 
node, while in fact, there are not asynchrony for different audio features from the same 
voice. N. Gowdy expanded this model for audio-visual speech recognition (Gowdy et al, 
2003), an improvement was obtained in word accuracy, while between the word nodes, and 
each stream is not complete independence, which affected the asynchrony of both streams to 
some extent. Bimes proposed a general multi-stream asynchrony DBN model structure 
(Bilmes & Bartels, 2005), in this model, the word transition probability is determined by the 
state transitions and the state positions both in the audio stream and in the visual stream.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Những năm gần đây, nó đã là một chủ đề hoạt động nghiên cứu để áp dụng năng động mạng Bayes (DBN) nhận dạng tiếng nói (Bilmes, 2002; Murphy, 2002; Zweig, 1998). DBN mô hình là một thống kê Mô hình có thể đại diện cho các bộ sưu tập nhiều biến ngẫu nhiên khi họ tiến triển theo thời gian. Nó là thích hợp để mô tả các biến phức tạp và có điều kiện mối quan hệ giữa các biến, kể từ khi nó có thể tự động tìm hiểu các phân phối xác suất có điều kiện giữa các biến, với hiệu suất tốt hơn mở rộng. Bilmes, Zweig et al, sử dụng đơn dòng DBN Các mô hình từ bị cô lập và nhận dạng tiếng nói nhỏ từ vựng (Bilmes et al, 2001; LV et Al, năm 2007). Zhang YM đề xuất một mô hình DBN đa dòng cho nhận dạng giọng nói bằng kết hợp các tính năng âm thanh khác nhau (MFCC, PLP, RASTA) (trương et al, 2003), mặc dù các Mô hình mô tả asynchrony dòng suối âm thanh và thị giác bằng cách chia sẻ cùng một từ nút, trong khi trong thực tế, không có asynchrony cho các tính năng âm thanh khác nhau từ cùng một giọng nói. N. Gowdy mở rộng mô hình này cho nhận dạng giọng nói nghe nhìn (Gowdy et al, năm 2003), một sự cải tiến đã được thu được trong chữ chính xác, trong khi giữa nút chữ, và mỗi dòng không phải là hoàn toàn độc lập, làm ảnh hưởng đến asynchrony cả hai dòng suối để một số phạm vi. Bimes đề xuất một cấu trúc mô hình tổng hợp nhiều dòng asynchrony DBN (Bilmes & Bartels, 2005), trong mô hình này, từ quá trình chuyển đổi xác suất được xác định bởi các quá trình chuyển đổi của nhà nước và các vị trí nhà nước trong cả dòng suối âm thanh và hình ảnh dòng.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Trong những năm gần đây, đó là một chủ đề nghiên cứu hoạt động thông qua động Bayesian Network (DBN)
cho nhận dạng giọng nói (Bilmes, 2002; Murphy, 2002; Zweig, 1998). DBN mô hình là một thống kê
mô hình có thể đại diện cho nhiều bộ sưu tập của các biến ngẫu nhiên khi họ phát triển theo thời gian.
Đó là thích hợp để mô tả các biến phức tạp và mối quan hệ có điều kiện giữa các
biến, vì nó có thể tự động tìm hiểu các phân bố xác suất có điều kiện giữa các
biến, với mở rộng tốt hơn hiệu suất. Bilmes, Zweig et al, được sử dụng DBN dòng duy nhất
mô hình cho những lời cô lập và từ vựng nhỏ nhận dạng giọng nói (Bilmes et al, 2001; Lv et
al, 2007). Zhang YM đề xuất một mô hình DBN đa luồng cho nhận dạng giọng nói bằng cách
kết hợp các tính năng âm thanh khác nhau (MFCC, PLP, RASTA) (Zhang et al, 2003), mặc dù các
mô hình mô tả sự không đồng bộ của các dòng âm thanh và hình ảnh bằng cách chia sẻ cùng một từ
nút, trong khi trên thực tế, không có sự không đồng bộ cho các tính năng âm thanh khác nhau từ cùng một
giọng nói. N. Gowdy mở rộng mô hình này để nhận dạng giọng nói nghe nhìn (Gowdy et al,
2003), một sự cải tiến đã đạt được trong độ chính xác từ, trong khi giữa các nút từ, và
mỗi dòng không phải là hoàn toàn độc lập, làm ảnh hưởng đến sự không đồng bộ của cả hai dòng để
một mức độ nào. Bimes đề xuất một đa luồng mô hình cấu trúc không đồng bộ của DBN chung
(Bilmes & Bartels, 2005), trong mô hình này, từ xác suất chuyển được xác định bởi các
chuyển trạng thái và vị trí nhà nước cả trong dòng âm thanh và trong dòng thị giác.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.