The frequency-filtered logarithm filter-bank energies (FF-logFBEs) (Na dịch - The frequency-filtered logarithm filter-bank energies (FF-logFBEs) (Na Việt làm thế nào để nói

The frequency-filtered logarithm fi

The frequency-filtered logarithm filter-bank energies (FF-logFBEs) (Nadeu et al., 2001) were
used as speech feature representation, due to their suitability for MFT-based recognition as
discussed earlier. Note that the FF-logFBEs achieve similar performance (in average) as
standard MFCCs. The FF-logFBEs were obtained with the following parameter set-up:
frames of 32 ms length with a shift of 10 ms between frames were used; both preemphasis
and Hamming window were applied to each frame; the short-time magnitude spectra,
obtained by applying the FFT, was passed to Mel-spaced filter-bank analysis with 20
channels; the obtained logarithm filter-bank energies were filtered by using the filter H(z)=z-
z-1. A feature vector consisting of 18 elements was obtained (the edge values were excluded).
In order to include dynamic spectral information, the first-order delta parameters were
added to the static FF-feature vector.
The HMMs were trained following the procedures distributed with the Aurora 2 database.
Each digit was modelled by a continuous-observation left-to-right HMM with 16 states (no
skip allowed) and three Gaussian mixture components with diagonal covariance matrices
for each state. During recognition, the MFT-based system marginalised static features
according to the mask employed, and used all the delta features.
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
Đã các nguồn năng lượng tinh lọc lọc tần số logarit (FF-logFBEs) (Nadeu và ctv., 2001) được sử dụng như đại diện tính năng speech, do sự phù hợp của MFT dựa trên sự công nhận như là thảo luận trước đó. Lưu ý rằng FF-logFBEs đạt được hiệu quả tương tự (trong trung bình) là tiêu chuẩn MFCCs. FF-logFBEs đã thu được với các thiết lập thông số sau đây: khung hình của 32 ms chiều dài với một sự thay đổi của 10 ms giữa khung đã được sử dụng; preemphasis cả và cửa sổ Hamming đã được áp dụng cho mỗi khung; phổ độ lớn thời gian ngắn, thu được bằng cách áp dụng FFT, là thông qua Mel khoảng cách lọc-ngân hàng phân tích với 20 Kênh; Các nguồn năng lượng lọc-ngân hàng thu được logarit được lọc bằng cách sử dụng các bộ lọc H (z) = z -z-1. Một tính năng vector bao gồm 18 yếu tố nhận được (edge giá trị đã bị loại trừ). Để bao gồm thông tin quang phổ năng động, các tham số thứ tự đầu tiên delta đã Thêm vào FF-tính năng vector tĩnh. Các HMMs đã được đào tạo theo các thủ tục phân phối với Aurora 2 cơ sở dữ liệu. Mỗi chữ số được mô hình bởi một HMM trái-sang-phải liên tục quan sát với 16 bang (no bỏ qua cho phép) và ba thành phần Gauss hỗn hợp với ma trận hiệp phương sai đường chéo cho mỗi tiểu bang. Trong sự công nhận, các hệ thống dựa trên MFT lề tính năng tĩnh theo mặt nạ làm việc, và sử dụng tất cả các tính năng của delta.
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
Lôgarit năng lượng tần số lọc lọc ngân hàng (FF-logFBEs) (Nadeu et al., 2001) đã được
sử dụng như là đại diện tính năng giọng nói, do phù hợp của họ đối với công nhận MFT dựa trên như
đã thảo luận trước đó. Lưu ý rằng các FF-logFBEs đạt được hiệu suất tương tự (trung bình) là
MFCCs chuẩn. FF-logFBEs đã thu được với các thông số sau thiết lập:
khung 32 ms thời với sự thay đổi của 10 ms giữa các khung đã được sử dụng; cả preemphasis
và cửa sổ Hamming được áp dụng cho mỗi khung hình; phổ độ lớn trong thời gian ngắn,
thu được bằng cách áp dụng FFT, đã được thông qua để phân tích bộ lọc ngân hàng Mel-khoảng cách với 20
kênh; logarit năng lọc ngân hàng thu được đã được lọc bằng cách sử dụng các bộ lọc H (z) = z-
z-1. Một vector đặc trưng bao gồm 18 yếu tố thu được (các giá trị cạnh bị loại bỏ).
Để có thông tin về quang năng động, các thông số tam giác đầu tiên đặt hàng được
thêm vào tĩnh vector FF-năng.
Các HMMs được đào tạo theo các thủ tục được phân phối với cơ sở dữ liệu Aurora 2.
mỗi chữ số được mô hình hóa bởi một liên tục quan sát HMM trái sang phải với 16 tiểu bang (không
bỏ qua cho phép) và ba thành phần hỗn hợp Gaussian với ma trận hiệp phương sai chéo
cho mỗi tiểu bang. Trong công nhận, hệ thống MFT dựa trên thiệt thòi tính năng tĩnh
theo mặt nạ sử dụng, và sử dụng tất cả các tính năng đồng bằng.
đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2024 I Love Translation. All reserved.

E-mail: