Statistical and grammatical units a

Statistical and grammatical units are used as the sub-word approaches in the Finnish,
Estonian and Turkish LVCSR experiments. For language model training in Finnish and
Estonian experiments we used the growing n-gram training algorithm (Siivola & Pellom,
2005). In this algorithm, the n-grams that increase the training set likelihood enough with
respect to the corresponding increase in the model size are accepted into the model (as in the
MDL principle). After the growing process the model is further pruned with entropy based
pruning. The method allows us to train compact and properly smoothed models using high
order n-grams, since only the necessary high-order statistics are collected and stored (Siivola
et al., 2007). Using the variable order n-grams we can also effectively control the size of the
models to make all compared language models equally large. In this way the n-grams using
shorter units do not suffer from a restricted span length which is the case when only 3-
grams or 4-grams are available. For language model training in Turkish, n-gram language
models were built with SRILM toolkit (Stolcke, 2002).

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Đơn vị thống kê và ngữ pháp được sử dụng như là phương pháp tiếp cận Phó từ trong tiếng Phần Lan,Thí nghiệm tiếng Estonia và LVCSR Thổ Nhĩ Kỳ. Cho ngôn ngữ mô hình đào tạo tại Phần Lan vàEstonia thí nghiệm chúng tôi sử dụng các thuật toán n-gam đào tạo ngày càng tăng (Siivola & Pellom,Năm 2005). trong thuật toán này, n-gam tăng việc đào tạo thiết lập khả năng đủ vớiĐối với sự gia tăng tương ứng trong kích thước mô hình được chấp nhận vào các mô hình (như trong cácNguyên tắc MDL). Sau khi quá trình phát triển mô hình thêm bớt với entropy dựacắt tỉa. Phương pháp này cho phép chúng tôi để đào tạo các mô hình nhỏ gọn và smoothed đúng cách sử dụng caoThứ tự n-gam, kể từ khi chỉ là những thống kê đặt hàng cao cần thiết được thu thập và lưu trữ (Siivolaet al., 2007). Bằng cách sử dụng các biến thứ tự n-gam chúng tôi cũng có hiệu quả có thể kiểm soát kích thước của cácCác mô hình để làm cho tất cả các mô hình ngôn ngữ so sánh bằng nhau lớn. Bằng cách này, n-gam bằng cách sử dụngngắn hơn các đơn vị không bị giới hạn chiều dài sải đó là trường hợp khi chỉ 3-gam hoặc 4 gram có sẵn. Cho ngôn ngữ mô hình đào tạo trong ngôn ngữ Thổ Nhĩ Kỳ, n-gamMô hình được xây dựng với bộ công cụ SRILM (Stolcke, 2002).

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Các đơn vị thống kê và ngữ pháp được sử dụng như là chữ tiểu phương pháp tiếp cận trong tiếng Phần Lan,
thí nghiệm LVCSR Estonia và Thổ Nhĩ Kỳ. Đối với đào tạo mô hình ngôn ngữ tiếng Phần Lan và
các thí nghiệm Estonia chúng tôi sử dụng các thuật toán huấn luyện n-gram phát triển (Siivola & Pellom,
2005). Trong thuật toán này, các n-gram làm tăng khả năng tập huấn luyện đủ với
đối với sự gia tăng tương ứng trong các kích thước mô hình được chấp nhận vào các mô hình (như trong các
nguyên tắc MDL). Sau khi quá trình phát triển các mô hình tiếp tục được cắt tỉa với entropy dựa
tỉa. Phương pháp này cho phép chúng tôi để đào tạo mô hình nhỏ gọn và vuốt đúng cách sử dụng cao
để n-gram, vì chỉ có số liệu thống kê bậc cao cần thiết được thu thập và lưu trữ (Siivola
et al., 2007). Sử dụng để biến n-gram, chúng tôi cũng có thể kiểm soát hiệu quả các kích thước của các
mô hình để làm cho tất cả các mô hình ngôn ngữ so sánh đồng đều lớn. Bằng cách này, các n-gram sử dụng
đơn vị ngắn hơn không bị một chiều dài khoảng giới hạn đó là trường hợp khi chỉ có 3
gam hoặc 4-gram có sẵn. Đối với đào tạo mô hình ngôn ngữ trong ngôn ngữ Thổ Nhĩ Kỳ, n-gram
mô hình được xây dựng với bộ công cụ SRILM (Stolcke, 2002).

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.