We will define segment2, which diff

We will define segment2, which differs from segment in three ways: first, it uses a conditional
bigram language model, cPw, rather than the unigram model Pw. Second, the function
signature is different. Instead of being passed a single argument (the text), segment2 is
also passed the previous word. At the start of the sentence, the previous word is the special
beginning-of-sentence marker, . The return value is not just a list of words, but
rather a pair of values: the probability of the segmentation, followed by the list of words.
We return the probability so that it can be stored (by memo) and need not be recomputed;
this fixes problem (1), the inefficiency. The function combine takes four inputs—the first
word and the remaining words, plus their probabilities—and combines them by appending
the first word to the remaining words, and by multiplying the probabilities—except
that in order to solve problem (2), we introduce the third difference: we add logarithms of
probabilities instead of multiplying the raw probabilities.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Chúng tôi sẽ xác định segment2, mà khác với các phân đoạn trong ba cách: đầu tiên, nó sử dụng một có điều kiệnbigram ngôn ngữ mô hình, cPw, chứ không phải là unigram mẫu Pw. Thứ hai, các chức năngchữ ký là khác nhau. Thay vì được thông qua một đối số duy nhất (văn bản), segment2 làcũng được thông qua từ trước. Đầu câu, từ trước đó là đặc biệtđánh dấu khởi đầu của câu, . Giá trị trả lại không phải là chỉ là một danh sách các từ, nhưngthay vào đó là một cặp giá trị: xác suất của phân khúc, theo sau là danh sách các từ.Chúng tôi trở lại xác suất để nó có thể được lưu trữ (bởi bản ghi nhớ) và cần không được recomputed;Điều này sửa chữa vấn đề (1), là không hiệu quả. Kết hợp chức năng mất bốn đầu vào-đầu tiêntừ và từ còn lại, cộng với xác suất của họ- và kết hợp chúng bằng cách phụ thêmtừ đầu tiên đến những từ còn lại, và bằng cách nhân các xác suất-ngoại trừđể giải quyết vấn đề (2), chúng tôi giới thiệu sự khác biệt thứ ba: chúng tôi thêm logarit củaxác suất thay vì nhân nguyên xác suất.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Chúng tôi sẽ xác định segment2, mà khác với phân khúc trong ba cách: thứ nhất, nó sử dụng một điều kiện
mô hình ngôn ngữ Bigram, CPW, chứ không phải là mô hình unigram Pw. Thứ hai, các chức năng
chữ ký là khác nhau. Thay vì được thông qua một đối số duy nhất (văn bản), segment2 được
cũng đã thông qua từ trước đó. Vào lúc bắt đầu của câu, từ trước đó là đặc biệt
đầu-của-câu marker,. Giá trị trả về không chỉ là một danh sách các từ, nhưng
đúng hơn là một cặp giá trị:. Xác suất của các phân khúc, theo sau là danh sách các từ
Chúng tôi trở về xác suất để nó có thể được lưu trữ (bằng cách ghi nhớ) và không cần phải được tính toán lại ;
này sửa chữa vấn đề (1), sự kém hiệu quả. Các chức năng kết hợp có bốn đầu vào-đầu tiên
từ và các từ còn lại, cộng với họ xác suất và kết hợp chúng bằng cách thêm
các từ đầu tiên đến những từ còn lại, và bằng cách nhân với xác suất-ngoại trừ
rằng để giải quyết vấn đề (2), chúng tôi giới thiệu sự khác biệt thứ ba: chúng ta thêm logarit của
xác suất thay vì nhân xác suất thô.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.