The YAP approach does not attempt a

The YAP approach does not attempt a full parse of the target language, but compares token strings made up from keywords drawn from the target language’s lexicon. This is particularly useful for English, as obtaining a full parse of the language is practically impossible.
The system works in the following manner:
• A tokeniser-generator is used to parse a number of texts and then determine the lexicon used to generate the token strings.
• A first lexicon-generating parse eliminates all numbers, words consisting of one or two letters, proper nouns and all “common” words (about 150 as defined in a stoplist). The stoplist is extended using simple stemming (for example if “keep” is in the stoplist, then so to will be “keeps” and “keeping” etc.).
The remaining words are stemmed using the PC-Kimmo recogniser (version 1.08) and the Englex10 rule and lexicon sets14.
The tokeniser-generator and resulting lexicon were applied to a series of essays using YAP3, although Wise reports no cases of plagiarism detected.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Cách tiếp cận YAP không cố gắng một phân tích đầy đủ của ngôn ngữ mục tiêu, nhưng so sánh chuỗi mã thông báo được tạo thành từ các từ khóa được rút ra từ lexicon ngôn ngữ mục tiêu. Đây là đặc biệt hữu ích cho tiếng Anh, như lấy một đầy đủ phân tích của ngôn ngữ là thực tế không thể.Hệ thống hoạt động theo cách sau đây:• A tokeniser-máy phát điện được sử dụng để phân tích một số văn bản và sau đó xác định lexicon được sử dụng để tạo ra chuỗi mã thông báo.• A đầu tiên tạo ra lexicon phân tích loại bỏ tất cả các số, chữ bao gồm một hoặc hai thư từ, danh từ riêng và tất cả các từ "phổ biến" (khoảng 150 theo quy định tại một stoplist). Stoplist được mở rộng bằng cách sử dụng đơn giản bắt nguồn (cho ví dụ nếu "giữ" là trong stoplist, sau đó như vậy sẽ là "giữ" và "giữ" vv.).Những từ còn lại được bắt nguồn bằng cách sử dụng máy PC-Kimmo recogniser (Phiên bản 1.08) và Englex10 chính phủ và lexicon sets14.Tokeniser-máy phát điện và lexicon kết quả đã được áp dụng cho một loạt các bài tiểu luận bằng cách sử dụng YAP3, mặc dù báo cáo khôn ngoan không có trường hợp của đạo văn phát hiện.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Cách tiếp cận YAP không cố gắng một phân tích cú pháp đầy đủ của ngôn ngữ đích, nhưng so sánh chuỗi hiệu được tạo thành từ các từ khóa được rút ra từ vựng của ngôn ngữ mục tiêu. Điều này đặc biệt hữu ích cho tiếng Anh, như có được một phân tích đầy đủ của ngôn ngữ là thực tế không thể.
Hệ thống hoạt động theo cách sau đây:
• Một tokeniser-máy phát điện được sử dụng để phân tích một số văn bản và sau đó xác định các từ vựng được sử dụng để tạo mã thông báo dây.
• Một đầu phân tích từ vựng-tạo giúp loại bỏ tất cả các số, từ gồm một hoặc hai chữ cái, danh từ riêng và tất cả các từ "phổ biến" (khoảng 150 như được định nghĩa trong một stoplist). Các stoplist được mở rộng bằng cách sử dụng đơn giản xuất phát (ví dụ nếu "giữ" là trong stoplist, sau đó để cho sẽ "tiếp tục" và "giữ", vv).
Những lời còn lại được bắt nguồn bằng cách sử dụng recogniser PC-Kimmo (phiên bản 1.08) và các quy tắc Englex10 và từ vựng sets14.
Các tokeniser-máy phát điện và các kết quả từ vựng đã được áp dụng cho một loạt các bài luận bằng YAP3, mặc dù khôn ngoan báo cáo không có trường hợp đạo văn phát hiện.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.