A recent article by Mozgovoy provid

A recent article by Mozgovoy provides a review on various source-code plagiarism detection approaches [100]. Most popular plagiarism detection algorithms use string-matching
to create token string representations of programs. The tokens of each document are compared on a pair-wise basis to determine similar source-code segments between the files and
compute the similarity value between files based on the similar segments found. Some well
known recent structure metric systems include YAP3 [144], Plague [139], and JPlag [115].
These approaches focus on detecting plagiarism based on the source-code files structural information derived from the programming language syntax. Each file’s words and characters
2
are converted into tokens representing their semantic meaning. The comparison process is
not itself based on the semantic meaning of the file but it is rather a structural comparison,
which consists of searching for files that contain matching token sequences. Algorithms
that rely on detecting similar files by analysing their structural characteristics often fail to
detect similar files that contain significant code shuffling, i.e. this kind of attack causes
local confusion [115]. In addition, string-matching based systems convert source-code files
into tokens using a parser. String-matching systems are language-dependent depending on
the programming languages supported by their parsers, and are immune to many attacks,
but as mentioned above they can be tricked by specific attacks mainly on the structure of
the source-code.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Một bài viết gần đây của Mozgovoy cung cấp một bài đánh giá về các mã nguồn đạo văn phát hiện phương pháp tiếp cận [100]. Phổ biến nhất các thuật toán phát hiện đạo văn sử dụng phù hợp với chuỗiđể tạo ra chuỗi mã thông báo đại diện của chương trình. Thẻ của mỗi tài liệu được so sánh trên cơ sở pair-wise để xác định các phân đoạn mã nguồn tương tự giữa các tập tin vàtính toán giá trị tương tự giữa tập tin dựa trên các phân đoạn tương tự tìm thấy. Một số cũngđược biết đến các hệ thống số liệu cấu trúc tại gồm YAP3 [144], bệnh dịch hạch [139] và JPlag [115].Các phương pháp tiếp cận tập trung vào phát hiện đạo văn dựa trên các tập tin mã nguồn cấu trúc thông tin có nguồn gốc từ các cú pháp ngôn ngữ lập trình. Mỗi tập tin từ và ký tự2được chuyển đổi thành thẻ đại diện cho ý nghĩa ngữ nghĩa của họ. Trình so sánhkhông chính nó dựa trên ý nghĩa ngữ nghĩa của các tập tin, nhưng nó là khá là một so sánh cấu trúc,đó bao gồm tìm kiếm cho các tập tin có chứa mã thông báo trình tự phù hợp. Thuật toánmà dựa trên phát hiện tương tự như tập tin bằng cách phân tích cấu trúc của đặc điểm thường không đểphát hiện các tập tin tương tự có chứa đáng kể mã shuffling, tức là loại tấn công nguyên nhân[115] nhầm lẫn địa phương. Ngoài ra, phù hợp với chuỗi dựa trên hệ thống chuyển đổi tập tin mã nguồnvào thẻ bằng cách sử dụng một phân tích cú pháp. Phù hợp với chuỗi hệ thống được phụ thuộc vào ngôn ngữ tùy thuộc vàoCác ngôn ngữ lập trình được hỗ trợ bởi parsers của họ, và được miễn dịch với nhiều cuộc tấn công nhất,nhưng như đã đề cập ở trên họ có thể được lừa bởi cuộc tấn công cụ thể chủ yếu là về cấu trúc củamã nguồn.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Một bài báo gần đây bởi Mozgovoy cung cấp đánh giá về mã nguồn phương pháp phát hiện đạo văn khác nhau [100]. Hầu hết các thuật toán phát hiện đạo văn phổ biến sử dụng chuỗi khớp
để tạo ra các xâu mã thông báo của chương trình. Các thẻ của mỗi tài liệu được so sánh trên cơ sở từng đôi để xác định các đoạn mã nguồn tương tự giữa các tập tin và
tính giá trị giống nhau giữa các tập tin dựa trên các phân đoạn tương tự được tìm thấy. Một số cũng
hệ thống số liệu cấu trúc gần đây được biết đến bao gồm YAP3 [144], Plague [139], và JPlag [115].
Những cách tiếp cận tập trung vào việc phát hiện đạo văn dựa trên mã nguồn tập tin thông tin cấu trúc bắt nguồn từ cú pháp ngôn ngữ lập trình. Từ và ký tự của mỗi tập
2
được chuyển vào thẻ đại diện cho ý nghĩa ngữ nghĩa của họ. Quá trình so sánh là
bản thân nó không dựa trên ý nghĩa ngữ nghĩa của các tập tin nhưng nó là khá một so sánh cấu trúc,
trong đó bao gồm tìm kiếm các tập tin có chứa phù hợp với chuỗi token. Các thuật toán
dựa trên việc phát hiện các tập tin tương tự bằng cách phân tích đặc điểm cấu trúc của họ thường không
phát hiện các file tương tự chứa mã xáo trộn đáng kể, tức là loại tấn công này gây ra
sự nhầm lẫn địa phương [115]. Ngoài ra, hệ thống dựa trên chuỗi khớp chuyển đổi các tập tin mã nguồn
vào thẻ bằng cách sử dụng một cú pháp. Hệ thống chuỗi khớp là ngôn ngữ phụ thuộc vào tùy thuộc vào
ngôn ngữ lập trình được hỗ trợ bởi bộ phân tích của họ, và miễn nhiễm với nhiều cuộc tấn công,
nhưng như đã đề cập ở trên họ có thể bị lừa bởi các cuộc tấn công cụ chủ yếu vào cấu trúc của
các mã nguồn.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.