Software plagiarism detection tools

Software plagiarism detection tools use either an attribute-counting method or structure-based approach. Careful comparison has shown that the structure-based methods are much more effective than those counting attributes. It would be interesting to try a similar approach to plagiarism of written text where methods based on structure of text may prove to be more successful than those based simply on attribute-counting (such as words). For example, it would be interesting to compare an Information Retrieval approach (such as vector representation and cosine similarity) that would compare the text as a “bag-of-words” and a method that aligned the texts and compared similarity (i.e. considering the structure of the text). Currently, comparing software plagiarism detection techniques with written text does not appear to have been undertaken. There are similarities between detection of plagiarism in each area and these could be exploited further. However, there are also obvious differences between plagiarism in written text and programming languages. Not more so than simply the ambiguity and complexity of natural language compared to programming languages that would make applying the same technique to both areas potentially unsuccessful.
A further improvement would be experiments based upon a common evaluation technique. Whale provided this basis for software that allows the success of techniques to be easily illustrated and ranked. This same evaluation strategy could be made with plagiarism in written text.
I am also interested in using the style of an author to detect unusual patterns in both software code and written text. This may provide useful research into how the style of an author changes over time and it would be interesting to determine what features could be used to successfully determine authorship.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Phần mềm phát hiện đạo văn công cụ sử dụng phương pháp đếm thuộc tính hoặc cách tiếp cận dựa trên cấu trúc. Cẩn thận so sánh đã chỉ ra rằng phương pháp dựa trên cấu trúc nhiều hơn nữa hiệu quả hơn những người đếm thuộc tính. Nó sẽ là thú vị để thử một phương pháp tương tự để đạo văn của văn bản văn nơi phương pháp dựa trên cấu trúc của văn bản có thể chứng minh là thành công hơn so với những người chỉ đơn giản là ngày đếm thuộc tính (chẳng hạn như từ). Ví dụ, nó sẽ là thú vị để so sánh một cách tiếp cận thông tin tra cứu (chẳng hạn như vector đại diện và cô sin giống nhau) sẽ so sánh các văn bản như là một "túi-của-từ" và một phương pháp liên kết các văn bản và so sánh tương tự (ví dụ xem xét cấu trúc của các văn bản). Hiện nay, so sánh phần mềm phát hiện đạo văn kỹ thuật bằng văn bản viết dường như không có được thực hiện. Có những điểm tương đồng giữa phát hiện đạo văn trong từng khu vực và đây có thể được khai thác hơn nữa. Tuy nhiên, cũng có sự khác biệt rõ ràng giữa plagiarism trong văn văn bản và ngôn ngữ lập trình. Không hơn so với chỉ đơn giản là mơ hồ và phức tạp của ngôn ngữ tự nhiên so với ngôn ngữ lập trình đó sẽ làm cho việc áp dụng kỹ thuật tương tự để cả hai khu vực có khả năng không thành công.Một cải tiến hơn nữa nào là thử nghiệm dựa trên kỹ thuật đánh giá phổ biến. Cá voi cung cấp cơ sở cho phần mềm cho phép sự thành công của kỹ thuật để dễ dàng được minh họa và xếp hạng. Này cùng một đánh giá chiến lược có thể được thực hiện với đạo văn trong văn bản văn.Tôi cũng quan tâm đến sử dụng phong cách của một tác giả để phát hiện các mô hình không bình thường trong mã phần mềm và viết văn bản. Điều này có thể cung cấp hữu ích nghiên cứu thành như thế nào phong cách của tác giả một thay đổi theo thời gian và nó sẽ là thú vị để xác định những gì các tính năng có thể được sử dụng để xác định thành công tác giả.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Phần mềm công cụ phát hiện đạo văn sử dụng một trong hai phương pháp thuộc tính đếm hoặc cách tiếp cận dựa trên cấu trúc. So sánh cẩn thận đã chỉ ra rằng các phương pháp dựa trên cấu trúc là hiệu quả hơn nhiều so với những thuộc tính đếm. Nó sẽ là thú vị để thử một cách tiếp cận tương tự như đạo văn của văn bản bằng văn bản mà các phương pháp dựa trên cấu trúc của văn bản có thể chứng minh được nhiều thành công hơn so với những người chỉ đơn giản dựa trên thuộc tính đếm (chẳng hạn như từ). Ví dụ, nó sẽ là thú vị để so sánh một cách tiếp cận thông tin Retrieval (như đại diện vector và cosin tương tự) mà sẽ so sánh các văn bản như là một "túi-of-từ" và một phương pháp phù hợp các văn bản và tương đồng so (tức là xem xét cấu trúc của văn bản). Hiện nay, so sánh các kỹ thuật phát hiện đạo văn với phần mềm văn bản bằng văn bản không có vẻ như đã được thực hiện. Có những điểm tương đồng giữa phát hiện đạo văn trong từng khu vực, nhưng có thể được khai thác thêm. Tuy nhiên, cũng có những khác biệt rõ ràng giữa đạo văn trong văn bản văn bản và lập trình ngôn ngữ. Không nhiều hơn so đơn giản chỉ là sự mơ hồ và phức tạp của ngôn ngữ tự nhiên so với các ngôn ngữ lập trình mà sẽ làm cho việc áp dụng các kỹ thuật tương tự cho cả hai khu vực có khả năng không thành công.
Một cải tiến hơn nữa sẽ là thí nghiệm dựa trên một kỹ thuật đánh giá chung. Whale cung cấp cơ sở cho phần mềm cho phép sự thành công của các kỹ thuật để dễ dàng được minh họa và xếp hạng. Chiến lược đánh giá tương tự này có thể được thực hiện với đạo văn trong văn bản.
Tôi cũng quan tâm trong việc sử dụng phong cách của một tác giả để phát hiện các mẫu bất thường trong cả hai mã phần mềm và văn bản bằng văn bản. Điều này có thể cung cấp các nghiên cứu hữu ích như thế nào phong cách của một tác giả thay đổi theo thời gian và nó sẽ là thú vị để xác định những tính năng có thể được sử dụng để xác định thành công quyền tác giả.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.