Một ví dụ về một thuật toán rất đơn giản để phát hiện đạo văn dựa trên so sánh chuỗi (34) là:
1. Hủy bỏ tất cả ý kiến.
2. Bỏ qua mọi khoảng trắng, thêm đường, trừ khi cần thiết như là ký tự phân cách,
3. Thực hiện một chuỗi ký tự so sánh giữa hai tập tin bằng cách sử dụng UNIX diff, grep và wc.
4. Duy trì một số tỷ lệ phần trăm của các nhân vật đó là như nhau (gọi là nhân vật tương quan).
5. Chạy cho tất cả các cặp chương trình có thể.
6. Tạo một bản tóm tắt của những so sánh có chứa các ký tự tương quan trong thứ tự giảm dần và
kiểm tra.
Các phương pháp khác đáng nói đến ở giai đoạn này là: 1) Faidhi và Robinson (14), người sử dụng 24 số liệu
để đánh giá tương tự. 10 người đầu tiên có khả năng được thay đổi bởi một người ăn cắp người mới và phần còn lại của một phần lớn
người ăn cắp có kinh nghiệm. 2) Rees và hệ thống STYLE của mình mà còn được sử dụng để cho điểm cho các chương trình
dựa trên phong cách, 3) Rees và Robinson của chương trình cheat, 4) Jankowitz người đã phân tích các chương trình sử dụng
cây tĩnh thực hiện được bằng cách phân tích cơ thể chương trình chính và các thủ tục và 5 ) các công cụ Plague
phát triển bởi Whale.
đang được dịch, vui lòng đợi..
