Phương pháp này so sánh các tập tin là hoàn toàn cú pháp và không đề cập đến các tập tin kích thước giới hạn được đưa ra mà phương pháp có thể phân hủy. Sử dụng cho Siff được đề cập trong (28) bao gồm:
· So sánh các phiên bản khác nhau của mã chương trình cho đạo văn,
· Tìm kiếm các bản sao chép các tập tin trong một kho dữ liệu lớn (ví dụ như cấu trúc thư mục),
· Tìm kiếm các tập tin tương tự trên Internet để nâng cao tìm kiếm và giảm tìm kiếm thông qua các thư mục
(ví dụ ftp thư mục) mà có thể có các file tương tự như những gì đã được xem,
· Đối với các nhà xuất bản để phát hiện đạo văn,
· Đối với các học giả muốn để phát hiện đạo văn trong bài tập,
· Đối với nhóm các tập tin với nhau tương tự với nhau trước khi chúng được nén,
· So sánh các phiên bản của các tập tin trên máy chủ, di động và làm việc.
cải tiến trong tương lai có liên quan đến việc lựa chọn các điểm neo với nhiều hơn "tình báo" mà là đại diện của các nội dung tập tin (tức là sử dụng "quan trọng" lời của một tài liệu) và so sánh chỉ các văn bản của một tài liệu không phải là định dạng. Ngoài ra các nghiên cứu thực nghiệm hơn để xác định kích thước của cửa sổ kiểm tra và số lượng các trận đấu cho các tập tin lớn và nhỏ được xếp vào loại tương tự sẽ có lợi.
đang được dịch, vui lòng đợi..