4.1.3 DUPDUP là một kỹ thuật phát triển bởi Brenda Baker (3), mà thấy dài phần của phần mềm mã gần như phù hợp. Các kỹ thuật sử dụng ý tưởng của một trận đấu parameterised (hoặc kết hợp p) sẽ phù hợp với hai đoạn mã nếu họ là textually như vậy, nhưng chứa hệ thống chỉ đơn giản là thay đổi tên biến. Người dùng chỉ định một chiều dài ngưỡng mà DUP báo cáo tất cả p-trận đấu giữa tập tin. Đầu ra là tỷ lệ phần trăm của các sao chép giữa hai tập tin và cấu hình hiển thị các trận đấu tham gia vào mỗi dòng trong các đầu vào và một cốt truyện đang hiện nơi diễn ra các trận đấu.Các trận đấu p được tính bằng cách sử dụng parameterised hậu tố cây (cây hậu tố p) đại diện cho đối tượng dời hìnhmã hóa các hậu tố của chuỗi mã thông báo ở dạng compacted trie. Một trie là chỉ đơn giản là một cấu trúc cây mà mỗi nút đại diện cho một ký tự và gốc đại diện cho chuỗi null. Lợi thế của đại diện này là thời gian để tìm thấy một chuỗi là tuyến tính và quá trình xây dựng và thêm nhiều yếu tố để cây là rất dễ dàng.
đang được dịch, vui lòng đợi..
