Luận án này nghiên cứu việc áp dụng một kỹ thuật tìm kiếm thông tin, phân tích ngữ nghĩa tiềm ẩn (LSA), có nguồn gốc thông tin ngữ nghĩa từ các tập tin mã nguồn bằng cách sử dụng các phương pháp tìm kiếm thông tin. Những thông tin này rất hữu ích trong việc phát hiện các tập tin mã nguồn tương tự liên quan đến việc phát hiện đạo văn. Hiệu suất của LSA là phụ thuộc
vào các thông số mà có thể ảnh hưởng đến hiệu quả của nó và nghiên cứu này nhằm mục đích điều tra của
hiệu suất sử dụng các thiết lập thông số khác nhau. Hiệu quả của các LSA trong tương tự như phát hiện tập tin sourcecode khi những thông số được tối ưu hóa sẽ được đánh giá. Chúng tôi đề xuất một
kỹ thuật để kết hợp các thông tin kỹ thuật truy với các công cụ phát hiện đạo văn
để cải thiện phát hiện đạo văn và điều tra quá trình. Chúng tôi cũng đề xuất một
định nghĩa thế nào là mã nguồn đạo văn từ góc độ học thuật.
đang được dịch, vui lòng đợi..
