3.8 xây dựng bộ của truy tìm nguồn gốc liên kết đầu tiên, chúng tôi sử dụng JSM và VSM để tạo ra các liên kết truy tìm nguồn gốc, tức là, R2CJSM và R2CV SM, giữa các yêu cầu và mã nguồn. Thứ hai, chúng tôi áp dụng Histracecommits, như được diễn tả trong phần 2.2, để xử lý jEdit, Pooka, tê giác, và SIP CVS/SVN cam thư (T1), và yêu cầu để tạo ra các liên kết truy tìm nguồn gốc đặt R2CT1 rj; tk. Chúng tôi xử lý SIP và báo cáo lỗi Rhino (T2) để tạo ra các liên kết truy tìm nguồn gốc bộ R2CT2 rj; tk bằng cách sử dụng Histracebug.Ví dụ, chúng tôi theo dõi Pooka yêu cầu "nó cần phải có thư rác lọc tùy chọn" để SVN cam kết thông điệp "thêm.prelim hỗ trợ bộ lọc spam." SVN cam số hiệu đính 1133. Sau đó, chúng tôi phục hồi tất cả các nguồn mã lớp học liên quan đến cam kết này, tức là, SpamSearchTerm.java và SpamFilter.java. Cuối cùng, chúng tôi tạo ra một liên kết truy tìm nguồn gốc trực tiếp giữa các tập tin SpamSearchTerm.java và SpamFilter.java để yêu cầu "nó cần phải cóthư rác lọc tùy chọn."Thứ ba, chúng tôi áp dụng Trumo như mô tả trong phần 2.3 sử dụng liên kết truy tìm nguồn gốc phục hồi với JSM và VSM. Chúng tôi do đó tính toán hai bộ R2C, R2CJSM và R2CV SM, một với mỗi kỹ thuật IR. Sau đó chúng tôi áp dụng phương trình Trumo via CVS/SVN cam thư và- hoặc lỗi báo cáo để loại bỏ / rerank liên kết bằng cách tính toán giá trị tương tự mới bằng cách sử dụng (3). Những giá trị này giúp đỡ để trả lời RQ1 và để tìm cách bác bỏ giả thuyết null của chúng tôi. JSMðq; dÞ ¼ H; X 2 2HðpÞ ¼ hðpðwÞÞ; hðxÞ ¼ xlogx;where HðpÞ is the entropy of the probability distribution p, and pq and pd are the probability distributions of the two documents (a “query” and a “document”), respectively. By definition, hð0Þ 0. We compute the similarity between two documents using 1 JSMðq;dÞ. The similarity values are in ½0;1.
đang được dịch, vui lòng đợi..
