Trọng lượng toàn cầu này đảm bảo rằng DynWing cho thấy rõ hơn để các chuyên gia Histracecommits hơn để các chuyên gia Histracebugs. Chúng tôi lựa chọn để ưu Histracecommits dựa vào chất lượng của các thông tin ngữ nghĩa chứa trong các bài viết cam kết, các báo cáo lỗi, và các lớp mã nguồn, như được thảo luận trong Phần 5.1.
3.11 Phương pháp phân
tích, chúng tôi sử dụng OraclejEdit, OraclePooka, OracleRhino, và OracleSIP để tính toán các giá trị chính xác và thu hồi các liên kết phục hồi bằng cách sử dụng JSM, Trustrace, và VSM. JSM và VSM gán một giá trị tương tự cho mỗi và mọi liên kết truy xuất nguồn gốc trong khi Trustrace sử dụng mô hình của nó, được xác định tại mục 2.3, phải đánh giá lại các giá trị giống nhau của các liên kết được cung cấp bởi một kỹ thuật cơ bản.
Để trả lời RQ1, chúng tôi thực hiện một số thí nghiệm với các giá trị ngưỡng khác nhau vào các liên kết bị thu hồi để thực hiện các bài kiểm tra thống kê về độ chính xác và thu hồi giá trị. Chúng tôi sử dụng một t ngưỡng tỉa bộ các liên kết truy xuất nguồn gốc, chỉ giữ lại các liên kết có giá trị tương đồng là lớn hơn hoặc bằng t 2 ½0; 1. Chúng tôi sử dụng các giá trị khác nhau của t 0,01-1 mỗi bước của 0.01 để có được bộ khác nhau của liên kết truy xuất nguồn gốc khác nhau với độ chính xác và giá trị thu hồi, cho tất cả các phương pháp tiếp cận. Sau đó chúng tôi thực hiện ghép nối-thống kê các xét nghiệm để đo lường những cải tiến mang lại bởi Trustrace. Trong các cuộc thử nghiệm kết hợp-thống kê, hai phương pháp được lựa chọn phải có cùng số điểm dữ liệu. Do đó, chúng tôi giữ các giá trị ngưỡng t nhau cho cả hai cách tiếp cận. Ví dụ, nếu VSM loại bỏ tất cả các liên kết truy xuất nguồn gốc mà tương đồng văn bản giá trị dưới ngưỡng 0,7, sau đó chúng tôi cũng sử dụng cùng một 0,7 ngưỡng cho Trustrace.
Sau đó, chúng tôi đánh giá xem sự khác biệt về độ chính xác và thu hồi giá trị, trong chức năng của t, được thống kê đáng kể giữa các phương pháp tiếp cận JSM, Trustrace, và VSM. Để chọn một bài kiểm tra thống kê thích hợp, chúng tôi sử dụng các bài kiểm tra Shapiro-Wilk để phân tích sự phân bố của các điểm dữ liệu của chúng tôi. Chúng tôi nhận thấy rằng các bản phân phối không theo một phân phối bình thường. Vì vậy, chúng tôi sử dụng một thử nghiệm không tham số, tức là, Mann-Whitney kiểm tra, kiểm chứng giả thuyết của chúng tôi để trả lời RQ1.
Một cải tiến có thể là ý nghĩa thống kê, nhưng nó cũng rất quan trọng để ước tính độ lớn của sự khác biệt giữa các mức độ chính xác đạt được với một kỹ thuật IR đơn và Trustrace
đang được dịch, vui lòng đợi..