chất lượng của định danh mã nguồn. Nếu có một sự tương đồng thấp giữa các định danh được sử dụng bởi các yêu cầu và mã nguồn, sau đó không có vấn đề như thế nào tốt một kỹ thuật IR dựa trên là, nó sẽ không mang lại kết quả với độ chính xác và thu hồi giá trị cao.
Để phân tích chất lượng của các bộ nhận trong bộ dữ liệu của chúng tôi và đo lường giá trị tương đồng của họ, chúng tôi sử dụng phương pháp tiếp cận của chúng tôi trước đó, Coparvo [22], giúp xác định các vùng nghèo ngữ nghĩa trong mã nguồn. Chúng tôi muốn để tính giá trị giống nhau giữa các tập hợp các yêu cầu R, tất cả hợp lại thành một tài liệu duy nhất Rall ¼SS cjjr. j, Weandbuildthe setthe của lớp C, tất cả sáp nhập vào Gọi ¼ j bình thường hạn-by-tài liệu ma trận để tránh bất kỳ tác động từ các độ dài tài liệu. Sau đó, chúng tôi sử dụng JSM và VSM để
SS
tính tương đồng giữa j rj, k cj. Sự giống nhau giữa các bộ cho thấy gần hai tài liệu là về mặt ngữ nghĩa.
đang được dịch, vui lòng đợi..
