Để phân tích chất lượng của các bộ nhận trong bộ dữ liệu của chúng tôi và đo lường giá trị tương đồng của họ, chúng tôi sử dụng phương pháp tiếp cận của chúng tôi trước đó, Coparvo [22], giúp xác định các vùng nghèo ngữ nghĩa trong mã nguồn. Chúng tôi muốn để tính giá trị giống nhau giữa các tập hợp các yêu cầu R, tất cả hợp lại thành một tài liệu duy nhất Rall ¼SS cjjr. j, Weandbuildthe setthe của lớp C, tất cả sáp nhập vào Gọi ¼ j bình thường hạn-by-tài liệu ma trận để tránh bất kỳ tác động từ các độ dài tài liệu. Sau đó, chúng tôi sử dụng JSM và VSM để
SS
tính tương đồng giữa j rj, k cj. Sự giống nhau giữa các bộ cho thấy gần hai tài liệu là về mặt ngữ nghĩa.
đang được dịch, vui lòng đợi..