Fig. 3. Excerpt of Pooka SVN Log.3.6.3 CVS/SVN Commit MessagesFig. 3 shows an excerpt of a commit of Pooka. There are 3,762, 1,743, 3,261, and 8,079 SVN commits for jEdit, Pooka, Rhino, and SIP, respectively. We performed the data preprocessing steps described in Section 2.2.1 on all SVN commits with the help of FacTrace.After performing the preprocessing steps, we obtained 2,911, 1,393, 2,508, and 5,188 SVN commits for jEdit, Pooka, Rhino, and SIP, respectively. There were many SVN commits that did not concern source code files. Also, some commit messages contained both source code files and other files. For example, revision 1604 in Pooka points only to HTML files except for one Java file, FolderInternalFrame.java. Therefore, we only kept the Java file and removed any reference to the HTML files. We stored all filtered SVN commit messages and related files in a FacTrace database.3.6.4 Bug ReportsChúng tôi không thể sử dụng jEdit [24] và báo cáo Pooka lỗi bởi vì hệ thống đầu tiên không có một kho lưu trữ công khai sẵn có lỗi và thứ hai có quá ít ghi lỗi (16). Tê giác là một phần của trình duyệt Mozilla và các báo cáo lỗi có sẵn thông qua theo dõi lỗi Mozilla Bugzilla. Chúng tôi trích xuất tất cả 770 lỗi báo cáo với tê giác và sử dụng Histrace để liên kết họ với kho CVS như mô tả trong phần 2.2. Histrace tự động liên kết 457 của các báo cáo lỗi để cam kết tương ứng của họ. Trong trường hợp của SIP, chúng tôi tải về báo cáo lỗi 413. SIP nhà phát triển đã không làm theo bất kỳ quy tắc trong khi sửa chữa lỗi liên kết báo cáo lỗi và cam kết. Do đó, đã có không có ID lỗi trong các tin nhắn tự. Tuy nhiên, nhà phát triển tham chiếu SVN sửa đổi số trong các báo cáo lỗi ý kiến, ví dụ như, lỗi ID 237 có sửa đổi ID r4550. Chúng tôi điều chỉnh biểu hiện thường xuyên của Histrace để tìm xem ID trong các mô tả của các báo cáo lỗi SIP. Histrace như vậy trích xuất tất cả các lỗi ID và liên kết họ với SVN cam kết. Nhìn chung, Histrace tự động liên kết 169 lỗi báo cáo chống lại SIP để cam kết tương ứng của họ.3.6.5 kéo tiền xử lý bướcChúng tôi tự động trích xuất tất cả các từ định danh từ jEdit, Pooka, tê giác, và yêu cầu SIP, mã nguồn, lọc CSV/SVN cam tin nhắn và lọc báo cáo lỗi, bằng cách sử dụng FacTrace. Sản lượng của bước này là bốn corpora mà chúng tôi sử dụng cho việc tạo các liên kết truy tìm nguồn gốc, như được diễn tả trong phần 2.2 và 2.3.
đang được dịch, vui lòng đợi..