Ç 1 GIỚI THIỆU R EQUIREMENT truy xuất nguồn gốc được định nghĩa là "khả năng để mô tả và theo đuổi cuộc sống của một yêu cầu, trong cả một tiền đạo và ngược hướng (tức là từ nguồn gốc của nó, thông qua phát triển và đặc điểm kỹ thuật của nó, để triển khai tiếp theo của nó và sử dụng, và qua tất cả các giai đoạn của sự tinh tế và liên tục lặp đi lặp lại trong bất kỳ các giai đoạn) "[1]. Liên kết truy xuất nguồn gốc giữa requirements1 của một hệ thống và mã nguồn của nó là hữu ích trong việc làm giảm nỗ lực hệ thống hiểu. Họ cũng rất cần thiết để đảm bảo rằng mã nguồn của một hệ thống phù hợp với yêu cầu của mình và rằng tất cả và chỉ có các yêu cầu quy định đã được thực hiện bởi các nhà phát triển. Tuy nhiên, trong quá trình bảo trì phần mềm và tiến hóa, như các nhà phát triển thêm, xóa, hoặc sửa đổi các tính năng, các liên kết yêu cầu truy xuất nguồn gốc trở nên lỗi thời bởi vì các nhà phát triển không / không thể cống hiến công sức để cập nhật [2]. Tuy nhiên, việc khôi phục các liên kết truy xuất nguồn gốc sau đó là một nhiệm vụ khó khăn và tốn kém cho các nhà phát triển. 1. Không mất tính tổng quát với các tài liệu văn bản khác, trong những điều sau đây chúng tôi sử dụng các yêu cầu văn bản như văn bản cấp cao và mã nguồn như là tài liệu cấp thấp.. Các tác giả với De'partement de Ge'nie Informatique et Ge'nie Logiciel, Ecole Polytechnique de Montre'al, CP 6079, succursale Centreville Montre'al, QC H3C 3A7, Canada. E-mail:. {nasir.ali, yann-gael.gueheneuc}@polymtl.ca, antoniol@ieee.org Manuscript nhận 20 Tháng Ba 2012; sửa đổi ngày 04 Tháng 7 2012; chấp nhận Tháng 10 22 2012; công bố trực tuyến ngày 26 tháng 10 năm 2012. Đề nghị cho sự chấp nhận bởi T. Tamai. Để biết thông tin về việc thu thập các bản in lại của bài viết này, xin vui lòng gửi e-mail tới: tse@computer.org, và tham chiếu IEEECS Log Số TSE-2012-03-0067. Digital Object Identifier không. 10,1109 / TSE.2012.71. Phương pháp Do đó, văn học đã đề xuất, kỹ thuật, và các công cụ để khôi phục lại các liên kết truy xuất nguồn gốc semiautomatically hoặc tự động [3]. Yêu cầu truy xuất nguồn gốc đã nhận được nhiều sự chú ý trong thập kỷ qua trong các tài liệu khoa học. Nhiều nhà nghiên cứu sử dụng truy xuất thông tin (IR) kỹ thuật, ví dụ, [2], [3], [4], để khôi phục lại các liên kết truy xuất nguồn gốc giữa các tài liệu cao cấp, ví dụ, yêu cầu, trang hướng dẫn, và các tài liệu thiết kế, và các văn bản cấp thấp , ví dụ, mã nguồn và sơ đồ UML [3], [4], [5], [6]. Kỹ thuật IR giả định rằng tất cả các vật phẩm phần mềm là / có thể được đặt trong một số định dạng văn bản. Sau đó, họ tính toán sự tương đồng văn bản giữa hai vật phẩm phần mềm, ví dụ, mã nguồn của một lớp và một yêu cầu. Sự giống nhau văn bản cao có nghĩa là hai hiện vật có thể chia sẻ một số khái niệm [3] và rằng, do đó, họ có nhiều khả năng liên kết với nhau. 0098-5589 / 13 / 31,00 $ 2013 IEEE đăng bởi Hội IEEE Computer Hiệu quả của kỹ thuật IR là đo bằng cách sử dụng các số liệu IR: thu hồi, độ chính xác, hoặc một số trung bình của cả hai, như số điểm F1 [3], [5], [7]. Đối với một yêu cầu nhất định, thu hồi là tỷ lệ phần trăm của các liên kết phục hồi đúng trên tổng số thích hợp, liên kết dự kiến, trong khi chính xác là tỷ lệ phần trăm của các liên kết phục hồi đúng trên tổng số liên kết phục hồi. Thu hồi cao có thể đạt được bằng cách liên kết từng yêu cầu cho tất cả các đơn vị mã nguồn (các lớp học, cấu trúc, phương pháp, và các chức năng), nhưng độ chính xác sẽ là gần bằng không. Độ chính xác cao có thể đạt được bằng cách báo cáo liên kết chỉ rõ ràng, nhưng thu hồi sẽ là gần bằng không. Hoặc trường hợp cực kỳ được ưa chuộng vì các nhà phát triển sau đó sẽ cần phải tự xem xét nhiều liên kết ứng cử viên để loại bỏ dương tính giả và / hoặc nghiên cứu mã nguồn để phục hồi liên kết còn thiếu [3].
đang được dịch, vui lòng đợi..
