4. THỰC NGHIỆM
4.1 nghiệm Cài đặt
Trong tiểu mục này, chúng tôi giới thiệu môi trường thử nghiệm, triển khai, và các phương pháp đánh giá. Thứ nhất, để tiến hành so sánh công bằng, chúng tôi xây dựng một khuôn khổ thực hiện chung trong đó cung cấp các cấu trúc dữ liệu chung và chương trình con để thực hiện tất cả các thuật toán. Tất cả các thí nghiệm được thực hiện trên một Intel (R) Core (TM) i7 3.40GHz PC với 4GB bộ nhớ chính, chạy trên Microsoft Windows 7. Hơn nữa, tất cả các thuật toán đã được thực hiện và biên dịch sử dụng của Microsoft Visual C ++ 2010.
Đối với mỗi thuật toán, chúng tôi sử dụng việc thực hiện mạnh mẽ hiện có của chúng tôi để so sánh. Theo các cuộc thảo luận ở phần 3, chúng ta tách so sánh thành ba loại: các thuật toán hỗ trợ dựa trên dự kiến; chính xác các thuật toán xác suất thường xuyên; xấp xỉ xác suất thường xuyên algorithms.For dự kiến sẽ hỗ trợ các thuật toán, chúng tôi sử dụng các phiên bản trong [17, 18] thực hiện các thuật toán UApriori mà làm việc tỉa decremental và kỹ thuật băm để tăng tốc độ quá trình khai thác. Việc thực hiện dựa trên [22] được sử dụng để kiểm tra thuật toán UFP-tăng trưởng. Chúng tôi không sử dụng thực hiện UCFP cây [4] vì không có tối ưu hóa rõ ràng giữa thuật toán UFP-tăng trưởng và thuật toán UCFP cây trong điều kiện của thời gian chạy và các chi phí bộ nhớ. Các thuật toán UH-Mine được thực hiện dựa trên các phiên bản trong [4]. Đối với bốn thuật toán thường xuyên xác suất chính xác, DPNB (Dynamic Programming dựa trên thuật toán với Không ràng buộc) thuật toán mà không bao gồm các kỹ thuật cắt tỉa Chernoff ràng buộc dựa trên được thực hiện dựa trên các phiên bản trong [9]. Tương ứng, DCNB (Conquer dựa trên thuật toán Không ràng buộc Divide-và-) thuật toán được sửa đổi
dựa trên các phiên bản trong [28]. Tuy nhiên, những gì là khác nhau là trong thuật toán của chúng tôi, mỗi mặt hàng có khả năng riêng của họ, trong khi trong [28], tất cả các mục trong một phần giao dịch cổ cùng xuất hiện
xác suất. Hơn nữa, DPB (Dynamic Programming dựa trên thuật toán có ràng buộc) thuật toán [9] và DCB (Divide-và- Conquer dựa trên thuật toán có ràng buộc) thuật toán [28] đại diện cho các thuật toán tương ứng của DPNB và DCNB, nhưng bao gồm các Chernoff ràng buộc dựa trên cắt tỉa, tương ứng. Đối với
ba thuật toán khai thác xấp xỉ, việc thực hiện các PDUApriori dựa trên [31] và tích hợp tất cả các kỹ thuật cắt tỉa được tối ưu hóa. PDUApriori [10] và PDUH-Mine được thực hiện dựa trên các khuôn khổ của UApriori và UHMine, tương ứng. Băm chức năng được sử dụng trong hai thuật toán để tính toán các hàm phân phối tích lũy của phân phối chuẩn bình thường có hiệu quả.
đang được dịch, vui lòng đợi..