3.2.1 Năng động Programmingbased Algorithms
Theo định nghĩa của tập phổ biến xác suất, nó là rất quan trọng để tính toán xác suất thường xuyên của một tập phổ biến có hiệu quả. [9] là công việc đầu tiên đề xuất khái niệm về
xác suất thường xuyên của một tập phổ biến và thiết kế một thuật toán lập trình dựa trên năng động để tính toán xác suất thường xuyên. Vì lợi ích của các cuộc thảo luận sau đây, chúng tôi xác định rằng Pr? 0, j (X) biểu thị xác suất mà itemset X xuất hiện ít nhất tôi lần trong số các giao dịch j đầu tiên trong cơ sở dữ liệu không chắc chắn được. Pr (X? Tj) là xác suất của itemset X xuất hiện trong các giao dịch j-th Tj. N là số lượng giao dịch trong cơ sở dữ liệu không chắc chắn. Vì vậy, mối quan hệ đệ quy được xác định như sau: (Tj X?) Pr i, j (X) = Pr i, j (X) x Pr + Pr i, j-1 (X) x (1 - Pr??? (? X Tj)) Trường hợp ranh giới:? Pr 0, j (X) = 1 0? j? N Pr? I, j (X) = 0 i> j
Như vậy, xác suất thường xuyên bằng Pr? Min sup, N (X). Theo phương pháp lập trình năng động, thuật toán DP sử dụng khuôn khổ Apriori để tìm tất cả các tập phổ biến xác suất.
Dựa vào định nghĩa của các tập phổ biến xác suất, sự hỗ trợ của một tập phổ biến sau sự phân bố Poisson nhị thức, từ đó chúng ta có thể suy ra rằng xác suất thường xuyên thực sự là một trong những bằng trừ xác suất tính toán từ các chức năng tương ứng tích lũy phân phối (CDF) của dự án. Hơn nữa, khác nhau từ UApriori, thuật toán DP tính xác suất thường xuyên thay vì hỗ trợ dự kiến cho mỗi tập phổ biến. Thời gian
phức tạp của việc tính toán quy hoạch động cho mỗi tập phổ biến là O (N2 × min sup).
đang được dịch, vui lòng đợi..
