6.2.2 Quy định Hiệp hội Tạo từ tập phổ biến
khi các tập phổ biến từ các giao dịch trong một cơ sở dữ liệu D đã được tìm thấy, nó là đơn giản để tạo ra các luật kết hợp mạnh mẽ của mình (nơi quy định sự liên mạnh mẽ đáp ứng cả hai hỗ trợ tối thiểu và tin cậy tối thiểu). Điều này có thể được thực hiện bằng phương trình. (6.4) cho sự tự tin, mà chúng tôi cho thấy một lần nữa ở đây cho đầy đủ:
số hỗ trợ (A ∪ B)
tự tin (A ⇒ B) = P (B | A) =
.
Count hỗ trợ (A)
Xác suất có điều kiện được thể hiện trong các điều khoản của itemset số hỗ trợ, nơi số hỗ trợ (A ∪ B) là số lượng giao dịch có chứa các tập phổ biến A ∪ B, và số lượng hỗ trợ (A) là số lượng giao dịch có chứa các tập phổ biến A. Dựa vào phương trình này, các luật kết hợp có thể được tạo ra như sau:
Đối với mỗi tập phổ biến l thường xuyên, tạo ra tất cả các tập con khác rỗng của l.
Đối với mỗi tập con khác rỗng của các l, đầu ra quy tắc "s ⇒ (l - s)" nếu hỗ trợ tính (l) ≥
min conf, nơi phút conf là ngưỡng tin cậy tối thiểu.
Bởi vì các quy tắc được tạo ra từ các tập phổ biến, mỗi người tự động satis- FIEs sự hỗ trợ tối thiểu. Tập phổ biến có thể được lưu trữ trước thời hạn trong bảng băm cùng với số lượng của họ để họ có thể được truy cập một cách nhanh chóng.
Ví dụ 6.4 Tạo luật kết hợp. Hãy thử một ví dụ dựa trên các dữ liệu giao dịch cho AllElectronics thể hiện trước đây trong Bảng 6.1. Các dữ liệu chứa tập phổ biến X = {I1, I2, I5}. Các luật kết hợp có thể được tạo ra từ X là gì? Các tập con khác rỗng của X là {I1, I2}, {I1, I5}, {I2, I5}, {I1}, {I2}, và {} I5. Kết quả là các luật kết hợp được như hình dưới đây, từng được liệt kê với sự tự tin của mình:
{I1, I2} ⇒ I5, tin cậy = 2/4 = 50%
{I1, I5} ⇒ I2, tin cậy = 2/2 = 100%
{I2, I5} ⇒ I1, tin cậy = 2/2 = 100% I1 ⇒ {I2, I5}, sự tự tin = 2/6 = 33% I2 ⇒ {I1, I5}, sự tự tin = 2/7 = 29% I5 ⇒ {I1, I2}, sự tự tin = 2/2 = 100%
Nếu ngưỡng tin cậy tối thiểu là, nói, 70%, sau đó chỉ là quy tắc thứ hai, thứ ba, và cuối cùng là đầu ra, bởi vì đây là những người duy nhất được tạo ra mà là mạnh mẽ. Lưu ý rằng, không giống như các quy tắc phân loại thông thường, luật kết hợp có thể chứa nhiều hơn một liên kết ở phía bên phải của các quy tắc.
6.2.3 Nâng cao hiệu quả của Apriori
"Làm thế nào chúng ta có thể tiếp tục nâng cao hiệu quả khai thác Apriori dựa trên?" Nhiều biến thể của các thuật toán Apriori đã được đề xuất tập trung đó vào việc nâng cao hiệu quả của các thuật toán ban đầu. Một số các biến thể được tóm tắt như sau:
đang được dịch, vui lòng đợi..
