6.1.2 tập phổ biến, đóng tập phổ biến và luật kết hợp 
Hãy I = {I1, I2,. . . , Im} là một tập phổ biến. Cho D, dữ liệu công việc có liên quan, là một tập hợp các giao dịch cơ sở dữ liệu, nơi mỗi giao dịch T là một tập phổ biến khác rỗng mà T ⊆ I. Mỗi giao dịch được kết hợp với một định danh, gọi là TID. Cho A là một tập hợp của các mặt hàng. T hành động xuyên được cho là chứa A nếu A ⊆ T. Một luật kết hợp là một ý nghĩa của mẫu A ⇒ B, trong đó A ⊂ I, B ⊂ I, A / = ∅, B / = ∅, và A ∩ B = φ. Các quy tắc A ⇒ B giữ trong bộ giao dịch D với sự hỗ trợ của, trong đó s là tỷ lệ giao dịch trong D có chứa A ∪ B (tức là, các công đoàn của bộ A và B nói, hay, cả A và B). Điều này được thực hiện để có xác suất P (A ∪ B) 0,1 Các quy tắc A ⇒ B có tự tin c trong giao dịch thiết lập D, 
trong đó c là tỷ lệ phần trăm của các giao dịch trong D chứa A mà cũng chứa B. Điều này được 
thực hiện để là xác suất có điều kiện, P (B | A). Đó là, 
hỗ trợ (A⇒B) = P (A ∪ B) (6.2) 
tự tin (A⇒B) = P (B | A). (6.3) 
Quy định thoả mãn cả một ngưỡng tối thiểu hỗ trợ (min sup) và tối thiểu ngưỡng fidence nhiễm (conf phút) được gọi là mạnh mẽ. Theo quy ước, chúng tôi viết thư ủng hộ và niềm tin giá trị để xảy ra giữa 0% và 100%, chứ không phải là 0-1,0. 
Một số mặt hàng được gọi là một itemset.2 Một tập phổ biến có chứa mục k là 
k-itemset. Các tập {máy tính, phần mềm chống virus} là một 2-itemset. Sự xuất hiện fre- tần của một tập phổ biến là số lượng giao dịch có chứa các tập phổ biến. Điều này cũng được biết đến, đơn giản, như tần số, số lượng hỗ trợ, hoặc số của tập phổ biến. Lưu ý rằng sự hỗ trợ tập phổ biến được xác định trong phương. (6.2) đôi khi được gọi là hỗ trợ tương đối, trong khi tần số xảy ra được gọi là sự hỗ trợ tuyệt đối. Nếu sự hỗ trợ tương đối của một tập phổ biến tôi thỏa mãn một ngưỡng hỗ trợ tối thiểu được xác định trước (tức là, sự ủng hộ tuyệt đối của tôi đáp ứng các ngưỡng hỗ trợ tối thiểu số lượng tương ứng), sau đó tôi là một thường xuyên itemset.3 Các bộ thường xuyên k-tập phổ biến thường được ký hiệu bằng Lc 0,4 
Từ phương trình. (6.3), chúng tôi có 
 
sự tự tin (A⇒B) = P (B | A) = 
 
hỗ trợ (A ∪ B) hỗ trợ (A) = 
 
số hỗ trợ (A ∪ B). (6.4) 
số hỗ trợ (A) 
 
1Notice rằng các ký hiệu P (A ∪ B) cho thấy xác suất mà một giao dịch có chứa các công đoàn của bộ A và B (tức là, nó có chứa tất cả các mục trong A và B). Điều này không nên nhầm lẫn với P (A hoặc B), cho biết xác suất mà một giao dịch có chứa hoặc là A hoặc B. 
2in các tài liệu nghiên cứu khai thác dữ liệu ", tập phổ biến" được sử dụng nhiều hơn "mục thiết lập." 
3in công việc sớm, tập phổ biến đáp ứng hỗ trợ tối thiểu được gọi là lớn. Thuật ngữ này, tuy nhiên, là hơi khó hiểu vì nó có ý nghĩa của số lượng các mục trong một tập phổ biến hơn là tần số xuất hiện của bộ này. Do đó, chúng tôi sử dụng thuật ngữ gần đây thường xuyên hơn. 
4Although thuật ngữ thường xuyên được ưa thích hơn lớn, vì những lý do lịch sử thường xuyên k-tập phổ biến vẫn được biểu thị là Lc.
 
đang được dịch, vui lòng đợi..
