6.2.2 Generating Association Rules

6.2.2 Generating Association Rules from Frequent Itemsets
Once the frequent itemsets from transactions in a database D have been found, it is straightforward to generate strong association rules from them (where strong associa- tion rules satisfy both minimum support and minimum confidence). This can be done using Eq. (6.4) for confidence, which we show again here for completeness:
support count (A ∪ B)

confidence (A ⇒ B) = P(B|A) =

.
support count (A)

The conditional probability is expressed in terms of itemset support count, where support count (A ∪ B) is the number of transactions containing the itemsets A ∪ B, and support count (A) is the number of transactions containing the itemset A. Based on this equation, association rules can be generated as follows:

For each frequent itemset l, generate all nonempty subsets of l.
For every nonempty subset s of l, output the rule “s ⇒ (l − s)” if support count (l) ≥
min conf, where min conf is the minimum confidence threshold.

Because the rules are generated from frequent itemsets, each one automatically satis- fies the minimum support. Frequent itemsets can be stored ahead of time in hash tables along with their counts so that they can be accessed quickly.

Example 6.4 Generating association rules. Let’s try an example based on the transactional data for AllElectronics shown before in Table 6.1. The data contain frequent itemset X = {I1, I2, I5}. What are the association rules that can be generated from X ? The nonempty subsets of X are {I1, I2}, {I1, I5}, {I2, I5}, {I1}, {I2}, and {I5}. The resulting association rules are as shown below, each listed with its confidence:
{I1, I2} ⇒ I5, confidence = 2/4 = 50%
{I1, I5} ⇒ I2, confidence = 2/2 = 100%
{I2, I5} ⇒ I1, confidence = 2/2 = 100% I1 ⇒ {I2, I5}, confidence = 2/6 = 33% I2 ⇒ {I1, I5}, confidence = 2/7 = 29% I5 ⇒ {I1, I2}, confidence = 2/2 = 100%
If the minimum confidence threshold is, say, 70%, then only the second, third, and last rules are output, because these are the only ones generated that are strong. Note that, unlike conventional classification rules, association rules can contain more than one conjunct in the right side of the rule.

6.2.3 Improving the Efficiency of Apriori
“How can we further improve the efficiency of Apriori-based mining?” Many variations of the Apriori algorithm have been proposed that focus on improving the efficiency of the original algorithm. Several of these variations are summarized as follows:

For each frequent itemset l, generate all nonempty subsets of l.
For every nonempty subset s of l, output the rule “s ⇒ (l − s)” if support count (l) ≥
min conf, where min conf is the minimum confidence threshold.

Because the rules are generated from frequent itemsets, each one automatically satis- fies the minimum support. Frequent itemsets can be stored ahead of time in hash tables along with their counts so that they can be accessed quickly.

Example 6.4 Generating association rules. Let’s try an example based on the transactional data for AllElectronics shown before in Table 6.1. The data contain frequent itemset X = {I1, I2, I5}. What are the association rules that can be generated from X ? The nonempty subsets of X are {I1, I2}, {I1, I5}, {I2, I5}, {I1}, {I2}, and {I5}. The resulting association rules are as shown below, each listed with its confidence:
{I1, I2} ⇒ I5, confidence = 2/4 = 50%
{I1, I5} ⇒ I2, confidence = 2/2 = 100%
{I2, I5} ⇒ I1, confidence = 2/2 = 100% I1 ⇒ {I2, I5}, confidence = 2/6 = 33% I2 ⇒ {I1, I5}, confidence = 2/7 = 29% I5 ⇒ {I1, I2}, confidence = 2/2 = 100%
If the minimum confidence threshold is, say, 70%, then only the second, third, and last rules are output, because these are the only ones generated that are strong. Note that, unlike conventional classification rules, association rules can contain more than one conjunct in the right side of the rule.

6.2.3 Improving the Efficiency of Apriori
“How can we further improve the efficiency of Apriori-based mining?” Many variations of the Apriori algorithm have been proposed that focus on improving the efficiency of the original algorithm. Several of these variations are summarized as follows:

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

6.2.2 tạo ra các quy tắc của Hiệp hội từ thường xuyên ItemsetsMột khi các itemsets thường xuyên từ các giao dịch trong một cơ sở dữ liệu D đã được tìm thấy, nó là đơn giản để tạo ra các quy tắc của Hiệp hội mạnh mẽ từ họ (nơi quy định mạnh mẽ associa-tion đáp ứng hỗ trợ tối thiểu và tối thiểu tự tin). Điều này có thể được thực hiện bằng cách sử dụng Eq. (6.4) cho sự tự tin, chúng tôi hiển thị một lần nữa ở đây cho đầy đủ:hỗ trợ tính (một u B) tin cậy (một ⇒ B) = P(B| A) = .hỗ trợ tính (A) Xác suất có điều kiện được thể hiện trong điều khoản của itemset hỗ trợ đếm, nơi hỗ trợ (một u B) là số lượng các giao dịch có chứa itemsets một u B, và hỗ trợ (A) là số lượng các giao dịch có chứa itemset A. dựa vào phương trình này, Hiệp hội quy tắc có thể được tạo ra như sau:Đối với mỗi l itemset thường xuyên, tạo ra tất cả các tập con nonempty l.Cho mỗi nonempty tập con s của l, đầu ra quy tắc "s ⇒ (l − s)" nếu hỗ trợ đếm (l) ≥Min conf, min conf đâu ngưỡng tối thiểu sự tự tin.Bởi vì các quy tắc được tạo ra từ itemsets thường xuyên, mỗi người sẽ tự động satis fies tối thiểu hỗ trợ. Itemsets thường xuyên có thể được lưu trữ trước thời trong bảng băm cùng với số lượng của họ vì vậy mà họ có thể được truy cập một cách nhanh chóng.Ví dụ 6.4 tạo Hiệp hội quy định. Hãy thử một ví dụ dựa trên các dữ liệu giao dịch cho AllElectronics trước khi được hiển thị trong bảng 6.1. Các dữ liệu chứa thường xuyên itemset X = {I1, I2, I5}. Các quy tắc của Hiệp hội có thể được tạo ra từ X là gì? Nonempty các tập con của X là {I1, I2}, {I1, I5}, {I2, I5}, {I1}, {I2} và {I5}. Các quy tắc của Hiệp hội kết quả như hình dưới đây, mỗi người liệt kê với sự tự tin của mình:{I1, I2} ⇒ I5, sự tự tin = 2/4 = 50%{I1, I5} ⇒ I2, sự tự tin = 2/2 = 100%{I2, I5} ⇒ I1, sự tự tin = 2/2 = 100% I1 ⇒ {I2, I5}, sự tự tin = 2/6 = 33% I2 ⇒ {I1, I5}, sự tự tin = 2/7 = 29% I5 ⇒ {I1, I2}, sự tự tin = 2/2 = 100%Nếu ngưỡng tối thiểu sự tự tin, nói, 70%, sau đó chỉ là những thứ hai, thứ ba, và cuối cùng quy định là sản lượng, vì đây là những chỉ những người tạo ra rất mạnh. Lưu ý rằng, không giống như các quy tắc phân loại thông thường, Hiệp hội quy định có thể chứa nhiều hơn một conjunct ở phía bên phải của các quy tắc.6.2.3 cải thiện hiệu quả của Apriori"Làm thế nào có thể chúng tôi tiếp tục cải thiện hiệu quả của Apriori dựa trên khai thác?" Nhiều biến thể của các thuật toán Apriori đã được đề xuất mà tập trung vào việc cải thiện hiệu quả của các thuật toán ban đầu. Một vài trong số những biến thể này được tóm tắt như sau:

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

6.2.2 Quy định Hiệp hội Tạo từ tập phổ biến
khi các tập phổ biến từ các giao dịch trong một cơ sở dữ liệu D đã được tìm thấy, nó là đơn giản để tạo ra các luật kết hợp mạnh mẽ của mình (nơi quy định sự liên mạnh mẽ đáp ứng cả hai hỗ trợ tối thiểu và tin cậy tối thiểu). Điều này có thể được thực hiện bằng phương trình. (6.4) cho sự tự tin, mà chúng tôi cho thấy một lần nữa ở đây cho đầy đủ:
số hỗ trợ (A ∪ B)

tự tin (A ⇒ B) = P (B | A) =

.
Count hỗ trợ (A)

Xác suất có điều kiện được thể hiện trong các điều khoản của itemset số hỗ trợ, nơi số hỗ trợ (A ∪ B) là số lượng giao dịch có chứa các tập phổ biến A ∪ B, và số lượng hỗ trợ (A) là số lượng giao dịch có chứa các tập phổ biến A. Dựa vào phương trình này, các luật kết hợp có thể được tạo ra như sau:

Đối với mỗi tập phổ biến l thường xuyên, tạo ra tất cả các tập con khác rỗng của l.
Đối với mỗi tập con khác rỗng của các l, đầu ra quy tắc "s ⇒ (l - s)" nếu hỗ trợ tính (l) ≥
min conf, nơi phút conf là ngưỡng tin cậy tối thiểu.

Bởi vì các quy tắc được tạo ra từ các tập phổ biến, mỗi người tự động satis- FIEs sự hỗ trợ tối thiểu. Tập phổ biến có thể được lưu trữ trước thời hạn trong bảng băm cùng với số lượng của họ để họ có thể được truy cập một cách nhanh chóng.

Ví dụ 6.4 Tạo luật kết hợp. Hãy thử một ví dụ dựa trên các dữ liệu giao dịch cho AllElectronics thể hiện trước đây trong Bảng 6.1. Các dữ liệu chứa tập phổ biến X = {I1, I2, I5}. Các luật kết hợp có thể được tạo ra từ X là gì? Các tập con khác rỗng của X là {I1, I2}, {I1, I5}, {I2, I5}, {I1}, {I2}, và {} I5. Kết quả là các luật kết hợp được như hình dưới đây, từng được liệt kê với sự tự tin của mình:
{I1, I2} ⇒ I5, tin cậy = 2/4 = 50%
{I1, I5} ⇒ I2, tin cậy = 2/2 = 100%
{I2, I5} ⇒ I1, tin cậy = 2/2 = 100% I1 ⇒ {I2, I5}, sự tự tin = 2/6 = 33% I2 ⇒ {I1, I5}, sự tự tin = 2/7 = 29% I5 ⇒ {I1, I2}, sự tự tin = 2/2 = 100%
Nếu ngưỡng tin cậy tối thiểu là, nói, 70%, sau đó chỉ là quy tắc thứ hai, thứ ba, và cuối cùng là đầu ra, bởi vì đây là những người duy nhất được tạo ra mà là mạnh mẽ. Lưu ý rằng, không giống như các quy tắc phân loại thông thường, luật kết hợp có thể chứa nhiều hơn một liên kết ở phía bên phải của các quy tắc.

6.2.3 Nâng cao hiệu quả của Apriori
"Làm thế nào chúng ta có thể tiếp tục nâng cao hiệu quả khai thác Apriori dựa trên?" Nhiều biến thể của các thuật toán Apriori đã được đề xuất tập trung đó vào việc nâng cao hiệu quả của các thuật toán ban đầu. Một số các biến thể được tóm tắt như sau:

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.