Table 6.8 2 × 2 Contingency Table for Two Items milk milk Xrowcoffee m dịch - Table 6.8 2 × 2 Contingency Table for Two Items milk milk Xrowcoffee m Việt làm thế nào để nói

Table 6.8 2 × 2 Contingency Table f

Table 6.8 2 × 2 Contingency Table for Two Items

milk milk Xrow
coffee mc mc c
coffee mc mc c
Xcol m m X


Table 6.9 Comparison of Six Pattern Evaluation Measures Using Contingency Tables for a Variety of Data Sets
Data
Set mc mc mc mc χ 2 lift all conf. max conf. Kulc. cosine
D1 10,000 1000 1000 100,000 90557 9.26 0.91 0.91 0.91 0.91
D2 10,000 1000 1000 100 0 1 0.91 0.91 0.91 0.91
D3 100 1000 1000 100,000 670 8.44 0.09 0.09 0.09 0.09
D4 1000 1000 1000 100,000 24740 25.75 0.5 0.5 0.5 0.5
D5 1000 100 10,000 100,000 8173 9.18 0.09 0.91 0.5 0.29
D6 1000 10 100,000 100,000 965 1.97 0.01 0.99 0.5 0.10


Example 6.10 Comparison of six pattern evaluation measures on typical data sets. The relationships between the purchases of two items, milk and coffee, can be examined by summarizing their purchase history in Table 6.8, a 2 × 2 contingency table, where an entry such as mc represents the number of transactions containing both milk and coffee.
Table 6.9 shows a set of transactional data sets with their corresponding contin- gency tables and the associated values for each of the six evaluation measures. Let’s first examine the first four data sets, D1 through D4. From the table, we see that m and c are positively associated in D1 and D2, negatively associated in D3, and neu- tral in D4. For D1 and D2, m and c are positively associated because mc (10,000) is considerably greater than mc (1000) and mc (1000). Intuitively, for people who bought milk (m = 10, 000 + 1000 = 11, 000), it is very likely that they also bought coffee (mc/m = 10/11 = 91%), and vice versa.
The results of the four newly introduced measures show that m and c are strongly
positively associated in both data sets by producing a measure value of 0.91. However, lift and χ 2 generate dramatically different measure values for D1 and D2 due to their sensitivity to mc. In fact, in many real-world scenarios, mc is usually huge and unstable. For example, in a market basket database, the total number of transactions could fluctu- ate on a daily basis and overwhelmingly exceed the number of transactions containing any particular itemset. Therefore, a good interestingness measure should not be affected by transactions that do not contain the itemsets of interest; otherwise, it would generate unstable results, as illustrated in D1 and D2.

0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
Bảng 6.8 2 × 2 Contingency bảng cho hai bài sữa sữa Xrowcà phê mc mc ccà phê mc mc cXcol m m XSo sánh bảng 6.9 của sáu mô hình đánh giá các biện pháp phòng hờ bảng bằng cách sử dụng cho một loạt các bộ dữ liệuDữ liệuThiết lập mc mc mc mc χ 2 lift tất cả conf. tối đa conf. Kulc. cô sinD1 10.000 1000 1000 100.000 90557 9,26 0.91 0.91 0.91 0.91D2 10.000 1000 1000 100 0 1 0.91 0.91 0.91 0.91D3 100 1000 1000 100.000 670 8.44 0.09 0,09 0.09 0,09D4 1000 1000 1000 100.000 24740 25,75 CÁCH 0.5 0,5 0,5 CÁCH 0.5D5 1000 100 10.000 100.000 8173 9.18 0.09 0.91 CÁCH 0.5 0.29D6 1000 10 100.000 100.000 965 1.97 0,01 0,99 CÁCH 0.5 0,10Ví dụ 6,10 so sánh của sáu mô hình đánh giá các biện pháp trên bộ dữ liệu điển hình. Các mối quan hệ giữa việc mua bán các mặt hàng hai, sữa và cà phê, có thể được kiểm tra bởi tổng kết lịch sử mua hàng của họ ở bàn 6.8, 2 × 2 bảng phòng hờ, nơi một mục nhập như mc đại diện cho số lượng các giao dịch có chứa sữa và cà phê.Bảng 6.9 Hiển thị một tập hợp các bộ dữ liệu giao dịch với bàn contin-gency tương ứng của họ và các giá trị liên kết cho mỗi người trong số các biện pháp sáu đánh giá. Hãy đầu tiên kiểm tra bốn bộ dữ liệu, D1 đến D4. Từ bảng, chúng tôi thấy rằng m và c đang tích cực liên quan đến D1 và D2, liên quan đến tiêu cực trong D3, và neu-tral D4. Đối với D1 và D2, m và c là tích cực liên quan bởi vì mc (10.000) là cao hơn đáng kể so với mc (1000) và mc (1000). Bằng trực giác, cho những người mua sữa (m = 10, 000 + 1000 = 11, 000), rất có thể họ cũng mua cà phê (mc/m = 10/11 = 91%), và ngược lại.Các kết quả của các biện pháp vừa được giới thiệu bốn Hiển thị rằng m và c là mạnh mẽtích cực liên quan đến cả hai bộ dữ liệu bằng cách sản xuất một giá trị đo của 0.91. Tuy nhiên, nâng và χ 2 tạo ra các biện pháp khác nhau đáng kể giá trị cho D1 và D2 do nhạy cảm của họ với mc. Trong thực tế, trong nhiều tình huống thực tế, mc thường là rất lớn và không ổn định. Cho ví dụ, trong một cơ sở dữ liệu thị trường giá trong giỏ hàng, tổng số giao dịch có thể fluctu - ăn trên một cơ sở hàng ngày và áp đảo vượt quá số lượng giao dịch có chứa bất kỳ itemset cụ thể. Do đó, một biện pháp tốt interestingness nên không bị ảnh hưởng bởi các giao dịch không chứa itemsets quan tâm; Nếu không, nó sẽ tạo ra kết quả không ổn định, như minh họa trong đường D1 và D2.
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
Bảng 6.8 2 × 2 Contingency bảng cho hai mục

Sữa Xrow
cà phê mc mc c
cà phê mc mc c
Xcol mm X


Bảng 6.9 So sánh Sáu biện pháp đánh giá mẫu Sử dụng Bàn dự phòng đối với đa dạng của các tập dữ liệu
Dữ liệu
Set mc mc mc mc χ 2 thang máy tất cả conf. max conf. Kulc. cosin
D1 10.000 1.000 1.000 100.000 90.557 9,26 0,91 0,91 0,91 0,91
D2 10.000 1000 1000 100 0 1 0,91 0,91 0,91 0,91
D3 100 1000 1000 100.000 670 8,44 0,09 0,09 0,09 0,09
D4 1000 1000 1000 100.000 24.740 25,75 0,5 0,5 0,5 0,5
D5 1000 100 10.000 100.000 8173 9,18 0,09 0,91 0,5 0,29
D6 1000 10 100.000 100.000 965 1,97 0,01 0,99 0,5 0,10


Ví dụ 6.10 So sánh sáu biện pháp đánh giá mô hình trên bộ dữ liệu điển hình. Các mối quan hệ giữa việc mua bán của hai mặt hàng, sữa và cà phê, có thể được kiểm tra bằng cách tổng kết lịch sử mua hàng của họ trong Bảng 6.8, một bảng tiếp 2 × 2, nơi một mục như mc đại diện cho số lượng giao dịch có chứa cả sữa và cà phê.
Bảng 6.9 cho thấy một tập hợp các bộ dữ liệu giao dịch với họ tương ứng với bảng khẩn tieáp tuïc và các giá trị liên quan cho mỗi sáu biện pháp đánh giá. Hãy đầu tiên kiểm tra bốn bộ dữ liệu đầu tiên, D1 qua D4. Từ bảng trên, chúng ta thấy rằng m và c có liên quan tích cực trong D1 và D2, liên quan đến tiêu cực trong D3, và trung lập ở D4. Đối với D1 và D2, m và c có liên quan tích cực vì mc (10.000) là lớn hơn đáng kể so với mc (1000) và mc (1000). Bằng trực giác, cho những người đã mua sữa (m = 10, 000 + 1000 = 11, 000), rất có khả năng rằng họ cũng đã mua cà phê (mc / m = 10/11 = 91%), và ngược lại.
Các kết quả bốn biện pháp mới được giới thiệu cho thấy m và c đều mạnh mẽ
tích cực liên quan ở cả hai bộ dữ liệu bằng cách tạo ra một giá trị đo là 0,91. Tuy nhiên, thang máy và χ 2 tạo ra các giá trị đo lường sự khác lạ cho D1 và D2 do tính nhạy cảm của họ để mc. Trong thực tế, trong nhiều tình huống thực tế, mc thường là rất lớn và không ổn định. Ví dụ, trong một cơ sở dữ liệu giỏ thị trường, tổng số lượng giao dịch có thể fluctu- ăn trên một cơ sở hàng ngày và áp đảo vượt quá số lượng giao dịch có chứa bất kỳ tập phổ biến cụ thể. Do đó, một biện pháp rất nhiều lý thú tốt không bị ảnh hưởng bởi các giao dịch không chứa các tập phổ biến của lãi suất; nếu không, nó sẽ tạo ra kết quả không ổn định, như minh họa trong D1 và D2.

đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2025 I Love Translation. All reserved.

E-mail: