data formats and pattern growth methods. Mining max-patterns was first studied by Bayardo [Bay98], where MaxMiner, an Apriori-based, level-wise, breadth-first search method, was proposed to find max-itemset by performing superset frequency pruning and subset infrequency pruning for search space reduction. Another efficient method, MAFIA, developed by Burdick, Calimlim, and Gehrke [BCG01], uses vertical bitmaps to compress TID lists, thus improving the counting efficiency. A FIMI (Frequent Itemset Mining Implementation) workshop dedicated to implementation methods for frequent itemset mining was reported by Goethals and Zaki [GZ03a].
The problem of mining interesting rules has been studied by many researchers. The statistical independence of rules in data mining was studied by Piatetski-Shapiro [P-S91]. The interestingness problem of strong association rules is discussed in Chen, Han, and Yu [CHY96]; Brin, Motwani, and Silverstein [BMS97]; and Aggarwal and Yu [AY99], which cover several interestingness measures, including lift. An efficient method for generalizing associations to correlations is given in Brin, Motwani, and Silverstein [BMS97]. Other alternatives to the support–confidence framework for assess- ing the interestingness of association rules are proposed in Brin, Motwani, Ullman, and Tsur [BMUT97] and Ahmed, El-Makky, and Taha [AEMT00].
A method for mining strong gradient relationships among itemsets was proposed by Imielinski, Khachiyan, and Abdulghani [IKA02]. Silverstein, Brin, Motwani, and Ullman [SBMU98] studied the problem of mining causal structures over transaction databases. Some comparative studies of different interestingness measures were done by Hilderman and Hamilton [HH01]. The notion of null transaction invariance was intro- duced, together with a comparative analysis of interestingness measures, by Tan, Kumar, and Srivastava [TKS02]. The use of all confidence as a correlation measure for generating interesting association rules was studied by Omiecinski [Omi03] and by Lee, Kim, Cai, and Han [LKCH03]. Wu, Chen, and Han [WCH10] introduced the Kulczynski measure for associative patterns and performed a comparative analysis of a set of measures for pattern evaluation.
định dạng dữ liệu và các mô hình phát triển phương pháp. Khai thác tối đa-mẫu đầu tiên được nghiên cứu bởi Bayardo [Bay98], nơi MaxMiner, một phương pháp tìm kiếm dựa trên Apriori, level-wise, chiều rộng-đầu tiên, đã được đề xuất để tìm thấy max-itemset bằng cách thực hiện superset tần số cắt tỉa và tập hợp con infrequency cắt tỉa để tìm space giảm. Một phương pháp hiệu quả, MAFIA, phát triển bởi Burdick, Calimlim và Gehrke [BCG01], sử dụng các ảnh bitmap dọc để nén TID danh sách này, do đó nâng cao hiệu quả đếm. Một hội thảo FIMI (Itemset thường xuyên khai thác khoáng sản thực hiện) dành riêng cho việc thực hiện phương pháp để khai thác thường xuyên itemset đã được báo cáo bởi Goethals và Zaki [GZ03a].Vấn đề khai thác quy thú vị đã được nghiên cứu bởi nhiều nhà nghiên cứu. Độc lập thống kê của các quy tắc trong khai thác dữ liệu được nghiên cứu bởi Piatetski-Shapiro [P-S91]. Các vấn đề interestingness của Hiệp hội mạnh mẽ quy tắc được thảo luận trong Chen, Han và Yu [CHY96]; Brin, Motwani và Silverstein [BMS97]; và Aggarwal và Yu [AY99], trong đó bao gồm một số interestingness biện pháp, bao gồm cả Thang máy. Một phương pháp hiệu quả để khái quát các Hiệp hội với mối tương quan được đưa ra trong Brin, Motwani và Silverstein [BMS97]. Lựa chọn thay thế khác để hỗ trợ – tự tin khuôn khổ cho đánh giá-ing interestingness Hiệp hội quy định được đề xuất tại Brin, Motwani, Ullman, Tsur [BMUT97] và Ahmed, El-Makky và Taha [AEMT00].Một phương pháp để khai thác mạnh gradient mối quan hệ giữa các itemsets đã được đề xuất bởi Imielinski, Khachiyan, và Abdulghani [IKA02]. Silverstein, Brin, Motwani và Ullman [SBMU98] nghiên cứu vấn đề khai thác cấu trúc quan hệ nhân quả trên cơ sở dữ liệu giao dịch. Một số nghiên cứu so sánh các biện pháp interestingness khác nhau đã được thực hiện bởi Hilderman và Hamilton [HH01]. Khái niệm về giao dịch vô định đã là giới thiệu-duced, cùng với một phân tích so sánh của các biện pháp interestingness, Tan, Kumar và Srivastava [TKS02]. Việc sử dụng của tất cả sự tự tin như một biện pháp tương quan để tạo ra các quy tắc hội thú vị được nghiên cứu bởi Omiecinski [Omi03] và Lee, Kim, Cai và Hán [LKCH03]. Wu, Chen, và Hán [WCH10] giới thiệu các biện pháp Kulczynski cho các mô hình kết hợp và thực hiện một phân tích so sánh của một tập hợp các biện pháp để đánh giá mô hình.
đang được dịch, vui lòng đợi..

định dạng dữ liệu và phương pháp phát triển mô hình. Khai thác tối đa-mô hình lần đầu tiên được nghiên cứu bởi Bayardo [Bay98], nơi MaxMiner, một Apriori dựa trên mức độ khôn ngoan, chiều rộng đầu tiên phương pháp tìm kiếm, đã được đề xuất để tìm max-itemset bằng cách thực hiện cắt tỉa tần số siêu và tập hợp con không thường xuyên cắt tỉa cho không gian tìm kiếm giảm. Một phương pháp hiệu quả, MAFIA, được phát triển bởi Burdick, Calimlim, và Gehrke [BCG01], sử dụng bitmap dọc để nén danh sách TID, do đó nâng cao hiệu quả đếm. Một cuộc hội thảo FIMI (tập phổ biến Khai thác thực hiện) dành riêng cho phương pháp thực hiện khai thác tập phổ biến đã được báo cáo bởi Goethals và Zaki [GZ03a].
Các vấn đề của quy tắc khai thác thú vị đã được nghiên cứu bởi nhiều nhà nghiên cứu. Sự độc lập thống kê các quy tắc trong khai thác dữ liệu đã được nghiên cứu bởi Piatetski-Shapiro [P-S91]. Các vấn đề lý thú của luật kết hợp mạnh mẽ được thảo luận trong Chen, người Hán, và Yu [CHY96]; Brin, Motwani, và Silverstein [BMS97]; và Aggarwal và Yu [AY99], trong đó bao gồm một số biện pháp rất nhiều lý thú, trong đó có thang máy. Một phương pháp hiệu quả cho việc khái quát các hiệp hội để tương quan được đưa ra trong Brin, Motwani, và Silverstein [BMS97]. Lựa chọn thay thế khác với khuôn khổ hỗ trợ tin cho Assessment ing lý thú của luật kết hợp được đề xuất trong Brin, Motwani, Ullman, và Tsur [BMUT97] và Ahmed El-Makky, và Taha [AEMT00].
Một phương pháp để khai thác dốc mạnh mối quan hệ giữa các tập phổ biến được đề xuất bởi Imielinski, Khachiyan, và Abdulghani [IKA02]. Silverstein, Brin, Motwani, và Ullman [SBMU98] đã nghiên cứu các vấn đề về cấu trúc nhân quả khai thác trên cơ sở dữ liệu giao dịch. Một số nghiên cứu so sánh các biện pháp lý thú khác nhau đã được thực hiện bởi Hilderman và Hamilton [HH01]. Các khái niệm bất biến giao dịch vô là intro- duced, cùng với một phân tích so sánh các biện pháp lý thú, bởi Tân, Kumar, và Srivastava [TKS02]. Việc sử dụng tất cả sự tự tin như một biện pháp tương quan để tạo ra các luật kết hợp thú vị đã được nghiên cứu bởi Omiecinski [Omi03] và Lee, Kim, Cai, và Han [LKCH03]. Wu, Chen, và Han [WCH10] giới thiệu các biện pháp Kulczynski cho mô hình kết hợp và thực hiện một phân tích so sánh của một loạt các biện pháp để đánh giá mô hình.
đang được dịch, vui lòng đợi..
