Báo cáo vấn đề và định nghĩa
Cho I ¼ {i 1, i 2, ..., im} là một tập hợp của tất cả các mặt hàng, trong đó có cơ quan đại diện trừu tượng của các thành phần của sản phẩm. Một cơ sở dữ liệu sản phẩm được ký hiệu là DB¼ {P 1, P 2, ..., P n}, trong đó P i (1rirn) là một sản phẩm được trình bày dưới dạng <Items, Val>, nơi mục là các mục (hay thành phần) tạo thành P i và Val là lợi nhuận mà các nhà máy có được bằng cách bán các sản phẩm P i. Một XDI bộ cũng được gọi là một tập phổ biến, và một tập phổ biến với các vật phẩm k được gọi là một k-itemset.
Các cơ sở dữ liệu ví dụ trong Bảng 1 được sử dụng trong suốt bài báo này. Trong cơ sở dữ liệu này, {a, b, c, d, đ, e, g, h} là tập hợp các mặt hàng (thành phần) được sử dụng để tạo ra tất cả các sản phẩm {P 1, P 2, ..., P 11}. Sản phẩm P 2 được làm từ hai thành phần {ab}. Nhà máy kiếm được 1000 triệu USD bằng cách bán sản phẩm P 2.
Để hiểu khai thác EI, hai định nghĩa cơ bản được trình bày như sau (Deng et al., 2009):
đang được dịch, vui lòng đợi..