Tiếp theo, chúng tôi trình bày một ví dụ cho thấy tính hiệu quả của các ước tính tiện ích của chúng tôi.
Chúng ta hãy xem xét các cơ sở dữ liệu ví dụ như thể hiện trong Bảng 1 và để cho min util = 75.
Trong đèo đầu tiên của cơ sở dữ liệu, giao dịch sử dụng trọng số (TWU) của
mỗi biệt mục được tính toán. {F}, {G} và {H} là các hạng mục tiện ích thấp
TWU của họ là dưới ngưỡng tiện ích tối thiểu. Các giao dịch sau đó được
tổ chức lại bằng cách loại bỏ các (tiện ích thấp) các mặt hàng không hứa hẹn và phân loại các
mặt hàng trong một giao dịch thứ tự giảm dần của TWUs của họ. Mỗi tổ chức lại
giao dịch được thêm vào từng người một để tạo ra một cây UP-Hist toàn cầu như trong
Hình 1. Bây giờ chúng ta xử lý các cây địa phương tạo ra bằng cách xử lý mục {A}
từ các bảng tiêu đề. Mục {A} là một ứng cử viên tiện ích cao itemset, vì nó
tiện ích giao dịch được tổ chức lại là 94, đó là lớn hơn so với tiện ích tối thiểu
ngưỡng. Các cơ sở mô hình có điều kiện ({A} - CPB) được tạo ra và các mặt hàng
trong CPB được xử lý. ({A} - CPB) bao gồm các đường dẫn <CD>, <C> và
<D> với tiện ích đường 56, 16 và 22. Các tiện ích giao dịch của các mục {C} và
{D} là 72 và 78. Do đó, { C} là một item không hứa hẹn và tiện ích của nó phải được
trừ để có được các tiện ích con đường được tổ chức lại. Các tiện ích được tổ chức lại của
con đường <CD> UP-Tăng trưởng được tính như hình dưới đây.
P.nunew (<CD>, A - CPB) = 56 - miu (C) × s (c) = 56-1 x 2 = 54.
p.nunew (<CD>, {A} - CPB) tính bằng UP-Growth + là cùng asc.mnu
cũng là 1. Các tiện ích ước tính của các tập phổ biến <AD> UP-Tăng trưởng và
UP-Growth + bằng tổng các tiện ích con đường của <CD> và <D> trong
{A} - CPB tức là 76.
Bây giờ, chúng tôi sẽ tính toán tiện ích ước tính bằng cách sử dụng biểu đồ của chúng tôi. Sự hỗ trợ
của các mục C không hứa hẹn là 2 và Minc (C, 2) là 5. Các tiện ích con đường của con đường
<CD> sử dụng các biểu đồ của mục {C} {<1,1>, <4,1>, <6 , 1>,
<10,1>, <13,1>} được đưa ra dưới đây:
pu (<CD>, {A} - CPB) = 56 - Minc (C, 2) * pr (C) = 56-5 = 51.
Các ước tính tiện ích của tập phổ biến <AD> là 73. Vì vậy, <AD> là một
tiện ích cao tiềm năng itemset theo UP-Tăng trưởng và UP-Growth +
thuật toán, nhưng một tiện ích thấp itemset theo thuật toán của chúng tôi.
đang được dịch, vui lòng đợi..
