Trong quá trình xây dựng các UFP-cây, đầu tiên nó tìm thấy tất cả các hỗ trợ dựa trên các hạng mục dự kiến thường xuyên và ra lệnh cho các mục bằng cách hỗ trợ dự kiến của họ. Đối với các cơ sở dữ liệu không chắc chắn trong hình 1, danh mục ra lệnh là {C: 2.6, A: 2.1, F: 1.8, B: 1.4, E: 1.3, D: 1,2} trong đó con số thực tế sau đại tràng là sự hỗ trợ dự kiến cho mỗi mục. Dựa trên danh sách, các thuật toán Sắp xếp mỗi giao dịch và chèn các giao dịch vào UFP-tree. Mỗi nút có ba giá trị trong UFPtree. Giá trị đầu tiên là nhãn của mặt hàng; giá trị thứ hai là xác suất xuất hiện của các mặt hàng này; và các giá trị thứ ba là những con số mà nút này được chia sẻ từ gốc đến nó.
Khác với truyền thống FP-tree, nén của UFP-tree là giảm đáng kể bởi vì nó là khó khăn để có những lợi thế của con đường tiền tố chia sẻ trong FP -tree dưới cơ sở dữ liệu không chắc chắn. Trong UFP-cây, các mục có thể chia sẻ một nút chỉ khi nhãn của họ và xác suất xuất hiện là cả hai cùng. Nếu không, các mục phải được trình bày trong hai khác nhau
nút. Trong thực tế, xác suất trong một cơ sở dữ liệu không chắc chắn làm cho các cơ sở dữ liệu xác định tương ứng trở nên thưa thớt do ít nút chia sẻ và đường dẫn. Do đó, cơ sở dữ liệu không chắc chắn thường được coi là cơ sở dữ liệu thưa thớt. Cho một UDB, chúng ta phải xây dựng nhiều cây con có điều kiện trong
tương ứng UFP-cây, dẫn tính toán nhiều dư thừa. Đó cũng là lý do tại sao UFP-tăng trưởng không thể đạt được hiệu quả tương tự như FP-tăng trưởng nào.
đang được dịch, vui lòng đợi..
