2. ĐỊNH NGHĨATrong phần này, chúng tôi cung cấp một số cơ bản định nghĩa về khai thác mỏ itemsets thường xuyên qua cơ sở dữ liệu không chắc chắn. Hãy để tôi = {i1, i2,..., trong} là một tập hợp các mục khác biệt. Chúng tôi đặt tên tập con không có sản phẩm nào, X, của tôi như một itemset. Cho ngắn gọn, chúng tôi sử dụng X = x 1 x 2... xn để biểu thị itemset X = {x 1, x 2,..., xn}. X là một l − itemset nếu nó có l mục. Đưa ra một cơ sở dữ liệu giao dịch không chắc chắn UDB, mỗi giao dịch được kí hiệu là một tuple < tid, Y > tid ở đâu nhận dạng giao dịch, và Y = {y1(p1), y2(p2),..., ym(pm)}. Y chứa đơn vị m. Mỗi đơn vị có một mục yi và xác suất, pi, biểu thị khả năng mục yi xuất hiện trong tid tuple. Số lượng giao dịch có chứa X trong UDB là một biến ngẫu nhiên, biểu hiện như là sup(X). Nhất định UDB, upportbased dự kiếnthường xuyên itemset và xác suất thường xuyên itemsets được định nghĩa như sau. Định nghĩa 1. (Dự kiến sẽ hỗ trợ) Đưa ra một cơ sở dữ liệu giao dịch không chắc chắn UDB bao gồm N giao dịch, và một itemset X, sự hỗ trợ dự kiến của X là:esup(X) = XN tôi = 1 pi(X)1651
đang được dịch, vui lòng đợi..