2. khái niệm sơ bộ
Cho D là một tập dữ liệu với thuộc tính d fg A1; A2; ...; Quảng cáo và n biểu thị hồ sơ (đối tượng), nơi mà mỗi bản ghi có một định danh đối tượng
(OID). Cho C ¼ fg c1; c2; ...; ck là một danh sách các nhãn lớp (k là số lượng các lớp học). Hãy Constraint_Class là một tập hợp con của C
có chứa nhãn lớp học đặc biệt coi bởi người dùng cuối. Một giá trị cụ thể của một Ai thuộc tính và các kỷ lục mth được ký hiệu
bởi ami (m 2 ½ 1; n; i 2 ½ Þ 1; d và một giá trị cụ thể của lớp C được ký hiệu là cx (x 2 ½ 1; k).
Định nghĩa 1. Một mục được mô tả như là một thuộc tính và một giá trị cụ thể cho thuộc tính đó, ký hiệu là Ai fg ð Þ; ami
(m 2 ½ 1; n; i 2 ½ 1; d).
Định nghĩa 2. Một tập phổ biến là một bộ các hạng mục, ký hiệu là Ai ð Þ; ami; ...; Aj; AMJ (m 2 ½ 1; n; i; j 2 ½ 1; d và i - j)?.
Định nghĩa 3. CAR R có hình Ai ð Þ; ami; cx AMJ, nơi Ai ð Þ;; ...; Aj?! ami; ...; Aj;? AMJ là một tập phổ biến và cx 2 C là một lớp
nhãn.
Định nghĩa 4. Sự xuất hiện thực tế ActOcc RD Þ cai trị R trong D là số lượng hồ sơ của D phù hợp với tiền đề. R của
Definition 5. Sự hỗ trợ của quy tắc R, kí hiệu là SupðRÞ, là số lượng hồ sơ của D phù hợp với tiền đề R và R của
quả .
Định nghĩa 6. Sự tự tin của quy tắc R, kí hiệu là Conf RD Þ, được định nghĩa
là:. 108 D. Nguyen et al / Khoa học thông tin 320 (2015) 107-125
Conf RD Þ¼ Sup RD Þ
ActOcc RD Þ
Ví dụ 1. Bảng 1 cho thấy một tập dữ liệu mẫu có chứa mười đối tượng, ba thuộc tính (A, B, và C), và ba lớp
(1, 2, và 3). Ví dụ, hãy xem xét quy tắc R: fg! ð Þ A; a1 1. Chúng tôi có ActOcc RD Þ¼ 5 và SupðRÞ ¼ 3 vì có năm
đối tượng với A ¼ a1, với ba đối tượng có cùng một lớp (tức là, 1). Chúng tôi cũng có Conf RD Þ ¼ Sup RD Þ
ActOcc RD Þ ¼ 3/5
đang được dịch, vui lòng đợi..