2. khái niệm sơ bộ Cho D là một tổ dữ suất với thuộc tính d fg A1; A2; ...; Quảng cáo và n biểu thị hồ sơ (đối tượng), nơi mà mỗi bản ghi có một định danh đối tượng (ANH). Cho C ¼ fg c1; C2; ...; ck là một danh sách các nhãn lớp (k là số lượng các lớp học). Hãy Constraint_Class là một tổ hợp con của C có chứa nhãn lớp học đặc biệt coi bởi người dùng cuối. Một giá trị cụ Bulgaria của một Ai thuộc tính và các kỷ lục mth được ký hiệu bởi ami (m 2 ½ 1; n; tôi 2 ½ Þ 1; d và một giá trị cụ Bulgaria của lớp C được ký hiệu là cx (x 2 ½ 1; k). Định nghĩa 1. Một mục được mô tả như là một thuộc tính và một giá trị cụ Bulgaria cho thuộc tính đó, ký hiệu là Ai fg ð Þ; Ami (m 2 ½ 1; n tôi 2 ½ 1; d). Định nghĩa 2. Một tổ phổ biến là một bộ các thiên mục, ký hiệu là Ai ð Þ; Ami; ...; AJ; AMJ (m 2 ½ 1; n tôi; j 2 ½ 1; d và tôi - j)?. Định nghĩa 3. XE R có chuyển Ai ð Þ; Ami; CX AMJ, nơi Ai ð Þ; ...; AJ?! Ami; ...; AJ;? AMJ là một tổ phổ biến và cx 2 C là một lớp nhãn. Định nghĩa 4. Sự cạnh hiện thực tế ActOcc RD Þ cai trị R trong D là số lượng hồ sơ của D phù hợp với tiền đề. R của Định nghĩa 5. Sự hỗ trợ của quy tắc R, kí hiệu là SupðRÞ, là số lượng hồ sơ của D phù hợp với tiền đề R và R của tên. Định nghĩa 6. Sự tự tin của quy tắc R, kí hiệu là Þ Conf RD, được định nghĩa là:. 108 mất Nguyễn et al / Khoa học thông tin 320 (2015) 107-125 Conf RD Þ¼ Sup RD Þ ActOcc RD Þ Ví dụ 1. Bảng 1 cho thấy một tổ dữ suất vị có chứa mười đối tượng, ba thuộc tính (A, B, và C), và ba lớp (1, 2, và 3). Ví dụ, hãy xem xét quy tắc R: fg! ð Þ A; A1 1. Chúng tôi có ActOcc RD Þ¼ 5 và SupðRÞ ¼ 3 vì có năm Đối tượng với một a1 ¼, với ba đối tượng có cùng một lớp (tức là, 1). Chúng tôi cũng có Conf RD Þ ¼ Sup RD Þ ActOcc RD Þ ¼ 3/5
đang được dịch, vui lòng đợi..