TÓM TẮT:
Sequential khai thác mẫu là quá trình áp dụng các kỹ thuật khai thác dữ liệu vào một cơ sở dữ liệu tuần tự cho các mục đích phát hiện các mối quan hệ tương quan tồn tại giữa một danh sách có thứ tự các sự kiện. Các nhiệm vụ phát hiện các trình tự thường xuyên là một thách thức, bởi vì các thuật toán cần xử lý một số combinatorially nổ của các trình tự có thể. Khám phá những thông tin ẩn từ dữ liệu Web log được gọi là khai thác sử dụng Web. Một sử dụng phổ biến trong các ứng dụng web là việc khai thác hành vi truy cập của người sử dụng với mục đích dự đoán và do đó tìm nạp trước các trang web mà người dùng có khả năng truy cập. Mục đích của việc khám phá các mẫu tuần tự thường xuyên trong dữ liệu Web log là để có được thông tin về các hành vi truy cập của người sử dụng.
Việc tìm kiếm thường xuyên mẫu tuần tự (FSP) là một vấn đề quan trọng trong việc khai thác sử dụng web. Trong bài báo này, chúng tôi khám phá một kỹ thuật mới mô hình chuỗi thường xuyên gọi AWAPT (Adaptive Web Access Pattern Tree), khai thác FSP. An AWAPT kết hợp cây Suffix và cây Prefix cho lưu trữ hiệu quả của tất cả các chuỗi có chứa một mục nào. Nó giúp loại bỏ tái đệ quy của cây WAP trung gian trong quá trình khai thác bằng cách gán các mã nhị phân cho mỗi nút trong cây WAP. Web cây mô hình truy cập (WAP-tree) khai thác mỏ là một kỹ thuật khai thác mô hình tuần tự cho các trình tự đăng nhập truy cập web, mà các cửa hàng đầu tiên các cơ sở dữ liệu trình tự truy cập web gốc (WASD) trên một cây tiền tố, tương tự như cây mẫu thường xuyên (FP-tree) để lưu trữ dữ liệu không tuần tự. WAP-tree thuật toán sau đó, mìn các trình tự thường xuyên từ WAP-cây bằng cách đệ quy tái xây dựng cây trung gian, bắt đầu với chuỗi hậu tố và kết thúc với chuỗi tiền tố. Một nỗ lực đã được thực hiện để AWAPT cách tiếp cận để nâng cao hiệu quả. AWAPT hoàn toàn loại bỏ sự cần thiết phải tham gia vào rất nhiều nguyên các trung gian WAP-cây trong khai thác và giảm đáng kể thời gian thực hiện. Từ khóa:. Data Mining, khai thác mô hình tuần tự, khai thác mô hình thường xuyên, khai thác sử dụng web, AWAPT DOI: 10,5121 / ijdms.2010.2304 31
đang được dịch, vui lòng đợi..
