Khai thác tuần tự là quá trình áp dụng các kỹ thuật khai thác dữ liệu vào một cơ sở dữ liệu tuần tự cho các mục đích phát hiện các mối quan hệ tương quan tồn tại giữa một danh sách có thứ tự các sự kiện. Một ứng dụng quan trọng của các kỹ thuật khai thác mỏ tuần tự là khai thác sử dụng web, cho log web khai thác truy cập, nơi mà các trình tự của các trang web các truy cập được thực hiện bởi người sử dụng web khác nhau trong một khoảng thời gian, thông qua một máy chủ, được ghi lại. Web cây mô hình truy cập (WAP-tree) khai thác mỏ là một kỹ thuật khai thác mô hình tuần tự cho các trình tự đăng nhập truy cập web, mà các cửa hàng đầu tiên các cơ sở dữ liệu trình tự truy cập web ban đầu trên một cây tiền tố, tương tự như cây mẫu thường xuyên (FP-tree) để lưu trữ không dữ liệu -sequential. WAP-tree thuật toán sau đó, mìn các trình tự thường xuyên từ WAP-cây bằng cách đệ quy tái xây dựng cây trung gian, bắt đầu với chuỗi hậu tố và kết thúc với chuỗi tiền tố.
Bài báo này đề xuất một cách tiếp cận hiệu quả hơn cho việc sử dụng WAP-cây để tôi trình tự thường xuyên , mà hoàn toàn loại bỏ sự cần thiết phải tham gia vào nhiều tái xây dựng các trung gian WAP-cây trong khai thác mỏ. Các thuật toán đề xuất xây dựng các liên kết nút tiêu đề thường xuyên của bản gốc WAP-cây trong một thời trang đặt hàng trước và sử dụng mã vị trí của mỗi nút để xác định các mối quan hệ tổ tiên / hậu duệ giữa các nút của cây. Sau đó, thấy mỗi mẫu tuần tự thường xuyên, thông qua tìm kiếm chuỗi tiền tố tiến bộ, bắt đầu với sự kiện tiền tố dãy đầu tiên của nó. Các thí nghiệm cho thấy đạt được hiệu suất lớn hơn các kỹ thuật WAP-tree.
đang được dịch, vui lòng đợi..
