Khai thác sử dụng Web là việc áp dụng các kỹ thuật khai thác dữ liệu để khám phá các mẫu sử dụng thú vị từ dữ liệu web, để hiểu và phục vụ tốt hơn nhu cầu của các ứng dụng dựa trên Web. Dữ liệu sử dụng gói gọn danh tính hay nguồn gốc của người dùng web. Cách sử dụng web khai thác mỏ chính nó có thể
được phân nhiều loại tùy thuộc vào loại dữ liệu sử dụng xem xét. Họ là những dữ liệu máy chủ web, dữ liệu máy chủ ứng dụng và dữ liệu mức ứng dụng. Dữ liệu máy chủ Web tương ứng với các bản ghi người dùng được thu thập được tại máy chủ Web. Các thông tin quan trọng được chiết xuất được tìm thấy cùng với việc áp dụng các luật kết hợp về các hành vi của người sử dụng. Thông tin này được thu thập dụng bao gồm các địa chỉ IP, tài liệu tham khảo trang, và thời gian truy cập của người sử dụng .. Công việc này tập trung vào khai thác sử dụng web và đặc biệt tập trung vào việc khám phá các mô hình sử dụng web của các trang web từ máy chủ nhật ký khai thác sử dụng files.Web là ứng dụng khai thác dữ liệu mà áp dụng các kỹ thuật khai thác dữ liệu để phát hiện ra những hành vi sử dụng dữ liệu web. Web quá trình khai thác sử dụng nói chung được chia thành ba nhiệm vụ: tiền xử lý, phân tích mô hình và phát hiện mô hình. Tiền xử lý bao gồm các phản ứng tổng hợp và xác định đồng bộ hóa, nhận dạng người dùng, xác định phiên (hoặc sessionization), nhận dạng tập, và sự tích hợp của dòng dữ liệu nhấp chuột với các nguồn dữ liệu thứ tự như nội dung hoặc thông tin ngữ nghĩa. Trong giai đoạn phân tích mô hình kiến thức thú vị được chiết xuất từ các mẫu thường xuyên và kết quả này được sử dụng cho các trang web modifications..In mô hình giai đoạn khám phá, phát hiện các thuật toán mô hình thường xuyên được áp dụng trên dữ liệu thô. Cho việc tìm kiếm các thông tin được giấu trong nhật ký web, kỹ thuật khai thác một số dữ liệu được áp dụng trên các bản ghi máy chủ web. Các nghiên cứu so sánh giữa hai thuật toán luật kết hợp cụ thể, FP Tăng trưởng và thuật toán Apriori những gì chúng tôi chứng minh trong bài báo này là.
đang được dịch, vui lòng đợi..