Khai thác thường xuyên 6Patterns,
hiệp hội, và mối tương quan:
Các khái niệm cơ bản và phương pháp
Hãy tưởng tượng rằng bạn là một quản lý bán hàng tại AllElectronics, và bạn đang nói chuyện với một khách hàng vừa mua một máy tính và một máy ảnh kỹ thuật số từ các cửa hàng. Bạn nên khuyên gì với cô ấy tới? Thông tin về những sản phẩm thường xuyên được mua bởi các khách cus- của bạn sau mua hàng của một máy tính và một máy ảnh kỹ thuật số trong chuỗi sẽ rất hữu ích trong việc đưa ra đề nghị của bạn. Mô hình thường xuyên và luật kết hợp là những kiến thức mà bạn muốn khai thác trong một kịch bản như vậy.
Mô hình thường xuyên là hình mẫu (ví dụ, tập phổ biến, subsequences, hoặc hạ tầng) xuất hiện thường xuyên trong một tập dữ liệu. Ví dụ, một số mặt hàng, chẳng hạn như sữa và bánh mì, mà thường xuyên xuất hiện cùng nhau trong một bộ dữ liệu giao dịch là một tập phổ biến. Một dãy, chẳng hạn như mua đầu tiên một máy tính, sau đó một máy ảnh kỹ thuật số, và sau đó là một thẻ nhớ, nếu nó xảy ra fre- xuyên trong một cơ sở dữ liệu lịch sử mua sắm, là một (thường xuyên) mô hình tuần tự. Một cấu trúc con có thể tham khảo các hình thức cấu trúc khác nhau, chẳng hạn như đồ thị con, subtrees, hoặc sublattices, có thể được kết hợp với tập phổ biến hoặc subsequences. Nếu một Hạ tầng cơ xảy ra thường xuyên, nó được gọi là (thường xuyên) có cấu trúc mô hình. Tìm kiếm các mẫu thường xuyên đóng một vai trò thiết yếu trong các hiệp hội khai thác, liên hệ, và nhiều mối quan hệ thú vị khác trong dữ liệu. Hơn nữa, nó giúp trong việc phân loại dữ liệu, phân nhóm, và nhiệm vụ khai thác dữ liệu khác. Vì vậy, thường xuyên khai thác mô hình đã trở thành một nhiệm vụ khai thác dữ liệu quan trọng và một chủ đề tập trung vào nghiên cứu khai thác dữ liệu.
Trong chương này, chúng tôi giới thiệu các khái niệm cơ bản của mô hình thường xuyên, các hiệp hội, và mối tương quan (mục 6.1) và nghiên cứu làm thế nào họ có thể khai thác một cách hiệu quả (mục 6.2). Chúng tôi cũng thảo luận làm thế nào để đánh giá liệu các mẫu được tìm thấy là thú vị (Phần 6.3). Trong Chương 7, chúng tôi mở rộng cuộc thảo luận của chúng tôi với các phương pháp tiên tiến của khai thác mô hình thường xuyên, trong đó khai thác các hình thức phức tạp hơn của mô hình thường xuyên và xem xét sở thích người dùng hoặc hạn chế để tăng tốc độ quá trình khai thác.
6.1 Các khái niệm cơ bản
thường xuyên tìm kiếm khai thác mô hình cho kỳ mối quan hệ trong một định tập dữ liệu. Phần này giới thiệu các khái niệm cơ bản về khai thác mô hình thường xuyên cho việc khám phá
đang được dịch, vui lòng đợi..