Tóm tắtViệc sử dụng thường xuyên itemsets đã được giới hạn bởi chi phí cao tính toán cũng như số lượng kết quả itemsets lớn. Trong nhiều tình huống thế giới thực, Tuy nhiên, nó thường là đủ để khai thác một tập hợp con nhỏ đại diện của itemsets thường xuyên với chi phí thấp tính toán. Cuối cùng, trong bài báo này, chúng tôi xác định một vấn đề mới của việc tìm kiếm các itemsets thường xuyên vớimột chiều dài tối đa và trình bày một thuật toán mới lạ để giải quyết vấn đề này. Thật vậy, tối đa chiều dài thường xuyên itemsets có thể được hiệu quả được xác định trong bộ dữ liệu rất lớn và rất hữu ích trong nhiều ứng dụng tên miền. Thuật toán của chúng tôi tạo ra chiều dài tối đa thường xuyên itemsets bởi điều chỉnh một đoạn mô hình tăng trưởng phương pháp dựa trên cấu trúc FP-cây. Ngoài ra, một số tối ưu hóa kỹ thuật đã được khai thác để prune không gian tìm kiếm. Cuối cùng, các thí nghiệm rộng rãi trên realworld bộ dữ liệu xác nhận các thuật toán được đề xuất.
đang được dịch, vui lòng đợi..
