Làm thế nào tôi nên giải thích kết quả? Trong các kết quả, mỗi tập phổ biến được chú thích với sự hỗ trợ của nó. Sự hỗ trợ của một tập phổ biến là bao nhiêu lần các itemset xuất hiện trong cơ sở dữ liệu giao dịch. Ví dụ, các itemset {2, 3 5} có một sự hỗ trợ của 3 vì nó xuất hiện trong các giao dịch t2, t3 và t5. Nó là một tập phổ biến bởi vì hỗ trợ của nó là cao hơn hoặc bằng với minsup tham số. định dạng tập tin đầu vào Các định dạng tập tin đầu vào cho Apriori được định nghĩa như sau. Nó là một tập tin văn bản. Một tiết mục được biểu diễn bởi một số nguyên dương. Một giao dịch là một dòng trong tập tin văn bản. Trong mỗi dòng (giao dịch), các mục được phân cách bởi một dấu cách trống. Nó được giả định rằng tất cả các mục trong cùng một giao dịch (line) đều được sắp xếp theo một trật tự toàn (ví dụ như thứ tự tăng dần) và không có mặt hàng có thể xuất hiện hai lần trong cùng một dòng. Ví dụ, đối với ví dụ trước đây, các tập tin đầu vào được định nghĩa như sau: 1 3 4 2 3 5 1 2 3 5 2 5 1 2 3 5 Lưu ý rằng nó cũng có thể sử dụng các định dạng ARFF như một thay thế cho định dạng đầu vào mặc định. Các đặc điểm kỹ thuật của các định dạng ARFF có thể được tìm thấy ở đây. Hầu hết các tính năng của các định dạng được hỗ trợ ARFF trừ rằng (1) nhân vật "=" bị cấm và (2) thoát khỏi nhân vật không được xem xét. Lưu ý rằng khi các định dạng ARFF được sử dụng, hiệu suất của các thuật toán khai thác dữ liệu sẽ thấp hơn một chút so với khi các định dạng tập tin SPMF bản địa được sử dụng bởi vì một sự chuyển đổi của tập tin đầu vào sẽ được tự động thực hiện trước khi tung ra thuật toán và kết quả cũng sẽ có được chuyển đổi. Chi phí này tuy nhiên phải nhỏ. định dạng tập tin đầu ra định dạng tập tin đầu ra được định nghĩa như sau. Nó là một tập tin văn bản, trong đó mỗi dòng đại diện cho một tập phổ biến. Trên mỗi dòng, các mục của các tập phổ biến được liệt kê đầu tiên. Mỗi mục được đại diện bởi một số nguyên và nó được theo sau bởi một không gian duy nhất. Sau đó, tất cả các mục, từ khóa "#SUP:" xuất hiện, tiếp theo là một số nguyên cho biết sự hỗ trợ của các tập phổ biến, được thể hiện một số giao dịch. Ví dụ, ở đây là các tập tin đầu ra ví dụ này. Dòng đầu tiên chỉ ra các tập phổ biến bao gồm các khoản 1 và nó chỉ ra rằng tập phổ biến này có một sự hỗ trợ của 3 giao dịch.
đang được dịch, vui lòng đợi..
