ATTRIBUTE GIẢM
Trong nhiều bộ dữ liệu, bạn sẽ thấy rằng một số các thuộc tính chỉ đơn giản là không thích hợp để trả lời một câu hỏi được đưa ra. Trong Chương 4, chúng tôi sẽ thảo luận về phương pháp đánh giá sự tương quan, hay sức mạnh của mối quan hệ giữa các thuộc tính nhất định. Trong một số trường hợp, bạn sẽ không biết mức độ mà một thuộc tính nào đó sẽ có ích mà không đánh giá thống kê tương quan của thuộc tính đó để các dữ liệu khác, bạn sẽ được đánh giá. Trong dòng quá trình của chúng tôi trong RapidMiner, chúng ta có thể loại bỏ các thuộc tính đó không phải là rất thú vị về việc trả lời một câu hỏi được đưa ra mà không hoàn toàn xóa chúng từ tập dữ liệu. Hãy nhớ rằng, chỉ đơn giản bởi vì biến nhất định trong một tập dữ liệu không được thú vị để trả lời một câu hỏi nào đó không có nghĩa là những biến sẽ không bao giờ thú vị. Đây là lý do tại sao chúng tôi đề nghị đưa vào tất cả các thuộc tính khi nhập dữ liệu Chương 3 thiết lập trước đó trong chương này thuộc tính-nhàm chán hoặc không liên quan được dễ dàng để loại trừ trong phạm vi luồng của mình bằng cách làm theo các bước sau:
1) Trở về thiết kế phối cảnh. Trong lĩnh vực tìm kiếm điều hành, gõ Chọn Thuộc tính. Chọn thuộc tính điều hành sẽ xuất hiện. Kéo nó vào cuối dòng của bạn để nó phù hợp giữa các nhà điều hành và thay thế các cổng kết quả. . Cửa sổ của bạn sẽ trông giống như hình 3-32
2) Trong cửa sổ Parameters, đặt các loại bộ lọc thuộc tính 'tập hợp', sau đó nhấn nút Chọn thuộc tính; một cửa sổ tương tự như Hình 3-33 sẽ xuất hiện.
3) Sử dụng đúng các mũi tên màu xanh lá cây và trái, bạn có thể chọn các thuộc tính bạn muốn giữ. Giả sử chúng ta sẽ nghiên cứu nhân khẩu học của người sử dụng Internet. Trong ví dụ này, chúng ta có thể chọn Birth_Year, Giới tính, Marital_Status, chủng tộc, và có lẽ Years_on_Internet, và di chuyển chúng sang bên phải dưới Thuộc tính được chọn bằng cách sử dụng mũi tên màu xanh bên phải. Bạn có thể chọn nhiều hơn một thuộc tính tại một thời điểm bằng cách giữ phím điều khiển hoặc thay đổi các phím của bạn (trên một máy tính Windows) khi nhấp chuột vào các thuộc tính bạn muốn để chọn hoặc bỏ chọn. Sau đó chúng ta có thể nhấn OK, và sẽ có những thuộc tính duy nhất chúng ta sẽ thấy trong kết quả quan điểm khi chúng tôi chạy mô hình của chúng tôi. Tất cả các hoạt động khai thác dữ liệu hạ lưu tiếp theo thêm vào mô hình của chúng tôi chỉ sẽ hành động theo tập hợp con của các thuộc tính của chúng tôi.
đang được dịch, vui lòng đợi..
