8) Bởi vì trọng tâm của cuốn sách này là để giới thiệu khai thác dữ liệu để các khán giả rộng nhất có thể, chúng tôi sẽ không sử dụng tất cả các công cụ có sẵn trong RapidMiner. Tại thời điểm này, chúng ta có thể làm một số công việc phức tạp và kỹ thuật, chẳng hạn như kết nối tới cơ sở dữ liệu doanh nghiệp từ xa. Tuy nhiên điều này có thể sẽ được áp đảo và không thể tiếp cận với nhiều độc giả. Đối với các mục đích của văn bản này, chúng tôi sẽ chỉ được kết nối với các giá trị riêng biệt dấu phẩy (CSV) các tập tin. Bạn nên biết rằng hầu hết các dự án khai thác dữ liệu kết hợp bộ dữ liệu rất lớn bao gồm hàng chục các thuộc tính và hàng ngàn hoặc thậm chí hàng triệu quan sát. Chúng tôi sẽ sử dụng dữ liệu nhỏ hơn trong văn bản này, nhưng những khái niệm căn bản minh họa là như nhau cho dữ liệu lớn hay nhỏ. Các bộ dữ liệu Chương 3 tải về từ trang web đồng hành là rất nhỏ, chỉ gồm các thuộc tính 15 và 11 quan sát. Bước tiếp theo của chúng tôi là kết nối với tập dữ liệu này. Nhấn vào biểu tượng Import, đó là biểu tượng thứ hai từ bên trái trong khu vực Kho, như được chỉ ra bởi các mũi tên màu đen trong hình 3-12.
đang được dịch, vui lòng đợi..
