Ba trường hợp không có sự tương quan quan sát được giữa hai vẽ các thuộc tính trong mỗi tập dữ liệu.
Từ dưới bên trái để phía trên bên phải, điều này có nghĩa rằng các giá trị gia tăng X là giá trị của Y tăng, cho thấy một mối tương quan tích cực (hình 2.8a ). Nếu mô hình của các điểm vẽ trên biểu đồ dốc từ phía trên bên trái để giảm đúng, giá trị gia tăng X là giá trị của Y giảm, cho thấy mối tương quan âm (hình 2.8b). Một dòng phù hợp nhất có thể được rút ra để nghiên cứu sự tương quan giữa các biến. Kiểm tra thống kê tương quan được nêu trong Chương 3 về tích hợp dữ liệu (Eq. (3.3)). Hình 2.9 cho thấy ba trường hợp mà không có mối quan hệ tương quan giữa hai thuộc tính trong mỗi tập dữ liệu cho trước. Mục 2.3.2 cho thấy cách phân tán này có thể được mở rộng đến các thuộc tính n, kết quả trong một ma trận tán xạ-lô.
Tóm lại, mô tả dữ liệu cơ bản (ví dụ, các biện pháp của xu hướng trung và biện đo lường mức độ phân tán) và hiển thị thống kê đồ họa (ví dụ, lô quantile, biểu đồ, và biểu đồ phân tán) cung cấp cái nhìn sâu sắc có giá trị vào các hành vi tổng thể của dữ liệu của bạn. Bằng cách giúp xác định tiếng ồn và sự chênh lệch, chúng đặc biệt hữu ích để làm sạch dữ liệu.
đang được dịch, vui lòng đợi..
