Lô Scatter và tương quan dữ liệu
Một biểu đồ phân tán là một trong những phương pháp đồ họa hiệu quả nhất để xác định nếu có dường như là một mối quan hệ, mô hình, hoặc xu hướng giữa hai thuộc tính số. Để con- struct một biểu đồ phân tán, mỗi cặp giá trị được coi là một cặp tọa độ trong một ý thức đại số và vẽ như các điểm trong mặt phẳng. Hình 2.7 cho thấy một biểu đồ phân tán cho các thiết lập của dữ liệu trong Bảng 2.1.
Các đồ phân tán là một phương pháp hữu ích để cung cấp một cái nhìn đầu tiên dữ liệu hai biến để xem các cụm điểm và giá trị ngoại lai, hoặc để khám phá những khả năng của các mối quan hệ tương quan. Hai thuộc tính, X, Y, có tương quan nếu một thuộc tính hàm ý khác. Mối tương quan có thể là tích cực, tiêu cực, hoặc null (không tương quan). Hình 2.8 cho thấy ví dụ về mối tương quan tích cực và tiêu cực giữa hai thuộc tính
đang được dịch, vui lòng đợi..