Đối với các dữ liệu số đó có nhiều giá trị rời rạc khác nhau với rất ít sự lặp lại hoặc là
liên tục, một phân bố tần số yêu cầu chúng ta xác định bằng cách xác định
1. số lượng các nhóm,
2. chiều rộng của mỗi nhóm, và
3. giới hạn trên và dưới của mỗi nhóm.
Điều quan trọng là hãy nhớ rằng các nhóm có thể không trùng nhau, do đó mỗi giá trị được tính
chính xác trong một nhóm.
Bạn nên xác định các nhóm sau khi xem xét phạm vi của dữ liệu. Nói chung, bạn
nên lựa chọn giữa 5-15 nhóm, và phạm vi của mỗi nên được bình đẳng. Càng nhiều
dữ liệu bạn có, nhiều nhóm bạn thường phải sử dụng. Lưu ý rằng với nhóm ít hơn,
độ rộng của nhóm sẽ được rộng hơn. Độ rộng nhóm rộng hơn cung cấp một "thô" biểu đồ. Đôi khi
bạn cần phải thử nghiệm để tìm số tốt nhất của các nhóm để cung cấp một hình dung hữu ích
của dữ liệu. Chọn giới hạn dưới của nhóm đầu tiên (LL) là một số nguyên nhỏ
hơn giá trị dữ liệu tối thiểu và giới hạn trên của nhóm cuối cùng (UL) như là một số nguyên
lớn hơn giá trị dữ liệu tối đa. Nói chung, nó làm cho cảm giác để lựa chọn tốt đẹp, toàn bộ vòng
số. Sau đó, bạn có thể tính toán chiều rộng nhóm như
đang được dịch, vui lòng đợi..
