Vẽ các dữ liệu
Một bước hữu ích đầu tiên là để âm mưu dữ liệu. Hình 2.1 cho thấy dữ liệu từ Ví dụ 2.1 vẽ trong thứ tự thời gian
quan sát, với một sơ đồ dot vẽ ở phía bên tay phải. Chấm được xếp chồng lên nhau để chỉ ra tần số.
Một sơ đồ dot bắt đầu để có được đông đúc khi có nhiều hơn khoảng 20 quan sát. Đối với một lượng lớn
số điểm (một kích thước mẫu lớn), nó là thuận lợi để nhóm các dấu chấm vào những khoảng thời gian và đại diện cho một
nhóm với một quán bar, như thể hiện trong hình 2.2. Hình vẽ này cho thấy các thực nghiệm (nhận ra) phân bố của
dữ liệu. Plots của loại hình này thường được gọi là biểu đồ, nhưng tên gợi nhiều âm mưu mật độ dữ liệu
đã được đề xuất (Watts, 1991).
HÌNH 2.1 Thời gian cốt truyện và chấm biểu đồ (phía bên phải) của dữ liệu nitrate trong Ví dụ 2.1.
HÌNH 2.2 Biểu đồ tần số (biểu đồ).
0 10 20 30
4
8
12
Nitrate (mg / L)
•
•••
•••••
••••••••
•
••••••
•••
tự quan sát
4 5 6 7 8 9 10
0
2
4
6
8
10
Tần số
Nitrate (mg / L)
L1592_Frame_C02 Page 8 Thứ ba 18 Tháng 12, 2001 1:40
© 2002 By CRC Press LLC
Các phối của biểu đồ có thể được tính thực tế (ni ) lần xuất hiện trong một khoảng thời gian hoặc có thể là
tần số tương đối, fi = ni / n, trong đó n là tổng số của các giá trị được sử dụng để xây dựng các biểu đồ.
tần số tương đối cung cấp một ước tính xác suất mà một quan sát sẽ rơi vào trong một cụ thể
khoảng thời gian.
Một âm mưu hữu ích của các dữ liệu thô là sự phân bố tần số tích lũy. Ở đây, các dữ liệu được cấp
ra lệnh, thường từ nhỏ nhất (cấp bậc = 1) đến lớn nhất (xếp hạng = n), và vẽ so với xếp hạng của họ.
Hình 2.3 cho thấy âm mưu này của các dữ liệu nitrate từ Ví dụ 2.1. Âm mưu này là cơ sở của các
lô xác suất mà sẽ được thảo luận trong Chương 5.
Phân phối xác suất
Khi kích thước mẫu, n, trở nên rất lớn, sự phân bố tần số trở nên mượt mà và cách tiếp cận
các hình dạng của phân phối tần số cơ bản. Chức năng phân phối này có thể đại diện cho
các biến ngẫu nhiên rời rạc hoặc các biến ngẫu nhiên liên tục. Một biến ngẫu nhiên rời rạc là một trong đó chỉ có
giá trị điểm (thường giá trị nguyên). Một biến ngẫu nhiên liên tục là một trong đó có thể giả định bất kỳ giá trị trên
một phạm vi. Một biến ngẫu nhiên liên tục có thể xuất hiện để được rời rạc như một biểu hiện của sự nhạy cảm của
các thiết bị đo lường, hoặc vì một nhà phân tích đã làm tròn các giá trị mà thực sự đã được đo.
Các hàm toán học được sử dụng để đại diện cho sự phân bố tần số dân số của một liên tục
biến ngẫu nhiên là gọi là hàm mật độ xác suất. Các phối p (y) của phân phối không phải là một
xác suất chính nó; nó là mật độ xác suất. Nó trở thành một xác suất khi nó được nhân lên bởi một khoảng thời gian
trên trục ngang (tức là, P = p (y) Δ Δ mà là kích thước của khoảng thời gian). Xác suất này luôn được
bởi vùng dưới hàm mật độ xác suất. Các luật xác suất yêu cầu diện tích dưới
đường cong bằng một (1.00). Khái niệm này được minh họa bằng hình 2.4, trong đó cho thấy mật độ xác suất
chức năng được gọi là phân phối chuẩn.
HÌNH 2.3 âm mưu phân phối tích lũy của các dữ liệu nitrate từ Ví dụ 2.1.
HÌNH 2.4 Hàm mật độ xác suất bình thường.
0 10 20 30
4
8
12
Nitrate ( mg / L)
Rank Order
0.0 y
0,1
0,2
0,3
0,4
Δ
Diện tích =
P = p (y) Δ
- 4 - 3 - 2 - 1 0 2 1 3 4
Probability Density, p
(y)
L1592_Frame_C02 Page 9 Thứ 3 Tháng 12 18, 2001 1:40
© 2002 By CRC Press LLC
Các Trung bình, phương sai, và Standard Deviation
Chúng tôi phân biệt giữa một số lượng đại diện cho dân chúng và một số đại diện cho một mẫu.
Một thống kê là một số lượng nhận ra tính từ dữ liệu được thực hiện để đại diện cho một dân số. Một tham số
là một số lượng lý tưởng hóa gắn liền với dân số. Thông số không thể đo trực tiếp trừ khi
toàn bộ dân số có thể được quan sát thấy. Vì vậy, các thông số được ước tính bằng số liệu thống kê. Các thông số được
thường được chỉ định bởi các chữ cái Hy Lạp (α, β, γ, vv) và số liệu thống kê của các chữ cái La Mã (a, b, c, vv). Thông
số. Là hằng số (thường không rõ về giá trị) và số liệu thống kê là các biến ngẫu nhiên tính từ dữ liệu
Với một dân số của một bộ rất lớn của N quan sát mà từ đó mẫu là tới,
dân số có nghĩa là η:
nơi yi
là một quan sát. Tổng kết, chỉ ra bởi Σ, là hơn dân số của N quan sát. Chúng tôi
cũng có thể nói rằng trung bình của dân số là giá trị kỳ vọng của y, được viết như E (y) = η,
khi N là rất lớn.
Các mẫu n quan sát thực sự sẵn từ dân số được sử dụng để tính toán mẫu
trung bình:
cho phép ước lượng η bình.
Phương sai của dân số được ký hiệu là
σ2. Các biện pháp như thế nào đến nay bất kỳ quan sát đặc biệt
là từ các η trung bình là yi - η. Phương sai là giá trị trung bình của bình phương của độ lệch như thực hiện trên
toàn bộ dân số:
Độ lệch chuẩn của dân số là một thước đo của sự lây lan có cùng đơn vị như ban đầu
đo và là trung bình. Độ lệch chuẩn là căn bậc hai của phương sai:
Các giá trị thực sự của dân số tham số σ và σ2
thường không biết đến người thí nghiệm. Họ
có thể được ước tính bằng phương sai mẫu:
trong đó n là kích thước của mẫu và là mẫu trung bình. Độ lệch chuẩn mẫu là
căn bậc hai của phương sai mẫu:
Đây là mẫu số là n - 1 hơn n. Các n - 1 đại diện cho mức độ tự do của mẫu.
Một mức độ tự do (-1) được tiêu thụ bởi vì trung bình phải tính toán để ước tính s. Các
sai lệch của n quan sát từ trung bình mẫu của họ phải tổng hợp chính xác về không. Điều này ngụ ý rằng bất kỳ
η
Σyi
N = --------
y
1
n = --Σyi
σ2 Σ () yi - η 2
N = --------------- ---------
σ
Σ () yi - η 2
N = ------------------------
s
2 Σ () yi - y 2
n - 1 = -----------------------
y
s Σ () yi - y 2
n - 1 = -------- ---------------
L1592_Frame_C02 Page 10 Thứ Ba 18 Tháng 12, 2001 1:40
© 2002 By CRC Press LLC
n - 1 trong những sai lệch hay dư hoàn toàn xác định số còn lại còn lại. Các dư n,
và do đó số tiền của họ của hình vuông và mẫu sai, được nói do đó để có n -. 1 bậc tự do
Degrees của tự do sẽ được ký hiệu bằng chữ ν Hy Lạp. Đối với các phương sai mẫu và lấy mẫu tiêu chuẩn
độ lệch, ν = n - 1.
Hầu hết thời gian, "mẫu" sẽ được giảm từ độ lệch mẫu chuẩn, mẫu phương sai, và
trung bình mẫu. Cần phải thấy rõ từ bối cảnh các số liệu thống kê tính toán đang được thảo luận.
Các chữ cái La Mã, ví dụ s
2, s, và sẽ cho biết số lượng mà là số liệu thống kê.
Chữ cái Hy Lạp
(σ2,
σ, và η) chỉ ra các thông số.
Ví dụ 2.2
Đối với 27 quan sát nitrat, các trung bình mẫu là
mẫu sai là
độ lệch chuẩn mẫu là
mẫu phương sai và nếm thử độ lệch chuẩn có ν = 27-1 = 26 độ của tự do.
Các số liệu được báo cáo với hai con số đáng kể. Mức trung bình của một số giá trị cần được tính toán
với ít nhất một con số so với các dữ liệu. Độ lệch chuẩn, cần được tính đến ít
nhất ba con số đáng kể (Taylor, 1987).
Độ chính xác, Bias, và chính xác
Độ chính xác là một chức năng của cả hai thiên vị và độ chính xác. Như được minh họa bằng ví dụ 2.3 và hình 2.5, thiên vị
đo sai số hệ thống và độ chính xác đo lường mức độ phân tán trong các dữ liệu. Đo chính xác
có độ chính xác tốt và gần bằng không thiên vị. Phương pháp không chính xác có thể có độ chính xác kém, không thể chấp nhận
thiên vị, hoặc cả hai.
Bias (lỗi hệ thống) có thể được gỡ bỏ, một khi xác định, bằng séc cẩn thận về phương pháp thí nghiệm
và thiết bị. Nó không thể được tính trung bình ra bằng cách làm phép đo hơn. Đôi khi, sai lệch không thể
xác định được vì giá trị thực sự cơ bản là không rõ.
HÌNH 2.5 Độ chính xác là một chức năng của sự thiên vị và độ chính xác tốt.
Y
y
6,9 7,8 + ++ + ... 8,1 7,9
27 = = ---------- -------------------------------------------------- 7.51 mg / L
s
2 () 6,9 7,51 - 2 ... () 7,9 7,51 - 2 + +
27 1 - -------------------------- -------------------------------------------------- --- 1,9138 (mg / L) 2 = =
s = = 1,9138 1,38 mg / L
• •
• • •
• • • • •
• • •• •
• • • • •
Chuyên viên phân tích
A
B
C
D
7,5 8,0 8,5 9,0
_Bias _Precision _Accuracy
lớn
lớn
nhỏ
vắng mặt
tốt
nghèo
nghèo
tốt tốt
nghèo
nghèo
nghèo
L1592_Frame_C02 Page 11 Thứ Ba 18 tháng 12, 2001 1:40
© 2002 By CRC Press LLC
chính xác đã làm với các phân tán giữa các phép đo lặp đi lặp lại. Phân tán này là do ngẫu nhiên
các lỗi trong các phép đo. Kết quả chính xác có lỗi nhỏ ngẫu nhiên. Độ lệch chuẩn s, thường được
sử dụng như một chỉ số về độ chính xác (hoặc không chính xác). Khi s là lớn, các phép đo không chính xác. Random
lỗi không bao giờ có thể được loại bỏ, mặc dù bằng kỹ thuật cẩn thận chúng có thể được giảm thiểu. Tác dụng của chúng có thể
được giảm bằng cách làm cho các phép đo lặp đi lặp lại và trung bình họ. Làm biện pháp replicate cũng
cung cấp các phương tiện để xác định số lượng các lỗi đo lường và đánh giá tầm quan trọng của họ.
Ví dụ 2.3
Bốn nhà phân tích từng được đưa ra năm mẫu mà đã được chuẩn bị để có một nồng độ nhất
8,00 mg / L. Các kết quả được thể hiện trong hình 2.5. Hai loại riêng biệt của các lỗi đã xảy ra
trong một tác phẩm: (1) những sai sót ngẫu nhiên gây ra các kết quả riêng để được "rải rác" về mức trung bình
của năm kết quả của mình và (2) một thành phần cố định trong các lỗi đo lường, một lỗi hệ thống hoặc thiên vị,
làm cho các quan sát quá cao. Chuyên viên phân tích B có độ chính xác kém, nhưng ít thiên vị quan sát được. Chuyên viên phân tích
C có độ chính xác kém và độ chính xác kém. Chỉ Analyst D có chút thiên vị và độ chính xác tốt.
Ví dụ 2.4
Xu hướng ước tính của 27 phép đo nitrat trong Ví dụ 2.1 là sự khác biệt giữa các
trung bình mẫu và các giá trị được biết:
Độ chính xác của phép đo được xác định bởi độ lệch chuẩn mẫu:
Chính xác = s = 1,38 mg / L
Sau đó ví dụ sẽ thấy làm thế nào để đánh giá xem liệu số tiền này của thiên vị rõ ràng là khả năng kết quả
chỉ từ sai số ngẫu nhiên trong các phép đo.
lặp và lặp lại
lặp lại và lặp lại đôi khi được dùng như từ đồng nghĩa cho chính xác. Tuy nhiên, một sự phân biệt
đang được dịch, vui lòng đợi..
