Plotting the DataA useful first step is to plot the data. Figure 2.1 s dịch - Plotting the DataA useful first step is to plot the data. Figure 2.1 s Việt làm thế nào để nói

Plotting the DataA useful first ste

Plotting the Data
A useful first step is to plot the data. Figure 2.1 shows the data from Example 2.1 plotted in time order
of observation, with a dot diagram plotted on the right-hand side. Dots are stacked to indicate frequency.
A dot diagram starts to get crowded when there are more than about 20 observations. For a large
number of points (a large sample size), it is convenient to group the dots into intervals and represent a
group with a bar, as shown in Figure 2.2. This plot shows the empirical (realized) distribution of the
data. Plots of this kind are usually called histograms, but the more suggestive name of data density plot
has been suggested (Watts, 1991).
FIGURE 2.1 Time plot and dot diagram (right-hand side) of the nitrate data in Example 2.1.
FIGURE 2.2 Frequency diagram (histogram).
0 10 20 30
4
8
12
Nitrate (mg/L)

•••
•••••
••••••••

••••••
•••
Order of Observation
4 5 6 7 8 9 10
0
2
4
6
8
10
Frequency
Nitrate (mg/L)
L1592_Frame_C02 Page 8 Tuesday, December 18, 2001 1:40 PM
© 2002 By CRC Press LLC
The ordinate of the histogram can be the actual count (ni) of occurrences in an interval or it can be
the relative frequency, fi = ni/n, where n is the total number of values used to construct the histogram.
Relative frequency provides an estimate of the probability that an observation will fall within a particular
interval.
Another useful plot of the raw data is the cumulative frequency distribution. Here, the data are rank
ordered, usually from the smallest (rank = 1) to the largest (rank = n), and plotted versus their rank.
Figure 2.3 shows this plot of the nitrate data from Example 2.1. This plot serves as the basis of the
probability plots that are discussed in Chapter 5.
Probability Distributions
As the sample size, n, becomes very large, the frequency distribution becomes smoother and approaches
the shape of the underlying population frequency distribution. This distribution function may represent
discrete random variables or continuous random variables. A discrete random variable is one that has only
point values (often integer values). A continuous random variable is one that can assume any value over
a range. A continuous random variable may appear to be discrete as a manifestation of the sensitivity of
the measuring device, or because an analyst has rounded off the values that actually were measured.
The mathematical function used to represent the population frequency distribution of a continuous
random variable is called the probability density function. The ordinate p(y) of the distribution is not a
probability itself; it is the probability density. It becomes a probability when it is multiplied by an interval
on the horizontal axis (i.e., P = p(y)∆ where ∆ is the size of the interval). Probability is always given
by the area under the probability density function. The laws of probability require that the area under
the curve equal one (1.00). This concept is illustrated by Figure 2.4, which shows the probability density
function known as the normal distribution.
FIGURE 2.3 Cumulative distribution plot of the nitrate data from Example 2.1.
FIGURE 2.4 The normal probability density function.
0 10 20 30
4
8
12
Nitrate (mg/L)
Rank Order
0.0 y
0.1
0.2
0.3
0.4

Area =
P = p( y) ∆
- 4 - 3 - 2 - 1 0 2 1 3 4
Probability Density, p(
y)
L1592_Frame_C02 Page 9 Tuesday, December 18, 2001 1:40 PM
© 2002 By CRC Press LLC
The Average, Variance, and Standard Deviation
We distinguish between a quantity that represents a population and a quantity that represents a sample.
A statistic is a realized quantity calculated from data that are taken to represent a population. A parameter
is an idealized quantity associated with the population. Parameters cannot be measured directly unless
the entire population can be observed. Therefore, parameters are estimated by statistics. Parameters are
usually designated by Greek letters (α, β, γ, etc.) and statistics by Roman letters (a, b, c, etc.). Parameters
are constants (often unknown in value) and statistics are random variables computed from data.
Given a population of a very large set of N observations from which the sample is to come, the
population mean is η:
where yi
is an observation. The summation, indicated by ∑,is over the population of N observations. We
can also say that the mean of the population is the expected value of y, which is written as E(y) = η,
when N is very large.
The sample of n observations actually available from the population is used to calculate the sample
average:
which estimates the mean η.
The variance of the population is denoted by σ2
. The measure of how far any particular observation
is from the mean η is yi − η. The variance is the mean value of the square of such deviations taken over
the whole population:
The standard deviation of the population is a measure of spread that has the same units as the original
measurements and as the mean. The standard deviation is the square root of the variance:
The true values of the population parameters σ and σ2
are often unknown to the experimenter. They
can be estimated by the sample variance:
where n is the size of the sample and is the sample average. The sample standard deviation is the
square root of the sample variance:
Here the denominator is n − 1 rather than n. The n − 1 represents the degrees of freedom of the sample.
One degree of freedom (the –1) is consumed because the average must be calculated to estimate s. The
deviations of n observations from their sample average must sum exactly to zero. This implies that any
η
∑yi
N = --------
y
1
n = --∑yi
σ2 ∑( ) yi – η 2
N = ------------------------
σ
∑( ) yi – η 2
N = ------------------------
s
2 ∑( ) yi – y 2
n – 1 = -----------------------
y
s ∑( ) yi – y 2
n – 1 = -----------------------
L1592_Frame_C02 Page 10 Tuesday, December 18, 2001 1:40 PM
© 2002 By CRC Press LLC
n − 1 of the deviations or residuals completely determines the one remaining residual. The n residuals,
and hence their sum of squares and sample variance, are said therefore to have n − 1 degrees of freedom.
Degrees of freedom will be denoted by the Greek letter ν. For the sample variance and sample standard
deviation, ν = n − 1.
Most of the time, “sample” will be dropped from sample standard deviation, sample variance, and
sample average. It should be clear from the context that the calculated statistics are being discussed.
The Roman letters, for example s
2
, s, and , will indicate quantities that are statistics. Greek letters (σ2
,
σ, and η) indicate parameters.
Example 2.2
For the 27 nitrate observations, the sample average is
The sample variance is
The sample standard deviation is
The sample variance and sample standard deviation have ν = 27 − 1 = 26 degrees of freedom.
The data were reported with two significant figures. The average of several values should be calculated
with at least one more figure than that of the data. The standard deviation should be computed to at
least three significant figures (Taylor, 1987).
Accuracy, Bias, and Precision
Accuracy is a function of both bias and precision. As illustrated by Example 2.3 and Figure 2.5, bias
measures systematic errors and precision measures the degree of scatter in the data. Accurate measurements
have good precision and near zero bias. Inaccurate methods can have poor precision, unacceptable
bias, or both.
Bias (systematic error) can be removed, once identified, by careful checks on experimental technique
and equipment. It cannot be averaged out by making more measurements. Sometimes, bias cannot be
identified because the underlying true value is unknown.
FIGURE 2.5 Accuracy is a function of bias and good precision.
y
y
6.9 7.8 + ++ + … 8.1 7.9
27 = = ------------------------------------------------------------ 7.51 mg/L
s
2 ( ) 6.9 7.51 – 2 … ( ) 7.9 7.51 – 2 + +
27 1 – ------------------------------------------------------------------------------- 1.9138 (mg/L)2 = =
s = = 1.9138 1.38 mg/L
• •
• • •
• • • • •
• • •• •
• • • • •
Analyst
A
B
C
D
7.5 8.0 8.5 9.0
_Bias _Precision _Accuracy
large
large
small
absent
good
poor
poor
good good
poor
poor
poor
L1592_Frame_C02 Page 11 Tuesday, December 18, 2001 1:40 PM
© 2002 By CRC Press LLC
Precision has to do with the scatter between repeated measurements. This scatter is caused by random
errors in the measurements. Precise results have small random errors. The standard deviation, s, is often
used as an index of precision (or imprecision). When s is large, the measurements are imprecise. Random
errors can never be eliminated, although by careful technique they can be minimized. Their effect can
be reduced by making repeated measurements and averaging them. Making replicate measures also
provides the means to quantify the measurement errors and evaluate their importance.
Example 2.3
Four analysts each were given five samples that were prepared to have a known concentration
of 8.00 mg/L. The results are shown in Figure 2.5. Two separate kinds of errors have occurred
in A’s work: (1) random errors cause the individual results to be ‘scattered’ about the average
of his five results and (2) a fixed component in the measurement error, a systematic error or bias,
makes the observations too high. Analyst B has poor precision, but little observed bias. Analyst
C has poor accuracy and poor precision. Only Analyst D has little bias and good precision.
Example 2.4
The estimated bias of the 27 nitrate measurements in Example 2.1 is the difference between the
sample average and the known value:
The precision of the measurements is given by the sample standard deviation:
Precision = s = 1.38 mg/L
Later examples will show how to assess whether this amount of apparent bias is likely to result
just from random error in the measurements.
Reproducibility and Repeatability
Reproducibility and repeatability are sometimes used as synonyms for precision. However, a distinction
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
Âm mưu dữ liệuMột bước đầu tiên hữu ích là lô dữ liệu. 2.1 nhân vật cho thấy các dữ liệu từ ví dụ 2,1 vẽ theo thứ tự thời gianquan sát, với một sơ đồ dot âm mưu trên bên phải. Dấu chấm được xếp chồng lên nhau để biểu thị tần số.Một sơ đồ dot bắt đầu để có được đông đúc khi có nhiều hơn khoảng 20 quan sát. Cho một lớnsố điểm (một kích thước lớn mẫu), nó là thuận tiện để nhóm các dấu chấm vào khoảng thời gian và đại diện cho mộtNhóm với một quầy bar, như minh hoạ trong hình 2.2. Âm mưu này cho thấy (thực hiện) phân phối thực nghiệm cácdữ liệu. Lô của loại này thường được gọi là histograms, nhưng tên hơn gợi của dữ liệu mật độ cốt truyệnđã đề nghị (Watts, 1991).2.1 hình thời gian âm mưu và dot sơ đồ (bên phải) dữ liệu nitrat trong ví dụ 2.1.Con số 2.2 tần số diagram (biểu đồ).0 10 20 304812Nitrat (mg/L)•••••••••••••••••••••••••••Thứ tự của các quan sát4 5 6 7 8 9 100246810Tần sốNitrat (mg/L)L1592_Frame_C02 trang 8 thứ ba 18 tháng 12, năm 2001 1:40 PM© 2002 bởi báo chí CRC LLCPhối biểu đồ có thể là tính (ni) thực tế của các sự kiện trong một khoảng thời gian hoặc nó có thểtần số tương đối, fi = ni/n, n là tổng số giá trị được sử dụng để xây dựng biểu đồ.Tần số tương đối cung cấp một ước tính của xác suất rằng một quan sát sẽ nằm trong một cụ thểkhoảng thời gian.Một cốt truyện hữu ích của các dữ liệu thô là phân phối tần số tích lũy. Ở đây, dữ liệu là đánh giáĐặt hàng, thường từ nhỏ nhất (xếp hạng = 1) để lớn nhất (xếp hạng = n), và âm mưu so với xếp hạng của họ.Con số 2,3 cho thấy âm mưu này của dữ liệu nitrat từ ví dụ 2.1. Âm mưu này phục vụ như là cơ sở của cácxác suất lô có được thảo luận trong chương 5.Phân bố xác suấtNhư kích thước mẫu, n, trở nên rất lớn, phân phối tần số trở nên mượt mà và phương pháp tiếp cậnhình dạng của phân phối tần số dân nằm bên dưới. Chức năng phân phối này có thể đại diện chobiến ngẫu nhiên rời rạc hoặc biến ngẫu nhiên liên tục. Một biến ngẫu nhiên rời rạc là một trong đó có chỉđiểm giá trị (thường là giá trị số nguyên). Một biến ngẫu nhiên liên tục là một trong đó có thể giả định bất kỳ giá trị hơnmột phạm vi. Một biến ngẫu nhiên liên tục có thể xuất hiện để được rời rạc như là một biểu hiện của sự nhạy cảm củathiết bị đo lường, hoặc vì một nhà phân tích đã làm tròn ra các giá trị thực sự được đo.Các chức năng toán học được sử dụng để đại diện cho phân phối tần số dân của một liên tụcbiến ngẫu nhiên được gọi là hàm mật độ xác suất. P(y) ordinate của sự phân bố không phải là mộtxác suất chính nó; nó là mật độ xác suất. Nó sẽ trở thành một xác suất khi nó được nhân với một khoảng thời giantrên trục ngang (tức là, P = p (y) ∆ nơi ∆ là kích thước của khoảng thời gian). Xác suất luôn luôn có đượctheo diện tích dưới hàm mật độ xác suất. Pháp luật của xác suất yêu cầu mà khu vực dướiđường cong bằng một (1,00). Khái niệm này được minh họa bởi nhân vật 2.4, mà cho thấy mật độ xác suấtchức năng được gọi là phân phối chuẩn.Con số 2,3 phân bố tích lũy cốt lõi của dữ liệu nitrat từ ví dụ 2.1.Con số 2.4 hàm mật độ xác suất bình thường.0 10 20 304812Nitrat (mg/L)Thứ tự xếp hạng0,0 y0,10,20.30.4∆Khu vực =P = p (y) ∆-4-3 - 2 - 1 0 2 1 3 4Mật độ xác suất, p)y)L1592_Frame_C02 trang 9 thứ ba 18 tháng 12, năm 2001 1:40 PM© 2002 bởi báo chí CRC LLCTrung bình, phương sai, và độ lệch chuẩnChúng tôi phân biệt giữa một số lượng đại diện cho một dân số và một số lượng đại diện cho một mẫu.Một thống kê là một số lượng thực hiện tính toán từ dữ liệu được thực hiện để phản ánh một số dân. Một tham sốlà một số lượng lý tưởng, kết hợp với dân số. Tham số không thể được đo trực tiếp trừ khidân số toàn bộ có thể được quan sát thấy. Vì vậy, tham số được ước tính theo Cục thống kê. Các tham sốthường chỉ định bởi chữ cái Hy Lạp (α, β, γ, vv) và số liệu thống kê bằng chữ cái La Mã (a, b, c, vv.). Tham sốlà hằng số (thường không rõ giá trị) và số liệu thống kê là tính từ dữ liệu biến ngẫu nhiên.Cho một dân số là một tập hợp rất lớn các quan sát N mà từ đó mẫu là tới, cáccó nghĩa là dân là η:nơi yi là một quan sát. Tổng kết, chỉ ra bởi ∑, là hơn dân số N quan sát. Chúng tôicũng có thể nói rằng trung bình của dân số là giá trị kỳ vọng của y, trong đó được viết là E(y) = η,Khi N là rất lớn.Mẫu n quan sát thực sự sẵn sàng từ dân số được sử dụng để tính toán mẫulà:có ước tính có nghĩa là η.Phương sai của dân số là biểu hiện bằng σ2. Các biện pháp của các quan sát cách xa bất kỳ cụ thểlà từ trung bình η là yi − η. Phương sai là giá trị trung bình của quảng trường của các độ lệch thực hiện trêntoàn dân:Độ lệch chuẩn của dân số là một biện pháp của lây lan có các đơn vị tương tự như bản gốcđo lường và là trung bình. Độ lệch chuẩn là bậc hai của phương sai:Các giá trị thực sự của dân tham số σ và σ2 thường được biết đến experimenter. Họcó thể được ước tính của mẫu phương sai:trong đó n là kích thước của mẫu và là mức trung bình của mẫu. Độ lệch chuẩn mẫu là cácbậc hai của mẫu phương sai:Ở đây các mẫu số là n − 1 chứ không phải là n. N − 1 đại diện cho bậc tự do của mẫu vật.Một mức độ of tự do (–1) được tiêu thụ bởi vì mức trung bình phải được tính toán để ước tính s. cácđộ lệch của các quan sát n từ của họ là mẫu phải tóm tắt chính xác về không. Điều này có nghĩa rằng bất cứΗ∑YiN = --------y1n = - ∑yiΣ2 ∑ () yi-η 2N = ------------------------Σ∑ () yi-η 2N = ------------------------s2 ∑ () yi-y 2n – 1 = -----------------------ys ∑ () yi-y 2n – 1 = -----------------------L1592_Frame_C02 trang 10 thứ ba 18 tháng 12, năm 2001 1:40 PM© 2002 bởi báo chí CRC LLCn − 1 của các độ lệch hoặc dư hoàn toàn xác định một còn dư. Dư n,và do đó của tổng của hình vuông và mẫu phương sai, được cho là do đó có n − 1 bậc tự do.Bậc tự do sẽ được ký hiệu là ν chữ cái Hy Lạp. Mẫu phương sai và tiêu chuẩn mẫuđộ lệch, ν = n − 1.Phần lớn thời gian, "mẫu" sẽ được thả từ độ lệch chuẩn mẫu, mẫu phương sai, vàmẫu là. Nó nên được rõ ràng từ bối cảnh các thống kê được tính đang được thảo luận.Các chữ cái La Mã, ví dụ: s2, s, và sẽ cho biết số lượng thống kê. Ký tự Hy Lạp (σ2,Σ, và η) chỉ ra tham số.Ví dụ 2.2Đối với các quan sát 27 nitrat, là mẫu làMẫu phương sai làĐộ lệch chuẩn mẫu làMẫu phương sai và độ lệch chuẩn mẫu có ν = 27 − 1 = 26 độ tự do.Các dữ liệu đã được báo cáo với hai nhân vật quan trọng. Mức trung bình của một số giá trị nên được tínhvới ít nhất một con số nhiều hơn của các dữ liệu. Độ lệch chuẩn nên được tính đến lúcít nhất là ba quan trọng con số (Taylor, 1987).Độ chính xác, thiên vị và độ chính xácĐộ chính xác là một chức năng của cả hai thiên vị và độ chính xác. Như minh họa bằng ví dụ 2,3 và con số 2.5, thiên vịCác biện pháp hệ thống lỗi và độ chính xác đo mức độ phân tán trong dữ liệu. Các đo đạc chính xáccó độ chính xác tốt và gần bằng không thiên vị. Phương pháp không chính xác có thể kém chính xác, không thể chấp nhậnthiên vị, hoặc cả hai.Thiên vị (hệ thống lỗi) có thể được gỡ bỏ, sau khi xác định, bởi các kiểm tra cẩn thận vào thử nghiệm kỹ thuậtvà thiết bị. Nó không thể được trung bình bằng cách thêm các phép đo. Đôi khi, thiên vị không thểxác định bởi vì giá trị thực sự nằm bên dưới là không rõ.Độ chính xác hình 2,5 là một chức năng của thiên vị và độ chính xác tốt.yy6.9 7.8 + ++ +... 8.1 7.927 = = ------------------------------------------------------------ 7.51 mg/Ls2 () 6.9 7,51-2... () 7.9 7,51-2 ++27 1 – ------------------------------------------------------------------------------- 1.9138 (mg/L)2 = =s == 1.9138 1.38 mg/L• •• • •• • • • •• • •• •• • • • •Chuyên viên phân tíchABCD7,5 8.0 8,5 9.0_Bias _Precision _Accuracylớnlớnnhỏvắng mặtTốtngười nghèongười nghèotốt tốtngười nghèongười nghèongười nghèoL1592_Frame_C02 trang 11 thứ ba 18 tháng 12, năm 2001 1:40 PM© 2002 bởi báo chí CRC LLCĐộ chính xác đã làm với scatter giữa các đo đạc lặp đi lặp lại. Scatter này được gây ra bởi ngẫu nhiênsai sót trong các phép đo. Kết quả chính xác có lỗi ngẫu nhiên nhỏ. Độ lệch chuẩn, s, thườngsử dụng như một chỉ mục của công cụ chính xác (hoặc không chính xác). Khi s là lớn, các phép đo được không chính xác. Ngẫu nhiênlỗi có thể không bao giờ được loại bỏ, mặc dù bởi kỹ thuật cẩn thận, họ có thể được giảm thiểu. Có thể có hiệu lực của họđược giảm bởi việc đo đạc lặp đi lặp lại và trung bình chúng. Làm cho tái tạo các biện pháp cũngcung cấp các phương tiện để định lượng các lỗi đo lường và đánh giá tầm quan trọng của họ.Ví dụ 2.3Bốn nhà phân tích đã được đưa ra năm mẫu mà đã được chuẩn bị sẵn sàng để có một tập trung được biết đếncủa 8,00 mg/L. Các kết quả được hiển thị trong hình 2,5. Hai loại riêng biệt của lỗi đã xảy raở của A làm việc: (1) ngẫu nhiên lỗi gây ra các kết quả cá nhân để được 'phân tán' về trung bìnhkết quả năm của mình và (2) một thành phần cố định trong đo lường lỗi, lỗi hệ thống hoặc thiên vị,làm cho các quan sát quá cao. Nhà phân tích B có độ chính xác kém, nhưng ít quan sát thiên vị. Chuyên viên phân tíchC có độ chính xác người nghèo và kém chính xác. Chỉ phân tích D có ít thiên vị và độ chính xác tốt.Ví dụ 2.4Xu hướng ước tính của các số đo 27 nitrat trong ví dụ 2.1 là sự khác biệt giữa cácmẫu trung bình và giá trị nổi tiếng:Độ chính xác của các số đo được đưa ra bởi độ lệch chuẩn mẫu:Độ chính xác = s = 1.38 mg/LVí dụ sau đó sẽ hiển thị làm thế nào để đánh giá xem số tiền này của thiên vị rõ ràng là có khả năng kết quảchỉ từ lỗi ngẫu nhiên trong các phép đo.Reproducibility và lặpReproducibility và độ đôi khi được dùng như từ đồng nghĩa cho chính xác. Tuy nhiên, một sự phân biệt
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
Vẽ các dữ liệu
Một bước hữu ích đầu tiên là để âm mưu dữ liệu. Hình 2.1 cho thấy dữ liệu từ Ví dụ 2.1 vẽ trong thứ tự thời gian
quan sát, với một sơ đồ dot vẽ ở phía bên tay phải. Chấm được xếp chồng lên nhau để chỉ ra tần số.
Một sơ đồ dot bắt đầu để có được đông đúc khi có nhiều hơn khoảng 20 quan sát. Đối với một lượng lớn
số điểm (một kích thước mẫu lớn), nó là thuận lợi để nhóm các dấu chấm vào những khoảng thời gian và đại diện cho một
nhóm với một quán bar, như thể hiện trong hình 2.2. Hình vẽ này cho thấy các thực nghiệm (nhận ra) phân bố của
dữ liệu. Plots của loại hình này thường được gọi là biểu đồ, nhưng tên gợi nhiều âm mưu mật độ dữ liệu
đã được đề xuất (Watts, 1991).
HÌNH 2.1 Thời gian cốt truyện và chấm biểu đồ (phía bên phải) của dữ liệu nitrate trong Ví dụ 2.1.
HÌNH 2.2 Biểu đồ tần số (biểu đồ).
0 10 20 30
4
8
12
Nitrate (mg / L)

•••
•••••
••••••••

••••••
•••
tự quan sát
4 5 6 7 8 9 10
0
2
4
6
8
10
Tần số
Nitrate (mg / L)
L1592_Frame_C02 Page 8 Thứ ba 18 Tháng 12, 2001 1:40
© 2002 By CRC Press LLC
Các phối của biểu đồ có thể được tính thực tế (ni ) lần xuất hiện trong một khoảng thời gian hoặc có thể là
tần số tương đối, fi = ni / n, trong đó n là tổng số của các giá trị được sử dụng để xây dựng các biểu đồ.
tần số tương đối cung cấp một ước tính xác suất mà một quan sát sẽ rơi vào trong một cụ thể
khoảng thời gian.
Một âm mưu hữu ích của các dữ liệu thô là sự phân bố tần số tích lũy. Ở đây, các dữ liệu được cấp
ra lệnh, thường từ nhỏ nhất (cấp bậc = 1) đến lớn nhất (xếp hạng = n), và vẽ so với xếp hạng của họ.
Hình 2.3 cho thấy âm mưu này của các dữ liệu nitrate từ Ví dụ 2.1. Âm mưu này là cơ sở của các
lô xác suất mà sẽ được thảo luận trong Chương 5.
Phân phối xác suất
Khi kích thước mẫu, n, trở nên rất lớn, sự phân bố tần số trở nên mượt mà và cách tiếp cận
các hình dạng của phân phối tần số cơ bản. Chức năng phân phối này có thể đại diện cho
các biến ngẫu nhiên rời rạc hoặc các biến ngẫu nhiên liên tục. Một biến ngẫu nhiên rời rạc là một trong đó chỉ có
giá trị điểm (thường giá trị nguyên). Một biến ngẫu nhiên liên tục là một trong đó có thể giả định bất kỳ giá trị trên
một phạm vi. Một biến ngẫu nhiên liên tục có thể xuất hiện để được rời rạc như một biểu hiện của sự nhạy cảm của
các thiết bị đo lường, hoặc vì một nhà phân tích đã làm tròn các giá trị mà thực sự đã được đo.
Các hàm toán học được sử dụng để đại diện cho sự phân bố tần số dân số của một liên tục
biến ngẫu nhiên là gọi là hàm mật độ xác suất. Các phối p (y) của phân phối không phải là một
xác suất chính nó; nó là mật độ xác suất. Nó trở thành một xác suất khi nó được nhân lên bởi một khoảng thời gian
trên trục ngang (tức là, P = p (y) Δ Δ mà là kích thước của khoảng thời gian). Xác suất này luôn được
bởi vùng dưới hàm mật độ xác suất. Các luật xác suất yêu cầu diện tích dưới
đường cong bằng một (1.00). Khái niệm này được minh họa bằng hình 2.4, trong đó cho thấy mật độ xác suất
chức năng được gọi là phân phối chuẩn.
HÌNH 2.3 âm mưu phân phối tích lũy của các dữ liệu nitrate từ Ví dụ 2.1.
HÌNH 2.4 Hàm mật độ xác suất bình thường.
0 10 20 30
4
8
12
Nitrate ( mg / L)
Rank Order
0.0 y
0,1
0,2
0,3
0,4
Δ
Diện tích =
P = p (y) Δ
- 4 - 3 - 2 - 1 0 2 1 3 4
Probability Density, p
(y)
L1592_Frame_C02 Page 9 Thứ 3 Tháng 12 18, 2001 1:40
© 2002 By CRC Press LLC
Các Trung bình, phương sai, và Standard Deviation
Chúng tôi phân biệt giữa một số lượng đại diện cho dân chúng và một số đại diện cho một mẫu.
Một thống kê là một số lượng nhận ra tính từ dữ liệu được thực hiện để đại diện cho một dân số. Một tham số
là một số lượng lý tưởng hóa gắn liền với dân số. Thông số không thể đo trực tiếp trừ khi
toàn bộ dân số có thể được quan sát thấy. Vì vậy, các thông số được ước tính bằng số liệu thống kê. Các thông số được
thường được chỉ định bởi các chữ cái Hy Lạp (α, β, γ, vv) và số liệu thống kê của các chữ cái La Mã (a, b, c, vv). Thông
số. Là hằng số (thường không rõ về giá trị) và số liệu thống kê là các biến ngẫu nhiên tính từ dữ liệu
Với một dân số của một bộ rất lớn của N quan sát mà từ đó mẫu là tới,
dân số có nghĩa là η:
nơi yi
là một quan sát. Tổng kết, chỉ ra bởi Σ, là hơn dân số của N quan sát. Chúng tôi
cũng có thể nói rằng trung bình của dân số là giá trị kỳ vọng của y, được viết như E (y) = η,
khi N là rất lớn.
Các mẫu n quan sát thực sự sẵn từ dân số được sử dụng để tính toán mẫu
trung bình:
cho phép ước lượng η bình.
Phương sai của dân số được ký hiệu là
σ2. Các biện pháp như thế nào đến nay bất kỳ quan sát đặc biệt
là từ các η trung bình là yi - η. Phương sai là giá trị trung bình của bình phương của độ lệch như thực hiện trên
toàn bộ dân số:
Độ lệch chuẩn của dân số là một thước đo của sự lây lan có cùng đơn vị như ban đầu
đo và là trung bình. Độ lệch chuẩn là căn bậc hai của phương sai:
Các giá trị thực sự của dân số tham số σ và σ2
thường không biết đến người thí nghiệm. Họ
có thể được ước tính bằng phương sai mẫu:
trong đó n là kích thước của mẫu và là mẫu trung bình. Độ lệch chuẩn mẫu là
căn bậc hai của phương sai mẫu:
Đây là mẫu số là n - 1 hơn n. Các n - 1 đại diện cho mức độ tự do của mẫu.
Một mức độ tự do (-1) được tiêu thụ bởi vì trung bình phải tính toán để ước tính s. Các
sai lệch của n quan sát từ trung bình mẫu của họ phải tổng hợp chính xác về không. Điều này ngụ ý rằng bất kỳ
η
Σyi
N = --------
y
1
n = --Σyi
σ2 Σ () yi - η 2
N = --------------- ---------
σ
Σ () yi - η 2
N = ------------------------
s
2 Σ () yi - y 2
n - 1 = -----------------------
y
s Σ () yi - y 2
n - 1 = -------- ---------------
L1592_Frame_C02 Page 10 Thứ Ba 18 Tháng 12, 2001 1:40
© 2002 By CRC Press LLC
n - 1 trong những sai lệch hay dư hoàn toàn xác định số còn lại còn lại. Các dư n,
và do đó số tiền của họ của hình vuông và mẫu sai, được nói do đó để có n -. 1 bậc tự do
Degrees của tự do sẽ được ký hiệu bằng chữ ν Hy Lạp. Đối với các phương sai mẫu và lấy mẫu tiêu chuẩn
độ lệch, ν = n - 1.
Hầu hết thời gian, "mẫu" sẽ được giảm từ độ lệch mẫu chuẩn, mẫu phương sai, và
trung bình mẫu. Cần phải thấy rõ từ bối cảnh các số liệu thống kê tính toán đang được thảo luận.
Các chữ cái La Mã, ví dụ s
2, s, và sẽ cho biết số lượng mà là số liệu thống kê.
Chữ cái Hy Lạp
(σ2,
σ, và η) chỉ ra các thông số.
Ví dụ 2.2
Đối với 27 quan sát nitrat, các trung bình mẫu là
mẫu sai là
độ lệch chuẩn mẫu là
mẫu phương sai và nếm thử độ lệch chuẩn có ν = 27-1 = 26 độ của tự do.
Các số liệu được báo cáo với hai con số đáng kể. Mức trung bình của một số giá trị cần được tính toán
với ít nhất một con số so với các dữ liệu. Độ lệch chuẩn, cần được tính đến ít
nhất ba con số đáng kể (Taylor, 1987).
Độ chính xác, Bias, và chính xác
Độ chính xác là một chức năng của cả hai thiên vị và độ chính xác. Như được minh họa bằng ví dụ 2.3 và hình 2.5, thiên vị
đo sai số hệ thống và độ chính xác đo lường mức độ phân tán trong các dữ liệu. Đo chính xác
có độ chính xác tốt và gần bằng không thiên vị. Phương pháp không chính xác có thể có độ chính xác kém, không thể chấp nhận
thiên vị, hoặc cả hai.
Bias (lỗi hệ thống) có thể được gỡ bỏ, một khi xác định, bằng séc cẩn thận về phương pháp thí nghiệm
và thiết bị. Nó không thể được tính trung bình ra bằng cách làm phép đo hơn. Đôi khi, sai lệch không thể
xác định được vì giá trị thực sự cơ bản là không rõ.
HÌNH 2.5 Độ chính xác là một chức năng của sự thiên vị và độ chính xác tốt.
Y
y
6,9 7,8 + ++ + ... 8,1 7,9
27 = = ---------- -------------------------------------------------- 7.51 mg / L
s
2 () 6,9 7,51 - 2 ... () 7,9 7,51 - 2 + +
27 1 - -------------------------- -------------------------------------------------- --- 1,9138 (mg / L) 2 = =
s = = 1,9138 1,38 mg / L
• •
• • •
• • • • •
• • •• •
• • • • •
Chuyên viên phân tích
A
B
C
D
7,5 8,0 8,5 9,0
_Bias _Precision _Accuracy
lớn
lớn
nhỏ
vắng mặt
tốt
nghèo
nghèo
tốt tốt
nghèo
nghèo
nghèo
L1592_Frame_C02 Page 11 Thứ Ba 18 tháng 12, 2001 1:40
© 2002 By CRC Press LLC
chính xác đã làm với các phân tán giữa các phép đo lặp đi lặp lại. Phân tán này là do ngẫu nhiên
các lỗi trong các phép đo. Kết quả chính xác có lỗi nhỏ ngẫu nhiên. Độ lệch chuẩn s, thường được
sử dụng như một chỉ số về độ chính xác (hoặc không chính xác). Khi s là lớn, các phép đo không chính xác. Random
lỗi không bao giờ có thể được loại bỏ, mặc dù bằng kỹ thuật cẩn thận chúng có thể được giảm thiểu. Tác dụng của chúng có thể
được giảm bằng cách làm cho các phép đo lặp đi lặp lại và trung bình họ. Làm biện pháp replicate cũng
cung cấp các phương tiện để xác định số lượng các lỗi đo lường và đánh giá tầm quan trọng của họ.
Ví dụ 2.3
Bốn nhà phân tích từng được đưa ra năm mẫu mà đã được chuẩn bị để có một nồng độ nhất
8,00 mg / L. Các kết quả được thể hiện trong hình 2.5. Hai loại riêng biệt của các lỗi đã xảy ra
trong một tác phẩm: (1) những sai sót ngẫu nhiên gây ra các kết quả riêng để được "rải rác" về mức trung bình
của năm kết quả của mình và (2) một thành phần cố định trong các lỗi đo lường, một lỗi hệ thống hoặc thiên vị,
làm cho các quan sát quá cao. Chuyên viên phân tích B có độ chính xác kém, nhưng ít thiên vị quan sát được. Chuyên viên phân tích
C có độ chính xác kém và độ chính xác kém. Chỉ Analyst D có chút thiên vị và độ chính xác tốt.
Ví dụ 2.4
Xu hướng ước tính của 27 phép đo nitrat trong Ví dụ 2.1 là sự khác biệt giữa các
trung bình mẫu và các giá trị được biết:
Độ chính xác của phép đo được xác định bởi độ lệch chuẩn mẫu:
Chính xác = s = 1,38 mg / L
Sau đó ví dụ sẽ thấy làm thế nào để đánh giá xem liệu số tiền này của thiên vị rõ ràng là khả năng kết quả
chỉ từ sai số ngẫu nhiên trong các phép đo.
lặp và lặp lại
lặp lại và lặp lại đôi khi được dùng như từ đồng nghĩa cho chính xác. Tuy nhiên, một sự phân biệt
đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2025 I Love Translation. All reserved.

E-mail: