Unlike the analysis of missing data

Unlike the analysis of missing data, the process of outlier detection aims to locate “abnormal” data records that are considered isolated from the bulk of the data gathered. There are a number of probable ways in which to ascertain if one or more values are outliers in a representative data set. If the values are normally distributed, then an investigator can isolate outliers using statistical procedures (e.g., Grubbs’ test, Dixon’s test, stem and leaf displays, histograms, and box plots). If the values have an unidentified or non-standard distribution, then there exist no prevailing statistical procedures for identifying outliers. Consider the use of the k-NN method, which requires calculation of the distance between each record and all other records in the data set to identify the k-NN for each record (Hodge et al., 2004). The distances can then be examined to locate records that are the most distant from their neighbors and, hence, values that may correspond to outliers. The k-NN approach can also be used with missing data by exchanging missing values with the closest possible avail-able data using the least distance measure as matching criteria.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Không giống như phân tích các dữ liệu bị thiếu, quá trình outlier phát hiện nhằm xác định vị trí "bất thường" dữ liệu hồ sơ được coi là bị cô lập từ số lượng lớn các dữ liệu thu thập được. Hiện có một số cách có thể xảy ra trong đó để xác định nếu một hoặc nhiều giá trị là outliers trong một tập hợp dữ liệu đại diện. Nếu các giá trị được phân phối thông thường, sau đó một điều tra viên có thể cô lập outliers sử dụng thống kê thủ tục (ví dụ như, Grubbs' thử nghiệm, Dixon của thử nghiệm, thân cây và lá Hiển thị, histograms và hộp lô). Nếu các giá trị có một phân phối không xác định hoặc không đúng tiêu chuẩn, sau đó có tồn tại không có quy trình thống kê hiện hành để xác định các outliers. Hãy xem xét việc sử dụng các phương pháp k-NN, đòi hỏi tính toán khoảng cách giữa mỗi bản ghi và tất cả các hồ sơ khác trong bộ dữ liệu để xác định k NN cho mỗi bản ghi (Hodge et al, 2004). Các khoảng cách sau đó có thể được kiểm tra để xác định hồ sơ mà là xa nhất từ hàng xóm của họ, và do đó, các giá trị mà có thể tương ứng với các outliers. Phương pháp tiếp cận k-NN cũng có thể được sử dụng với thiếu dữ liệu bằng cách trao đổi thiếu giá trị với các dữ liệu gần nhất nhưng có thể có thể sử dụng các biện pháp khoảng cách ít nhất là phù hợp với tiêu chí.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Không giống như việc phân tích dữ liệu bị mất, quá trình phát hiện outlier nhằm xác định vị trí "bất thường" hồ sơ dữ liệu được coi là tách biệt khỏi phần lớn các dữ liệu thu thập được. Có một số cách có thể xảy ra, trong đó để xác định nếu một hoặc nhiều giá trị là giá trị ngoại lai trong một tập dữ liệu đại diện. Nếu các giá trị được phân bố bình thường, sau đó một điều tra viên có thể cô lập kẻ xuất sử dụng các thủ tục thống kê (ví dụ, Grubbs 'kiểm tra, kiểm tra của Dixon, thân và hiển thị lá, biểu đồ, và các lô hộp). Nếu các giá trị có một phân bố không xác định hoặc không đúng tiêu chuẩn, sau đó có tồn tại không có thủ tục thống kê thắng kiện để xác định giá trị ngoại lai. Hãy xem xét việc sử dụng các phương pháp k-NN, đòi hỏi tính toán khoảng cách giữa mỗi bản ghi và tất cả các hồ sơ khác trong tập dữ liệu để xác định các k-NN cho mỗi bản ghi (Hodge et al., 2004). Khoảng cách đó có thể được kiểm tra để xác định vị trí những hồ sơ có cách xa nhất từ các nước láng giềng của họ và, do đó, giá trị mà có thể tương ứng với giá trị ngoại lai. Cách tiếp cận k-NN cũng có thể được sử dụng với dữ liệu bị mất bằng cách trao đổi các giá trị thiếu với các dữ liệu vô ích, có thể có thể sử dụng gần nhất đo khoảng cách ít nhất là tiêu chí phù hợp.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.