have a high discriminatory power and the ‘left-over’ features havevery dịch - have a high discriminatory power and the ‘left-over’ features havevery Việt làm thế nào để nói

have a high discriminatory power an

have a high discriminatory power and the ‘left-over’ features have
very little to contribute to the success of financial fraud detection.
Furthermore, in order to conduct an exhaustive study over this
dataset, in the second set of experiment we considered only the top
10 features (based on the values of the t-statistics) for constructing
the reduced feature subset. The top 10 features can be seen in the first
ten rows of Table 2.We repeated the experiments as in the first case.
The average results for all the classifiers over all foldswith 10 features
are presented in Table 5. From Table 5 we observe that PNN
outperformed other classifiers with 90.77% accuracy and 87.53%
sensitivity (as indicated by bold faced numerals in Table 5), whereas
GP came second with 89.27% accuracy and 85.64% sensitivity.
Moreover, results based on the AUC indicated that PNN yielded the
highest accuracy followed by GP, which yielded only marginally less
accuracy.
In order to find out whether the difference in average AUCs is
statistically significant or not, we conducted a t-test between the top
performer and the remaining classifiers (i) without feature selection,
(ii) with feature selection including top 18 features, and (iii) with
feature selection including top 10 features. In case of the dataset
without feature selection, the t-statistic values between the average
AUCs obtained by PNN and that of other classifiers are presented in
Table 6. From Table 6 we observe that t-statistic values are more
than the critical value of the test statistic, which is 1.73 at the 10%
level of significance. Thus, we infer that PNN significantly outperformed
other classifiers without feature selection. In case of the
dataset with feature selection and considering only the top 18
features, the t-statistic values between the average AUCs obtained
by GP and that of other classifiers are presented in Table 7. From this
table we can observe that t-statistic values are more than 1.73 in
case of MLFF, SVM and LR, whereas those values are less than 1.73 in
case of PNN and GMDH. From these results we can say that the GP
significantly outperformed all classifiers except GMDH and PNN.
Considering only the top 10 features, the t-statistic values between
the average AUCs obtained by PNN and that of other classifiers are
presented in Table 8. From this table we can observe that t-statistic
values are more than 1.73 in case of MLFF, SVM and LR, whereas
those values are less than 1.73 in case of GP and GMDH. From these
results we can say that PNN outperformed all classifiers except GP
and GMDH.
When we take a close look at the top 10 and top 18 features shown
in Table 2, we observe that most of these features are associated with
the firm's ability to generate profit or income. Among the top 10
features, eight features are associated with the profitability of the
firm. A closer looks reveals that among the top 10 features, four are
associated with primary business income, and five are associated with
either gross or net profit earned by the firm. This indicated that a
fraudulent firm usually tried to inflate the profit or the income figures
in order to create an impressive financial statement. Any unusual
income or profit figures should be a reason for suspicion and further
investigation by an auditor.
When the present dataset of 35 dimensions (financial items) is
visualized using the tool Neucom [32] in the principal component
dimensions by plotting the first principal component on x-axis and
the second principal component on y-axis, we noticed three
predominant clusters and nine outliers. This provided a possible
reason for the spectacular performance of PNN because PNN is
tolerant to outliers [4]. While comparing the dataset with and
without feature selection, it is noticed that even after reducing the
number of features to almost one third of the original number, the
change in accuracies is at most 5% in all the cases except PNN, where
the accuracies are reduced by 8%. From this we can infer that the tstatistic
is a simple and efficient feature selection technique for
picking up very significant features that ensured better accuracies.
Based on our experiments, we conclude that PNN without feature
selection outperformed methods such asMLFF, SVM, GP, GMDH, and
LR. After feature selection, GP performed well compared to all other
techniques, and PNN yielded marginally less accuracies when top 18
features are selected. Similarly, PNN outperformed all other
techniques when top 10 features are selected. Also, we concluded
that our results are much superior to an earlier study on the same
dataset.
It should be noted that while all the techniques have equal cost,
the technique that is preferred and recommended is totally dictated
by the dataset at hand. Since accuracy is amajor concern for financial
analysts, we should select that technique which yields less
misclassifications and consumes l
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
có một sức mạnh mang tính phân biệt cao và các tính năng 'trái trên' córất ít để đóng góp vào sự thành công của phát hiện gian lận tài chính.Hơn nữa, để tiến hành một nghiên cứu đầy đủ trên nàybộ dữ liệu, trong tập thứ hai của thử nghiệm, chúng tôi coi là chỉ có top10 tính năng (dựa trên giá trị thống kê t) cho xây dựngtập hợp các tính năng giảm. 10 tính năng hàng đầu có thể được nhìn thấy trong lần đầu tiênmười hàng của bảng 2. chúng tôi lặp đi lặp lại thí nghiệm như trong trường hợp đầu tiên.Các kết quả trung bình cho tất cả các máy phân loại trên tất cả các tính năng foldswith 10được trình bày trong bảng 5. Từ bảng 5 chúng ta quan sát rằng PNNtốt hơn các máy phân loại với độ chính xác 90.77%, 87,53%nhạy cảm (như được chỉ ra bởi đậm phải đối mặt với chữ số ở bảng 5), trong khiBác sĩ gia ĐÌNH đến lần thứ hai với sự nhạy cảm chính xác và 85.64% 89.27%.Hơn nữa, kết quả dựa trên AUC chỉ ra rằng PNN mang lại cácđộ chính xác cao nhất theo GP, mang lại chỉ nhỉnh hơnđộ chính xác.Để tìm hiểu xem sự khác biệt trong AUCs trung bình làý nghĩa thống kê hay không, chúng tôi tiến hành một thử nghiệm t giữa đầubiểu diễn và các máy phân loại còn lại (i) không có tính năng lựa chọn,(ii) với lựa chọn tính năng bao gồm các tính năng trên 18, và (iii) vớilựa chọn tính năng bao gồm cả top 10 tính năng. Trong trường hợp bộ dữ liệukhông có lựa chọn tính năng, các giá trị thống kê t giữa trung bìnhAUCs thu được bằng PNN và của máy phân loại khác được trình bày trongBảng 6. Từ bảng 6 chúng tôi quan sát rằng các giá trị thống kê t là thêmso với giá trị quan trọng của thống kê thử nghiệm, mà là 1.73 10%ý nghĩa của độ cao. Vì vậy, chúng ta suy ra rằng PNN đáng kể tốt hơnMáy phân loại khác mà không có tính năng lựa chọn. Trường hợp của cácbộ dữ liệu với tính năng lựa chọn và xem xét chỉ đầu 18tính năng, các giá trị thống kê t giữa AUCs trung bình thu đượcbác sĩ gia ĐÌNH và của máy phân loại khác được trình bày trong bảng 7. Từ nàychúng ta có thể quan sát các giá trị thống kê t là hơn 1.73 in bảngtrường hợp của MLFF, SVM và LR, trong khi những giá trị ít hơn 1.73 intrường hợp của PNN và GMDH. Từ những kết quả, chúng tôi có thể nói rằng bác sĩ gia ĐÌNHđáng kể tốt hơn máy phân loại tất cả ngoại trừ GMDH và PNN.Xem xét chỉ là 10 tính năng hàng đầu, giá trị thống kê t giữamức trung bình của AUCs thu được bằng PNN và của máy phân loại kháctrình bày trong bảng 8. Từ bảng này chúng ta có thể quan sát rằng t-thống kêgiá trị là hơn 1.73 trong trường hợp MLFF, SVM và LR, trong khiCác giá trị đó là ít hơn 1.73 trong trường hợp bác sĩ gia ĐÌNH và GMDH. Từ đâykết quả, chúng tôi có thể nói rằng PNN tốt hơn máy phân loại tất cả ngoại trừ GPvà GMDH.Khi chúng ta hãy xem đóng tại top 10 và top 18 các tính năng hiển thịtrong bảng 2, chúng tôi quan sát rằng hầu hết các tính năng này được kết hợp vớiCác công ty có khả năng tạo ra lợi nhuận hoặc thu nhập. Trong top 10tính năng, tính năng tám được liên kết với lợi nhuận của cáccông ty. Có vẻ kỹ hơn cho thấy rằng trong số các tính năng của top 10, bốn làliên quan đến thu nhập chính của doanh nghiệp, và năm được liên kết vớiTổng hoặc net lợi nhuận thu được của công ty. Điều này chỉ ra rằng mộtcông ty lừa đảo thường cố gắng để làm tăng lợi nhuận hoặc những con số thu nhậpđể tạo ra một báo cáo tài chính đầy ấn tượng. Bất kỳ bất thườngcon số thu nhập hoặc lợi nhuận nên là một lý do để nghi ngờ và tiếp tụcđiều tra của một kiểm toán viên.Khi số liệu hiện nay 35 kích thước (các mục tài chính) làhình dung sử dụng công cụ Neucom [32] trong các thành phần chínhKích thước bằng cách vẽ các thành phần chủ yếu đầu tiên trên trục x vàthành phần chính thứ hai trên trục y, chúng tôi nhận thấy bacụm chiếm ưu thế và chín outliers. Điều này cung cấp một có thểlý do cho hiệu suất ngoạn mục của PNN vì PNNkhoan dung để outliers [4]. Trong khi so sánh số liệu với vàNếu không có tính năng lựa chọn, đó là nhận thấy rằng ngay cả sau khi việc giảm cácsố lượng các tính năng gần như một phần ba số lượng bản gốc, cácthay đổi trong phàm nhất là 5% trong tất cả các trường hợp ngoại trừ PNN, nơiphàm những được giảm 8%. Từ đây, chúng ta có thể suy ra rằng tstatisticlà một kỹ thuật lựa chọn tính năng đơn giản và hiệu quả nhấtchọn lên rất đáng kể các tính năng mà đảm bảo tốt hơn phàm.Dựa trên thử nghiệm của chúng tôi, chúng tôi kết luận rằng PNN không có tính nănglựa chọn tốt hơn phương pháp như vậy asMLFF, SVM, GP, GMDH, vàLR. Sau khi lựa chọn tính năng, GP thực hiện tốt so với tất cả cáckỹ thuật, và PNN phàm nhẹ ít mang lại khi đầu 18Các tính năng được lựa chọn. Tương tự, PNN tốt hơn tất cả cáckỹ thuật khi top 10 tính năng được lựa chọn. Ngoài ra, chúng tôi kết luậnkết quả của chúng tôi là nhiều cao hơn một nghiên cứu trước đó trên cùng mộtbộ dữ liệu.Cần lưu ý rằng trong khi tất cả các kỹ thuật có bằng chi phí,các kỹ thuật đó là ưu tiên và khuyến cáo là hoàn toàn khiểnbởi bộ dữ liệu ở bàn tay. Kể từ khi chính xác là mối quan tâm amajor cho tài chínhCác nhà phân tích, chúng tôi nên lựa chọn kỹ thuật rằng đó sản lượng ít hơnmisclassifications và tiêu thụ l
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
có khả năng phân biệt cao và 'còn sót lại' các tính năng có
rất ít để đóng góp vào sự thành công của việc phát hiện gian lận tài chính.
Hơn nữa, để tiến hành một nghiên cứu thấu đáo hơn này
tập dữ liệu, trong tập thứ hai của thử nghiệm chúng tôi chỉ xem xét đầu
10 tính năng (dựa trên các giá trị của t-thống kê) để xây dựng
các tính năng giảm tập hợp con. 10 tính năng hàng đầu có thể được nhìn thấy trong những người đầu tiên
mười hàng Bảng 2.We lặp đi lặp lại các thí nghiệm như trong trường hợp đầu tiên.
Các kết quả trung bình cho tất cả các phân loại trên khắp foldswith 10 tính năng
được thể hiện trong Bảng 5. Từ bảng 5 chúng ta thấy rằng PNN
vượt trội so với các phân loại khác với 90.77% độ chính xác và 87,53%
nhạy cảm (như được chỉ ra bởi chữ số mặt in đậm trong bảng 5), trong khi
GP đứng thứ hai với 89,27% và độ chính xác 85,64% nhạy cảm.
Hơn nữa, kết quả dựa trên AUC chỉ ra rằng PNN mang lại sự
chính xác cao nhất tiếp theo GP, mà mang lại chỉ nhỉnh ít
chính xác.
Để tìm hiểu xem sự khác biệt trong AUCs trung bình là
ý nghĩa thống kê hay không, chúng tôi đã tiến hành một t-test giữa đầu
biểu diễn và phân loại còn lại (i) không có lựa chọn tính năng,
(ii) với lựa chọn tính năng bao gồm cả đầu 18 tính năng, và (iii) với
lựa chọn tính năng bao gồm 10 tính năng hàng đầu. Trong trường hợp của các tập dữ liệu
mà không cần lựa chọn tính năng, các giá trị thống kê t giữa các trung bình
AUCs thu được bằng PNN và của các phân loại khác được thể hiện trong
Bảng 6. Từ bảng 6 chúng tôi nhận thấy rằng các giá trị thống kê t có nhiều
hơn giá trị quan trọng của kiểm tra số liệu thống kê, đó là 1,73 ở 10%
mức ý nghĩa. Như vậy, chúng ta suy ra rằng PNN tốt hơn đáng kể
phân loại khác mà không có lựa chọn tính năng. Trong trường hợp của các
bộ dữ liệu với tính năng lựa chọn và xem xét chỉ có 18 đầu
tính năng, các giá trị thống kê t giữa AUCs trung bình thu được
bằng GP và của các phân loại khác được trình bày trong Bảng 7. Từ
bảng chúng ta có thể thấy rằng các giá trị thống kê t hơn 1,73 trong
trường hợp MLFF, SVM và LR, trong khi những giá trị ít hơn 1,73 trong
trường hợp của PNN và GMDH. Từ những kết quả này, chúng tôi có thể nói rằng các GP
tốt hơn đáng kể tất cả các phân loại trừ GMDH và PNN.
Xem xét chỉ ra 10 tính năng hàng đầu, các giá trị thống kê t giữa
các AUCs trung bình thu được bằng PNN và của các phân loại khác được
trình bày trong Bảng 8. Từ bảng này, chúng ta có thể quan sát thống kê t
giá trị hơn 1,73 trong trường hợp MLFF, SVM và LR, trong khi
những giá trị ít hơn 1,73 trong trường hợp GP và GMDH. Từ những
kết quả chúng ta có thể nói rằng PNN vượt trội so với tất cả các phân loại trừ GP
và GMDH.
Khi chúng ta có một cái nhìn gần vào top 10 và top 18 tính năng thể hiện
trong Bảng 2, chúng tôi nhận thấy rằng hầu hết các tính năng này được kết hợp với
khả năng của công ty để tạo ra lợi nhuận hoặc thu nhập. Trong số 10 đầu
tính năng, tám tính năng có liên quan đến lợi nhuận của các
công ty. Một vẻ gần hơn cho thấy rằng trong số 10 tính năng hàng đầu, bốn được
kết hợp với thu nhập kinh doanh chính, và năm được kết hợp với
một trong hai tổng hoặc lợi nhuận ròng thu được của công ty. Điều này chỉ ra rằng một
công ty lừa đảo thường cố gắng để thổi phồng lợi nhuận hoặc các con số thu nhập
nhằm tạo ra một báo cáo tài chính đầy ấn tượng. Bất kỳ bất thường
con số thu nhập hoặc lợi nhuận phải là lý do để nghi ngờ và tiếp tục
điều tra của kiểm toán.
Khi các bộ dữ liệu hiện tại của 35 chiều (chỉ tiêu tài chính) được
hình dung bằng cách sử dụng công cụ Neucom [32] trong các thành phần chính
kích thước bằng cách vẽ các thành phần chính đầu tiên trên trục x và
các thành phần chính thứ hai trên trục y, chúng tôi nhận thấy ba
cụm chiếm ưu thế và chín kẻ xuất. Điều này cung cấp một khả năng
lý do để thực hiện ngoạn mục của PNN vì PNN là
khoan dung để tách [4]. Trong khi so sánh các số liệu có và
không có lựa chọn tính năng, nó được nhận thấy rằng ngay cả sau khi giảm
số tính năng để gần một phần ba số lượng ban đầu, các
thay đổi về độ chính xác tối đa là 5% trong tất cả các trường hợp ngoại trừ PNN, nơi
các độ chính xác là giảm 8%. Từ đây chúng ta có thể suy ra rằng tstatistic
là một kỹ thuật lựa chọn tính năng đơn giản và hiệu quả để
chọn lên các tính năng rất quan trọng mà đảm bảo độ chính xác tốt hơn.
Dựa trên các thí nghiệm của chúng tôi, chúng tôi kết luận rằng PNN không có tính năng
lựa chọn tốt hơn các phương pháp như asMLFF, SVM, GP, GMDH, và
LR. Sau khi lựa chọn tính năng, GP thực hiện tốt so với tất cả các
kỹ thuật, và PNN mang lại độ chính xác nhẹ ít khi top 18
tính năng được lựa chọn. Tương tự như vậy, PNN vượt trội so với tất cả các
kỹ thuật khi top 10 tính năng được lựa chọn. Ngoài ra, chúng tôi kết luận
rằng kết quả của chúng tôi là vượt trội hơn nhiều để nghiên cứu trước đó trên cùng một
tập dữ liệu.
Cần lưu ý rằng trong khi tất cả các kỹ thuật có chi phí bằng nhau,
các kỹ thuật được ưa thích và đề nghị được hoàn toàn quyết
bởi các số liệu trong tầm tay. Kể từ khi chính xác là amajor quan tâm đến tài chính
các nhà phân tích, chúng ta nên chọn là kỹ thuật trong đó sản lượng ít
misclassifications và tiêu thụ l
đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2025 I Love Translation. All reserved.

E-mail: