ing and association rule algorithms can exceed the 4GB provided by tra dịch - ing and association rule algorithms can exceed the 4GB provided by tra Việt làm thế nào để nói

ing and association rule algorithms

ing and association rule algorithms can exceed the 4GB provided by traditional
sequential servers.
5 Conclusion
This paper presented an overview of parallel algorithms for two of the commonly
used data mining techniques: classification and associations. Key issues such as
load balancing, attention to locality, extracting maximal concurrency, avoiding
hot spots in contention, and minimizing parallelization overhead are just as
central to these parallel formulations as they are to the traditional scientific
parallel algorithms. In fact, in many cases, the underlying kernels are identical
to well known algorithms, such as sparse matrix-vector product.
To date, the parallel formulations of many decision-tree induction and asso-
ciation rule discovery algorithms are reasonably well-understood. Relatively less
work has been done on the parallel algorithms for other data mining techniques
such as clustering, rule-based classification algorithms, deviation detection, and
regression. Some possible areas of further research include parallelization of many
emerging new and improved serial data mining algorithms, further analysis and
refinements of existing algorithms for scalability and efficiency, designs targeted
for shared memory and distributed shared memory machines equipped with sym-
metric multiprocessors, and efficient integration of parallel algorithms with par-
allel database systems.
High-performance data mining algorithms and tools are needed for mining
large-scale data sets that arise in a variety of applications. This paper presented
a possible application, i.e., large data sets collected by Earth observing satellites
that need to be processed to better understand global scale changes in biosphere
processes and patterns. Other examples of important applications of data mining
include understanding gene functions in the field of genomics, the categorization
of stars and galaxies in the field of astrophysics, and using data obtained through
monitoring network traffic to detect illegal network activities. The key technical
challenges in mining these data sets include (i) high volume, dimensionality and
heterogeneity; (ii) the spatio-temporal aspects of the data; (iii) possibly skewed
class distributions; (iv) the distributed nature of the data; (v) the complexity
in converting raw collected data into high level features. High performance data
mining is essential to analyze the growing data and provide analysts with auto-
mated tools that facilitate some of the steps needed for hypothesis generation
and evaluation.
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
giải thuật quy tắc ing và Hiệp hội có thể vượt quá 4GB được cung cấp bởi truyền thốngtuần tự máy chủ.5 kết luậnBài báo này trình bày một tổng quan về các giải thuật song song cho hai của các phổ biếnsử dụng kỹ thuật khai thác dữ liệu: phân loại và các Hiệp hội. Vấn đề chính chẳng hạn nhưtải cân bằng, sự chú ý đến địa phương, giải nén tối đa concurrency, tránhđiểm nóng trong ganh đua, và giảm thiểu chi phí parallelization là cũng giống nhưTrung tâm của các công thức song song khi chúng để truyền thống khoa họcsong song thuật toán. Trong thực tế, trong nhiều trường hợp, hạt nhân cơ bản là giống hệt nhauthuật toán được biết đến, chẳng hạn như thưa thớt ma trận-vector sản phẩm.Ngày, công thức song song của nhiều cảm ứng quyết định-cây và asso-ciation quy tắc phát hiện thuật toán là hợp lý cũng hiểu. Tương đối ít hơncông việc đã được thực hiện trên các thuật toán song song cho các kỹ thuật khai thác dữ liệu khácchẳng hạn như clustering, thuật toán phân loại dựa trên nguyên tắc, phát hiện độ lệch, vàhồi quy. Một số khu vực có thể tiếp tục nghiên cứu bao gồm parallelization của nhiềunổi lên các thuật toán khai thác dữ liệu nối tiếp mới và cải tiến, hơn nữa phân tích vàCác cải tiến của các thuật toán sẵn có cho khả năng mở rộng và hiệu quả, thiết kế nhắm mục tiêuchia sẻ bộ nhớ và phân phối bộ nhớ máy được trang bị với sym - chia sẻ.số liệu multiprocessors, và tích hợp các giải thuật song song với par - hiệu quảCác hệ thống cơ sở dữ liệu allel.Thuật toán khai thác dữ liệu hiệu suất cao và các công cụ cần thiết cho khai thác mỏquy mô lớn dữ liệu bộ mà phát sinh trong một loạt các ứng dụng. Bài báo này trình bàymột ứng dụng có thể, tức là, lớn tập hợp dữ liệu được thu thập bởi trái đất quan sát vệ tinhmà cần phải được xử lý để hiểu rõ hơn về phạm vi toàn cầu thay đổi trong sinh quyểnquy trình và các mẫu. Các ví dụ khác của các ứng dụng quan trọng của khai thác dữ liệubao gồm sự hiểu biết gen chức năng trong lĩnh vực gen, các loạicủa ngôi sao và Thiên Hà trong lĩnh vực vật lý thiên văn, và sử dụng dữ liệu thu được thông quaGiám sát mạng lưới giao thông để phát hiện hoạt động bất hợp pháp mạng. Chìa khóa kỹ thuậtthách thức trong khai thác các bộ dữ liệu bao gồm (i) cao khối lượng, chiều vàheterogeneity; (ii) các khía cạnh nhất của dữ liệu; (iii) có thể sai lệchlớp phân phối; (iv) sự phân phối dữ liệu; (v) sự phức tạptrong chuyển đổi nguyên thu thập dữ liệu vào tính năng cao cấp. Dữ liệu hiệu suất caokhai thác mỏ là điều cần thiết để phân tích các dữ liệu phát triển và cung cấp cho các nhà phân tích với auto-mated công cụ tạo điều kiện cho một số các bước cần thiết cho giả thuyết thế hệvà đánh giá.
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
ing và luật kết hợp các thuật toán có thể vượt quá 4GB cung cấp bởi truyền thống
các máy chủ liên tục.
5 Kết luận
Bài báo này trình bày một cái nhìn tổng quan về các thuật toán song song cho hai trong số các thường
các kỹ thuật khai thác dữ liệu được sử dụng: phân loại và hiệp hội. Các vấn đề chính như
cân bằng tải, chú ý đến địa phương, đồng thời chiết xuất tối đa, tránh
những điểm nóng trong ganh đua, và giảm thiểu song song trên không chỉ là
trung tâm của các công thức này song song như họ đến khoa học truyền thống
thuật toán song song. Trong thực tế, trong nhiều trường hợp, các hạt cơ bản là giống hệt nhau
để thuật toán nổi tiếng, chẳng hạn như thưa thớt sản phẩm ma trận vector.
Cho đến nay, các công thức song song của nhiều cảm ứng cây quyết định và ÆÂng
thuật toán phát hiện quy luật ciation được hợp lý được hiểu rõ. Tương đối ít
công việc đã được thực hiện trên các thuật toán song song cho các kỹ thuật khai thác dữ liệu khác
như phân nhóm, các thuật toán phân loại dựa trên nguyên tắc, phát hiện sai lệch, và
hồi quy. Một số lĩnh vực có thể tiếp tục nghiên cứu bao gồm song song của nhiều
thuật toán mới nổi mới và cải tiến nối tiếp khai thác dữ liệu, phân tích và
cải tiến các thuật toán hiện có khả năng mở rộng và hiệu quả, những thiết kế nhắm mục tiêu
cho bộ nhớ chia sẻ và phân phối máy bộ nhớ chia sẻ trang bị sym-
multiprocessors metric, và hiệu quả tích hợp các thuật toán song song với biệt
hệ thống cơ sở dữ liệu allel.
thuật toán khai thác dữ liệu hiệu suất cao và các công cụ cần thiết cho việc khai thác
các bộ dữ liệu quy mô lớn phát sinh trong một loạt các ứng dụng. Bài báo này trình bày
một ứng dụng có thể, ví dụ, tập hợp dữ liệu lớn được thu thập bởi Trái đất quan sát vệ tinh
mà cần phải được xử lý để hiểu rõ hơn về những thay đổi quy mô toàn cầu trong sinh quyển
quy trình và mô hình. Các ví dụ khác của các ứng dụng quan trọng của khai thác dữ liệu
bao gồm các chức năng hiểu biết gen trong lĩnh vực gen thì việc phân loại
các sao và thiên hà trong lĩnh vực vật lý thiên văn, và sử dụng dữ liệu thu được thông qua
lưu lượng truy cập mạng lưới giám sát để phát hiện các hoạt động mạng bất hợp pháp. Các kỹ thuật chính
những thách thức trong khai thác các dữ liệu bộ bao gồm (i) lượng cao, đa chiều và
không đồng nhất; (ii) các khía cạnh không-thời gian của dữ liệu; (iii) có thể bị sai lệch
phân lớp; (iv) tính chất phân bố của dữ liệu; (v) sự phức tạp
trong việc chuyển đổi dữ liệu thô thu thập vào các tính năng cao cấp. Cao dữ liệu hiệu suất
khai thác là điều cần thiết để phân tích các dữ liệu ngày càng tăng và cung cấp cho các nhà phân tích với auto
công cụ giao phối để tạo điều kiện một số bước cần thiết cho thế hệ giả thuyết
và đánh giá.
đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2025 I Love Translation. All reserved.

E-mail: