7.10 MAHOUT(70)Attempting to use big data for analytics would be limit dịch - 7.10 MAHOUT(70)Attempting to use big data for analytics would be limit Việt làm thế nào để nói

7.10 MAHOUT(70)Attempting to use bi

7.10 MAHOUT(70)
Attempting to use big data for analytics would be limited without any analytics capabilities. Mahout is a project to provide a library of scalable implementations of machine learning algorithms on top of MapReduce and Hadoop. As is described at the project’s home page6, Mahout’s library includes numerous well-known analysis methods including:
• Collaborative filtering and other user and item-based recommender algorithms, which is used to make predictions about an individual’s interest or preferences through comparison with a multitude of others that may or may not share similar characteristics.
• Clustering, including K-Means, Fuzzy K-Means, Mean Shift, and Dirichlet process clustering algorithms to look for groups, patterns, and commonality among selected cohorts in a population.
• Categorization using Naïve Bayes or decision forests to place items into already defined categories.
• Text mining and topic modeling algorithms for scanning text and assigning contextual meanings.
• Frequent pattern mining, which is used for market basket analysis, comparative health analytics, and other patterns of correlation within large datasets.
Mahout also supports other methods and algorithms. The availability of implemented libraries for these types of analytics free the development team to consider the types of problems to be analyzed and more specifically, the types of analytical models that can be applied to seek the best answers.

7.11 CONSIDERATIONS
Big data analytics applications employ a variety of tools and techniques for implementation. When organizing your thoughts about developing those applications, it is important to think about the parameters that will frame your needs for technology evaluation and acquisition, sizing and configuration, methods of data organization, and required algorithms to be used or developed from scratch. Prior to diving directly into downloading and installing software, focus on the types of big data business applications and their corresponding performance scaling needs, such as those listed in Table 7.1. The technical requirements will guide both the hardware and the software configurations. This also allows you to align the development of the platform with the business application development needs.

7.12 THOUGHT EXERCISES
When considering the types of tools and technologies necessary to flesh out a big data application development and implementation ecosystem, here are some questions and exercises to ponder:
• For a selected big data application, describe how the process can be divided up into “chunks of work” to be performed by the pool of processors.
• Why is it a good idea for the processing nodes to work on data at colocated data nodes?
• Review the Hadoop components described in this chapter—discuss whether they will or won’t adequately address your big data needs.
• Is there a value proposition for solely using HDFS as a scalable data storage option? How does this compare to a traditional storage solution in cost, security, and availability?

0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
7,10 MAHOUT(70)Cố gắng sử dụng lớn dữ liệu Analytics sẽ được giới hạn mà không có bất kỳ khả năng phân tích. Mahout là một dự án để cung cấp một thư viện của các hiện thực khả năng mở rộng của máy học thuật toán trên đầu trang của MapReduce và Hadoop. Như được mô tả tại của dự án nhà page6, Mahout của thư viện bao gồm rất nhiều các phương pháp phân tích nổi tiếng bao gồm:• Hợp tác lọc và khác người sử dụng và mục dựa trên các thuật toán, mà được sử dụng để làm cho dự đoán về một cá nhân quan tâm hay sở thích thông qua so sánh với một vô số của những người khác có thể có hoặc không có thể chia sẻ đặc điểm tương tự.• Clustering, bao gồm K-phương tiện, mờ K-có nghĩa là, có nghĩa là thay đổi, và quá trình Dirichlet clustering thuật toán tìm kiếm nhóm, mô hình, và sự tương đồng giữa các cohorts đã chọn trong dân.• Phân loại bằng cách sử dụng rừng ngây thơ Bayes hoặc quyết định để đặt các mục thành đã được xác định loại.• Văn bản khai thác và chủ đề mô hình hóa các thuật toán để quét văn bản và chỉ định nghĩa theo ngữ cảnh.• Thường xuyên mô hình khai thác, mà được sử dụng để phân tích thị trường giá trong giỏ hàng, phân tích so sánh sức khỏe, và các mẫu khác của mối tương quan trong vòng lớn datasets.Mahout cũng hỗ trợ những phương pháp và thuật toán. Sự sẵn có của các thư viện thực hiện cho các loại phân tích miễn phí nhóm phát triển để xem xét các loại của các vấn đề được phân tích và cụ thể hơn, các loại mô hình phân tích có thể được áp dụng để tìm kiếm các câu trả lời tốt nhất.7.11 CONSIDERATIONSBig data analytics applications employ a variety of tools and techniques for implementation. When organizing your thoughts about developing those applications, it is important to think about the parameters that will frame your needs for technology evaluation and acquisition, sizing and configuration, methods of data organization, and required algorithms to be used or developed from scratch. Prior to diving directly into downloading and installing software, focus on the types of big data business applications and their corresponding performance scaling needs, such as those listed in Table 7.1. The technical requirements will guide both the hardware and the software configurations. This also allows you to align the development of the platform with the business application development needs.7.12 THOUGHT EXERCISESWhen considering the types of tools and technologies necessary to flesh out a big data application development and implementation ecosystem, here are some questions and exercises to ponder:• For a selected big data application, describe how the process can be divided up into “chunks of work” to be performed by the pool of processors.• Why is it a good idea for the processing nodes to work on data at colocated data nodes?• Review the Hadoop components described in this chapter—discuss whether they will or won’t adequately address your big data needs.• Có một đề xuất giá trị để chỉ sử dụng HDFS như là một tùy chọn lưu trữ dữ liệu khả năng mở rộng? Làm thế nào này so sánh với một giải pháp lưu trữ truyền thống trong chi phí, bảo mật và tính sẵn sàng?
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
7.10 MAHOUT(70)
Attempting to use big data for analytics would be limited without any analytics capabilities. Mahout is a project to provide a library of scalable implementations of machine learning algorithms on top of MapReduce and Hadoop. As is described at the project’s home page6, Mahout’s library includes numerous well-known analysis methods including:
• Collaborative filtering and other user and item-based recommender algorithms, which is used to make predictions about an individual’s interest or preferences through comparison with a multitude of others that may or may not share similar characteristics.
• Clustering, including K-Means, Fuzzy K-Means, Mean Shift, and Dirichlet process clustering algorithms to look for groups, patterns, and commonality among selected cohorts in a population.
• Categorization using Naïve Bayes or decision forests to place items into already defined categories.
• Text mining and topic modeling algorithms for scanning text and assigning contextual meanings.
• Frequent pattern mining, which is used for market basket analysis, comparative health analytics, and other patterns of correlation within large datasets.
Mahout also supports other methods and algorithms. The availability of implemented libraries for these types of analytics free the development team to consider the types of problems to be analyzed and more specifically, the types of analytical models that can be applied to seek the best answers.

7.11 CONSIDERATIONS
Big data analytics applications employ a variety of tools and techniques for implementation. When organizing your thoughts about developing those applications, it is important to think about the parameters that will frame your needs for technology evaluation and acquisition, sizing and configuration, methods of data organization, and required algorithms to be used or developed from scratch. Prior to diving directly into downloading and installing software, focus on the types of big data business applications and their corresponding performance scaling needs, such as those listed in Table 7.1. The technical requirements will guide both the hardware and the software configurations. This also allows you to align the development of the platform with the business application development needs.

7.12 THOUGHT EXERCISES
When considering the types of tools and technologies necessary to flesh out a big data application development and implementation ecosystem, here are some questions and exercises to ponder:
• For a selected big data application, describe how the process can be divided up into “chunks of work” to be performed by the pool of processors.
• Why is it a good idea for the processing nodes to work on data at colocated data nodes?
• Review the Hadoop components described in this chapter—discuss whether they will or won’t adequately address your big data needs.
• Is there a value proposition for solely using HDFS as a scalable data storage option? How does this compare to a traditional storage solution in cost, security, and availability?

đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2024 I Love Translation. All reserved.

E-mail: