7.10 MAHOUT(70)Attempting to use big data for analytics would be limit dịch - 7.10 MAHOUT(70)Attempting to use big data for analytics would be limit Việt làm thế nào để nói

7.10 MAHOUT(70)Attempting to use bi

7.10 MAHOUT(70)
Attempting to use big data for analytics would be limited without any analytics capabilities. Mahout is a project to provide a library of scalable implementations of machine learning algorithms on top of MapReduce and Hadoop. As is described at the project’s home page6, Mahout’s library includes numerous well-known analysis methods including:
• Collaborative filtering and other user and item-based recommender algorithms, which is used to make predictions about an individual’s interest or preferences through comparison with a multitude of others that may or may not share similar characteristics.
• Clustering, including K-Means, Fuzzy K-Means, Mean Shift, and Dirichlet process clustering algorithms to look for groups, patterns, and commonality among selected cohorts in a population.
• Categorization using Naïve Bayes or decision forests to place items into already defined categories.
• Text mining and topic modeling algorithms for scanning text and assigning contextual meanings.
• Frequent pattern mining, which is used for market basket analysis, comparative health analytics, and other patterns of correlation within large datasets.
Mahout also supports other methods and algorithms. The availability of implemented libraries for these types of analytics free the development team to consider the types of problems to be analyzed and more specifically, the types of analytical models that can be applied to seek the best answers.

7.11 CONSIDERATIONS
Big data analytics applications employ a variety of tools and techniques for implementation. When organizing your thoughts about developing those applications, it is important to think about the parameters that will frame your needs for technology evaluation and acquisition, sizing and configuration, methods of data organization, and required algorithms to be used or developed from scratch. Prior to diving directly into downloading and installing software, focus on the types of big data business applications and their corresponding performance scaling needs, such as those listed in Table 7.1. The technical requirements will guide both the hardware and the software configurations. This also allows you to align the development of the platform with the business application development needs.

7.12 THOUGHT EXERCISES
When considering the types of tools and technologies necessary to flesh out a big data application development and implementation ecosystem, here are some questions and exercises to ponder:
• For a selected big data application, describe how the process can be divided up into “chunks of work” to be performed by the pool of processors.
• Why is it a good idea for the processing nodes to work on data at colocated data nodes?
• Review the Hadoop components described in this chapter—discuss whether they will or won’t adequately address your big data needs.
• Is there a value proposition for solely using HDFS as a scalable data storage option? How does this compare to a traditional storage solution in cost, security, and availability?

0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
7,10 MAHOUT(70)Cố gắng sử dụng lớn dữ liệu Analytics sẽ được giới hạn mà không có bất kỳ khả năng phân tích. Mahout là một dự án để cung cấp một thư viện của các hiện thực khả năng mở rộng của máy học thuật toán trên đầu trang của MapReduce và Hadoop. Như được mô tả tại của dự án nhà page6, Mahout của thư viện bao gồm rất nhiều các phương pháp phân tích nổi tiếng bao gồm:• Hợp tác lọc và khác người sử dụng và mục dựa trên các thuật toán, mà được sử dụng để làm cho dự đoán về một cá nhân quan tâm hay sở thích thông qua so sánh với một vô số của những người khác có thể có hoặc không có thể chia sẻ đặc điểm tương tự.• Clustering, bao gồm K-phương tiện, mờ K-có nghĩa là, có nghĩa là thay đổi, và quá trình Dirichlet clustering thuật toán tìm kiếm nhóm, mô hình, và sự tương đồng giữa các cohorts đã chọn trong dân.• Phân loại bằng cách sử dụng rừng ngây thơ Bayes hoặc quyết định để đặt các mục thành đã được xác định loại.• Văn bản khai thác và chủ đề mô hình hóa các thuật toán để quét văn bản và chỉ định nghĩa theo ngữ cảnh.• Thường xuyên mô hình khai thác, mà được sử dụng để phân tích thị trường giá trong giỏ hàng, phân tích so sánh sức khỏe, và các mẫu khác của mối tương quan trong vòng lớn datasets.Mahout cũng hỗ trợ những phương pháp và thuật toán. Sự sẵn có của các thư viện thực hiện cho các loại phân tích miễn phí nhóm phát triển để xem xét các loại của các vấn đề được phân tích và cụ thể hơn, các loại mô hình phân tích có thể được áp dụng để tìm kiếm các câu trả lời tốt nhất.7,11 CÂN NHẮCLớn dữ liệu phân tích ứng dụng sử dụng một loạt các công cụ và kỹ thuật để thực hiện. Khi tổ chức các suy nghĩ của bạn về việc phát triển những ứng dụng, nó là quan trọng để suy nghĩ về các thông số sẽ khung nhu cầu của bạn cho công nghệ đánh giá và mua lại, định cỡ và cấu hình, các phương pháp của tổ chức dữ liệu, và các thuật toán cần thiết để được sử dụng hoặc phát triển từ đầu. Trước khi lặn trực tiếp vào tải về và cài đặt phần mềm, tập trung vào các loại ứng dụng kinh doanh lớn dữ liệu và hiệu suất tương ứng của họ rộng nhu cầu, chẳng hạn như những người được liệt kê trong bảng 7.1. Yêu cầu kỹ thuật sẽ hướng dẫn các cấu hình phần mềm và phần cứng. Điều này cũng cho phép bạn để sắp xếp sự phát triển của các nền tảng với nhu cầu phát triển ứng dụng kinh doanh.7,12 TƯ TƯỞNG BÀI TẬPKhi xem xét các loại công cụ và công nghệ cần thiết để xác thịt ra một lớn dữ liệu ứng dụng phát triển và triển khai thực hiện hệ sinh thái, đây là một số câu hỏi và bài tập để suy nghĩ về:• Cho một ứng dụng đã chọn dữ liệu lớn, mô tả làm thế nào trình có thể được chia thành "khối của công việc" được thực hiện bởi các hồ bơi của bộ vi xử lý.• Tại sao là nó là một ý tưởng tốt cho các nút xử lý để làm việc trên các dữ liệu tại colocated dữ liệu nút?• Xem xét các thành phần Hadoop được diễn tả trong chương này — thảo luận cho dù họ sẽ hoặc sẽ không đầy đủ địa chỉ nhu cầu lớn dữ liệu của bạn.• Có một đề xuất giá trị để chỉ sử dụng HDFS như là một tùy chọn lưu trữ dữ liệu khả năng mở rộng? Làm thế nào này so sánh với một giải pháp lưu trữ truyền thống trong chi phí, bảo mật và tính sẵn sàng?
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
7.10 quản tượng (70)
Cố gắng sử dụng dữ liệu lớn cho phân tích sẽ được giới hạn mà không có bất kỳ khả năng phân tích. Quản tượng là một dự án để cung cấp một thư viện hiện thực khả năng mở rộng của thuật toán học máy trên đầu trang của MapReduce và Hadoop. Như được mô tả ở page6 nhà của dự án, thư viện Quản tượng bao gồm nhiều phương pháp phân tích nổi tiếng bao gồm:
• Lọc cộng tác và người dùng khác và các thuật toán recommender dựa trên item, được sử dụng để đưa ra dự đoán về sự quan tâm hay sở thích của từng cá nhân thông qua so sánh với vô của những người khác có thể có hoặc không có thể chia sẻ các đặc điểm tương tự.
• Clustering, bao gồm K-Means, Fuzzy K-Means, Mean Shift, và các thuật toán quá trình phân nhóm Dirichlet để tìm kiếm nhóm, mô hình, và tính phổ biến trong nhóm người được chọn trong một quần thể.
• Phân loại sử dụng Naïve Bayes hoặc quyết định giao rừng cho đặt các mặt hàng vào danh mục đã được định nghĩa.
• thuật toán khai thác văn bản và mô hình chủ đề cho văn bản quét và gán ý nghĩa theo ngữ cảnh.
• khai thác mô hình thường xuyên, được sử dụng để phân tích giỏ thị trường, phân tích so sánh sức khỏe, và các mẫu khác mối liên quan trong các tập dữ liệu lớn.
Quản tượng cũng hỗ trợ các phương pháp và thuật toán khác. Tính sẵn có của các thư viện thực hiện cho các loại phân tích phóng nhóm phát triển để xem xét các loại của các vấn đề được phân tích và đặc biệt hơn, các loại mô hình phân tích có thể được áp dụng để tìm câu trả lời tốt nhất. 7.11 CÂN NHẮC ứng dụng Big phân tích dữ liệu sử dụng một loạt các công cụ và kỹ thuật để thực hiện. Khi tổ chức những suy nghĩ của mình về việc phát triển các ứng dụng, điều quan trọng là để suy nghĩ về những thông số đó sẽ khung nhu cầu của bạn để đánh giá công nghệ và mua lại, kích thước và cấu hình, cách thức tổ chức dữ liệu, và các thuật toán cần thiết để được sử dụng hoặc phát triển từ đầu. Trước khi lặn trực tiếp vào tải và cài đặt phần mềm, tập trung vào các loại ứng dụng kinh doanh dữ liệu lớn và nhu cầu mở rộng quy mô hoạt động tương ứng của họ, chẳng hạn như những người được liệt kê trong Bảng 7.1. Các yêu cầu kỹ thuật sẽ hướng dẫn cả phần cứng và cấu hình phần mềm. Điều này cũng cho phép bạn sắp xếp các sự phát triển của nền tảng này với nhu cầu phát triển ứng dụng kinh doanh. 7.12 bài tập TƯỞNG Khi xem xét các loại công cụ và công nghệ cần thiết phải bổ sung thêm một phát triển và triển khai ứng dụng dữ liệu hệ sinh thái lớn, đây là một số câu hỏi và bài ​​tập để suy ngẫm : • Đối với một ứng dụng được chọn dữ liệu lớn, mô tả như thế nào quá trình này có thể được phân chia thành các "khối công việc" được thực hiện bởi các hồ bơi của bộ vi xử lý. • Tại sao nó là một ý tưởng tốt cho các nút xử lý để làm việc trên dữ liệu dữ liệu colocated nút? • Xem lại các thành phần Hadoop được mô tả trong chương này-thảo luận xem họ sẽ hoặc sẽ không giải quyết đầy đủ nhu cầu dữ liệu lớn của bạn. • Có một đề xuất giá trị cho chỉ sử dụng HDFS như một tùy chọn lưu trữ dữ liệu mở rộng? Làm thế nào thực hiện điều này so sánh với một giải pháp lưu trữ truyền thống trong chi phí, bảo mật, và tính sẵn sàng?











đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2025 I Love Translation. All reserved.

E-mail: