Trung ương đến khả năng mở rộng của Apache Hadoop là khung xử lý phân tán được gọi là MapReduce (Hình 1). MapReduce giúp các lập trình giải quyết vấn đề dữ liệu song song mà tập dữ liệu có thể được phân chia thành các phần nhỏ và xử lý độc lập.
MapReduce là một bước tiến quan trọng vì nó cho phép các nhà phát triển bình thường, không chỉ những người có tay nghề cao trong tính toán hiệu năng cao, sử dụng lập trình song song xây dựng mà không cần lo lắng về các chi tiết phức tạp của nội - thông tin liên lạc cluster, giám sát công việc, và xử lý thất bại. MapReduce đơn giản hoá tất cả.
đang được dịch, vui lòng đợi..
