Hệ thống đầu vào dữ liệu thiết lập chia tách nhiều khối, mỗi trong số đó được giao một nhiệm vụ bản đồ mà có thể xử lý dữ liệu song song. Mỗi tác vụ đồ đọc các đầu vào như là một cặp thiết lập của (chính, giá trị) và tạo ra một cặp chuyển đổi thiết lập của (chính, giá trị) là đầu ra. Khuôn khổ shuffles và sắp xếp các kết quả đầu ra của các tác vụ đồ, gửi các cặp Trung cấp (chìa khóa, giá trị) với nhiệm vụ giảm, mà nhóm chúng thành kết quả cuối cùng. MapReduce sử dụng cơ chế JobTracker và TaskTracker để lịch trình công việc, theo dõi chúng, và khởi động lại bất kỳ mà không thành công.
đang được dịch, vui lòng đợi..
