Hạn chếCho xử lý song song tối đa, bạn cần các bản đồ và giaûm được quốc tịch, không phụ thuộc vào bất kỳ dữ liệu nào được tạo ra trong công việc MapReduce cùng. Bạn không thể kiểm soát trình tự mà các bản đồ chạy, hoặc việc cắt giảm. Nó là rất kém hiệu quả nếu bạn lặp đi lặp lại tương tự như tìm kiếm một lần nữa và một lần nữa. Cơ sở dữ liệu với một chỉ số sẽ luôn luôn nhanh hơn so với chạy một công việc ÔNG trên dữ liệu unindexed. Tuy nhiên, nếu chỉ số rằng cần phải được tái tạo mỗi khi dữ liệu được thêm vào, và dữ liệu đang được bổ sung liên tục, các công việc của ÔNG có thể có một cạnh. Mà không hiệu quả có thể được đo ở cả hai thời gian CPU và điện năng tiêu thụ. Ở Hadoop thực hiện giảm hoạt động không có đặt cho đến khi tất cả các bản đồ hoàn thành (hoặc đã thất bại và bị bỏ qua). Kết quả là, bạn không nhận được bất kỳ dữ liệu trở lại cho đến khi ánh xạ toàn bộ đã hoàn thành.Đó là một giả định chung rằng sản lượng giảm là nhỏ hơn so với đầu vào cho bản đồ. Có nghĩa là, bạn đang tham gia một datasource lớn và tạo ra giá trị nhỏ hơn cuối cùng.MapReduce/Hadoop sẽ giải quyết vấn đề của tôi?Nếu bạn có thể ghi lại các thuật toán của bạn như bản đồ và giaûm, sau đó có. Nếu không, sau đó không có.Nó không phải là một viên đạn bạc cho tất cả các vấn đề về quy mô, chỉ là một kỹ thuật tốt để làm việc trên bộ lớn của dữ liệu khi bạn có thể làm việc trên mảnh nhỏ của rằng bộ dữ liệu song song.
đang được dịch, vui lòng đợi..
