Nền tảng Apache Hadoop cũng bao gồm các Hadoop phân phối tệp hệ thống (HDFS), được thiết kế cho khả năng mở rộng và lỗi khoan dung. HDFS cửa hàng lớn tập tin bằng cách phân chia chúng thành các khối (thường 64 hoặc 128 MB) và sao chép các khối trên ba hoặc nhiều máy chủ. HDFS cung cấp các API cho các ứng dụng MapReduce để đọc và ghi dữ liệu song song. Năng lực và hiệu suất có thể được thu nhỏ bằng cách thêm các nút dữ liệu, và một cơ chế duy nhất của NameNode quản lý dữ liệu vị trí và màn hình chủ tình trạng sẵn có. HDFS cụm sản xuất sử dụng đáng tin cậy hôm nay giữ petabytes của dữ liệu trên hàng ngàn các nút.
đang được dịch, vui lòng đợi..
