bao gồm cả n-cách nhân rộng (ánh xạ), các chương trình RAID chẵn lẻ hoặc các hình thức khác của tẩy xoá mã hóa, và các phương pháp lai (ví dụ, RAID-10). Những tính năng này làm cho CRUSH lý tưởng cho quản lý phân phối đối tượng trong (multi-petabyte) hệ thống lưu trữ vô cùng rộng lớn, nơi khả năng mở rộng, hiệu suất và độ tin cậy là cực kỳ quan trọng.
2. Công việc liên quan đến
đối tượng lưu trữ dựa trên thời gian gần đây đã thu hút được sự quan tâm đáng kể như một cơ chế để nâng cao khả năng mở rộng của hệ thống lưu trữ. Một số hệ thống nghiên cứu và sản xuất tập tin đã được thông qua một cách tiếp cận dựa trên đối tượng, bao gồm các chuyên đề hệ thống tập tin NASD [Gobioff et al. 1997], hệ thống tập tin Panasas [Nagle et al. 2004], Lustre [Braam 2004], và những người khác [Rodeh và Teperman năm 2003; Ghemawat et al. 2003]. Khác dựa trên khối phân phối hệ thống tập tin như GPFS [SCHMUCK và Haskin 2002] và Liên Array của Gạch (FAB) [Saito et al. 2004] đối mặt với một thách thức phân phối dữ liệu tương tự. Trong các hệ thống này một cách tiếp cận bán ngẫu nhiên hoặc heuristicbased được sử dụng để phân bổ dữ liệu mới cho các thiết bị lưu trữ với dung lượng có sẵn, nhưng dữ liệu là rất hiếm khi di chuyển để duy trì một phân bố cân bằng thời gian. Quan trọng hơn, tất cả các hệ thống xác định vị trí dữ liệu thông qua một số loại thư mục siêu dữ liệu, trong khi CRUSH dựa thay vì trên một mô tả cụm nhỏ gọn và chức năng lập bản đồ xác định. Sự khác biệt này là quan trọng nhất khi ghi dữ liệu, như các hệ thống sử dụng Crush có thể tính toán mục tiêu lưu trữ bất kỳ dữ liệu mới mà không tham khảo ý kiến một cấp trung ương. Sorrento [Tang et al. 2004] lưu trữ của hệ thống sử dụng các hàm băm ổn định [Karger et al. 1997] gần giống nhất CRUSH, nhưng thiếu hỗ trợ cho trọng kiểm soát các thiết bị, một phân phối wellbalanced của dữ liệu, và các lĩnh vực thất bại trong việc cải thiện an toàn dữ liệu. Mặc dù vấn đề di chuyển dữ liệu đã được nghiên cứu rộng rãi trong bối cảnh hệ thống với các bản đồ phân bổ rõ ràng [Anderson et al. năm 2001; Anderson et al. 2002], cách tiếp cận này có những yêu cầu siêu dữ liệu nặng mà cách tiếp cận chức năng như tránh Crush. Choy, et al. [1996] mô tả thuật toán để phân phối dữ liệu trên đĩa mà di chuyển một số lượng tối ưu của các đối tượng là các đĩa được thêm vào, nhưng không hỗ trợ trọng, sao chép, hoặc cắt bỏ đĩa. Brinkmann, et al. [2000] sử dụng hàm băm để phân phối dữ liệu đến một cụm không đồng nhất nhưng tĩnh. SCADDAR [Goel et al. 2002] quyết việc bổ sung và loại bỏ các lưu trữ, nhưng chỉ hỗ trợ một tập hợp con ràng buộc của các chiến lược nhân rộng. Không ai trong số những phương pháp tiếp cận bao gồm linh hoạt hay thất bại của CRUSH làm nguồn điện cho cải thiện độ tin cậy. CRUSH chặt chẽ như RUSH [Honicky và Miller 2004] gia đình của các thuật toán mà trên đó nó được dựa. RUSH vẫn là thiết lập hiện tại duy nhất của thuật toán trong các tài liệu mà sử dụng một chức năng lập bản đồ ở vị trí của siêu dữ liệu rõ ràng và hỗ trợ việc bổ sung hiệu quả và loại bỏ các thiết bị gia quyền. Mặc dù có những tính chất cơ bản, một số vấn đề làm cho RUSH một giải pháp không đủ trong thực tế. CRUSH khái quát đầy đủ các yếu tố hữu ích của RUSHP và RUSHT trong khi giải quyết các vấn đề độ tin cậy và nhân rộng trước đó chưa được giải quyết, và cung cấp cải thiện hiệu suất và tính linh hoạt.
3 Các thuật toán CRUSH
Thuật toán CRUSH phân phối đối tượng dữ liệu giữa các thiết bị lưu trữ theo một giá trị trọng lượng cho mỗi thiết bị, xấp xỉ một phân bố xác suất thống nhất. Sự phân bố được điều khiển bởi một bản đồ nhóm theo bậc đại diện cho các tài nguyên lưu trữ có sẵn và bao gồm các yếu tố hợp lý mà từ đó nó được xây dựng. Ví dụ, người ta có thể mô tả một cài đặt lớn về mặt hàng tủ server, tủ chứa đầy các kệ đĩa, và kệ chứa đầy các thiết bị lưu trữ. Các chính sách phân phối dữ liệu được xác định theo quy định vị trí đó xác định có bao nhiêu mục tiêu sao được lựa chọn từ các cụm và những hạn chế được áp đặt vào vị trí bản sao. Ví dụ, người ta có thể xác định rằng ba bản sao nhân đôi sẽ được đặt trên các thiết bị trong tủ vật lý khác nhau để họ không chia sẻ các mạch điện tương tự. Cho một số nguyên duy nhất giá trị đầu vào x, CRUSH sẽ ra một danh sách đặt ~ R n mục tiêu lưu trữ riêng biệt. CRUSH sử dụng một đa đầu vào chức năng nguyên băm mạnh mà đầu vào bao gồm X, làm cho việc lập bản đồ hoàn toàn xác định và độc lập có thể tính được chỉ sử dụng bản đồ cluster, quy định vị trí, và x. Sự phân bố là giả ngẫu nhiên trong đó không có mối tương quan rõ ràng giữa các kết quả đầu ra từ đầu vào tương tự hoặc trong các mục được lưu trữ trên bất kỳ thiết bị lưu trữ. Chúng tôi nói CRUSH mà tạo ra một phân phối declustered bản sao trong đó tập hợp các thiết bị chia sẻ bản sao cho một mặt hàng cũng xuất hiện để được độc lập của tất cả các mặt hàng khác.
đang được dịch, vui lòng đợi..