including n-way replication (mirror

including n-way replication (mirroring), RAID parity schemes or other forms of erasure coding, and hybrid approaches (e. g., RAID-10). These features make CRUSH ideally suited for managing object distribution in extremely large (multi-petabyte) storage systems where scalability, performance, and reliability are critically important.

2. Related Work
Object-based storage has recently garnered significant interest as a mechanism for improving the scalability of storage systems. A number of research and production file systems have adopted an object-based approach, including the seminal NASD file system [Gobioff et al. 1997], the Panasas file system [Nagle et al. 2004], Lustre [Braam 2004], and others [Rodeh and Teperman 2003; Ghemawat et al. 2003]. Other block-based distributed file systems like GPFS [Schmuck and Haskin 2002] and Federated Array of Bricks (FAB) [Saito et al. 2004] face a similar data distribution challenge. In these systems a semi-random or heuristicbased approach is used to allocate new data to storage devices with available capacity, but data is rarely relocated to maintain a balanced distribution over time. More importantly, all of these systems locate data via some sort of metadata directory, while CRUSH relies instead on a compact cluster description and deterministic mapping function. This distinction is most significant when writing data, as systems utilizing CRUSH can calculate any new data’s storage target without consulting a central allocator. The Sorrento [Tang et al. 2004] storage system’s use of consistent hashing [Karger et al. 1997] most closely resembles CRUSH, but lacks support for controlled weighting of devices, a wellbalanced distribution of data, and failure domains for improving data safety. Although the data migration problem has been studied extensively in the context of systems with explicit allocation maps [Anderson et al. 2001; Anderson et al. 2002], such approaches have heavy metadata requirements that functional approaches like CRUSH avoid. Choy, et al. [1996] describe algorithms for distributing data over disks which move an optimal number of objects as disks are added, but do not support weighting, replication, or disk removal. Brinkmann, et al. [2000] use hash functions to distribute data to a heterogeneous but static cluster. SCADDAR [Goel et al. 2002] addresses the addition and removal of storage, but only supports a constrained subset of replication strategies. None of these approaches include CRUSH’s flexibility or failure do mains for improved reliability. CRUSH most closely resembles the RUSH [Honicky and Miller 2004] family of algorithms upon which it is based. RUSH remains the only existing set of algorithms in the literature that utilizes a mapping function in place of explicit metadata and supports the efficient addition and removal of weighted devices. Despite these basic properties, a number of issues make RUSH an insufficient solution in practice. CRUSH fully generalizes the useful elements of RUSHP and RUSHT while resolving previously unaddressed reliability and replication issues, and offering improved performance and flexibility.

3 The CRUSH algorithm
The CRUSH algorithm distributes data objects among storage devices according to a per-device weight value, approximating a uniform probability distribution. The distribution is controlled by a hierarchical cluster map representing the available storage resources and composed of the logical elements from which it is built. For example, one might describe a large installation in terms of rows of server cabinets, cabinets filled with disk shelves, and shelves filled with storage devices. The data distribution policy is defined in terms of placement rules that specify how many replica targets are chosen from the cluster and what restrictions are imposed on replica placement. For example, one might specify that three mirrored replicas are to be placed on devices in different physical cabinets so that they do not share the same electrical circuit. Given a single integer input value x, CRUSH will output an ordered list ~R of n distinct storage targets. CRUSH utilizes a strong multi-input integer hash function whose inputs include x, making the mapping completely deterministic and independently calculable using only the cluster map, placement rules, and x. The distribution is pseudo-random in that there is no apparent correlation between the resulting output from similar inputs or in the items stored on any storage device. We say that CRUSH generates a declustered distribution of replicas in that the set of devices sharing replicas for one item also appears to be independent of all other items.

2. Related Work 
Object-based storage has recently garnered significant interest as a mechanism for improving the scalability of storage systems. A number of research and production file systems have adopted an object-based approach, including the seminal NASD file system [Gobioff et al. 1997], the Panasas file system [Nagle et al. 2004], Lustre [Braam 2004], and others [Rodeh and Teperman 2003; Ghemawat et al. 2003]. Other block-based distributed file systems like GPFS [Schmuck and Haskin 2002] and Federated Array of Bricks (FAB) [Saito et al. 2004] face a similar data distribution challenge. In these systems a semi-random or heuristicbased approach is used to allocate new data to storage devices with available capacity, but data is rarely relocated to maintain a balanced distribution over time. More importantly, all of these systems locate data via some sort of metadata directory, while CRUSH relies instead on a compact cluster description and deterministic mapping function. This distinction is most significant when writing data, as systems utilizing CRUSH can calculate any new data’s storage target without consulting a central allocator. The Sorrento [Tang et al. 2004] storage system’s use of consistent hashing [Karger et al. 1997] most closely resembles CRUSH, but lacks support for controlled weighting of devices, a wellbalanced distribution of data, and failure domains for improving data safety. Although the data migration problem has been studied extensively in the context of systems with explicit allocation maps [Anderson et al. 2001; Anderson et al. 2002], such approaches have heavy metadata requirements that functional approaches like CRUSH avoid. Choy, et al. [1996] describe algorithms for distributing data over disks which move an optimal number of objects as disks are added, but do not support weighting, replication, or disk removal. Brinkmann, et al. [2000] use hash functions to distribute data to a heterogeneous but static cluster. SCADDAR [Goel et al. 2002] addresses the addition and removal of storage, but only supports a constrained subset of replication strategies. None of these approaches include CRUSH’s flexibility or failure do mains for improved reliability. CRUSH most closely resembles the RUSH [Honicky and Miller 2004] family of algorithms upon which it is based. RUSH remains the only existing set of algorithms in the literature that utilizes a mapping function in place of explicit metadata and supports the efficient addition and removal of weighted devices. Despite these basic properties, a number of issues make RUSH an insufficient solution in practice. CRUSH fully generalizes the useful elements of RUSHP and RUSHT while resolving previously unaddressed reliability and replication issues, and offering improved performance and flexibility.

3 The CRUSH algorithm 
The CRUSH algorithm distributes data objects among storage devices according to a per-device weight value, approximating a uniform probability distribution. The distribution is controlled by a hierarchical cluster map representing the available storage resources and composed of the logical elements from which it is built. For example, one might describe a large installation in terms of rows of server cabinets, cabinets filled with disk shelves, and shelves filled with storage devices. The data distribution policy is defined in terms of placement rules that specify how many replica targets are chosen from the cluster and what restrictions are imposed on replica placement. For example, one might specify that three mirrored replicas are to be placed on devices in different physical cabinets so that they do not share the same electrical circuit. Given a single integer input value x, CRUSH will output an ordered list ~R of n distinct storage targets. CRUSH utilizes a strong multi-input integer hash function whose inputs include x, making the mapping completely deterministic and independently calculable using only the cluster map, placement rules, and x. The distribution is pseudo-random in that there is no apparent correlation between the resulting output from similar inputs or in the items stored on any storage device. We say that CRUSH generates a declustered distribution of replicas in that the set of devices sharing replicas for one item also appears to be independent of all other items.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

bao gồm n chiều rộng (ánh xạ), cuộc tấn công tương đương đề án hoặc các hình thức khác của erasure mã hóa, và cách tiếp cận hybrid (e. g., RAID-10). Các tính năng này làm cho lòng lý tưởng cho việc quản lý đối tượng phân phối trong hệ thống lưu trữ cực lớn (multi-petabyte) mà khả năng mở rộng, hiệu suất và độ tin cậy là cực kỳ quan trọng.2. liên quan đến công việc Dựa trên đối tượng lí mới đã giành được lợi ích đáng kể như là một cơ chế cho việc cải thiện khả năng mở rộng của hệ thống. Một số nghiên cứu và sản xuất các hệ thống tập tin đã thông qua một đối tượng dựa trên cách tiếp cận, Hệ thống tập tin NASD hội thảo [Gobioff et al. 1997], Hệ thống tập tin Panasas [Nagle ctv. 2004], Lustre [Braam 2004] và nhiều người khác [Rodeh và Teperman năm 2003; Ghemawat et al. 2003]. Khối khác dựa trên phân phối hệ thống tập tin như GPFS [Schmuck và Haskin 2002] và liên bang mảng của gạch (FAB) [Saito và ctv. 2004] mặt một thách thức phân phối dữ liệu tương tự. Trong các hệ thống này một cách tiếp cận bán ngẫu nhiên hoặc heuristicbased được sử dụng để phân bổ các dữ liệu mới vào thiết bị lưu trữ với khả năng, nhưng dữ liệu hiếm khi di dời để duy trì một sự cân bằng phân bố theo thời gian. Quan trọng hơn, tất cả các hệ thống xác định vị trí dữ liệu thông qua một số loại siêu dữ liệu thư mục, trong khi lòng dựa thay vì vào một mô tả cụm nhỏ gọn và chức năng lập bản đồ xác định. Sự phân biệt này là quan trọng nhất khi ghi dữ liệu, như hệ thống sử dụng lòng có thể tính toán bất kỳ dữ liệu mới lưu trữ mục tiêu mà không tham khảo cấp phát trung. Sử dụng hệ thống lưu trữ Sorrento [Tang ctv. 2004] phù hợp băm [Karger et al. 1997] chặt chẽ tương tự như lòng, nhưng thiếu hỗ trợ kiểm soát nặng của các thiết bị, một phân phối wellbalanced dữ liệu, và thất bại các tên miền cho việc cải thiện an toàn dữ liệu. Mặc dù các vấn đề di chuyển dữ liệu đã được nghiên cứu rộng rãi trong bối cảnh hệ thống với bản đồ rõ ràng phân bổ [Anderson et al. năm 2001; Anderson và ctv. 2002], phương pháp tiếp cận như vậy có yêu cầu nặng siêu dữ liệu chức năng phương pháp tiếp cận như lòng tránh. Choy, et al. [1996] mô tả các thuật toán để phân phối dữ liệu trên đĩa mà di chuyển một số lượng tối ưu của các đối tượng như đĩa được thêm vào, nhưng không hỗ trợ cân, sao chép hay gỡ bỏ đĩa. Brinkmann, et al. [2000] sử dụng chức năng băm để phân phối dữ liệu không đồng nhất nhưng tĩnh là một cụm. SCADDAR [Goel ctv. 2002] địa chỉ bổ sung và loại bỏ lưu trữ, nhưng hỗ trợ chỉ một tập hợp con hạn chế trong chiến lược mở rộng. Không ai trong số những phương pháp tiếp cận bao gồm sự linh hoạt của lòng hoặc thất bại làm nguồn điện cho độ tin cậy được cải thiện. LÒNG nhất khá giống với gia đình vội vàng [Honicky và Miller 2004] mà nó được dựa trên các thuật toán. Cơn sốt vẫn chỉ tập hiện có của các thuật toán trong văn học sử dụng một chức năng lập bản đồ ở vị trí rõ ràng siêu dữ liệu và hỗ trợ hiệu quả bổ sung và loại bỏ các trọng số thiết bị. Mặc dù có những tính chất cơ bản, thị trấn này có một số vấn đề hãy vội vàng một giải pháp không đủ trong thực tế. LÒNG đầy đủ generalizes các yếu tố hữu ích của RUSHP và RUSHT trong khi giải quyết trước đó unaddressed độ tin cậy và nhân rộng các vấn đề, và cung cấp cải thiện hiệu suất và tính linh hoạt.3 các thuật toán CRUSH Các thuật toán lòng phân phối các đối tượng dữ liệu giữa các thiết bị lưu trữ theo một giá trị trọng lượng cho mỗi thiết bị, số một phân bố xác suất thống nhất. Phân phối điều khiển bởi một bản đồ phân cấp cụm sao đại diện cho các nguồn lực sẵn có lí và bao gồm các yếu tố hợp lý mà từ đó nó được xây dựng. Ví dụ, một trong những có thể mô tả một cài đặt lớn về mặt hàng tủ server, tủ đầy với đĩa kệ và kệ đầy với thiết bị lưu trữ. Chính sách phân phối dữ liệu được định nghĩa trong điều khoản của quy định vị trí xác định có bao nhiêu bản sao mục tiêu được lựa chọn từ các nhóm và những hạn chế này được áp dụng trên vị trí đặt bản sao. Ví dụ, một trong những có thể chỉ định ba phản ánh bản sao phải được đặt trên các thiết bị trong tủ vật lý khác nhau, vì vậy mà họ không chia sẻ các mạch điện tương tự. Đưa ra một giá trị đầu vào đơn nguyên x, lòng sẽ ra một danh sách đã ra lệnh ~ R n khác biệt lí tiêu. LÒNG sử dụng một hàm băm mạnh đầu vào đa số có yếu tố đầu vào bao gồm x, làm ánh xạ hoàn toàn xác định và độc lập calculable chỉ sử dụng các cụm sao bản đồ, vị trí quy định, và x. Phân phối là giả ngẫu nhiên trong đó có là không có sự tương quan rõ ràng giữa các kết quả đầu ra từ đầu vào tương tự hoặc trong các mục được lưu trữ trên bất kỳ thiết bị lưu trữ. Chúng tôi nói rằng lòng tạo ra một phân phối declustered của bản sao trong đó các thiết lập của thiết bị chia sẻ các bản sao cho một mục cũng xuất hiện để được độc lập của tất cả các mặt hàng khác.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

bao gồm cả n-cách nhân rộng (ánh xạ), các chương trình RAID chẵn lẻ hoặc các hình thức khác của tẩy xoá mã hóa, và các phương pháp lai (ví dụ, RAID-10). Những tính năng này làm cho CRUSH lý tưởng cho quản lý phân phối đối tượng trong (multi-petabyte) hệ thống lưu trữ vô cùng rộng lớn, nơi khả năng mở rộng, hiệu suất và độ tin cậy là cực kỳ quan trọng.

2. Công việc liên quan đến
đối tượng lưu trữ dựa trên thời gian gần đây đã thu hút được sự quan tâm đáng kể như một cơ chế để nâng cao khả năng mở rộng của hệ thống lưu trữ. Một số hệ thống nghiên cứu và sản xuất tập tin đã được thông qua một cách tiếp cận dựa trên đối tượng, bao gồm các chuyên đề hệ thống tập tin NASD [Gobioff et al. 1997], hệ thống tập tin Panasas [Nagle et al. 2004], Lustre [Braam 2004], và những người khác [Rodeh và Teperman năm 2003; Ghemawat et al. 2003]. Khác dựa trên khối phân phối hệ thống tập tin như GPFS [SCHMUCK và Haskin 2002] và Liên Array của Gạch (FAB) [Saito et al. 2004] đối mặt với một thách thức phân phối dữ liệu tương tự. Trong các hệ thống này một cách tiếp cận bán ngẫu nhiên hoặc heuristicbased được sử dụng để phân bổ dữ liệu mới cho các thiết bị lưu trữ với dung lượng có sẵn, nhưng dữ liệu là rất hiếm khi di chuyển để duy trì một phân bố cân bằng thời gian. Quan trọng hơn, tất cả các hệ thống xác định vị trí dữ liệu thông qua một số loại thư mục siêu dữ liệu, trong khi CRUSH dựa thay vì trên một mô tả cụm nhỏ gọn và chức năng lập bản đồ xác định. Sự khác biệt này là quan trọng nhất khi ghi dữ liệu, như các hệ thống sử dụng Crush có thể tính toán mục tiêu lưu trữ bất kỳ dữ liệu mới mà không tham khảo ý kiến một cấp trung ương. Sorrento [Tang et al. 2004] lưu trữ của hệ thống sử dụng các hàm băm ổn định [Karger et al. 1997] gần giống nhất CRUSH, nhưng thiếu hỗ trợ cho trọng kiểm soát các thiết bị, một phân phối wellbalanced của dữ liệu, và các lĩnh vực thất bại trong việc cải thiện an toàn dữ liệu. Mặc dù vấn đề di chuyển dữ liệu đã được nghiên cứu rộng rãi trong bối cảnh hệ thống với các bản đồ phân bổ rõ ràng [Anderson et al. năm 2001; Anderson et al. 2002], cách tiếp cận này có những yêu cầu siêu dữ liệu nặng mà cách tiếp cận chức năng như tránh Crush. Choy, et al. [1996] mô tả thuật toán để phân phối dữ liệu trên đĩa mà di chuyển một số lượng tối ưu của các đối tượng là các đĩa được thêm vào, nhưng không hỗ trợ trọng, sao chép, hoặc cắt bỏ đĩa. Brinkmann, et al. [2000] sử dụng hàm băm để phân phối dữ liệu đến một cụm không đồng nhất nhưng tĩnh. SCADDAR [Goel et al. 2002] quyết việc bổ sung và loại bỏ các lưu trữ, nhưng chỉ hỗ trợ một tập hợp con ràng buộc của các chiến lược nhân rộng. Không ai trong số những phương pháp tiếp cận bao gồm linh hoạt hay thất bại của CRUSH làm nguồn điện cho cải thiện độ tin cậy. CRUSH chặt chẽ như RUSH [Honicky và Miller 2004] gia đình của các thuật toán mà trên đó nó được dựa. RUSH vẫn là thiết lập hiện tại duy nhất của thuật toán trong các tài liệu mà sử dụng một chức năng lập bản đồ ở vị trí của siêu dữ liệu rõ ràng và hỗ trợ việc bổ sung hiệu quả và loại bỏ các thiết bị gia quyền. Mặc dù có những tính chất cơ bản, một số vấn đề làm cho RUSH một giải pháp không đủ trong thực tế. CRUSH khái quát đầy đủ các yếu tố hữu ích của RUSHP và RUSHT trong khi giải quyết các vấn đề độ tin cậy và nhân rộng trước đó chưa được giải quyết, và cung cấp cải thiện hiệu suất và tính linh hoạt.

3 Các thuật toán CRUSH
Thuật toán CRUSH phân phối đối tượng dữ liệu giữa các thiết bị lưu trữ theo một giá trị trọng lượng cho mỗi thiết bị, xấp xỉ một phân bố xác suất thống nhất. Sự phân bố được điều khiển bởi một bản đồ nhóm theo bậc đại diện cho các tài nguyên lưu trữ có sẵn và bao gồm các yếu tố hợp lý mà từ đó nó được xây dựng. Ví dụ, người ta có thể mô tả một cài đặt lớn về mặt hàng tủ server, tủ chứa đầy các kệ đĩa, và kệ chứa đầy các thiết bị lưu trữ. Các chính sách phân phối dữ liệu được xác định theo quy định vị trí đó xác định có bao nhiêu mục tiêu sao được lựa chọn từ các cụm và những hạn chế được áp đặt vào vị trí bản sao. Ví dụ, người ta có thể xác định rằng ba bản sao nhân đôi sẽ được đặt trên các thiết bị trong tủ vật lý khác nhau để họ không chia sẻ các mạch điện tương tự. Cho một số nguyên duy nhất giá trị đầu vào x, CRUSH sẽ ra một danh sách đặt ~ R n mục tiêu lưu trữ riêng biệt. CRUSH sử dụng một đa đầu vào chức năng nguyên băm mạnh mà đầu vào bao gồm X, làm cho việc lập bản đồ hoàn toàn xác định và độc lập có thể tính được chỉ sử dụng bản đồ cluster, quy định vị trí, và x. Sự phân bố là giả ngẫu nhiên trong đó không có mối tương quan rõ ràng giữa các kết quả đầu ra từ đầu vào tương tự hoặc trong các mục được lưu trữ trên bất kỳ thiết bị lưu trữ. Chúng tôi nói CRUSH mà tạo ra một phân phối declustered bản sao trong đó tập hợp các thiết bị chia sẻ bản sao cho một mặt hàng cũng xuất hiện để được độc lập của tất cả các mặt hàng khác.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.