The Ceph file system has three main components: the client, each instance of which
exposes a near-POSIX file system interface to a host or process; a cluster of OSDs, which
collectively stores all data and metadata; and a metadata server cluster, which manages the
namespace (file names and directories) while coordinating security, consistency and coherence
(see Figure 3.1). I say the Ceph interface is near-POSIX because I find it appropriate to extend
the interface and selectively relax consistency semantics in order to better align both with the
needs of applications and improve system performance (discussed in Section 3.2.2)
The primary goals of the architecture are scalability (to hundreds of petabytes and beyond), performance, and reliability. Scalability is considered in a variety of dimensions, including
the overall storage capacity and throughput of the system, and performance in terms
of individual clients, directories, or files. Our target workload may include such extreme cases
as tens or hundreds of thousands of hosts concurrently reading from or writing to the same
file or creating files in the same directory. Such scenarios, common in scientific applications
running on supercomputing clusters, are increasingly indicative of tomorrow’s general purpose
workloads. More importantly, distributed file system workloads are inherently dynamic, with
significant variation in data and metadata access as active applications and data sets change overtime. Ceph directly addresses the issue of scalability while simultaneously achieving high performance,reliability and availability through three fundamental design features: decoupled dataand metadata, dynamic distributed metadata management, and reliable autonomic distributed
object storage.
Hệ thống tập tin Ceph có ba thành phần chính: khách hàng, mỗi trường hợp đềuđưa ra một giao diện gần POSIX hệ thống tập tin vào một máy chủ hoặc quá trình; một cụm các OSDs, màchung mua sắm tất cả các dữ liệu và siêu dữ liệu; và một cụm máy chủ siêu dữ liệu, quản lý cáckhông gian tên (tên tập tin và thư mục) trong khi phối hợp thống nhất, chặt chẽ và bảo mật(xem hình 3.1). Tôi nói Ceph giao diện là gần POSIX vì tôi tìm thấy nó thích hợp để mở rộnggiao diện và chọn lọc thư giãn nhất quán ngữ nghĩa để tốt hơn align với cácnhu cầu của các ứng dụng và cải thiện hiệu suất hệ thống (được thảo luận trong phần 3.2.2) Mục tiêu chính của kiến trúc là khả năng mở rộng (cho hàng trăm petabytes và hơn thế nữa), hiệu suất và độ tin cậy. Khả năng mở rộng được coi là trong một loạt các kích thước, bao gồm cảTổng dung lượng lưu trữ và băng thông của hệ thống và hiệu suất trong các điều khoảnkhách hàng cá nhân, thư mục hoặc tập tin. Khối lượng công việc mục tiêu của chúng tôi có thể bao gồm các trường hợp cực đoanhàng chục hay hàng trăm hàng ngàn máy chủ đồng thời đọc từ hoặc viết để cùngtệp hoặc tạo ra các tập tin trong thư mục tương tự. Tình huống như vậy, phổ biến trong khoa học ứng dụngchạy trên siêu cụm, đang ngày càng chỉ mang tính mục đích chung của ngày maikhối lượng công việc. Quan trọng hơn, khối lượng công việc hệ thống tệp phân tán vốn đã năng động, vớibiến đổi đáng kể trong truy cập dữ liệu và siêu dữ liệu như hoạt động ứng dụng và dữ liệu thay đổi thời gian bù giờ. CEPH trực tiếp địa chỉ các vấn đề khả năng mở rộng trong khi đồng thời đạt được hiệu suất cao, độ tin cậy và có sẵn thông qua ba cơ bản thiết kế tính năng: tách dataand siêu dữ liệu, phân phối động siêu dữ liệu quản lý và phân phối tự trị đáng tin cậyđối tượng lưu trữ.
đang được dịch, vui lòng đợi..

Các hệ thống tập tin Ceph có ba thành phần chính: khách hàng, mỗi trường hợp trong đó
phơi bày một gần-POSIX giao diện hệ thống tập tin vào một máy chủ hoặc trình; một cụm OSDs, trong đó
lưu trữ tất cả dữ liệu chung và siêu dữ liệu; và một cụm máy chủ siêu dữ liệu, trong đó quản lý
không gian tên (tên tập tin và thư mục) trong khi phối hợp an ninh, ổn định và sự gắn kết
(xem Hình 3.1). Tôi nói giao diện Ceph là gần POSIX vì tôi thấy nó thích hợp để mở rộng
giao diện và chọn lọc thư giãn ngữ nghĩa thống nhất để phù hợp hơn cả với những
nhu cầu của các ứng dụng và cải thiện hiệu năng hệ thống (được thảo luận tại mục 3.2.2)
Các mục tiêu chính của kiến trúc là khả năng mở rộng (tới hàng trăm petabyte và xa hơn nữa), hiệu suất và độ tin cậy. Khả năng mở rộng được xem trong một loạt các kích thước, bao gồm cả
năng lực tổng thể lưu trữ và băng thông của hệ thống, và hiệu suất về
các cá nhân khách hàng, thư mục hoặc tập tin. Khối lượng công việc mục tiêu của chúng tôi có thể bao gồm các trường hợp cực đoan như vậy
là hàng chục hoặc hàng trăm hàng ngàn máy chủ đồng thời đọc từ hoặc văn bản cho cùng một
tập tin hoặc tạo các file trong cùng thư mục. Tình huống như vậy, phổ biến trong các ứng dụng khoa học
chạy trên siêu máy tính cụm, đang ngày càng biểu hiện của mục đích chung vào ngày mai của
khối lượng công việc. Quan trọng hơn, hệ thống tập tin phân phối khối lượng công việc vốn đã năng động, với
sự thay đổi đáng kể trong dữ liệu và truy cập dữ liệu mô tả các ứng dụng hoạt động và tập hợp dữ liệu thay đổi theo thời gian. Ceph trực tiếp giải quyết các vấn đề khả năng mở rộng trong khi đồng thời đạt được hiệu suất cao, độ tin cậy và tính sẵn sàng qua ba đặc điểm thiết kế cơ bản: tách rời siêu dữ liệu dataand, quản lý siêu dữ liệu phân phối năng động, và tự trị đáng tin cậy phân phối
lưu trữ đối tượng.
đang được dịch, vui lòng đợi..
