Một nói:sao chép dữ liệu nếu cùng một dữ liệu được lưu trữ trên nhiều thiết bị lưu trữ, [1]tính toán nhân rộng nếu nhiệm vụ tính toán tương tự được thực hiện nhiều lần.Một nhiệm vụ tính toán thường được nhân rộng trong không gian, tức là thực hiện trên thiết bị riêng biệt, hoặc nó có thể được nhân rộng trong thời gian, nếu nó được thực hiện nhiều lần trên một thiết bị duy nhất. Bản sao trong không gian hoặc trong thời gian thường được liên kết để lập lịch trình thuật toán [2]Truy cập đến một thực thể sao chép là thường đều có quyền truy cập đến một thực thể duy nhất, không sao chép. Sao chép chính nó nên được minh bạch với người dùng bên ngoài. Ngoài ra, trong một trường hợp thất bại, một chuyển đổi dự phòng của bản sao ẩn càng nhiều càng tốt. Sau này đề cập đến dữ liệu sao nhân bản đối với chất lượng dịch vụ (QoS) khía cạnh.[3]Các nhà khoa học máy tính nói về hoạt động và thụ động nhân rộng trong hệ thống sao chép dữ liệu hay dịch vụ:hoạt động sao chép được thực hiện bằng cách xử lý yêu cầu cùng một lúc mỗi bản sao.thụ động nhân bản liên quan đến việc thực hiện mỗi yêu cầu duy nhất trên một bản sao đơn và sau đó chuyển trạng thái kết quả các bản sao khác.Nếu tại bất kỳ thời gian một bản sao tổng thể được chỉ định để xử lý tất cả các yêu cầu, sau đó chúng tôi đang nói về chương trình sao lưu chính (master-slave đề án) chiếm ưu thế trong cụm cao sẵn có. Trên mặt khác, nếu bất kỳ bản sao xử lý một yêu cầu và sau đó phân phối một nhà nước mới, thì đây là một đề án đa chính (gọi là đa chủ trong lĩnh vực cơ sở dữ liệu). Trong các đề án đa chính, một số hình thức kiểm soát phân phối concurrency phải được sử dụng, chẳng hạn như quản lý phân phối khóa.Cân bằng tải khác với bản sao công việc, kể từ khi nó phân phối một tải trọng của khác nhau (không giống nhau) tính toán trên máy, và cho phép một tính toán duy nhất bị rớt trong trường hợp thất bại. Cân bằng tải, Tuy nhiên, đôi khi sử dụng sự sao chép dữ liệu (đặc biệt là đa chủ nhân rộng) trong nội bộ, để phân phối các dữ liệu giữa các máy.Sao lưu khác từ nhân rộng ở chỗ nó sẽ lưu lại một bản sao của dữ liệu không thay đổi trong một thời gian dài của thời gian.[cần dẫn nguồn] Bản sao, mặt khác, trải qua thường xuyên cập nhật và nhanh chóng mất đi bất kỳ nhà nước lịch sử. Sao chép là một trong những chủ đề lâu đời nhất và quan trọng nhất trong khu vực tổng thể của hệ thống phân phối.Cho dù một sao chép dữ liệu hoặc tính toán, mục tiêu là để có một số nhóm các quá trình xử lý các sự kiện. Nếu chúng tôi sao chép dữ liệu, các quá trình thụ động và hoạt động chỉ để duy trì các dữ liệu được lưu trữ, trả lời để đọc yêu cầu và áp dụng bản Cập Nhật. Khi chúng tôi tái tạo tính toán, mục tiêu thông thường là cung cấp lỗi khoan dung. Ví dụ, một dịch vụ sao chép có thể được sử dụng để kiểm soát một chuyển đổi điện thoại, với mục tiêu của việc đảm bảo rằng ngay cả khi bộ điều khiển chính thất bại, sao lưu có thể đi qua các chức năng. Nhưng các nhu cầu cơ bản là như nhau trong cả hai trường hợp: bằng cách đảm bảo rằng các bản sao nhìn thấy các sự kiện tương tự trong tương đương đơn đặt hàng, họ ở lại tại kỳ phù hợp và do đó bất kỳ bản sao có thể trả lời các truy vấn.Sao chép các mô hình trong hệ thống phân phối [sửa]Một số mô hình được trích dẫn rộng rãi tồn tại cho dữ liệu sao nhân bản, mỗi có tính chất và hiệu suất của riêng mình:Nhân rộng giao dịch. Đây là mô hình cho sao chép dữ liệu giao dịch, ví dụ một cơ sở dữ liệu hoặc một số hình thức khác của cấu trúc lí giao dịch. Các mô hình một bản sao serializability được sử dụng trong trường hợp này, mà xác định các kết quả pháp lý của một giao dịch trên sao chép dữ liệu phù hợp với các thuộc tính axit tổng thể giao dịch hệ thống tìm kiếm để đảm bảo.Nhà nước máy nhân bản. Mô hình này giả định rằng quá trình sao chép là một automaton hữu hạn xác định và đó phát sóng nguyên tử của mỗi sự kiện có thể. Nó được dựa trên một vấn đề tính toán phân phối được gọi là phân phối đồng thuận và có rất nhiều điểm chung với mô hình nhân rộng giao dịch. Điều này đôi khi nhầm lẫn được sử dụng như từ đồng nghĩa của hoạt động sao chép. Nhà nước máy nhân bản thường được thực hiện bởi một đăng sao chép bao gồm nhiều vòng tiếp theo của thuật toán Paxos. Điều này phổ biến rộng rãi bởi hệ thống Chubby của Google, và là cốt lõi đằng sau cửa hàng dữ liệu mã nguồn mở khóa.[4][5]Synchrony ảo. Mô hình tính toán này được sử dụng khi một nhóm các quá trình hợp tác để sao chép dữ liệu trong bộ nhớ hoặc phối hợp hành động. Các mô hình định nghĩa một thực thể phân phối được gọi là một quá trình nhóm. Một quá trình có thể tham gia một nhóm, và được cung cấp với một trạm kiểm soát có tình trạng hiện thời của dữ liệu nhân rộng bởi thành viên của nhóm. Quá trình có thể sau đó gửi multicast đến nhóm và sẽ thấy đến multicast trong bộ giống hệt nhau. Thay đổi thành viên được xử lý như một phát đa hướng đặc biệt cung cấp một cái nhìn thành viên mới cho các quá trình trong nhóm.Cơ sở dữ liệu sao nhân bản [sửa]Cơ sở dữ liệu sao nhân bản có thể được sử dụng trên nhiều cơ sở dữ liệu quản lý hệ thống, thường với một mối quan hệ Thạc sĩ/nô lệ giữa bản gốc và các bản sao. Là bậc thầy sẽ ghi lại các bản Cập Nhật, mà sau đó gợn thông qua để nô lệ. Nô lệ kết quả đầu ra một thông báo nói rằng nó đã nhận được cập nhật thành công, do đó cho phép việc gửi (và có khả năng tái gửi cho đến khi áp dụng thành công) của bản Cập Nhật tiếp theo.Đa chủ nhân rộng, nơi thông tin Cập Nhật có thể được gửi đến bất kỳ nút cơ sở dữ liệu, và sau đó gợn thông qua đến các máy chủ khác, thường là mong muốn, nhưng giới thiệu tăng đáng kể chi phí và sự phức tạp mà có thể làm cho nó không thực tế trong một số trường hợp. Thách thức phổ biến nhất mà tồn tại trong nhiều chủ nhân rộng là công tác phòng chống xung đột giao dịch hoặc độ phân giải. Đặt đồng bộ hoặc mong muốn sao chép giải pháp xung đột công tác phòng chống, trong khi không đồng bộ các giải pháp có xung đột độ phân giải. Ví dụ, nếu một kỷ lục thay đổi trên hai nút cùng một lúc, một mong muốn sao chép hệ thống sẽ phát hiện cuộc xung đột trước khi xác nhận cam kết và hủy bỏ một trong các giao dịch. Một hệ thống lười biếng nhân rộng sẽ cho phép cả hai giao dịch cam và chạy một giải quyết xung đột trong resynchronization. Nghị quyết của một cuộc xung đột có thể được dựa trên một dấu thời gian của giao dịch, Hệ thống phân cấp của các nút nguồn gốc hoặc trên logic phức tạp hơn, quyết định một cách nhất quán trên tất cả các nút.Cơ sở dữ liệu sao nhân bản trở nên khó khăn khi nó quy mô. Thông thường, quy mô lên đi với hai chiều, ngang và dọc: ngang quy mô-up có thêm dữ liệu bản sao, quy mô-up dọc có bản sao dữ liệu nằm tiếp tục đi khoảng cách. Vấn đề nêu ra bởi quy mô-up ngang có thể được giảm nhẹ bởi một giao thức nhiều lớp đa xem truy cập. Quy mô-up dọc gây ra vấn đề ít hơn trong đó internet đáng tin cậy và hiệu suất cải thiện.[6]Khi dữ liệu được nhân rộng giữa các máy chủ cơ sở dữ liệu, do đó, thông tin vẫn nhất quán trong suốt hệ thống cơ sở dữ liệu và người sử dụng không thể nói hoặc thậm chí biết máy chủ trong DBMS họ đang sử dụng, Hệ thống được cho triển lãm nhân rộng minh bạch.Đĩa lưu trữ bản sao [sửa]Lưu trữ bản saoHoạt động (thời gian thực) lí nhân rộng thường được thực hiện bởi phân phối các bản Cập Nhật của một thiết bị chặn để một số đĩa cứng vật lý. Bằng cách này, bất kỳ hệ thống tập tin được hỗ trợ bởi hệ điều hành có thể được nhân rộng mà không sửa đổi, như các tập tin hệ thống mã hoạt động trên một mức độ trên khối thiết bị điều khiển lớp. Nó được thực hiện hoặc trong phần cứng (trong một bộ điều khiển mảng đĩa) hoặc trong phần mềm (trong một trình điều khiển thiết bị).Các phương pháp cơ bản nhất là đĩa ánh xạ, điển hình nhất tại địa phương kết nối đĩa. Ngành công nghiệp lưu trữ thu hẹp các định nghĩa, do đó, phản ánh là một hoạt động địa phương (ngắn khoảng cách). Sao chép một là mở rộng trên một mạng máy tính, do đó, các đĩa có thể được đặt tại các địa điểm xa xôi về thể chất, và các mô hình nhân rộng cơ sở dữ liệu master-slave thường được áp dụng. Mục đích của nhân bản là để ngăn chặn thiệt hại từ thất bại hoặc thiên tai có thể xảy ra tại một địa điểm, hoặc trong trường hợp các sự kiện xảy ra, cải thiện khả năng phục hồi.[7] để nhân rộng, độ trễ là yếu tố quan trọng bởi vì nó sẽ xác định một trong hai cách xa ngoài các trang web có thể hoặc loại nhân bản có thể được sử dụng.Các đặc điểm chính của nhân rộng qua trang web như vậy là cách thức hoạt động ghi được xử lý:Bản sao đồng bộ - đảm bảo "zero mất dữ liệu" bởi các phương tiện của nguyên tử viết hoạt động, tức là viết một trong hai hoàn thành trên cả hai mặt hay không ở tất cả. Ghi không được coi là hoàn thành cho đến khi xác nhận bởi cả hai địa phương và từ xa hành lý. Hầu hết các ứng dụng chờ đợi cho một giao dịch viết hoàn thành trước khi tiếp tục với công việc, do đó hiệu suất tổng thể giảm đáng kể. Vốn, hiệu suất giảm tương ứng với khoảng cách, như độ trễ là do vận tốc ánh sáng. Đối với khoảng cách 10 km, roundtrip có thể nhanh nhất mất 67 μs, trong khi ngày nay bản ghi lưu trữ toàn bộ địa phương hoàn thành trong về 10-20 μs.Một khía cạnh thường bỏ qua của bản sao đồng bộ là một thực tế rằng sai lầm của bản sao từ xa, hoặc thậm chí chỉ cần kết nối, các điểm dừng theo định nghĩa tất cả viết (đóng băng hệ thống lưu trữ cục bộ). Đây là hành vi đó đảm bảo không mất dữ liệu. Tuy nhiên, nhiều hệ thống thương mại tại điểm nguy hiểm tiềm tàng không đóng băng, nhưng chỉ cần tiến hành với địa phương viết, mất đi những mong muốn không mục tiêu điểm phục hồi.Sự khác biệt chính giữa sao chép khối lượng đồng bộ và không đồng bộ là bản sao đồng bộ đó cần phải đợi cho máy chủ đích trong bất kỳ hoạt động viết.[8]Bản sao không đồng bộ - ghi được coi là hoàn thành ngay sau khi lưu trữ cục bộ thừa nhận nó. Lưu trữ từ xa được Cập Nhật, nhưng có lẽ với một độ trễ nhỏ. Hiệu suất tăng lên rất nhiều, nhưng trong trường hợp mất một lưu trữ địa phương, lưu trữ từ xa không được đảm bảo để có bản sao hiện tại của dữ liệu và đặt dữ liệu có thể bị mất.Bản sao đồng bộ bán - điều này thường có nghĩa [cần dẫn nguồn] viết được coi hoàn thành ngay sau khi lưu trữ cục bộ thừa nhận nó và một máy chủ từ xa thừa nhận rằng nó đã nhận được viết vào bộ nhớ hoặc vào một tập tin Nhật ký dành riêng. Viết từ xa thực tế chưa được thực hiện ngay lập tức nhưng được thực hiện không đồng bộ, resul
đang được dịch, vui lòng đợi..
