Các ứng dụng được chạy đồng thời trên tất cả các máy tính chín. Còn lạithời gian, các ứng dụng đã phải chạy trên một máy tính duy nhất.a. tính toán speedup hiệu quả với điều kiện nói trên sođể thực hiện chương trình trên một máy tính duy nhất. Cũng tính toán một, các tỷ lệ phần trăm củaMã số đã được parallelized (lập trình hoặc biên soạn để sử dụng cụmchế độ) trong chương trình trước.sinh giả sử rằng chúng tôi có thể có hiệu quả sử dụng 17 máy tính chứ không phải là 9 máy tínhtrên phần parallelized của các mã. Tính toán tăng tốc hiệu quả mà làđạt được.17,15 chương trình FORTRAN sau này được thực hiện trên một máy tính, và song songPhiên bản là để được thực hiện trên một cụm máy tính 32.L1: LÀM 10 I = 1, 1024L2: SUM(I) = 0L3: DO 20 J = 1, TÔIL4: 20 SUM(I) = SUM(I) + IL5: 10 TIẾP TỤCGiả sử dòng 2 và 4 mỗi mất hai chu kỳ máy thời gian, bao gồm tất cả các bộ xử lývà các hoạt động truy cập bộ nhớ. Bỏ qua chi phí do phần mềmvòng lặp kiểm soát báo cáo (dòng 1, 3, 5) và tất cả các hệ thống chi phí và tài nguyêncuộc xung đột.a. những gì là thời gian thực hiện tất cả (trong chu kỳ máy lần) của chương trình trên mộtMáy vi tính?sinh chia tôi vòng lặp đi lặp lại giữa các máy tính 32 như sau: 1 máy tính thực hiệnlặp đi lặp lại đầu tiên 32 (tôi = 1 đến 32), bộ xử lý 2 thực hiện lặp đi lặp lại tiếp theo 32,và như vậy. Thời gian thực hiện là gì và yếu tố speedup so vớiphần (một)? (Lưu ý rằng khối lượng công việc tính toán, quyết định bởi J-loop, là không cân bằngtrong số các máy tính.)c. giải thích làm thế nào để sửa đổi parallelizing để tạo điều kiện một thực hiện song song cân bằngTất cả tính toán khối lượng công việc trên máy tính 32. Bởi một cân bằng tải là có nghĩa làmột số lượng tương đương của bổ sung được gán cho mỗi máy tính đối với cả haivòng.mất những gì là thời gian thực hiện tối thiểu dẫn đến từ thực hiện song song trênmáy tính 32? Speedup kết quả trên một máy tính duy nhất là gì?17.16 xem xét sau hai phiên bản của một chương trình để thêm hai vectơ:L1: LÀM 10 I = 1, N DOALL K = 1, ML2: A(I) = B(I) + C(I) DO 10 TÔI = L (K - 1) + 1, KLL3: 10 TIẾP TỤC A(I) = B(I) + C(I)L4: TỔNG = 0 10 TIẾP TỤCL5: DO 20 J = 1, N SUM(K) = 0L6: TỔNG HỢP = TỔNG + A(J) DO 20 J = 1, LL7: 20 TIẾP TỤC SUM(K) = SUM(K) + A (L (K - 1) + J)20 TIẾP TỤCENDALLa. chương trình bên trái thực hiện trên một bộ xử lý đơn. Giả sử mỗi dòng mãL2, L4 và L6 mất một chu kỳ đồng hồ bộ xử lý để thực hiện. Để đơn giản, bỏ quathời gian cần thiết cho các dòng mã. Ban đầu tất cả mảng đã được nạptrong bộ nhớ chính và nội dung short program mảnh là trong bộ nhớ cache chỉ dẫn. Làm thế nàonhiều đồng hồ chu kỳ được yêu cầu để thực hiện chương trình này?ĐIỀU KHOẢN 17,9 / DỰ, ĐÁNH GIÁ CÂU HỎI VÀ VẤN ĐỀ 663b. chương trình bên phải văn bản thực hiện trên một sự với bộ vi xử lý M.Chúng tôi phân vùng hoạt động cáo khi thành phần M với L = N > yếu tố Mmột phần. DOALL tuyên bố rằng tất cả các phần M được thực hiện song song. Cáckết quả của chương trình này là để sản xuất M một phần tiền. Giả sử rằng chu kỳ đồng hồ k làcần thiết cho mỗi chiến dịch interprocessor truyền thông qua bộ nhớ dùng chungvà rằng do đó bổ sung mỗi tổng một phần đòi hỏi k chu kỳ. Độ lnhị phân adder cây có thể hợp nhất tất cả các khoản tiền một phần, nơi l = log2M. Bao nhiêuchu kỳ là cần thiết để sản xuất tổng cuối cùng?c. giả sử N = 220 phần tử trong mảng và M = 256. Speedup là gìđạt được bằng cách sử dụng sự? Giả sử k = 200. Đây là những gì tỷ lệ phần trămcủa speedup lý thuyết của một yếu tố của 256?
đang được dịch, vui lòng đợi..