Multiply R1, R2> R1 d (R1) * (R2)>
tải R3, A (I)> R3 d Memory (g + I)>
Thêm R3, R1> R3 d (R3) + (R1)>
cửa hàng D1, R3> Memory (u + I) d (R3)>
nơi R1, R2, R3 và được đăng ký xử lý, và a, b, g, u là bắt đầu từ bộ nhớ chính
địa chỉ của mảng B (I), C (I), A (I), và D (I), tương ứng. Giả sử bốn đồng hồ
cho mỗi chu kỳ Load hoặc Store, hai chu kỳ cho Add, và tám chu kỳ cho Multiplier
trên hoặc là một bộ xử lý đơn hoặc một bộ xử lý duy nhất trong một máy SIMD.
a. Tính tổng số chu kỳ xử lý cần thiết để thực thi đoạn mã này
lặp đi lặp lại 64 lần trên một bộ xử lý đơn SISD máy tính tuần tự, bỏ qua
tất cả sự chậm trễ thời gian khác.
b. Hãy xem xét việc sử dụng một máy tính SIMD với 64 yếu tố xử lý để thực hiện
các hoạt động vector trong sáu hướng dẫn vector đồng bộ trên 64 thành phần
dữ liệu vector và cả hai điều khiển bởi cùng một đồng hồ tốc độ. Tính tổng
thời gian thực hiện trên máy SIMD, bỏ qua hướng dẫn phát sóng và các
sự chậm trễ.
c. Đạt tốc độ tăng của máy tính SIMD trên máy tính SISD là gì?
17.13 Sản xuất một phiên bản vectorized của chương trình như sau:
DO 20 I = 1, N
B (I, 1) = 0
DO 10 J = 1, M
A (I) = A (I) + B (I, J) * C (I, J)
10 TIẾP TỤC
D (I) = E (I) + A (I)
20 TIẾP TỤC
17,14 Một chương trình ứng dụng được thực hiện trên một nhóm gồm chín máy tính. Một chương trình chuẩn
đã dành thời gian T trên cụm này. Hơn nữa, nó đã được tìm thấy rằng 25% của T là thời gian trong
đang được dịch, vui lòng đợi..
![](//viimg.ilovetranslation.com/pic/loading_3.gif?v=b9814dd30c1d7c59_8619)