Multiply R1, R2 >R1 d (R1) * (R2)>Load R3, A(I) >R3 d Memory (g + I)>A dịch - Multiply R1, R2 >R1 d (R1) * (R2)>Load R3, A(I) >R3 d Memory (g + I)>A Việt làm thế nào để nói

Multiply R1, R2 >R1 d (R1) * (R2)>L

Multiply R1, R2 >R1 d (R1) * (R2)>
Load R3, A(I) >R3 d Memory (g + I)>
Add R3, R1 >R3 d (R3) + (R1)>
Store D1, R3 >Memory (u + I) d (R3)>
where R1, R2, and R3 are processor registers, and a, b, g, u are the starting main memory
addresses of arrays B(I), C(I), A(I), and D(I), respectively. Assume four clock
cycles for each Load or Store, two cycles for the Add, and eight cycles for the Multiplier
on either a uniprocessor or a single processor in an SIMD machine.
a. Calculate the total number of processor cycles needed to execute this code segment
repeatedly 64 times on a SISD uniprocessor computer sequentially, ignoring
all other time delays.
b. Consider the use of an SIMD computer with 64 processing elements to execute
the vector operations in six synchronized vector instructions over 64-component
vector data and both driven by the same-speed clock. Calculate the total
execution time on the SIMD machine, ignoring instruction broadcast and other
delays.
c. What is the speedup gain of the SIMD computer over the SISD computer?
17.13 Produce a vectorized version of the following program:
DO 20 I = 1, N
B(I, 1) = 0
DO 10 J = 1, M
A(I) = A(I) + B(I, J) * C(I, J)
10 CONTINUE
D(I) = E(I) + A(I)
20 CONTINUE
17.14 An application program is executed on a nine-computer cluster. A benchmark program
took time T on this cluster. Further, it was found that 25% of T was time in
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
Nhân R1, R2 > R1 d (R1) * (R2) >Tải R3, A(I) > R3 d bộ nhớ (g + I) >Thêm R3, R1 > R3 d (R3) + (R1) >Lưu trữ D1, R3 > bộ nhớ (u + I) d (R3) >nơi R1, R2, và R3 là xử lý đăng ký, và a, b, g, bạn đang bắt đầu bộ nhớ chínhđịa chỉ của mảng B(I), C(I), A(I), và D(I), tương ứng. Giả sử bốn đồng hồchu kỳ cho mỗi tải hoặc các cửa hàng, hai chu kỳ cho thêm, và các chu kỳ tám cho hệ sốtrên một bộ xử lý đơn hoặc một bộ xử lý duy nhất trong một máy SIMD.a. tính toán tổng số chu kỳ bộ xử lý cần thiết để thực hiện đoạn mã nàynhiều lần 64 lần trên một máy tính bộ xử lý đơn SISD tuần tự, bỏ quaTất cả các thời gian trễ.sinh xem xét việc sử dụng một máy tính SIMD với 64 xử lý các yếu tố để thực hiệnCác hoạt động vector trong sáu được đồng bộ hoá véc tơ hướng dẫn trên 64-thành phầndữ liệu vectơ và cả hai lái xe của cùng một tốc độ đồng hồ. Tính toán tổng sốthời gian thực hiện trên máy SIMD, bỏ qua các hướng dẫn phát sóng và khácsự chậm trễ.c. gì là đạt được tăng tốc của máy tính SIMD trên máy tính SISD?17.13 sản xuất một phiên bản vectorized của chương trình sau đây:20 TÔI = 1, NB (I, 1) = 0LÀM 10 J = 1, MA(I) = A(I) + B (I, J) * C (I, J)10 TIẾP TỤCD(I) = E(I) + A(I)20 TIẾP TỤC17,14 một chương trình ứng dụng được thực hiện trên một cụm máy tính chín. Một chương trình chuẩnmất thời gian T trên cụm sao này. Hơn nữa, nó đã được tìm thấy rằng 25% của T là thời gian trong
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
Multiply R1, R2> R1 d (R1) * (R2)>
tải R3, A (I)> R3 d Memory (g + I)>
Thêm R3, R1> R3 d (R3) + (R1)>
cửa hàng D1, R3> Memory (u + I) d (R3)>
nơi R1, R2, R3 và được đăng ký xử lý, và a, b, g, u là bắt đầu từ bộ nhớ chính
địa chỉ của mảng B (I), C (I), A (I), và D (I), tương ứng. Giả sử bốn đồng hồ
cho mỗi chu kỳ Load hoặc Store, hai chu kỳ cho Add, và tám chu kỳ cho Multiplier
trên hoặc là một bộ xử lý đơn hoặc một bộ xử lý duy nhất trong một máy SIMD.
a. Tính tổng số chu kỳ xử lý cần thiết để thực thi đoạn mã này
lặp đi lặp lại 64 lần trên một bộ xử lý đơn SISD máy tính tuần tự, bỏ qua
tất cả sự chậm trễ thời gian khác.
b. Hãy xem xét việc sử dụng một máy tính SIMD với 64 yếu tố xử lý để thực hiện
các hoạt động vector trong sáu hướng dẫn vector đồng bộ trên 64 thành phần
dữ liệu vector và cả hai điều khiển bởi cùng một đồng hồ tốc độ. Tính tổng
thời gian thực hiện trên máy SIMD, bỏ qua hướng dẫn phát sóng và các
sự chậm trễ.
c. Đạt tốc độ tăng của máy tính SIMD trên máy tính SISD là gì?
17.13 Sản xuất một phiên bản vectorized của chương trình như sau:
DO 20 I = 1, N
B (I, 1) = 0
DO 10 J = 1, M
A (I) = A (I) + B (I, J) * C (I, J)
10 TIẾP TỤC
D (I) = E (I) + A (I)
20 TIẾP TỤC
17,14 Một chương trình ứng dụng được thực hiện trên một nhóm gồm chín máy tính. Một chương trình chuẩn
đã dành thời gian T trên cụm này. Hơn nữa, nó đã được tìm thấy rằng 25% của T là thời gian trong
đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2024 I Love Translation. All reserved.

E-mail: