Pentium III SSE thực hiệnKhe cắm 1 Pentium III CPU gắn trên một bo mạch chủKể từ khi Katmai được xây dựng trong quá trình μm 0,25 tương tự như Pentium II "Deschutes", nó đã thực hiện SSE sử dụng là silicon ít nhất có thể. Để đạt được mục tiêu này, Intel thực hiện kiến trúc 128-bit bởi đôi-chạy xe đạp đường dẫn 64-bit dữ liệu sẵn có và kết hợp các đơn vị hệ số SIMD-FP với x 87 hệ số FPU vô hướng vào một đơn vị. Để sử dụng đường dẫn 64-bit dữ liệu sẵn có, Katmai vấn đề mỗi hướng dẫn SIMD-FP là hai μops. Để bù lại một phần cho việc thực hiện chỉ là một nửa chiều rộng kiến trúc của SSE, Katmai thực hiện adder SIMD-FP như một đơn vị riêng biệt trên cổng công văn thứ hai. Tổ chức này cho phép một một nửa một SIMD nhân và một nửa của một SIMD độc lập thêm để được phát hành cùng nhau đưa thông lượng cao điểm quay lại bốn nổi điểm hoạt động cho mỗi chu kỳ — lúc ít nhất cho mã với một phân phối thậm chí sẽ nhân và cho biết thêm. [12]Vấn đề là Katmai của phần cứng-thực hiện trái ngược với các mô hình xử lý song song ngụ ý bởi tập lệnh SSE. Lập trình viên phải đối mặt với một mã lập kế hoạch tiến thoái lưỡng nan: nên SSE-mã được điều chỉnh cho các nguồn lực hạn chế thực hiện của Katmai, hoặc nó nên được điều chỉnh cho một bộ xử lý trong tương lai với nguồn lực nhiều hơn? Tối ưu hóa SSE dành riêng cho Katmai mang lại hiệu suất tốt nhất có thể từ gia đình Pentium III nhưng được suboptimal cho sau này bộ xử lý Intel, chẳng hạn như Pentium 4 và cốt lõi.
đang được dịch, vui lòng đợi..