G4 PowerPC vi xử thảo luận bài báo này thiết kế của G4 PowerPC với AltiVec và cân bằng mà các nhà thiết kế gặp phải trong quá trình thiết kế và mô phỏng các giai đoạn. Mục đích của họ là để tìm "... nơi trong vi kiến trúc nơi tăng đáng kể có thể được tìm thấy, "không bao gồm những thay đổi đó sẽ gây ra chỉ tăng nhẹ tại các chi phí của khu vực chip ngày càng phức tạp cao hơn. Để so sánh cải tiến tiềm năng và các tính năng khác nhau, các nhà thiết kế xây dựng một mô phỏng mà họ gọi là những thách thức, do đó đã được dựa trên một giả lớn tuổi hơn tên ADAPT , bản thân các mô phỏng hiệu suất sử dụng trên các bộ xử lý thế hệ trước. Nhóm nghiên cứu sử dụng thách thức để thử nghiệm các tính năng khác nhau tìm kiếm tăng hiệu suất đáng kể. dấu vết Chỉ thị đã được sử dụng, chủ yếu từ SpecInt95, SpecFp95, và một bộ các ứng dụng đa phương tiện chuẩn đặt tên Mediamark. Các Các tính năng chính của nghiên cứu là chiều dài đường ống, thông lượng, số lượng bộ đệm sắp xếp lại, và các chiến lược dự báo nhánh. thông số kỹ thuật thiết kế ban đầu của họ được gọi là một bộ vi xử lý bao gồm một lõi trung tâm, 256 KB bộ nhớ cache trên chip L2, với một tần số mục tiêu tối thiểu 700MHz. lõi này đã là một bộ xử lý PowerPC hiệu suất cao với 32 KB cache L1 cộng với phần cứng thực hiện các phần mở rộng AltiVec ISA. Các bộ nhớ cache đã được đơn được chuyển, 8-cách thiết lập liên kết. Cuối cùng nhóm thiết kế quyết định 16 sắp xếp lại đệm, khả năng điều động và đầy đủ 3 hướng dẫn cộng với một chi nhánh phụ cho gấp và thực hiện các chi nhánh, và 11 đơn vị thực hiện. Sau này bao gồm 3 số nguyên ALU, một số nguyên phức tạp ALU, một FPU, một vector và hoán vị đơn vị (có lẽ cho AltiVec mở rộng), một đơn vị tải / cửa hàng, và một đơn vị chi nhánh. Các quyết định điều động và chỉ hoàn thành 3 hướng dẫn đã được thực hiện bởi vì đó là điểm xa hơn mà phức tạp tăng lên làm cho lợi nhuận giảm sút tăng chiều rộng máy không mong muốn. Để đạt được tần số đồng hồ cao hơn các nhà thiết kế đã chọn để sử dụng một đường ống dài hơn gồm 7 giai đoạn. Fetch được chia thành hai, tiếp theo công văn / Chi nhánh, Issue, Thực hiện, hoàn thành, và writeback. Việc truy cập bộ nhớ cache chính được chia thành hai chu kỳ. Mặc dù điều này cho phép tốc độ xung nhịp cao hơn, nó cũng có khả năng làm giảm tổng số tiền xử lý song song có sẵn, điều này do tăng hình phạt chi nhánh và thiếu hiệu quả khác. Các quyết định để phân chia các truy cập bộ nhớ cache chính đã được thực hiện vì các vấn đề với 32 KB bộ nhớ cache, mà nếu không thể có được truy cập tại các tần số mong muốn. Một lựa chọn khác là để tăng kích thước của bộ nhớ cache, nhưng điều này được coi là không mong muốn vì thêm con chip bất động sản này sẽ có yêu cầu. Một lựa chọn thứ ba là làm cho bộ nhớ cache dữ liệu với hai cổng thay vì một, nhưng điều này sẽ tăng lên rất nhiều phức tạp và diện tích chip, lần lượt ảnh hưởng đến thời gian nó sẽ có được để cung cấp những kiến trúc thị trường, tất cả trong ngoài tác động tiêu cực đến tần số, vì vậy tùy chọn này, quá, đã được đánh đắm. Các nhà thiết kế cũng nhận thấy họ cần phải chia công văn và vấn đề thành hai giai đoạn, thay cho một thường xuyên. Để làm gì khác trong vòng một chu kỳ sẽ có yêu cầu độ dài chu kỳ tăng. Các nhà thiết kế cũng đề cập đến họ gặp khó khăn trong việc ước tính thời gian cần thiết để đọc hướng dẫn từ sắp xếp lại bộ đệm và tuyến đường cho các đơn vị thực hiện nhiệm vụ, giải quyết vấn đề này bằng cách cho một hàng đợi vấn đề riêng biệt cho mỗi phần chính của vi kiến trúc lõi. Các đơn vị nói chung mục đích, AltiVec, và FPU On dự đoán chi nhánh, họ so sánh gshare và hai mốt, thấy rằng, thất vọng, gshare chỉ gây ra những cải tiến nhỏ hơn dự đoán chi nhánh hai mốt. Kết quả là, họ đã quyết định để thực hiện các dự báo chi nhánh hai mốt cho các cấu trúc cuối cùng.
đang được dịch, vui lòng đợi..
