Giới thiệu
Thách thức trong thiết kế GPU:
- GPU hiện đại cần cung cấp hiệu suất cao cho các ứng dụng như chơi game, hình ảnh y tế, và thiết kế công nghiệp. Điều này đòi hỏi các chip phải tối ưu hóa năng lượng để giảm nhiệt, giảm chi phí hệ thống và kéo dài tuổi thọ pin.
- Ba mục tiêu chính:
- Giảm tiêu thụ năng lượng ở mức tải cao nhất.
- Tối ưu năng lượng mà không làm ảnh hưởng đến quy trình thiết kế hiện tại.
- Tự động hóa tối ưu hóa năng lượng trong giai đoạn sớm.
RTL Clock Gating và các kỹ thuật liên quan
Clock Gating: Kỹ thuật giảm năng lượng động bằng cách vô hiệu hóa tín hiệu đồng hồ đến các thành phần không cần thiết.
Combinational Clock Gating:
- Dễ triển khai, thay thế các điều kiện logic trong RTL bằng các cổng clock gating.
- Công cụ tổng hợp RTL có thể tự động nhận diện và thêm điều kiện này.
Sequential Clock Gating:
- Phức tạp hơn, yêu cầu phân tích hành vi mạch qua nhiều chu kỳ.
- Tối ưu hóa năng lượng bằng cách khai thác quan hệ tuần tự giữa các thanh ghi và dữ liệu.
Hạn chế của Clock Gating thủ công:
- Mất nhiều thời gian và công sức để xác định các điều kiện tối ưu.
- Khó khăn trong kiểm chứng và tạo các bài kiểm tra chức năng cho hàng trăm điều kiện clock gating.
Tích hợp công cụ PowerPro CG
PowerPro CG: Công cụ tự động hóa tối ưu hóa năng lượng dựa trên phân tích tuần tự, cho phép:
- Tìm thêm các điều kiện clock gating mới mà quy trình thủ công bỏ sót.
- Giữ nguyên định dạng mã RTL gốc, bao gồm cả chú thích và pragma.
- Tích hợp với SLEC Pro (Sequential Equivalence Checking) để đảm bảo rằng chức năng của mã không bị thay đổi sau khi tối ưu hóa.
Hiệu quả đạt được từ PowerPro CG (Siemens EDA)
Công cụ đã thử nghiệm trên nhiều khối thiết kế và mang lại kết quả đáng kể:
- Tăng số lượng thanh ghi được clock gating hoặc tăng thời gian áp dụng clock gating.
- Giảm năng lượng tiêu thụ từ 16% đến 34,8%, trong khi ảnh hưởng đến diện tích thiết kế dưới 0,81%.
- Đảm bảo thiết kế vẫn đáp ứng yêu cầu thời gian.
Khối thiết kế | Số lượng thanh ghi trong RTL gốc | Thanh ghi Clock gated trong RTL gốc | % thanh ghi clock gated trong RTL gốc | Thanh ghi được kích hoạt hoặc tăng cường bởi clock gating PowerPro |
B1 | 34500 | 34233 | 99% | 5722 |
B2 | 28047 | 23410 | 83% | 4555 |
B3 | 39032 | 34607 | 89% | 2951 |
Kết luận
- PowerPro CG (Siemens EDA) giúp NVIDIA đạt được giải pháp tối ưu năng lượng tốt hơn so với các phương pháp thủ công truyền thống.
- Sự tích hợp của PowerPro CG vào quy trình thiết kế công suất thấp cho phép tự động hóa hiệu quả và tạo ra mã RTL tối ưu cho giai đoạn tổng hợp.
Về Siemens Digital Industries Software
Siemens cung cấp các giải pháp phần mềm toàn diện cho việc số hóa quy trình thiết kế và sản xuất, bao gồm các công cụ như PowerPro CG và SLEC Pro để hỗ trợ tối ưu hóa năng lượng và chức năng trong thiết kế phần cứng.
Tham khảo thêm:
Liên hệ với Vietbay để được tư vấn: