NVIDIA đã thực hiện những điều chỉnh lớn về thiết kế cho GPU Rubin Ultra của trung tâm dữ liệu thế hệ tiếp theo, chuyển từ thiết kế gói bốn chip (Die) đã lên kế hoạch trước đó sang giải pháp hai chip để giảm độ phức tạp của chuỗi cung ứng và rủi ro sản xuất. NVIDIA hiện duy trì nhịp lặp sản phẩm một thế hệ mỗi năm, nhưng chu kỳ phản hồi thực tế của các đối tác trong chuỗi cung ứng chỉ từ 8 đến 10 tháng.

Trước đây, NVIDIA đã tránh đưa ra những thay đổi có tác động quá lớn đến chuỗi cung ứng giữa các thế hệ kiến ​​trúc. Cuộc gọi lại thiết kế Rubin Ultra này tiếp tục chiến lược này.

Rubin Ultra ban đầu được lên kế hoạch sử dụng 4 chip GPU, 16 ngăn xếp bộ nhớ HBM4 (tổng dung lượng 1TB) và bao bì CoWoS-L để tạo thành một gói rất lớn.

Tuy nhiên, các nhà phân tích trong ngành đã chỉ ra rằng việc tích hợp bao bì mật độ cao như vậy tiềm ẩn rủi ro cong vênh nghiêm trọng và áp suất tản nhiệt, điều này sẽ trực tiếp kéo tỷ lệ sản lượng xuống.

NVIDIA cuối cùng đã chọn chuyển đổi thiết kế bốn chip từ tích hợp cấp gói sang lắp ráp cấp bo mạch, tức là sử dụng cấu hình đóng gói chip kép 2+2 thay vì tích hợp bốn chip trong một gói phức tạp duy nhất.

Việc điều chỉnh này không liên quan đến việc giảm thông số kỹ thuật của thiết bị đầu cuối. Dung lượng HBM4 và hiệu suất tính toán của Rubin Ultra sẽ không thay đổi, đồng thời chu kỳ thích ứng của các đối tác trong chuỗi cung ứng cũng sẽ được rút ngắn đáng kể.

Tuy nhiên, giải pháp chip kép vẫn gặp phải các vấn đề về chiếm không gian vật lý và quản lý tản nhiệt. NVIDIA cần giải quyết những hạn chế này ở cấp độ thiết kế bo mạch.