Card đồ họa thế hệ tiếp theo của NVIDIA ra mắt với quy trình 1.6nm A16. Năng lực sản xuất quá thấp và không còn lựa chọn nào khác ngoài việc trộn và kết hợp 3nm

Tại hội nghị GTC tuần trước, NVIDIA đã làm rõ thêm lộ trình cho kiến trúc GPU thế hệ tiếp theo Feynman, dự kiến sẽ được phát hành vào năm 2028. Feynman sẽ không chỉ sử dụng chip HBM tùy chỉnh mà còn lần đầu tiên sử dụng Die Stack, đó là quy trình đóng gói ngăn xếp 3D. Nhân GPU sẽ là nhân đầu tiên sử dụng tiến trình 1.6nm của TSMC - A16.

Đây là lần đầu tiên NVIDIA ra mắt quy trình mới của TSMC sau nhiều năm. Lần ra mắt cuối cùng là ở kỷ nguyên 55nm. Sau sự trỗi dậy của kỷ nguyên di động, Apple gần như thống trị việc ra mắt quy trình mới của TSMC. Lần này nó đã tái sinh với sự trỗi dậy của thời đại AI.

A16 là phiên bản cải tiến của quy trình 2nm N2. Nó sẽ bổ sung thêm một công nghệ mới trên cơ sở bóng bán dẫn GAA - nguồn điện trở lại SRP, giúp cải thiện mật độ và hiệu suất, đồng thời cũng cải thiện khả năng cung cấp điện. Do đó, nó phù hợp với máy tính HPC nhưng không phải là chip tiêu thụ điện năng thấp và Apple sẽ không phải là hãng đầu tiên ra mắt nó.

Theo TSMC, quy trình A16 có thể cải thiện hiệu suất từ 8-10% so với quy trình N2P nâng cao 2nn hoặc giảm mức tiêu thụ điện năng từ 15-20% và tăng mật độ bóng bán dẫn lên 7-10%.

Mặc dù NVIDIA lần đầu tiên đạt được quy trình A16 nhưng nó phải đối mặt với nhiều thách thức. Lý do chính là năng lực sản xuất hạn chế. Mức tăng ít hơn dự kiến. Năng lực sản xuất của A16 sẽ chỉ đạt 20.000 tấm wafer mỗi tháng vào cuối năm tới và sẽ tăng gấp đôi lên 40.000 tấm wafer vào năm 2028. Năng lực sản xuất của toàn bộ gia đình theo quy trình 2nm dự kiến sẽ đạt 200.000 tấm wafer mỗi tháng. Bằng cách này, tỷ trọng năng lực sản xuất của A16 không cao.

Điều này cũng dẫn đến việc GPU Feynman phải thực hiện các thay đổi. Nó chỉ có thể sử dụng quy trình A16 trên GPU Die lõi, quy trình nhạy cảm nhất với hiệu suất và mức tiêu thụ điện năng. Các bộ phận ít lõi hơn sẽ sử dụng quy trình N3P của TSMC, điều này cũng giúp giảm chi phí.

Trên thực tế, NVIDIA từ lâu đã nhận ra rằng việc chỉ dựa vào TSMC để có năng lực sản xuất tiên tiến sẽ quá rủi ro và không có lợi cho việc đàm phán giá nên họ cũng đang tích cực tìm kiếm các OEM khác. Factory, chip LPU ra mắt lần này đều do Samsung sản xuất và có thể sử dụng công nghệ EMIB-T của Intel để đóng gói chip trong tương lai. Nếu sự hợp tác diễn ra suôn sẻ thì không thể sử dụng quy trình 14A của Intel để sản xuất chip GPU.