Vào tháng 10 năm 2024, AMD và Intel cùng thành lập Nhóm tư vấn hệ sinh thái x86 (Nhóm tư vấn hệ sinh thái x86) để tập hợp các nhà lãnh đạo ngành nhằm cùng nhau thúc đẩy tương lai của kiến trúc điện toán x86. Khi EAG được thành lập, nó đã công bố bốn tính năng cốt lõi: FRED, AVX10, ChkTag và ACE. Bây giờ AMD và Intel đã cùng nhau phát hành sách trắng ACE, chính thức đưa bộ hướng dẫn được gọi là "kiến trúc tăng tốc ma trận tiêu chuẩn x86" này tới cộng đồng nhà phát triển.

ACE Mục tiêu cốt lõi của ACE rất đơn giản: đạt được bước nhảy lớn về hiệu suất nhân ma trận của chip x86.
Nhân ma trận là đơn vị tính toán cơ bản của mạng nơron và mô hình ngôn ngữ lớn. Mặc dù các tập lệnh SIMD hiện có như AVX10 có thể hoàn thành các phép toán ma trận nhưng vẫn có những hạn chế rõ ràng về mật độ tính toán và khả năng mở rộng.
ACE Bằng cách giới thiệu cơ chế tăng tốc ma trận dựa trên các hoạt động của sản phẩm bên ngoài, mật độ tính toán đạt gấp 16 lần so với hoạt động tích lũy nhân AVX10 tương đương trong khi sử dụng cùng một vectơ đầu vào.
Về mặt hỗ trợ định dạng dữ liệu, ACE vốn bao gồm các tiêu chuẩn chính xác phổ biến hiện nay trong lĩnh vực AI, bao gồm INT8, OCP FP8, OCP MXFP8, OCP MXINT8 và BF16.
Là bộ hướng dẫn mở rộng của AVX10, quá trình thích ứng sinh thái phần mềm của ACE đang được tiến hành. Các thư viện cơ bản của Deep Learning và HPC, các thư viện điện toán khoa học Python như NumPy và SciPy cũng như các khung máy học chính thống như PyTorch và TensorFlow đều đã bắt đầu công việc tích hợp.
AMD và Intel đã nhấn mạnh trong sách trắng rằng ý tưởng thiết kế của ACE là ma sát thấp và phạm vi phủ sóng rộng. Từ máy tính xách tay đến siêu máy tính, các nhà phát triển không cần phải viết lại mã cho các nền tảng phần cứng khác nhau.
Điều này trái ngược hoàn toàn với giải pháp di chuyển điện toán AI sang các bộ tăng tốc chuyên dụng, vốn thường đòi hỏi thêm chi phí di chuyển và thích ứng mã.
