Lệnh cấm bán Nvidia H800/A800, có hiệu lực trong 30 ngày. Sau khi lệnh cấm chip của Mỹ được nâng cấp, liệu chỉ còn V100?

Vừa rồi, Hoa Kỳ một lần nữa thắt chặt xuất khẩu chip AI tiên tiến sang nước tôi, còn Nvidia A100, A800, H100, H800, v.v. Ngày 17/10 theo giờ địa phương, Mỹ chính thức ban hành quy định mới nhằm thắt chặt toàn diện việc xuất khẩu chip AI tiên tiến sang Trung Quốc. Bộ trưởng Thương mại Raimondo tuyên bố rằng mục đích của các biện pháp kiểm soát là ngăn chặn Trung Quốc có được chip tiên tiến, do đó cản trở "những đột phá trong lĩnh vực trí tuệ nhân tạo và máy tính phức tạp".

Truy cập trang mua hàng:

Tóm tắt sản phẩm dòng Jingdong NVIDIATAGP H57

Kể từ đó, Nvidia và các nhà sản xuất chip khác ngày càng phát triển hạn chế hơn trong việc bán chất bán dẫn hiệu suất cao cho đất nước của tôi, và các công ty liên quan ngày càng khó tìm cách lách các hạn chế.

Theo các tài liệu liên quan, chip GPU sẽ bị hạn chế xuất khẩu miễn là chúng đáp ứng một trong các điều kiện sau -

TAG PH64

Nguồn: CITIC Chứng khoán

Với việc đưa ra các quy định mới, giá cổ phiếu của Nvidia, AMD và Intel cũng giảm mạnh.

Người ta nói rằng NVIDIA phụ thuộc vào thị trường Trung Quốc với tới 25% doanh thu chip trung tâm dữ liệu của mình.

Ngoài ra, theo quy định mới, các công ty thiết kế chip Moore Thread và Biren Technology cũng bị đưa vào danh sách đen mới nhất.

Trong vòng 30 ngày, có hiệu lực ngay lập tức!

Theo tài liệu do Bộ Thương mại Hoa Kỳ ban hành, lệnh cấm sẽ có hiệu lực trong vòng 30 ngày.

Đồng thời, Raimondo cũng cho biết các quy định có thể được cập nhật ít nhất mỗi năm một lần trong tương lai.

Liên kết tệp: https://www.bis.doc.gov/index.php/about-bis/newsroom/2082

8Tổng công suất tính toán nhỏ hơn 300TFLOPS và dưới 370GFLOPS trên mỗi milimet vuông

Trong lệnh cấm năm ngoái, Hoa Kỳ đã cấm xuất khẩu các chip vượt quá hai ngưỡng: một là kích thước sức mạnh tính toán có trong chip và hai là tốc độ giao tiếp giữa các chip.

Lý do đưa ra quy định này là hệ thống AI cần kết nối hàng nghìn chip với nhau cùng lúc để xử lý một lượng lớn dữ liệu.

Phiên bản đặc biệt của chip H800/A800 của NVIDIA có thể duy trì trong giới hạn giao tiếp trong khi vẫn có thể huấn luyện các mô hình AI vì chúng vẫn giữ được khả năng tính toán mạnh mẽ.

Trước đó, Reuters đưa tin tốc độ truyền dữ liệu giữa các chip Nvidia H800 là 400GB/s, chưa bằng một nửa tốc độ đỉnh cao của H100 (900GB/s).

Lần này, các quan chức Mỹ cho biết các quy định mới sẽ tập trung nhiều hơn vào sức mạnh tính toán, sẽ kiểm soát nhiều chip hơn, bao gồm cả Phiên bản đặc biệt của Nvidia.

Về sức mạnh tính toán, Bộ Thương mại Hoa Kỳ lần này đã hủy bỏ “tham số băng thông” và thay thế bằng “mật độ hiệu suất”.

Theo quy định mới, các biện pháp kiểm soát xuất khẩu sửa đổi cấm bán cho các công ty Trung Quốc chip trung tâm dữ liệu chạy ở tốc độ 300TFLOPS (một nghìn tỷ hoạt động mỗi giây) trở lên.

Chip có tốc độ 150-300TFLOPS sẽ bị cấm bán nếu "mật độ hiệu suất" của chúng là 370GFLOPS (hoạt động giga mỗi giây) trên milimet vuông trở lên.

Các chip chạy ở tốc độ nói trên nhưng có mật độ hiệu suất thấp hơn sẽ rơi vào "vùng xám", nghĩa là việc bán hàng sang Trung Quốc phải được thông báo cho chính phủ Hoa Kỳ.

Mặc dù các quy tắc này không áp dụng cho chip dành cho “sản phẩm tiêu dùng”, Bộ Thương mại Hoa Kỳ cho biết các nhà xuất khẩu cũng phải báo cáo khi xuất khẩu chip có tốc độ vượt quá 300TFLOPS để cơ quan chức năng có thể theo dõi xem những con chip này có được sử dụng với số lượng lớn để đào tạo mô hình AI hay không.

Theo quy định mới, các chip Weida của Anh bị ảnh hưởng bao gồm nhưng không giới hạn ở A100, A800, H100, H800, L40 và L40S, thậm chí RTX4090 còn có các yêu cầu cấp phép bổ sung.

Bây giờ có vẻ như chiếc duy nhất còn lại là NVIDIA V100. Theo thông số chip, tốc độ giao tiếp của chip là 300GB/s và tốc độ hoạt động tối đa là 125TFLOPS.

Ngoài ra, bất kỳ hệ thống nào tích hợp một hoặc nhiều mạch tích hợp được bảo hiểm (bao gồm nhưng không giới hạn ở hệ thống DGX và HGX) cũng phải tuân theo các yêu cầu cấp phép mới.

Tuy nhiên, NVIDIA không kỳ vọng rằng các hạn chế mới nhất của Hoa Kỳ sẽ có tác động đáng kể trong ngắn hạn.

Chặn các lỗ hổng của Chiplet

Một vấn đề khác mà Hoa Kỳ đang cố gắng giải quyết lần này là Chiplet. Với công nghệ này, các phần nhỏ hơn của con chip có thể được kết nối với nhau để tạo thành một con chip hoàn chỉnh.

Mỹ lo ngại rằng các công ty Trung Quốc thu được những con chip nhỏ đáp ứng quy định thông qua chiplets và sau đó bí mật lắp ráp chúng thành những con chip lớn hơn.

Lần này các quy định mới tăng giới hạn "mật độ hiệu suất", giới hạn khả năng tính toán của chip ở một kích thước nhất định, dành cho cách giải quyết này.

Phương pháp Chiplet có thể là cốt lõi cho tương lai của ngành bán dẫn Trung Quốc.

Các công ty GPU Trung Quốc đều bị đưa vào danh sách đen

Người trong ngành tin rằng nếu chip Mỹ bị cấm ở Trung Quốc, các công ty Trung Quốc sẽ nỗ lực để lấp đầy khoảng trống trên thị trường.

Cả Moore Threading và Biren Technology đều được thành lập bởi các cựu nhân viên của Nvidia và được coi là những ứng cử viên sáng giá nhất để Trung Quốc sản xuất các sản phẩm thay thế nội địa cho chip Nvidia.

Nhưng giờ đây, hai công ty này cũng đã được thêm vào Danh sách thực thể, ngăn chặn Taiwan Semiconductor hoặc các nhà sản xuất khác sử dụng thiết bị của Hoa Kỳ sản xuất chip cho họ.

Tín hiệu nguy hiểm trong nhà máy sản xuất chipT AGPH36

Hoa Kỳ cho biết bất kỳ con chip nào chứa từ 50 tỷ bóng bán dẫn trở lên và sử dụng bộ nhớ băng thông cao chứa cờ đỏ.

Nhà xuất khẩu cần đặc biệt chú ý đến việc xuất khẩu sang Trung Quốc có cần giấy phép hay không.

Ngưỡng này bao gồm hầu hết tất cả các chip AI tiên tiến, giúp các nhà máy sản xuất chip phát hiện ra các hành vi lách luật.

Máy in thạch bản DUV cũng bị hạn chế

Hoa Kỳ cũng đã tăng yêu cầu cấp phép xuất khẩu đối với chip tiên tiến tới 22 quốc gia.

Phạm vi kiểm soát cũng được mở rộng cho bất kỳ công ty nào có công ty mẹ cuối cùng có trụ sở chính tại các quốc gia nêu trên để ngăn chặn các công ty con ở nước ngoài mua chip bị cấm.

Hoa Kỳ cũng đã áp đặt yêu cầu cấp phép đối với các công cụ sản xuất chip từ 21 quốc gia còn lại vì lo ngại rằng những thiết bị này có thể được chuyển sang Trung Quốc.

Hệ thống in thạch bản DUV của Hà Lan cũng đã bị hạn chế để ngăn ASML vận chuyển một số mẫu và phụ kiện DUV cũ hơn đến các nhà máy sản xuất chip ở Trung Quốc.

Thiết bị DUV không tốt bằng thiết bị EUV tiên tiến nhất nhưng có thể sản xuất chip với chi phí cao hơn. EUV đã bị cấm hoàn toàn.

Các nhà sản xuất lớn dự trữ: 100.000 chiếc A800, sẽ giao trong năm nay

Đối với các đại gia Internet trong nước, họ còn bao nhiêu hàng tồn kho?

Hiện tại, số tiền cụ thể này vẫn chưa được xác định. Tuy nhiên, các nhà sản xuất lớn trong nước mới nói: Chúng tôi có đủ.

Cách đây một thời gian, phương tiện truyền thông nước ngoài FT đưa tin rằng các công ty Internet lớn trong nước đang cạnh tranh để đặt mua chip NVIDIA trị giá khoảng 5 tỷ USD.

Theo báo cáo, Baidu, Byte, Tencent và Alibaba đã đặt hàng A800 từ Nvidia, trị giá 1 tỷ USD, với tổng số 100.000 chip, sẽ được giao trong năm nay.

Ngoài ra, có 4 tỷ USD đơn đặt hàng GPU, cũng sẽ được giao vào năm 2024.

Hai người trong cuộc tiết lộ rằng Byte đã đặt trước ít nhất 10.000 Nvidia GPU để hỗ trợ các sản phẩm trí tuệ nhân tạo tổng hợp khác nhau.

Công ty cũng đã đặt hàng gần 70.000 chip A800 sẽ được giao vào năm tới, trị giá khoảng 700 triệu USD, họ cho biết thêm.

Nvidia cho biết trong một tuyên bố: "Các công ty Internet tiêu dùng và nhà cung cấp dịch vụ đám mây đầu tư hàng tỷ đô la mỗi năm vào các thành phần của trung tâm dữ liệu, thường đặt hàng trước nhiều tháng." TAGP H82

Đầu năm nay, khi AI toàn cầu tiếp tục phát triển, những người trong cuộc tại các công ty công nghệ trong nước cho biết hầu hết các gã khổng lồ Internet Trung Quốc đều có ít hơn vài nghìn con chip trong kho có thể sử dụng để đào tạo các mô hình ngôn ngữ lớn.

Kể từ đó, khi nhu cầu tăng lên, giá thành của những con chip này cũng tăng theo. Một nhà phân phối của Nvidia cho biết “giá A800 đến tay nhà phân phối đã tăng hơn 50%”.

Ví dụ, sau khi Alibaba phát hành mẫu lớn Tongyi Qianwen của riêng mình, họ đã tích hợp nó vào từng dòng sản phẩm.

Đồng thời, Baidu cũng đầu tư toàn lực vào việc phát triển và ứng dụng các mô hình lớn. Wen Xinyiyan đã được nâng cấp nhiều lần và hiện có thể so sánh với GPT-4.

Tencent Cloud đã phát hành cụm máy chủ mới vào tháng 4 năm nay, sử dụng NVIDIA H800.

Theo hai người, Alibaba Cloud cũng đã nhận được hàng nghìn chiếc H800 từ NVIDIA và nhiều khách hàng đã thiết lập liên hệ với Alibaba với hy vọng sử dụng các dịch vụ đám mây điều khiển bằng chip này để thúc đẩy việc nghiên cứu và phát triển các mẫu máy của riêng họ.

Con chip nào dùng để đào tạo các mô hình lớn?

Kể từ đầu năm, ngành này đã phát triển các mẫu lớn của riêng mình, thường là điểm chuẩn so với mẫu GPT-4 "mạnh nhất trên bề mặt".

Trước đây đã tiết lộ rằng GPT-4 sử dụng kiến trúc MoE, bao gồm 8 mẫu 220B với khối lượng tham số là 1,76 nghìn tỷ.

Số lượng thông số này đã vượt quá tầm với của nhiều người và mức tiêu thụ năng lượng tính toán đã đạt đến giới hạn tối đa.

Cụ thể, FLOPS của chương trình đào tạo OpenAI GPT-4 là khoảng 2,15e25. Nó đã được huấn luyện trên khoảng 25.000 chiếc A100 trong 90 đến 100 ngày và tỷ lệ sử dụng là từ 32% đến 36%.

Vậy, đối với model thế hệ tiếp theo, cái mà mọi người gọi là "GPT-5", nhu cầu về sức mạnh tính toán sẽ là bao nhiêu?

Trước đó, Morgan Stanley cho biết GPT-5 sẽ sử dụng 25.000 GPU và đã bắt đầu đào tạo từ tháng 2, nhưng Sam Altman sau đó đã làm rõ rằng GPT-5 vẫn chưa được đào tạo.

Theo Musk, GPT-5 có thể yêu cầu 30.000-50.000 khối H100.

Điều này có nghĩa là nếu các công ty công nghệ lớn muốn đẩy mạnh hơn nữa việc nâng cấp lặp đi lặp lại của các mẫu máy lớn, họ cũng sẽ cần sự hỗ trợ sức mạnh tính toán khổng lồ.

Về vấn đề này, nhà khoa học trưởng của NVIDIA, Bill Dally đã từng nói: "Với nhu cầu đào tạo tăng gấp đôi sau mỗi 6 đến 12 tháng, khoảng cách này sẽ mở rộng nhanh chóng theo thời gian."