Học viện Công nghệ Thông tin và Truyền thông Trung Quốc hôm nay thông báo rằng họ đã chính thức triển khai thử nghiệm khả năng thích ứng bản địa hóa của DeepSeek V4 nhằm thúc đẩy sự hợp tác chuyên sâu giữa mô hình này với phần mềm và phần cứng trong nước, đồng thời đẩy nhanh quá trình triển khai công nghiệp. Thử nghiệm này được thực hiện dựa trên Phòng thí nghiệm trọng điểm của Bộ Công nghiệp và Công nghệ thông tin và hệ thống điểm chuẩn AISHPerf, bao gồm các sản phẩm phần cứng và phần mềm AI toàn diện như chip, máy chủ, máy tất cả trong một, cụm, chuỗi công cụ phát triển và nền tảng điện toán thông minh, tập trung vào các quy trình suy luận và tinh chỉnh của toàn bộ loạt mô hình DeepSeek V4.
Đánh giá đánh giá từ năm khía cạnh: mức độ dễ thích ứng, tính hoàn thiện về chức năng, hiệu quả tối ưu hóa, hiệu suất và chi phí, đồng thời bổ sung thêm các chỉ số đặc biệt mới như xử lý trình tự, khả năng mã, tỷ lệ thành công của cuộc gọi tổng đài và phân tách nhiệm vụ để tạo thành một hệ thống đánh giá ba chiều.
DeepSeek V4 đã đạt được khả năng thích ứng Ngày-0 cho nhiều phần cứng trong nước vào ngày nó được phát hành, đánh dấu rằng phần mềm và phần cứng AI trong nước đã bước vào giai đoạn lặp lại cùng tần số.
Thử nghiệm này sẽ xác minh một cách khách quan mức độ thích ứng, tăng cường hỗ trợ sức mạnh tính toán trong nước và đẩy nhanh việc xây dựng hệ sinh thái AI độc lập và có thể kiểm soát.
DeepSeek V4 bao gồm hai phiên bản V4-Pro (Phiên bản hàng đầu) và V4-Flash (Phiên bản nhẹ). Cả hai phiên bản đều hỗ trợ nguyên bản 1 triệu ngữ cảnh cực dài Token (khoảng 750.000 từ). Họ áp dụng cơ chế chú ý thưa thớt DSA tự phát triển, giảm 70% chi phí suy luận cho một triệu bối cảnh và giảm 40% mức sử dụng bộ nhớ video.
V4-Pro: Tổng thông số đạt 1,6 nghìn tỷ và thông số kích hoạt là 49B. Nó tập trung vào giới hạn hiệu suất cao nhất, điểm chuẩn so với các mô hình nguồn đóng hàng đầu thế giới như GPT-5 và Claude Opus, đồng thời phù hợp với lý luận phức tạp, tạo mã, tính toán nghiên cứu khoa học và các nhiệm vụ khó khăn khác.
V4-Flash: tổng tham số 284B, tham số kích hoạt 13B, tập trung vào hiệu quả cao và chi phí thấp, khả năng suy luận gần giống với phiên bản Pro, tốc độ nhanh hơn, giá thấp hơn, phù hợp cho tương tác hàng ngày, tạo nội dung, triển khai nhẹ cho doanh nghiệp và các tình huống khác.
