Bài kiểm tra trình độ tiếng Trung DeepSeek V4 trở lại vị trí số 1 tại Trung Quốc

Nhóm SuperCLUE công bố kết quả đánh giá dòng DeepSeek V4 của các mẫu cỡ lớn Trung Quốc. DeepSeek-V4-Pro xếp hạng đầu tiên trong nước nhờ hiệu suất toàn diện và phiên bản Flash theo sát ở vị trí thứ hai. Mô hình nguồn mở trong nước đang tạo ra bước đột phá khác. Đánh giá này bao gồm sáu khía cạnh: lý luận toán học, lý luận khoa học, tạo mã, lập kế hoạch nhiệm vụ tác nhân, tuân theo hướng dẫn và kiểm soát ảo ảnh. Phiên bản Pro đạt 70,98 điểm và phiên bản Flash đạt 68,82 điểm. Cả hai điểm số đều vượt trội so với các mẫu xe nội địa khác.

Dòng DeepSeek V4 áp dụng cơ chế chú ý mới. Tất cả các phiên bản đều hỗ trợ hàng triệu ngữ cảnh dài, đồng thời giảm sức mạnh tính toán và mức sử dụng bộ nhớ. Khi sử dụng với chip nội địa, hiệu quả tổng thể sẽ cao hơn.

So với thế hệ V3.2 trước đó, cả hai phiên bản đều đạt được những cải tiến toàn diện. Khả năng đặc vụ của phiên bản Pro đã được cải thiện hơn 20 điểm, khả năng suy luận toán học được cải thiện gần 10 điểm, khả năng ra lệnh được cải thiện gần 12 điểm và khả năng kiểm soát ảo ảnh cũng được tối ưu hóa đáng kể.

Phiên bản Flash duy trì khả năng lý luận hiệu quả, đồng thời tác nhân và lý luận toán học cũng được cải thiện đáng kể, với hiệu suất chi phí vượt trội.

Phiên bản Pro (15 nhân dân tệ/triệu Token) tập trung vào hiệu suất cao, kiểm soát ảo ảnh ổn định hơn và phù hợp với các nhiệm vụ phức tạp và cảnh quay chuyên nghiệp. Phiên bản Flash nhanh hơn và rẻ hơn. Giá API chỉ là 1,25 nhân dân tệ trên một triệu Token, giúp tiết kiệm chi phí hơn khi sử dụng hàng ngày. Đánh giá

cũng chỉ ra rằng vẫn còn khoảng cách giữa mô hình này và các mô hình hàng đầu ở nước ngoài về khả năng tạo mã và thực thi lệnh phức tạp. Nhìn chung, DeepSeek V4 đã khẳng định mình là cấp cao nhất ở Trung Quốc với khả năng cân bằng và chi phí phải chăng, trở thành lựa chọn chất lượng cao cho công việc văn phòng hàng ngày, phát triển và sáng tạo cũng như xử lý văn bản dài.