Phiên bản xem trước DeepSeek-V4 chính thức ra mắt, mang đến trải nghiệm mới về bộ nhớ ngữ cảnh siêu dài 1M

Vào ngày 24 tháng 4, DeepSeek thông báo rằng phiên bản xem trước của loạt mẫu mới DeepSeek-V4 đã chính thức ra mắt và đồng thời có mã nguồn mở. DeepSeek-V4 có bối cảnh siêu dài hàng triệu từ và dẫn đầu các lĩnh vực nguồn mở và trong nước về khả năng tác nhân, kiến thức thế giới và hiệu suất lý luận. Mô hình được chia thành hai phiên bản: deepseek-v4-flash và deepseek-v4-pro theo kích thước.

Đăng nhập vào trang web chính thức hoặc Ứng dụng chính thức từ bây giờ để nói chuyện với DeepSeek-V4 mới nhất và khám phá trải nghiệm mới về bộ nhớ ngữ cảnh siêu dài 1M. Dịch vụ API đã được cập nhật đồng bộ và có thể được gọi bằng cách sửa đổi model_name thành deepseek-v4-pro hoặc deepseek-v4-flash.

So với mẫu thế hệ trước, khả năng của Tác nhân DeepSeek-V4-Pro được nâng cao đáng kể. Trong đánh giá Agentic Coding, V4-Pro đã đạt mức tốt nhất trong các mô hình nguồn mở hiện tại và cũng hoạt động tốt trong các đánh giá khác liên quan đến Agent. Hiện tại, DeepSeek-V4 đã trở thành mô hình Agentic Coding được các nhân viên nội bộ của công ty sử dụng. Theo phản hồi đánh giá, trải nghiệm sử dụng tốt hơn Sonnet 4.5 và chất lượng phân phối gần với chế độ không suy nghĩ của Opus 4.6, nhưng vẫn có một khoảng cách nhất định với chế độ suy nghĩ của Opus 4.6.

Theo báo cáo, DeepSeek-V4 đã tạo ra cơ chế chú ý mới, nén theo chiều mã thông báo, kết hợp với chú ý thưa thớt DSA (DeepSeek Sparse Chú ý), đạt được khả năng ngữ cảnh dài hàng đầu thế giới và giảm đáng kể yêu cầu về bộ nhớ máy tính và đồ họa so với các phương pháp truyền thống. Từ giờ trở đi, bối cảnh 1 triệu (một triệu) sẽ là tiêu chuẩn cho tất cả các dịch vụ DeepSeek chính thức.

Độ dài ngữ cảnh tối đa của V4-Pro và V4-Flash là 1M và cả hai đều hỗ trợ chế độ không suy nghĩ và chế độ suy nghĩ , trong đó chế độ suy nghĩ hỗ trợ lý_năng lực Thiết lập tham số cường độ tư duy (cao/tối đa). Đối với các kịch bản Tác nhân phức tạp, nên sử dụng chế độ tư duy và đặt cường độ ở mức tối đa.

Hiện tại, DeepSeek API đã được ra mắt đồng thời trên V4-Pro và V4-Flash, hỗ trợ giao diện OpenAI ChatCompletions và giao diện Anthropic. Khi truy cập vào một mô hình mới, base_url không thay đổi và tham số mô hình cần được thay đổi thành deepseek-v4-pro hoặc deepseek-v4-flash.