Nếu bạn có thể tóm tắt tốc độ hiện tại của vòng tròn mô hình lớn AI bằng một từ thì "Tốc độ DeepSeek" không thể phù hợp hơn. Chưa đầy năm ngày sau khi phát hành phiên bản chỉ có văn bản của V4, quan chức này đã tổ chức đợt giảm giá chớp nhoáng "ba đợt giảm giá liên tiếp". Trước khi ngành công nghiệp kịp phục hồi, con át chủ bài tiếp theo đã xuất hiện - động cơ V4 "hoàn chỉnh" với khả năng đa phương thức, chính thức bước vào thời gian đếm ngược để phát hành.
Nhà nghiên cứu cốt lõi tiết lộ: Khả năng thị giác bản địa đang đến
Chen Xiaokang, thành viên cốt lõi của nhóm đa phương thức DeepSeek, gần đây đã xuất bản một bài báo trên nền tảng X, thông báo rõ ràng rằng "phiên bản mới của DeepSeek V4" sắp ra mắt. Kết hợp với bối cảnh hiện tại, “phiên bản mới” này gần như chắc chắn sẽ là phiên bản đa phương thức được chờ đợi từ lâu.
Kể từ khi ra mắt V4, cuộc thảo luận sôi nổi nhất trong ngành và dấu vết tiếc nuối đều hướng đến một điểm giống nhau: chỉ có hai mẫu chỉ có văn bản là Flash (nhanh) và Pro (chuyên gia) được ra mắt trong đợt đầu tiên. Khả năng văn bản thuần túy chắc chắn là nền tảng, nhưng trong lĩnh vực mô hình lớn ngày nay, “đa phương thức gốc” từ lâu đã là tấm vé dẫn đến các cấp cao nhất. Nếu không có sự hiểu biết trực quan về hình ảnh và video, giới hạn trên của mô hình trong các cảnh thực phức tạp sẽ bị khóa chặt. Việc ra mắt phiên bản đa phương thức lần này là bước quan trọng để DeepSeek bù đắp cho thiếu sót vừa qua.
APP đã gợi ý: Vấn đề không phải là về điểm chạy, mà là về “khả năng chi trả”

Những người dùng cẩn thận đã phát hiện ra rằng sau bản cập nhật ứng dụng khách DeepSeek gần đây, thanh chọn mô hình đã âm thầm thêm ba tùy chọn độc lập: "Nhanh", "Chuyên gia" và "Trực quan". Hai cái đầu tiên tương ứng với Flash và Pro của V4, và tùy chọn "Trực quan", vốn ở trạng thái "được kích hoạt", rõ ràng là một giao diện dành riêng cho phiên bản mới sắp tới của V4 đa phương thức.
Về mặt sức mạnh cứng, chiếc V4 đa phương thức thuần huyết này có thể đạt đến thứ hạng nào? Hiện chưa có dữ liệu cụ thể. Tuy nhiên, đề cập đến hiệu suất vượt trội của V4 Pro trong lĩnh vực văn bản thuần túy, ngành công nghiệp thường dự đoán rằng khả năng hình ảnh của nó ít nhất sẽ vững chắc ở cấp độ đầu tiên - tuy nhiên, đây chưa bao giờ là điều mà DeepSeek quan tâm nhất.
Con át chủ bài thực sự: “hạ giá” đa phương thức
Đối với DeepSeek, vốn luôn đi theo con đường độc đáo, việc lao vào bảng xếp hạng một cách mù quáng không phải là mục tiêu chính. “Đưa giá của các mô hình đa phương thức lớn xuống mức giá bắp cải để các nhà phát triển và người dùng bình thường thực sự có thể mua được” là con át chủ bài thực sự của nó. Hãy nhớ lại rằng V4 đã tổ chức “ba đợt giảm giá” chỉ năm ngày sau khi phát hành. Nếu chi phí của các lệnh gọi API đa phương thức tiếp theo cũng giảm xuống mức giá sàn thì cuộc cải tổ ngành sẽ khốc liệt hơn nhiều so với cuộc chiến về giá trong trường văn bản thuần túy.
Tóm tắt trong một câu: Sự xuất hiện của phiên bản đa phương thức V4 không chỉ là khả năng bổ sung mà còn là điểm khởi đầu để DeepSeek lật đổ bảng giá theo dõi đa phương thức.