DeepSeek V4 mới ra mắt được 5 ngày và hầu như ngày nào cũng có những hành động mới. Hôm qua, các nhà nghiên cứu đã dự đoán rằng khả năng đa phương thức sẽ xuất hiện và hôm nay đã có thử nghiệm thang độ xám. Nhiều người phát hiện ra trang web DeepSeek đã bổ sung thêm chế độ nhận diện hình ảnh, tức là có thể hiểu được thông tin hình ảnh. Mặc dù khả năng này sẽ không trực tiếp cải thiện hiệu suất lập trình và suy luận của AI nhưng nó sẽ rất thuận tiện khi sử dụng. Nếu gặp vấn đề trong cuộc sống hàng ngày, bạn có thể trực tiếp tải ảnh chụp màn hình lên và để DeepSeek tự phân tích. Nó dễ dàng hơn việc tự mình mô tả vấn đề.
Cư dân mạng đã đạt đến thang độ xám cũng sử dụng thông tin hình ảnh chuyên nghiệp, chẳng hạn như ảnh CT chụp trong bệnh viện để kiểm tra khả năng nhận dạng hình ảnh của DeepSeek và bị sốc trước kết quả.

Hình ảnh CT này được tải lên bởi @brick, một cư dân mạng trong cộng đồng Linux.do, là một bài viết chuyên nghiệp. Trên báo, sau khi được DeepSeek phân tích, nội dung trong ảnh có thể được đánh giá chính xác và phân tích chuyên nghiệp đã được thực hiện. cuối cùng đã thu được một số kết quả và đưa ra phương hướng khả thi cho căn bệnh này, bao gồm khả năng xảy ra một số loại viêm phổi khác nhau.
Bài báo đăng bức ảnh CT này đã có kết luận rõ ràng. Khi so sánh, có thể thấy phân tích của DeepSeek vẫn rất đáng tin cậy và nó có thể đảm nhận vai trò của một bác sĩ AI trong vấn đề này.
Nhưng AI rốt cuộc vẫn là AI. Nó có thể giúp mọi người phân tích tình hình. Việc xác nhận các cuộc kiểm tra y tế và bệnh tật quan trọng như vậy cần có sự phân tích và xác nhận của bệnh viện và bác sĩ.
Nếu không phải là bệnh nặng thì giờ đây có thể sử dụng AI để trở thành bác sĩ cho các vấn đề y tế thông thường. Ngoài ra còn có nhiều ứng dụng AI được đào tạo bởi các mô hình y tế chuyên nghiệp lớn. Chỉ cần sử dụng chúng để phán đoán vấn đề và đưa ra gợi ý khi gặp vấn đề là đủ. Không cần phải đến bệnh viện và xếp hàng vì những vấn đề nhỏ.
Quay lại vấn đề DeepSeek, trước đây họ cũng đã tiến hành nghiên cứu đa phương thức và công nghệ OCR nguồn mở thậm chí đã đạt đến đỉnh cao trên thế giới. Vì vậy, khả năng trực quan cũng rất đáng mong đợi, có thể nâng cao hơn nữa phạm vi khả năng cũng như giới hạn sử dụng của các mẫu máy cỡ lớn DeepSeek V4.