DeepSeek V4 thích ứng với chip Ascend của Huawei. “Thảm họa” được Huang Renxun dự đoán đang đến

DeepSeek V4 vừa được ra mắt. Một số người trên các phương tiện truyền thông nước ngoài nhìn thấy hiệu suất, một số nhìn thấy giá cả và một số nhìn thấy Huawei. Bloomberg viết đây là một thách thức mạnh mẽ đối với OpenAI và Anthropic, và Fortune tập trung vào nó một lần nữa khiến giá gần sàn; Việc cắt giảm của Reuters nhạy cảm hơn: đây không chỉ là model mới rẻ hơn và văn bản dài tốt hơn mà DeepSeek lần đầu tiên tiết lộ rõ ràng rằng dòng V4 đã được điều chỉnh cho phù hợp với chip Ascend của Huawei. Tất nhiên, Reuters cũng không quên bù đắp khi cho rằng V4 vẫn tụt hậu so với một số mẫu mã nguồn đóng hàng đầu và không hỗ trợ đa phương thức trong thời điểm hiện tại.

Nhưng chính từ "Huawei" đã đưa toàn bộ cuộc thảo luận lên một tầm cao mới. V4 không chỉ gây ra cuộc thảo luận về việc "mô hình có mạnh hay không", mà còn là "ai sẽ gặp rắc rối". Giám đốc điều hành Nvidia Jensen Huang đã đưa ra tuyên bố gay gắt trong một podcast tháng này: "Nếu DeepSeek được phát hành trên nền tảng Huawei trước, đó sẽ là thảm họa đối với Hoa Kỳ." Bây giờ nhìn lại, câu nói này gần như đang chuẩn bị trước cho dư luận V4.

Vậy điều thú vị nhất về DeepSeek V4 lần này không phải là nó có thêm một vài điểm chạy mà là ngay khi lên mạng, giới truyền thông Mỹ đã cùng lúc thể hiện hai cảm xúc. Trong khi thừa nhận rằng các công ty Trung Quốc đang tiếp tục tiếp cận với mức giá thấp hơn và hiệu quả kỹ thuật cao hơn, họ vẫn miễn cưỡng thừa nhận rằng bức tường do Thung lũng Silicon xây dựng dựa trên chip, vốn và hệ sinh thái khép kín đã bắt đầu nới lỏng.

1. Giá/hiệu suất cực cao: phá vỡ rào cản cạnh tranh ở Thung lũng Silicon

Ngày 24 tháng 4, DeepSeek Phiên bản xem trước của V4 đã chính thức được phát hành và có mã nguồn mở đồng thời, ra mắt hai dòng sản phẩm: phiên bản hàng đầu V4-Pro và phiên bản nhẹ V4-Flash. Cả hai mô hình đều hỗ trợ 1 triệu bối cảnh mã thông báo. V4-Pro tập trung vào việc tăng cường năng lực của Tác nhân và đã đạt đến đẳng cấp hàng đầu về các mô hình nguồn mở trong nhiều đánh giá như Mã hóa tác nhân, Toán học, STEM, Lập trình cạnh tranh và Kiến thức thế giới, cùng một số khả năng gần với các mô hình nguồn đóng hàng đầu. V4-Flash chú ý nhiều hơn đến hiệu suất chi phí thấp và chi phí cao, phù hợp cho các cuộc gọi tần số cao hàng ngày. Về giá cả, đầu vào V4-Pro (bộ nhớ đệm) là 1 nhân dân tệ trên một triệu mã thông báo và đầu ra là 24 nhân dân tệ trên một triệu mã thông báo; đầu vào V4-Flash (bộ nhớ đệm) chỉ 0,2 nhân dân tệ trên một triệu mã thông báo và đầu ra là 2 nhân dân tệ trên một triệu mã thông báo.

So với thế hệ trước, bước đột phá lớn nhất của V4 không phải là các tham số heap đơn giản mà là sự đổi mới của các cơ chế chú ý kết hợp như CSA (Chú ý nén thưa thớt) và HCA (Chú ý nén nặng), giúp giảm đáng kể chi phí tính toán và bộ nhớ của các ngữ cảnh dài, biến "1 triệu ngữ cảnh" từ một tham số hiển thị thành một cấu hình tiêu chuẩn thực sự có thể sử dụng được. Nhìn chung, V4 tiếp tục phong cách sản phẩm “rẻ và mạnh mẽ” và là bản nâng cấp cấp cơ sở hạ tầng dành cho các đại lý tầm xa và các ứng dụng ngữ cảnh dài quy mô lớn.

Về vấn đề này, "Bloomberg" tin rằng DeepSeek V4 hiện là nền tảng nguồn mở mạnh mẽ nhất và là thách thức mạnh mẽ đối với OpenAI và Anthropic. Việc phát hành mô hình mới khiến các công ty công nghệ và nhà đầu tư toàn cầu phải xem xét lại sự khôn ngoan của việc đầu tư hàng tỷ đô la vào trí tuệ nhân tạo.

CNBC đã mô tả việc phát hành V4 như một "sự thể hiện sức mạnh toàn diện". Báo cáo chỉ ra rằng mặc dù tác động thị trường của V4 có thể không đột phá như R1 vì thị trường đã dự đoán trước sự cạnh tranh giá thấp từ AI Trung Quốc, nhưng nó trực tiếp khiến các đối thủ Mỹ phải chịu áp lực lớn.

"Fortune" tập trung vào "giá sàn" của V4. Bài viết nhấn mạnh rằng giá của V4-Pro chỉ bằng 1/6 đến 1/10 so với các dịch vụ tương tự của OpenAI hoặc Anthropic. Lợi thế cực kỳ hiệu quả về mặt chi phí này có thể phá vỡ hoàn toàn lợi thế cạnh tranh của các phòng thí nghiệm hàng đầu của Hoa Kỳ.

Sở dĩ có thể đẩy giá xuống sàn không chỉ vì chiến lược kinh doanh cấp tiến. Bí mật cốt lõi nằm ở việc DeepSeek tái cấu trúc một cách đột phá kiến trúc cơ bản của mô hình.

2. “Sự sang trọng về mặt kỹ thuật”: Sử dụng hiệu quả thuật toán để chống lại sức mạnh tính toán bạo lực

VentureBeat ngạc nhiên trước “mật độ thông minh” của V4 và gọi nó là “cá voi khổng lồ trở lại chiến trường”. Bài viết phân tích chi tiết cơ chế chú ý kết hợp và siêu kết nối bị ràng buộc đa dạng (mHC) do nó giới thiệu và tin rằng những đổi mới này giúp giảm đáng kể yêu cầu bộ nhớ và chi phí điện toán mà không làm giảm hiệu suất.

Tuy nhiên, VentureBeat cũng khách quan chỉ ra rằng V4 vẫn còn những hạn chế, chẳng hạn như không hỗ trợ nhiều khả năng phương thức như hình ảnh và video.

Al Jazeera đề cập rằng V4-Pro đã đánh bại tất cả các mô hình nguồn mở về khả năng toán học và mã hóa, đồng thời hiện chỉ thua mô hình nguồn đóng Gemini 3.1 Pro của Google ở một số lĩnh vực như “kiến thức thế giới”. Nền tảng mã nguồn mở Ôm Mặt chính thức chào đón sự trở lại của "cá voi khổng lồ" này và tin rằng "kỷ nguyên tiết kiệm chi phí của hàng triệu văn bản dài" đã chính thức đến.

Reuters dẫn lời kỹ sư máy học Hugging Face Lewis Tunstall xác nhận V4 là mẫu máy nhanh nhất trên nền tảng đứng đầu danh sách, hoạt động tốt và rẻ khi xử lý các tác vụ văn bản dài và phức tạp.

Tuy nhiên, hiệu quả cao nhất cũng đi kèm với sự "phân chia" rõ ràng.

Tunstall và các chuyên gia khác đã chỉ ra rằng V4 vẫn là một mô hình văn bản thuần túy và hoàn toàn vắng mặt trong các xu hướng phổ thông như hiểu hình ảnh và tạo video. Điều này hạn chế trí tưởng tượng của nó trong ngành công nghiệp sáng tạo ngày nay khi đa phương thức đã trở thành tiêu chuẩn. Ngoài ra, các quan chức DeepSeek cũng thừa nhận rằng V4 vẫn tụt hậu so với Gemini 3.1 Pro về trữ lượng “kiến thức thế giới”, điều đó có nghĩa là V4 vẫn khó loại bỏ hoàn toàn vấn đề “ảo tưởng” khi xử lý các động lực toàn cầu có tính nhạy cảm cao với thời gian hoặc nền tảng văn hóa phức tạp.

3. “Sovereign AI”: Bước đột phá về phần cứng trong cuộc chơi quyền lực lớn

Vậy DeepSeek, vốn đã “nghìn cân”, sử dụng con chip nào để phát triển V4?

Cả Reuters và New York Times đều đề cập rằng DeepSeek đã sử dụng chip Nvidia, chẳng hạn như H800 hoặc phiên bản tuân thủ được đồn đại là H20, trong quá trình nghiên cứu và phát triển ban đầu, nhưng đến chu kỳ V4, tình hình đã thay đổi đáng kể. DeepSeek nói rõ rằng V4 đã tiến hành xác minh song song GPU Nvidia và NPU Huawei Ascend trong quá trình phát triển. Dựa trên phương tiện truyền thông xã hội và phân tích ngành, V4 đã được hưởng lợi rất nhiều từ sự hợp tác sâu sắc với các cụm điện toán mới nhất của Huawei như Ascend SuperPoD, đặc biệt là hỗ trợ gốc cho các công nghệ tiên tiến như suy luận có độ chính xác thấp FP4, đã cải thiện đáng kể tỷ lệ hiệu suất năng lượng của V4 trên các chip nội địa.

Điều này có nghĩa là mô hình AI đã bắt đầu được tối ưu hóa vốn dựa trên phần cứng nội địa của Trung Quốc. Reuters nhận thức sâu sắc về tầm quan trọng chiến lược của việc DeepSeek chuyển sang sử dụng chip Huawei và tin rằng đây là công việc tiêu biểu cho việc thúc đẩy đổi mới độc lập của Trung Quốc. Điều này cũng chỉ xác nhận mối lo ngại của Huang Renxun. Gần đây ông đã thừa nhận trong một podcast: "Chúng ta phải thừa nhận rằng hầu hết những tiến bộ trong AI đều đến từ các thuật toán chứ không phải phần cứng thô và DeepSeek hoàn toàn không phải là một tiến bộ không đáng kể. Nếu DeepSeek được phát hành trên nền tảng Huawei trước tiên, đó sẽ là một thảm họa đối với đất nước chúng ta."

New York Times tin rằng V4 đã mở rộng hơn nữa ảnh hưởng của Trung Quốc trong lĩnh vực AI nguồn mở và cho rằng “nguồn mở là sức mạnh mềm của công nghệ tương lai”. Bài báo đề cập rằng công nghệ của DeepSeek đang được các nhà phát triển trên khắp thế giới từ Kuala Lumpur đến Lagos áp dụng, giúp công nghệ Trung Quốc vượt qua các lệnh phong tỏa phần cứng của Mỹ.

Channel News Asia tin rằng sự xuất hiện của V4 là một "điểm uốn" về phần cứng và giá thành. Thông qua sự hợp tác sâu rộng với chip Ascend của Huawei, Trung Quốc đang đạt được khả năng “tự cung tự cấp” từ thuật toán đến phần cứng, đây là một cột mốc quan trọng cho sự độc lập của ngành AI của Trung Quốc.

4. “Trải nghiệm thực tế” của các nhà phát triển trên khắp thế giới: Có hương thơm thực sự, nhưng cũng có những nghi ngờ

Trò chơi ở cấp độ vĩ mô quả thực rất hỗn loạn, nhưng đối với các nhà phát triển viết mã và điều chỉnh API hàng ngày, tính dễ sử dụng và tính ổn định là tiêu chí duy nhất để đánh giá. Trên các nền tảng xã hội như Reddit và X, “trải nghiệm thực tế” của các nhà phát triển toàn cầu đã đẩy cuộc thảo luận này lên đến đỉnh điểm. Sau khi phát hành

V4, Reddit và X ngay lập tức trở thành những người đi đầu trong việc phá bỏ công nghệ và ngành game.

Trên Reddit, các nhà phát triển tập trung vào tính ổn định của văn bản dài.

Người dùng cấp cao a9udn9u thẳng thắn nói rằng khả năng xử lý văn bản dài của V4 là "hoàn toàn điên rồ" và cung cấp trợ giúp rất lớn trong việc hiểu các cơ sở mã rất lớn.

Người dùng Comfort-Rock-498 cũng có cảm nhận tương tự. Anh ta cố tình đẩy bài kiểm tra sang một bối cảnh siêu dài và phát hiện ra rằng V4-Flash thực sự đạt được "không có lỗi".

SignalCompetitive582 đã chỉ ra rằng thay đổi lớn nhất do V4 mang lại là thay đổi hoạt động của LLM từ "bị giới hạn bởi bộ nhớ video" thành "bị giới hạn bởi sức mạnh tính toán". Điều này có nghĩa là trong tương lai, các công cụ lập trình AI có thể cung cấp giới hạn đăng ký hào phóng hơn và “giá trọn gói” sẽ giúp việc tự động hóa doanh nghiệp quy mô lớn hoàn toàn khả thi về mặt kinh tế.

InterstellarReddit đã mô tả DeepSeek là "ngửi thấy mùi máu trong nước và tấn công ngay lập tức", tin rằng hiệu quả chi phí cực cao của nó sẽ một lần nữa tấn công thị trường AI Hoa Kỳ.

cũng có âm thanh êm dịu. Những người dùng như CallMePyro đã chỉ ra một cách khách quan rằng vẫn còn khoảng cách giữa V4-Pro và Claude 4.7 về chất lượng tổng thể, nhưng mọi người ít nhất nên dùng thử V4-Flash và so sánh nó với Google Gemini 3 Flash.

Trên nền tảng X, cuộc thảo luận đã nâng lên tầm đổi mới kiến trúc, sức mạnh công nghệ và thậm chí cả tầm nhìn.

Chuyên gia kỹ thuật MZ (@myknz) đã đăng một bài viết dài chỉ ra rằng các phòng thí nghiệm của Mỹ như OpenAI và Anthropic hiện thích cải thiện hiệu suất mô hình thông qua "Brute-forcing", trong khi DeepSeek đại diện cho lộ trình đạt được những đột phá thông qua "Hiệu quả kiến trúc". Ông chỉ ra gay gắt rằng các phòng thí nghiệm của Mỹ đang "âm thầm tiếp thu" các giải pháp kỹ thuật do các công ty Trung Quốc như DeepSeek, Alibaba và Dark Side of the Moon đóng góp, nhưng trước công chúng, họ lại lan truyền câu chuyện về "sự ăn cắp của Trung Quốc" để bảo vệ các mô hình khép kín của chính họ.

MZ đã phân tích thêm rằng hệ sinh thái AI toàn cầu Chúng ta đang ở trong một "cân bằng Nash" đạo đức giả, trong đó Hoa Kỳ kiểm soát tường thuật và tỷ suất lợi nhuận cao, đồng thời khai thác các kết quả R&D nguồn mở; trong khi các công ty Trung Quốc tiếp tục sử dụng nguồn mở để đảm bảo rằng các nhà phát triển toàn cầu áp dụng các tiêu chuẩn của Trung Quốc, do đó vượt qua được lệnh phong tỏa phần cứng của Hoa Kỳ.

Blogger nổi tiếng Lisan al Gaib tin rằng V4 hiện ở cấp độ GPT-5.2 hoặc Opus 4.5+. Mặc dù tụt hậu so với các mô hình nguồn đóng hàng đầu khoảng 4 đến 5 tháng nhưng nó lại dẫn trước các mô hình AI khác của Trung Quốc, tiếp theo là Kimi K2.6. Ở quy mô 1,6 nghìn tỷ thông số, V4 vốn đã nặng ngang với GPT-5.4. Ông cũng đề cập rằng các tài liệu kỹ thuật liên quan đã giới thiệu chi tiết về đào tạo và kiến trúc kỹ thuật của mô hình, đồng thời suy đoán rằng các phòng thí nghiệm nguồn mở khác sẽ áp dụng kiến trúc này để hoạt động tốt trong bối cảnh lâu dài.

Tất nhiên cũng có rất nhiều người bình tĩnh dò xét.

Kỹ sư AI Daniel Dewhurst nhắc nhở mọi người hãy thận trọng với Điểm chuẩn chính thức, tin rằng nếu không có đánh giá độc lập, những dữ liệu tuyệt đẹp này có thể được tối ưu hóa cho bộ thử nghiệm. Lisan al Gaib thậm chí còn thẳng thắn cho rằng V4 trông vẫn còn "chưa chín" và chưa có bước nhảy vọt thực sự về logic suy luận so với V3.2.

Một số người dùng cũng đề cập rằng DeepSeek V4 hiện hoạt động rất kém trong các nhiệm vụ pháp lý.

Sage Aurélius nhắc nhở mọi người đừng quá say mê với "nguồn mở thuần túy". Anh ấy tin rằng việc DeepSeek áp dụng giao thức MIT là một chiến lược kinh doanh thông minh, nhằm thu hút tâm trí và dữ liệu của các nhà phát triển bằng cách phát hành các mô hình mạnh mẽ, sau đó kiếm được lợi nhuận cao thông qua dịch vụ lưu trữ. Đây là mô hình "lõi mở" (Open-core) cổ điển.

Nhà nghiên cứu Chen Deli của DeepSeek đã gọi V4 là một "công việc chăm chỉ" trên X và nhắc lại tầm nhìn của công ty: "AGI thuộc về tất cả mọi người .”

TAGP H545. Kết luận: Sự đổi mới thực sự không sợ tường

DeepSeek Sự ra mắt của V4 trực tiếp chỉ ra logic "bá chủ sức mạnh tính toán" mà Thung lũng Silicon đã xây dựng trong hơn mười năm.

Nó cho thế giới biết rằng trên con đường dẫn tới tương lai, việc xếp chồng mạnh mẽ sức mạnh tính toán không phải là câu trả lời duy nhất và hiệu quả kiến trúc cũng có thể đạt được những kết quả đáng kinh ngạc. Khi các nhà phát triển trên khắp thế giới đang cổ vũ cho sự ổn định và mức giá thấp của V4, những gì chúng ta thấy không chỉ là sự trỗi dậy của thương hiệu AI Trung Quốc mà còn là sự cải tổ thầm lặng trong cơ cấu quyền lực công nghệ toàn cầu.

"Cá voi biển sâu" đã nổi lên. Nếu tương lai của AGI được định sẵn là thuộc về tất cả mọi người, thì trò chơi phá bỏ phong tỏa, phá bỏ giá cả và định hình lại hiệu quả này mới bước vào hiệp hai.