Trường hợp con trỏ, Jen-Hsun Huang với tư cách khách mời, vầng hào quang của DeepSeek giờ thuộc về Kimi

Vào ngày 20 tháng 3, công cụ lập trình AI Cursor đã phát hành mô hình Composer 2 tự phát triển, được cho là kết quả đầu tiên của công ty về việc “tiếp tục đào tạo trước kết hợp với học tập tăng cường” trên mô hình cơ sở. Blog phát hành không đề cập đến nguồn gốc của mô hình cơ sở, nhưng cách diễn đạt dường như muốn nói rằng Cursor đã tạo ra nó từ đầu.

Trong vòng chưa đầy hai giờ, một nhà phát triển có tên Fynn đã chặn ID mô hình thực của Composer 2, kimi-k2p5-rl-0317-s515-fast, trong khi gỡ lỗi API của Cursor. Tách nó ra, kimi-k2p5 trỏ đến Kimi K2.5, rl là Học tăng cường, tiếp theo là ngày và số phiên bản.

Trưởng nhóm đào tạo trước Dark Side of the Moon Du Yulun đã tweet ngay lập tức, nói rằng nhóm đã thử nghiệm mã thông báo của Composer 2 được phát hiện là "hoàn toàn phù hợp" với mã thông báo của Kimi, gần như xác nhận rằng "đây là một bước nữa tinh chỉnh mô hình của chúng tôi.” Anh ấy đã trực tiếp hỏi người đồng sáng lập @Cursor Michael Truell, hỏi tại sao giấy phép không được tuân thủ và không phải trả phí. Dòng tweet sau đó đã bị xóa.

Nhưng lửa đã cháy rồi. Musk trả lời "Ừ, đó là Kimi 2.5" trước dòng tweet của Fynn, điều này trực tiếp khiến vấn đề này trở thành một cuộc tìm kiếm nóng.

TA GPH75Từ "vỏ bọc" đến "hợp tác", việc đảo ngược chỉ mất vài phút giờ

Kimi K2.5 áp dụng phiên bản sửa đổi của giấy phép MIT, trong đó yêu cầu rõ ràng rằng các sản phẩm thương mại có doanh thu hàng tháng vượt quá 20 triệu đô la Mỹ hoặc số người dùng hoạt động hàng tháng vượt quá 100 triệu phải có "Kimi K2.5" nổi bật trên giao diện người dùng. Doanh thu hàng năm của Cursor xấp xỉ 2 tỷ USD, vượt ngưỡng này hơn 8 lần.

Nhưng vào đúng ngày dư luận đang lên men thì cốt truyện lại đảo ngược. Tài khoản chính thức của Dark Side of the Moon @Kimi_Moonshot đã đăng một tin nhắn, chuyển giọng điệu từ thắc mắc sang chúc mừng, nói rằng "Chúng tôi tự hào khi thấy Kimi K2.5 cung cấp nền tảng cho Composer 2" và làm rõ rằng Cursor đã được cấp phép sử dụng thông qua nhà cung cấp dịch vụ suy luận Fireworks AI.

Người đồng sáng lập Cursor Aman Sanger sau đó giải thích rằng nhóm đã đánh giá nhiều mô hình cơ sở, Kimi K2.5 là "mạnh nhất" và sau đó thực hiện đào tạo trước và học tăng cường bổ sung gấp 4 lần quy mô trên cơ sở này. Anh thừa nhận việc không nhắc đến Kimi K2.5 trong blog ra mắt là một sai lầm.

Toàn bộ quá trình từ tranh chấp thỏa thuận nguồn mở đến thông báo hợp tác chính thức chỉ mất chưa đầy 24 giờ.

Tại sao Cursor mắc "sai lầm"

Đây không phải là lần đầu tiên Cursor bị phát hiện có "cơ sở từ Trung Quốc". Khi Composer 1 được phát hành vào tháng 11 năm 2025, cộng đồng đã suy đoán thông qua phân tích mã thông báo rằng nó rất phù hợp với DeepSeek và đôi khi sẽ xuất ra tiếng Trung trong quá trình suy luận. Con trỏ cũng không phản hồi vào thời điểm đó.

Từ DeepSeek đến Kimi, nền tảng của mô hình tự phát triển của Cursor đã thay đổi, tất cả đều hướng đến cùng một thực tế. Mô hình cơ sở có khả năng lập trình mạnh nhất thế giới đến từ cộng đồng nguồn mở của Trung Quốc.

Việc Cursor miễn cưỡng tiết lộ nguồn gốc của căn cứ có vấn đề sâu xa hơn về cấu trúc đằng sau nó. Cursor luôn dựa vào các mô hình của Anthropic và OpenAI để thúc đẩy sản phẩm, nhưng hai công ty này hiện đang tự chế tạo các công cụ lập trình. Claude Code và Codex đều đang lan rộng nhanh chóng và nhiều nhà phát triển đã bắt đầu di chuyển. Nghịch lý mà Cursor phải đối mặt là nó phải dựa vào những mẫu hàng đầu để đáp ứng nhu cầu của người dùng, nhưng các nhà sản xuất mẫu cũng chính là đối thủ cạnh tranh trực tiếp của nó. Nếu không có cơ sở mô hình điều khiển riêng, Con trỏ sẽ luôn bị người khác điều khiển.

Từ quan điểm này, việc chọn mô hình nguồn mở của Trung Quốc để tinh chỉnh gần như là một logic tất yếu. Nó đủ mạnh nhưng sẽ không trở thành đối thủ của chính nó. Nhưng đây cũng chính là lý do tại sao Cursor không muốn nói chuyện công khai. Vào năm 2025, nó sẽ là ngôi sao hot nhất trong lĩnh vực lập trình AI, với mức định giá 29,3 tỷ USD. Vào ngày 12 tháng 3, Bloomberg đưa tin rằng vòng định giá mục tiêu tài chính mới là khoảng 50 tỷ USD. Việc thừa nhận rằng mô hình cốt lõi đến từ cộng đồng nguồn mở Trung Quốc vào thời điểm này là không thân thiện với câu chuyện định giá.

Composer 2 đạt 61,3 điểm trên CursorBench do Cursor thiết kế, vượt qua con số 58,2 điểm của Claude Opus 4.6, nhưng xét cho cùng, đây chỉ là bản ghi của một bài kiểm tra tự thực hiện. Mặt khác, nếu một sản phẩm được tinh chỉnh dựa trên mô hình nguồn mở có thể cạnh tranh với những gã khổng lồ trong nhiệm vụ lập trình thì bản thân vấn đề này có thể còn thú vị hơn lỗi tiết lộ của Cursor. Clément Delangue, người đồng sáng lập Hugging Face, nhận xét: "Nguồn mở của Trung Quốc hiện là lực lượng lớn nhất định hình nền tảng công nghệ AI toàn cầu".

Đối với Dark Side of the Moon, kết quả của cuộc tranh cãi này gần như là một sự kiện thương hiệu hoàn hảo. Từ "bên bị vi phạm" đến "đối tác", nó đã có được cảm giác hiện diện trong cộng đồng nhà phát triển toàn cầu. Cuối cùng, Cursor đích thân xác nhận rằng “Tôi chọn Kimi K2.5 vì nó mạnh nhất”.

Tuần lễ vàng của Kimi

Quay lại vài ngày, Kimi vừa trải qua một chu kỳ phơi nhiễm cực kỳ dày đặc.

Vào ngày 16 tháng 3, Dark Side of the Moon đã phát hành một bài báo kỹ thuật cấp độ kiến trúc thuần túy "Attention Residuals", cố gắng thay thế một thành phần cơ bản trong kiến trúc Transformer gần như không bị ảnh hưởng kể từ ResNet năm 2015, đó là kết nối còn lại. Trước đây, đầu ra và đầu vào của mỗi lớp được thêm và truyền trực tiếp mà không có sự phân biệt. Nhóm Kimi cho phép mỗi lớp "nhìn lại" và tự động chọn lớp trước đó để trích xuất thông tin. Các thử nghiệm cho thấy hiệu quả đào tạo được cải thiện khoảng 25% và độ trễ suy luận tăng lên dưới 2%. Một trong những đồng tác giả của bài báo là một học sinh trung học Thâm Quyến 17 tuổi, cùng với các nhà nghiên cứu chủ chốt của Kimi là Su Jianlin và Zhang Yu.

Đêm bài báo được phát hành, Musk nhận xét Andrej Karpathy nói rằng: "Có vẻ như chúng ta chưa hiểu đúng nghĩa đen của cụm từ 'Attention is All You Need'". Cựu VP học tăng cường OpenAI Jerry Tworek gọi đây là sự khởi đầu của "học sâu 2.0".

Ngày hôm sau, 17 tháng 3, Huang Renxun đã nhiều lần đề cập đến mô hình nguồn mở của Trung Quốc trong Bài phát biểu chính của GTC 2026. Kimi K2.5 đã thay thế DeepSeek năm ngoái và trở thành mô hình chuẩn được Huang Renxun sử dụng để chứng minh tầm quan trọng của lý luận với thế giới.

Ngày 18 tháng 3, Yang Zhilin đã trực tiếp có bài phát biểu tại diễn đàn phụ GTC. Ông là đại diện duy nhất của một công ty khởi nghiệp mô hình lớn độc lập có tên trong danh sách khách mời, cùng với Giám đốc AI của Tesla và kiến trúc sư cốt lõi DeepMind. Buổi thuyết trình cũng chật cứng người. Ông đã tiết lộ một cách có hệ thống lộ trình kỹ thuật đằng sau Kimi K2.5 và tóm tắt quá trình phát triển mô hình thành ba khía cạnh: hiệu quả của mã thông báo, bối cảnh lâu dài và cụm đại lý.

Trước khi DeepSeek trở nên hoàn toàn phổ biến, nhóm mô hình nguồn mở Trung Quốc chia sẻ nhiều nhất trên GTC từng là DeepSeek.

Papers, GTC và Cursor, ba thứ lần lượt thành hiện thực trong vòng một tuần, và những điểm nổi bật rực rỡ này đều mang ý nghĩa "thay đổi thời thế" với DeepSeek: từng là DeepSeek. Mỗi bài báo đều được cộng đồng công nghệ toàn cầu và các ông chủ KOL săn lùng và đăng lại. Trước đây, GTC gần như là hội nghị ra mắt “không chính thức” của DeepSeek. Ngay cả "vỏ bọc yên tĩnh" trước đây của Cursor cũng là DeepSeek nhưng trong tích tắc, mọi thứ đã biến thành Kimi, Mặt tối của Mặt trăng.

Đứng ở vị trí của DeepSeek

Điều này khiến nhiều người bắt đầu nhận ra rằng Kimi đang chiếm giữ vị trí của DeepSeek trong cộng đồng AI toàn cầu.

Sự bùng nổ của DeepSeek R1 vào đầu năm 2025 đã định hình lại nhận thức của toàn ngành, biến "AI Trung Quốc" từ một khái niệm mơ hồ thành một mô hình cụ thể và có trọng lượng hoạt động. Nhưng kể từ đó, DeepSeek tương đối im ắng. V4/R2 mà cộng đồng đã chờ đợi từ lâu vẫn chưa được phát hành. V3.1, V3.2 và các phiên bản khác liên tục được cập nhật nhưng tác động của việc “viết lại luật ngay khi game ra mắt” vẫn chưa được tái hiện.

Kimi tình cờ bước vào thời kỳ cửa sổ này.

Sau Lễ hội mùa xuân năm 2025, hoạt động hàng ngày của Kimi gặp nhiều áp lực. Dark Side of the Moon đã cắt một lượng lớn ngân sách tiếp thị và bắt đầu làm việc trên các mô hình đằng sau cánh cửa đóng kín. Vào tháng 7, Kimi K2 đã được phát hành với kiến trúc MoE nghìn tỷ thông số. Sau khi K2 ra mắt, số lượt tải xuống trong ngày đầu tiên Ôm Mặt đã vượt qua tất cả các mẫu khác trên nền tảng này. Người đồng sáng lập Anthropic Jack Clark đã đánh giá nó là "mô hình trọng lượng nguồn mở tốt nhất trên thế giới".

Vào cuối tháng 1 năm 2026, K2.5 đã được phát hành với kiến trúc cụm Tác nhân và đa phương thức gốc, đồng thời đã giành được giải thưởng nguồn mở tốt nhất trên thế giới trong nhiều cuộc đánh giá Tác nhân. Sau khi cơn sốt OpenClaw ập đến, Kimi Claw nhanh chóng lên mạng. Theo báo cáo, chưa đầy một tháng sau khi phát hành K2.5, doanh thu tích lũy của Kimi trong 20 ngày qua đã vượt quá cả năm 2025. Dữ liệu của Stripe cho thấy lệnh thanh toán từ các thuê bao Kimi cá nhân đã tăng 8.280% so với tháng trước trong tháng 1.

Tốc độ ở cấp vốn cũng đang tăng tốc. Vòng C trị giá 500 triệu USD vào cuối năm 2025, với mức định giá sau huy động vốn là 4,3 tỷ USD; vào tháng 2 năm 2026, nó vượt quá 700 triệu USD và định giá tăng lên 10 tỷ USD; vào giữa tháng 3, một vòng mới trị giá 1 tỷ USD đang được tiến hành và mức định giá đã lên tới 18 tỷ USD. Giá trị thị trường của Zhipu và MiniMax, được niêm yết trên thị trường chứng khoán Hồng Kông trong cùng thời gian, đạt mức lần lượt là 330 tỷ đô la Hồng Kông và 380 tỷ đô la Hồng Kông vào giữa tháng 3. Dark Side of the Moon vẫn chưa bước vào thị trường thứ cấp. Đánh giá từ mức phí bảo hiểm hiện tại của lĩnh vực AI, không có nhiều chỗ cho trí tưởng tượng sau khi niêm yết.

Kimi đã sử dụng phương pháp của DeepSeek để lấy đi hào quang của DeepSeek.

Kiến trúc của Kimi K2 được lấy trực tiếp từ DeepSeek V3. Cơ chế chú ý MLA và khung kết hợp chuyên gia MoE là những cơ chế đầu tiên được DeepSeek tiên phong hoặc xác minh trên quy mô lớn. Bản thân sự trỗi dậy của Kimi là sự tiếp nối ảnh hưởng của công nghệ DeepSeek. Chiến lược nguồn mở của DeepSeek cũng kỹ lưỡng hơn, sử dụng giấy phép MIT thuần túy mà không có bất kỳ hạn chế nào về ngưỡng doanh thu, điều này cho phép DeepSeek tích lũy tỷ lệ thâm nhập rất cao trong hệ sinh thái nhà phát triển toàn cầu. Giấy phép MIT sửa đổi của Kimi có thêm một lớp hạn chế đối với việc sử dụng thương mại. Sự cố Cursor này là một ví dụ.

Trong khoảng thời gian tương đối yên tĩnh của DeepSeek, Kimi đã tiếp quản micro từ “Đại diện nguồn mở AI Trung Quốc”. Cho dù đó là bục giảng của Jen-Hsun Huang, cơ sở mô hình của Cursor hay các bài báo học thuật và cộng đồng nhà phát triển, Kimi đang lấp đầy một không gian tường thuật đòi hỏi nội dung mới mẻ liên tục.

Và Kimi không chỉ sản xuất người mẫu. Bài viết về Phần dư chú ý đề cập đến cấu trúc cơ bản của học sâu vốn không thay đổi đáng kể trong mười năm. Đây là cách tiếp cận tương tự như MLA của DeepSeek trước đây, cả hai đều đang cố gắng xác định lại cơ sở hạ tầng của ngành.

Câu chuyện về nguồn mở AI của Trung Quốc đang chuyển từ "DeepSeek" sang câu chuyện trong đó những người chơi mới liên tục nổi lên để lấy đi hào quang. Điều này ngày càng giống với nhịp điệu của Thung lũng Silicon. OpenAI được theo sau bởi Google, Google được theo sau bởi Anthropic, và sau đó chu kỳ tiếp tục.

Các mô hình nguồn mở của Trung Quốc lần lượt tiếp quản dòng thời gian của các nhà phát triển toàn cầu. Trong khi năng lực của người mẫu ngày càng tăng cao thì quyền lên tiếng vẫn không bị mất: đợi đến khi DeepSeek xuất hiện khi các mô hình mới xuất hiện, liệu sự chú ý của Kimi có bị lấy đi không? Liệu tác phẩm mới của MiniMax, Qwen, Zhipu, Step và tân binh mạnh mẽ không kém Xiaomi có bất ngờ tước đi vị trí dẫn đầu của họ? Tất cả những điều này đều cho phép sự luân phiên theo vòng xoáy này tiếp tục và đây là một điều tốt cho mọi người tham gia AI Trung Quốc.