Các mẫu lớn trong nước được nâng cấp thường xuyên trong tuần qua. Theo mã nguồn mở của GLM-5.1 và MiniMax 2.7, bản xem trước mã Kimi K2.6 của Dark Side of the Moon cũng có sẵn. Đây là mô hình lớn nghìn tỷ tham số được tối ưu hóa đặc biệt cho lập trình AI. Trang web chính thức cho biết nó đã trực tuyến, , nhưng để trải nghiệm mô hình lớn này cần có gói thành viên của Kimi, giá khởi điểm là 39 nhân dân tệ mỗi tháng và có thể được sử dụng trong Kimi Code.

Tuy nhiên, mẫu lớn xem trước mã K2.6 tương đối đơn giản. Nó không được công bố nhiều trong phiên bản beta nội bộ trước đó. Chỉ khi nó ra mắt cách đây hai ngày tôi mới thấy có ai nhắc tới. Các quan chức của Kimi không quảng bá nó một cách rầm rộ. Ngay cả trang web chính thức cũng chưa thấy nâng cấp cụ thể nào cho mẫu xe cỡ lớn này.
Đánh giá từ phản hồi beta nội bộ và lời giới thiệu của mọi người trên Internet, bản xem trước mã K2.6 được cải thiện trên cơ sở K 2.5, một mô hình lớn với hàng nghìn tỷ tham số. Tối ưu hóa chính vẫn là lập trình AI. Điểm danh sách được xác minh SWE-Bench của K 2,5 là 76,8% và LiveCodeBench là 85%.
K2.6-xem trước mã chủ yếu tập trung vào chiều sâu lý luận, chất lượng lập kế hoạch tổng đài viên và độ tin cậy của các lệnh gọi công cụ nhiều bước. Một số người thử nghiệm nội bộ cho biết chuỗi tư duy mang phong cách Opus (điều này thật sâu sắc).

Về cấp độ cụ thể, có một anh chàng to lớn Versun đã tự mình đánh giá khả năng lập trình. K2.6-code-preview có điểm 89, cao hơn K. Điểm 2,5 là 83 tăng 6 điểm, nhưng vẫn có khoảng cách giữa những người chơi hàng đầu trước đó.
So với các nhà sản xuất khác thường tuyên bố rằng họ đang bắt kịp hoặc vượt qua Opus 4.6 trong tài liệu quảng cáo của mình, một số cư dân mạng trong bản xem trước mã K2.6 hiện đánh giá nó là cấp độ Sonnet 4.6, cũng rất mạnh.

Cư dân mạng đã sử dụng đánh giá vẫn tốt, khả năng tuân lệnh không tệ, khả năng cũng tốt. Hiện được kết hợp với gói Coding Plan của Kimi, ít nhất nó cung cấp một tùy chọn mạnh mẽ và tiết kiệm chi phí cho việc lập trình AI.