Hôm nay, Ant Bailing chính thức ra mắt Ling-2.6-flash - mẫu Instruct với tổng khối lượng tham số là 104B và tham số kích hoạt là 7.4B. Mô hình này tập trung vào "Hiệu quả mã thông báo". Trong khi vẫn duy trì mức độ thông minh cạnh tranh, nó nhanh hơn, tiết kiệm hơn và phù hợp hơn cho các ứng dụng thực tế quy mô lớn.

Theo đánh giá có thẩm quyền của bên thứ ba Dữ liệu phân tích nhân tạo, Ling-2.6-flash cho thấy những ưu điểm vượt trội về Hiệu suất mã thông báo, đạt được Chỉ số thông minh là 26 điểm với 15 triệu mã thông báo đầu ra, đồng thời duy trì mức độ thông minh mạnh mẽ trong khi kiểm soát mức tiêu thụ đầu ra ở vị trí tương đối thấp.

Được hiểu rằng Ling-2.6-flash tuân theo thiết kế kiến ​​trúc tuyến tính lai của Ling 2.5. Kiến trúc MoE rất thưa thớt này có lợi thế rõ ràng về hiệu suất phần cứng.

Trong điều kiện H20 4 thẻ, tốc độ suy luận có thể đạt tới 340 mã thông báo/giây và thông lượng điền trước đạt 2,2 lần so với Nemotron-3-Super.

Trong phần đánh giá Tốc độ đầu ra, Ling-2.6-flash được xếp hạng đầu tiên trong số các mẫu có cùng mức thông số với tốc độ đầu ra ổn định là 215 token/s.

Từ góc độ tiêu thụ Token, I/O của Ling-2.6-flash được cải thiện đáng kể.

Trong đánh giá đầy đủ về Phân tích nhân tạo, tổng mức tiêu thụ của Ling-2.6-flash là 15 triệu mã thông báo, trong khi các mô hình như Nemotron-3-Super đạt hoặc vượt quá 110 triệu mã thông báo. Điều này có nghĩa là Ling-2.6-flash chỉ sử dụng khoảng 1/10 mức tiêu thụ mã thông báo để hoàn thành các nhiệm vụ đánh giá tương tự.

6

Ling-2.6-flash Các cải tiến dành cho mục tiêu đã được thực hiện được thực hiện cho các kịch bản của Đại lý. Trong khi kiểm soát mức tiêu thụ Token, nó vẫn duy trì khả năng thực thi nhiệm vụ mạnh mẽ. Mô hình đã đạt mức SOTA cùng kích thước trên các benchmark liên quan đến Agent như BFCL-V4, TAU2-bench, SWE-bench Verify, Claw-Eval và PinchBench.

Đồng thời, Ling-2.6-flash duy trì mức độ xuất sắc về các khía cạnh như kiến ​​thức chung, lý luận toán học, làm theo hướng dẫn và phân tích văn bản dài.

Giá API, đầu vào Ling-2.6-flash có giá 0,1 USD trên một triệu mã thông báo và đầu ra là 0,3 USD. Hiện tại, API của Ling-2.6-flash đã chính thức được mở cho người dùng và cung cấp bản dùng thử miễn phí có giới hạn thời gian một tuần.

Người dùng có thể nhận được các dịch vụ tương ứng thông qua tbox mô hình lớn OpenRouter và Bailing. Điều này được hiểu rằng mô hình này sau đó sẽ phát hành phiên bản thương mại, LingDT, thông qua Ant Digital để phục vụ các nhà phát triển toàn cầu và các doanh nghiệp vừa và nhỏ.