AI có thể tự kiểm tra mã. Opus 4.7 giải quyết "Núi chết tiệt"

Khi các nhà sản xuất AI khác phát hành mô hình, họ chắc chắn sẽ cho bạn biết "sản phẩm của chúng tôi lần này tuyệt vời và mạnh mẽ như thế nào". Nhưng Anthropic thì khác. Họ nói, "Chúng tôi có thứ gì đó mạnh hơn, nhưng chúng tôi chưa thể đưa nó cho bạn được." Vì vậy vào ngày 17/04/2026, Anthropic đã phát hành Claude Opus 4.7. Không có nhiều hồi hộp trong phiên bản này. Blog chính thức liệt kê từng bước điểm chạy, cải thiện khả năng và kịch bản ứng dụng. Nhưng nếu bạn đọc kỹ toàn bộ thông báo, bạn sẽ nhận thấy điều gì đó bất thường.

Opus 4.7 nối tiếp Project Glasswing và Mythos Preview của Anthropic. Và tuần trước họ vừa thông báo rằng Mythos Preview tạm thời bị hạn chế phát hành do khả năng bảo mật mạng quá cao. Do đó,

Opus 4.7 được định vị rõ ràng là “mô hình công khai đầu tiên được sử dụng để thử nghiệm các biện pháp bảo vệ an ninh mạng mới”.

Các quan chức thậm chí còn cho biết họ đã thử nghiệm làm suy yếu khả năng an ninh mạng của mô hình này trong quá trình đào tạo.

Còn Opus 4.7 cụ thể thì sao?

01 Opus 4.7 hoạt động như thế nào?

Trước tiên hãy nói về phần chung.

Opus 4.7 vượt trội hơn Opus 4.6 trên nhiều điểm chuẩn, đặc biệt là trong các tác vụ kỹ thuật phần mềm nâng cao.

Trong biểu đồ chính thức, Opus 4.7 là 87,6% và Opus 4.6 là 80,8% trên SWE-Bench Verify; trên SWE-Bench Pro khó hơn, Opus 4.7 là 64,3% và Opus 4.6 là 53,4%; trên Terminal-Bench 2.0, Opus 4.7 là 69,4%, Opus 4.6 là 65,4%; trên Đại lý tài chính v11, Opus 4.7 là 64,4%, Opus 4.6 là 60,1%.

Hãy giải thích chuỗi số này bằng ngôn ngữ của con người: Giờ đây, bạn có thể giao các tác vụ lập trình phức tạp hơn cho Opus 4.7, nó sẽ xử lý các tác vụ dài hạn một cách chặt chẽ hơn, làm theo hướng dẫn chính xác hơn và tìm cách xác minh đầu ra trước khi báo cáo.

Trong phản hồi từ những người thử nghiệm đầu tiên của Opus 4.7, có một số điểm đáng lưu ý.

Đầu tiên là khả năng làm theo hướng dẫn được cải thiện rất nhiều.

Opus 4.7 sẽ diễn giải các hướng dẫn theo đúng nghĩa đen, trong khi các mẫu trước đây có xu hướng diễn giải chúng một cách lỏng lẻo hoặc bỏ qua một số phần nhất định.

Điều này nghe có vẻ là điều tốt nhưng thực tế nó có thể gây rắc rối. Hiệu suất là Opus 4.7 "ngoan ngoãn" hơn, nhưng điều này sẽ khiến một số từ nhắc nhở cũ không hợp lệ.

Claude trước đây có thể sẽ "hiểu biết" hơn. Bạn viết một hướng dẫn mơ hồ và nó sẽ tự động hoàn thành ý định thực sự của bạn hoặc bỏ qua một số yêu cầu ít quan trọng hơn, mâu thuẫn hoặc viết không rõ ràng. Nhiều lời nhắc của người dùng thực sự được điều chỉnh dựa trên thói quen kiểu cũ này.

Nhưng các quan chức của Opus 4.7 nói rằng họ thích tuân thủ nghiêm ngặt các hướng dẫn theo nghĩa đen. Bằng cách này, các chi tiết nhỏ trong các từ gợi ý cũ mà mô hình tự động bỏ qua giờ đây có thể được triển khai một cách cẩn thận. Các biểu thức mờ mà mô hình từng xử lý một cách linh hoạt giờ đây được hiểu một cách trực tiếp nhất.

Kết quả là mô hình rõ ràng là mạnh hơn, nhưng đầu ra lại khác với những gì người dùng mong đợi.

Thứ hai là cải tiến hỗ trợ đa phương thức.

Opus 4.7 có thể chấp nhận hình ảnh có chiều dài lên tới 2576 pixel, tức là khoảng 3,75 megapixel, gấp hơn ba lần so với mẫu Claude trước đó.

Đây không phải là bản nâng cấp "khả năng nhận dạng hình ảnh" thông thường mà là để cho phép AI hiểu giao diện phần mềm và phục vụ chức năng Sử dụng Máy tính của Anthropic.

Việc nâng cấp trực quan của Opus 4.7 không phải để khiến người dùng hỏi "Trong ảnh này là gì" mà để cho phép tác nhân hiểu giao diện phần mềm.

Nếu một tác nhân không thể nhìn rõ các biểu mẫu dày đặc, đầu ra đầu cuối, chi tiết dự thảo thiết kế và ảnh chụp màn hình mã thì cho dù khả năng hoạt động của nó có mạnh đến đâu, vì nó chỉ biết làm việc chứ không biết làm việc ở đâu.

Anthropic tăng độ phân giải hình ảnh, về cơ bản giúp Claude có đôi mắt rõ ràng hơn.

Trong tương lai, nhiều nhiệm vụ trong văn phòng AI, kiểm tra AI, bảo mật AI và phát triển giao diện người dùng AI sẽ không phải là nhiệm vụ văn bản thuần túy mà là nhiệm vụ màn hình.

Thứ ba là hiệu suất làm việc thực tế.

Thử nghiệm nội bộ cho thấy Opus 4.7 hiệu quả hơn Opus 4.6 trong các nhiệm vụ phân tích tài chính, tạo ra các mô hình và phân tích chặt chẽ hơn, trình bày chuyên nghiệp hơn và tích hợp giữa các tác vụ chặt chẽ hơn.

Nó cũng có số điểm cao nhất trong bài đánh giá của bên thứ ba GPQAval-AA, đây là bài đánh giá bao gồm tài chính, luật và các lĩnh vực khác.

Thứ tư là khả năng ghi nhớ.

Opus 4.7 cũng sẽ sử dụng bộ nhớ dựa trên hệ thống tệp. Nó có thể ghi nhớ các ghi chú quan trọng trong quá trình làm việc dài hạn, nhiều phiên và các nhiệm vụ tiếp theo yêu cầu ít thông tin trước hơn.

Điểm này không rõ ràng trong thông báo chính thức, nhưng tôi nghĩ đây có thể là tính năng cập nhật quan trọng nhất khi sử dụng lâu dài.

Chỉ tác nhân có thể nhớ các hạn chế của dự án, sở thích của người dùng, quyết định về kiến trúc và lý do dẫn đến lỗi cuối cùng trong các phiên mới có thể chuyển đổi từ "nhân viên tạm thời thông minh" thành "đồng nghiệp ổn định".

Về mặt bảo mật và căn chỉnh, hiệu suất tổng thể của Opus 4.7 và Opus 4.6 là tương tự nhau.

Nó đã được cải thiện về tính trung thực và khả năng chống lại các cuộc tấn công tiêm nhắc độc hại nhưng lại giảm khả năng đưa ra các đề xuất có hại, chẳng hạn như cách chế tạo và sử dụng dao được điều khiển.

Đánh giá liên kết chính thức kết luận rằng mô hình này “nói chung là phù hợp và đáng tin cậy, nhưng chưa hoàn toàn phù hợp về mặt hành vi”.

Về mặt giá cả, Opus 4.7 và Opus 4.6 vẫn giữ nguyên. Đầu vào có giá 5 USD trên một triệu token và đầu ra có giá 25 USD trên một triệu token.

Nhưng có hai thay đổi về chi phí được đề cập trong hướng dẫn di chuyển. Trình mã thông báo mới có thể biến cùng một đầu vào thành gấp 1,0 đến 1,35 lần mã thông báo. Ở chế độ tư duy mạnh mẽ, đặc biệt là đối thoại nhiều vòng của tác nhân, mô hình sẽ suy nghĩ nhiều hơn và có thể xuất ra nhiều mã thông báo hơn.

Vì vậy đây là lúc Anthropic phải cẩn thận. Giá danh nghĩa không thay đổi nhưng sẽ đắt hơn nếu bạn chạy nhiều hơn.

Trước đây, việc thanh toán mô hình chủ yếu phụ thuộc vào độ dài đầu vào và đầu ra, nhưng bây giờ nó cũng phụ thuộc vào mức độ tư duy, ngân sách nhiệm vụ, số vòng mà tác nhân đã chạy và liệu quá trình suy luận có tiếp tục diễn ra sau khi công cụ thất bại hay không.

Ngân sách nhiệm vụ và nỗ lực x-cao mới của Anthropic cho thấy rằng việc sử dụng các mô hình cao cấp đang tuân theo cùng một logic của điện toán đám mây. Những gì bạn đang trả tiền không phải là một câu trả lời mà là một quá trình thực hiện nhiệm vụ bao gồm suy nghĩ, thử và sai cũng như xác minh.

02 Tại sao Anthropic lại tung ra mẫu thiến?

Sau đó, một trong những điểm bán hàng thực sự của Opus 4.7 chính xác là nó không phát huy hết khả năng của mình.

Điều này nghe có vẻ hơi phản trực giác nhưng có thể là tiêu chuẩn cho các công ty kiểu mẫu thế hệ tiếp theo.

Mô hình càng gần với môi trường sản xuất thực tế thì chúng ta càng ít có thể theo đuổi hiệu suất mạnh mẽ hơn. Nó cần biết những gì có thể và không thể làm được, những người dùng nào có thể mở thêm quyền và những yêu cầu nào phải bị chặn.

Anthropic triển khai Chương trình xác minh mạng cùng lúc với thời điểm Opus 4.7 được phát hành.

Dự án này chủ yếu là chấm điểm khả năng. Người dùng thông thường nhận được Opus có lan can bảo vệ và chỉ những chuyên gia bảo mật đã được xác minh mới có thể đăng ký để sử dụng bảo mật mạng rộng hơn. Mô hình

tự động phát hiện và chặn các yêu cầu cho biết việc sử dụng an ninh mạng bị cấm hoặc có rủi ro cao.

Anthropic cho biết họ sẽ học hỏi từ việc triển khai Opus 4.7 trong thế giới thực để chuẩn bị cho việc phát hành rộng rãi các mô hình cấp Mythos trong tương lai.

Phải nói là Anthropic vẫn biết chơi. Họ tin rằng khả năng hiện tại của Opus là quá mức nên họ đã biến bảo mật thành khả năng của sản phẩm.

Trong vài năm qua, logic cạnh tranh của các công ty AI là "Tôi giỏi hơn bạn". Nó có điểm chạy cao hơn, nhiều tham số hơn và nhiều thứ phức tạp hơn mà nó có thể thực hiện. Nhưng khi khả năng của mô hình đạt đến một điểm tới hạn nhất định, logic này bắt đầu thất bại.

Một mô hình hoạt động quá tốt trong các bài kiểm tra bảo mật mạng có thể có nghĩa là mô hình đó cũng có thể được sử dụng cho mục đích xấu. Một tác nhân không có hạn chế nào có thể đưa ra những quyết định nguy hiểm mà người dùng không hề hay biết.

Con đường được Anthropic lựa chọn là khóa mô hình mạnh nhất trước và sử dụng mô hình yếu hơn nhưng đủ tốt để kiểm tra cơ chế bảo mật. Không phải là không thể về mặt kỹ thuật mà là bạn chủ động chọn không làm điều đó. Bản thân sự “hạn chế” này trở thành một phần của sự khác biệt hóa sản phẩm.

Chiến lược này có thể thành công hay không phụ thuộc vào việc thị trường có thừa nhận khái niệm "thận trọng" hay không.

Nếu người dùng chỉ quan tâm đến việc “có thể làm được” thì cách tiếp cận của Anthropic sẽ có vẻ thận trọng. Nhưng nếu khách hàng doanh nghiệp bắt đầu chú ý đến "liệu có chuyện gì xảy ra không", thì kiểu phát hành theo cấp bậc này và chủ động làm suy yếu một số khả năng nhất định thực sự có thể trở thành một lợi thế cạnh tranh.

Đồng thời với Opus 4.7 được phát hành, Anthropic cũng cập nhật Claude Code, bổ sung thêm chế độ tự động và chức năng /ultrareview.

Chế độ tự động không phải là lựa chọn kiểu máy tự động mà là một tùy chọn cấp phép. Nó cho phép Claude đưa ra một số quyết định về quyền cho người dùng, do đó, các tác vụ dài ít bị gián đoạn hơn nhưng rủi ro thấp hơn so với việc bỏ qua hoàn toàn việc xác nhận quyền.

Thiết kế này hướng đến mâu thuẫn cốt lõi của sản phẩm đại lý: nếu bạn hỏi quá nhiều câu hỏi, đại lý sẽ trông giống như một thực tập sinh; nếu không hỏi thì rủi ro sẽ quá lớn.

Nút khó thiết kế nhất trong thời đại đặc vụ không phải là "Bắt đầu" mà là "Cho phép".

Trước đây, AI chỉ trả lời các câu hỏi và có rất ít quyền.

Bây giờ nó phải thay đổi mã, đọc tệp, chạy lệnh, mở trang web và gửi PR. Mỗi bước đi đều có rủi ro.

Nếu mọi thao tác đều yêu cầu xác nhận của người dùng thì quyền tự chủ của đại lý sẽ trở nên vô nghĩa. Nhưng nếu buông bỏ hoàn toàn, người dùng sẽ lo lắng AI sẽ đưa ra những quyết định sai lầm không thể cứu vãn.

chế độ tự động Bản chất là tìm sự cân bằng giữa "đừng làm phiền tôi" và "đừng làm phiền".

Nó sẽ quyết định xem có thực thi tự động, nhắc người dùng hay yêu cầu ủy quyền rõ ràng dựa trên mức độ rủi ro của hoạt động hay không.

Đây cũng là một bước nhảy vọt lớn giữa tác nhân từ "có thể làm được gì" đến "có thể sử dụng được" hay không.

/ultrareview là phiên đánh giá mã chuyên dụng để đọc các thay đổi và chỉ ra các lỗi cũng như vấn đề về thiết kế.

Chức năng này thú vị hơn nhiều so với việc viết mã, vì nó cho thấy lập trình AI đã chính thức bước vào giai đoạn thứ hai, cho phép AI xem lại mã do chính AI tạo ra.

Việc AI viết mã không còn là chuyện hiếm nữa. Điều thực sự hiếm gặp là liệu AI có thể xem lại mã của chính nó hay không.

/ultrareview giống như đôi mắt thứ hai của Anthropic dành cho Claude Code.

Một đại diện chịu trách nhiệm viết và một phiên khác thận trọng hơn có trách nhiệm xem xét.

Không cần nhìn vào dữ liệu tôi có thể đoán được rằng hai chức năng này chắc hẳn là chức năng tần số cao. Bởi vì về cơ bản, hai chức năng này từng là điều mà tất cả các lập trình viên sử dụng Claude Code đều làm.

Việc tạo mã chỉ là một phần của quá trình phát triển. Việc xem xét, kiểm tra, tái cấu trúc và ghi lại tài liệu đều quan trọng như nhau. Nếu AI chỉ làm được bước đầu tiên thì mãi mãi nó chỉ là công cụ phụ trợ. Nếu nó có thể tham gia vào toàn bộ quá trình, nó có thể thực sự thay đổi cách phát triển phần mềm.

Có một chi tiết khác đáng chú ý trong phiên bản này. Quan chức này đặc biệt nhắc nhở người dùng trong hướng dẫn di chuyển rằng việc sử dụng mã thông báo trong Opus 4.7 có thể tăng lên, nhưng trong đánh giá lập trình thực tế, hiệu quả tổng thể đã được cải thiện.

Điều này cho thấy rằng họ đang tối ưu hóa không phải chi phí của một cuộc gọi mà là tổng chi phí để hoàn thành nhiệm vụ. Nếu một đại lý thực hiện đúng ngay lần đầu tiên, ngay cả khi một cuộc gọi đắt hơn, tổng chi phí sẽ thấp hơn so với việc thử và sai nhiều lần.

Đây là một ý tưởng sản phẩm trưởng thành hơn. Những ngày đầu, các sản phẩm AI theo đuổi “rẻ” và “nhanh”, nhưng giờ đây họ theo đuổi “độ tin cậy”.

Opus 4.7 không phải là mô hình mạnh nhất và Anthropic không đóng gói nó là mô hình mạnh nhất.

Đó là điểm cân bằng giữa khả năng, độ an toàn và chi phí. Nhưng liệu nó có thực sự cân bằng hay không thì tôi không biết. Điều này cần được thị trường kiểm chứng.

Ít nhất về mặt chiến lược phát hành, Anthropic đưa ra một ý tưởng mới, bởi đôi khi "việc không nên làm" còn quan trọng hơn "việc nên làm".