Công ty trí tuệ nhân tạo Anthropic của Mỹ đã công bố ra mắt thế hệ mới của mẫu lớn Claude Opus 4.7 vào thứ Năm, cho biết rằng nó đã được cải thiện về nhiều khả năng so với các phiên bản trước, nhưng nhìn chung nó vẫn "không rộng rãi và mạnh mẽ như sản phẩm mạnh nhất của hãng, Claude Mythos Preview." Mô hình mới tập trung vào công nghệ phần mềm, thực hiện các hướng dẫn phức tạp và xử lý các tình huống công việc kinh doanh thực tế. Nó được định vị là "mô hình chung mạnh mẽ nhất mở cửa cho công chúng" hiện tại của công ty.

Ngược lại, Claude Mythos Preview tập trung vào an ninh mạng cũng như khả năng tấn công và phòng thủ. Nó được Anthropic đánh giá là mẫu xe tiên tiến mạnh mẽ nhất hiện nay. Nó chỉ được thông qua bởi "Project Glasswing (Glass Wing Plan)" vào đầu tháng này. Chương trình an ninh mạng này, được mở trên cơ sở giới hạn cho một số khách hàng doanh nghiệp chọn lọc, được sử dụng để xác định các lỗ hổng phần mềm và rủi ro tấn công mạng. Để giảm nguy cơ lạm dụng, Anthropic đã nói rõ rằng Claude Opus 4.7 đã cố tình làm suy yếu "khả năng liên quan đến an ninh mạng" trong quá trình đào tạo và khả năng tấn công và phòng thủ mạng của nó không tốt bằng mô hình cấp Mythos.
Anthropic đã chỉ ra trong tuyên bố rằng công ty đã bổ sung cơ chế bảo vệ bảo mật tự động cho Claude Opus 4.7, cơ chế này có thể phát hiện và chặn các yêu cầu liên quan đến các mục đích bảo mật mạng bị cấm hoặc có rủi ro cao. Họ hy vọng rằng bằng cách quan sát và đánh giá hoạt động của các cơ chế bảo mật này trong môi trường thực, họ sẽ dần dần tích lũy kinh nghiệm cho việc phát hành các mô hình cấp Mythos lớn hơn và an toàn hơn trong tương lai. Anthropic cho biết kể từ khi thành lập vào năm 2021, công ty đã cam kết phát hành và lặp lại các mô hình lớn một cách an toàn và có thể kiểm soát, đồng thời đã cố tình tạo sự khác biệt với các đối thủ cạnh tranh như OpenAI với tư cách là nhà cung cấp “chú ý nhiều hơn đến bảo mật và triển khai có trách nhiệm”.
Xoay quanh việc ra mắt Dự án Glasswing và mô hình Mythos, Nhà Trắng, các giám đốc điều hành công ty công nghệ và CEO ngân hàng lớn gần đây đã tổ chức nhiều cuộc họp kín để tập trung vào những rủi ro tiềm ẩn của các mô hình AI tiên tiến trong an ninh mạng và hệ thống tài chính. Dưới sự lãnh đạo của chính quyền hiện tại của Tổng thống Trump, các cuộc thảo luận xung quanh vấn đề bảo mật AI giữa các cơ quan quản lý, tổ chức tài chính và công ty công nghệ ngày càng trở nên thường xuyên và Anthropic đã trở thành một trong những người tham gia quan trọng trong cuộc thảo luận về định vị bảo mật của mình.

Việc phát hành Claude Opus 4.7 cách đây không lâu. Mới tháng 2 này, Anthropic đã ra mắt Claude Opus 4.6. Công ty cho biết phiên bản mới vượt qua 4.6 trong một số tình huống chính, bao gồm các tiêu chuẩn toàn ngành như mã hóa tác nhân, lý luận phức tạp đa ngành, gọi công cụ quy mô lớn và vận hành máy tính tự động. Trong quá trình đào tạo Opus 4.7, Anthropic đã cố gắng "làm suy yếu các khả năng an ninh mạng một cách khác biệt", cố gắng tăng cường khả năng thực hiện nhiệm vụ chung đồng thời giảm có chọn lọc sức mạnh của mình trong việc tấn công và phòng thủ mạng có rủi ro cao.
Mặc dù vậy, Anthropic không có ý định cung cấp đầy đủ bản xem trước Claude Mythos cho công chúng. Công ty đã nhiều lần nhấn mạnh rằng mục tiêu hiện tại của họ là liên tục tích lũy kinh nghiệm thông qua các thử nghiệm quy mô nhỏ và khám phá các con đường triển khai các mô hình cấp Mythos trên quy mô lớn hơn trong tương lai. Đối với các chuyên gia bảo mật muốn sử dụng Claude Opus 4.7 để kiểm tra và bảo vệ an ninh mạng trong khuôn khổ tuân thủ pháp luật, Anthropic khuyến khích ứng dụng thông qua chương trình đánh giá chính thức để các công ty có thể đánh giá các trường hợp sử dụng trong môi trường giám sát nghiêm ngặt hơn.
Hiện tại, Claude Opus 4.7 đã được ra mắt trong nhiều sản phẩm Claude khác nhau của Anthropic. Nó cũng có thể được truy cập thông qua API và được cung cấp bên ngoài thông qua các nhà cung cấp dịch vụ đám mây như Microsoft, Google và Amazon. Về giá cả, Anthropic cho biết model mới sẽ tiếp tục sử dụng giá của Claude Opus 4.6 mà không tăng giá thêm, hy vọng hạ thấp ngưỡng cho các doanh nghiệp và nhà phát triển nâng cấp lên phiên bản mới.