Công ty trí tuệ nhân tạo Anthropic hôm thứ Ba đã tung ra phiên bản xem trước của "mô hình tiên tiến" Mythos thế hệ tiếp theo. Mô hình này, được mô tả nội bộ là "mạnh nhất", trước tiên sẽ được bàn giao cho một nhóm nhỏ các tổ chức đối tác để thực hiện các nhiệm vụ liên quan đến an ninh mạng thông qua chương trình bảo mật có tên "Dự án Glasswing".

Theo tiết lộ của công ty, Mythos là một mô hình lớn có mục đích chung trong hệ thống Claude, với khả năng lập trình và suy luận cấp độ “đại lý” mạnh mẽ. Nó không được đào tạo đặc biệt cho bộ phận an ninh mạng, nhưng công dụng chính hiện tại của nó trong bản xem trước là quét các lỗ hổng mã trong hệ thống phần mềm nguồn mở và bên thứ nhất.

Trong vài tuần qua, Anthropic tuyên bố rằng Mythos đã phát hiện ra "hàng nghìn lỗ hổng zero-day, trong đó có nhiều lỗ hổng có mức độ rủi ro cao". Nhiều lỗ hổng thậm chí có thể được truy nguyên từ mã cũ hơn từ một đến hai mươi năm trước. Sự phơi bày này nêu bật tiềm năng của các mô hình lớn trong việc khai thác "các lỗ hổng lịch sử" chưa được phát hiện trong một thời gian dài và cũng gây ra mối lo ngại rộng rãi trong ngành về các mối đe dọa mà các công cụ đó sẽ mang lại nếu bị kiểm soát bởi những kẻ tấn công. Để kiểm soát rủi ro, Anthropic nói rõ rằng phiên bản xem trước này sẽ không được mở cho người dùng thông thường hoặc công chúng và chỉ có thể được sử dụng bởi các đối tác đã ký hợp đồng cho các nhiệm vụ bảo mật cụ thể.

Hàng chục tổ chức hiện đang tham gia thử nghiệm Mythos bao gồm Amazon, Apple, Broadcom, Cisco, CrowdStrike, Linux Foundation, Microsoft và Palo Alto Networks. Họ được đưa vào Project Glasswing, cùng sử dụng mô hình cho "công tác phòng thủ an ninh" và hứa hẹn sẽ chia sẻ kinh nghiệm sử dụng sau khi dự án kết thúc để giúp toàn ngành công nghệ nâng cao mức độ bảo mật. Anthropic cũng cho biết họ đã tham gia vào "các cuộc thảo luận đang diễn ra" với các quan chức liên bang Hoa Kỳ để khám phá ứng dụng tiềm năng của Mythos trong các hệ thống quan trọng của quốc gia, một cuộc thảo luận tương tự với tranh chấp pháp lý hiện tại của Anthropic với Bộ Quốc phòng Hoa Kỳ, nơi đã chỉ định Anthropic là "thực thể rủi ro chuỗi cung ứng" vì phòng thí nghiệm AI từ chối cho phép sử dụng công nghệ của mình cho các cuộc tấn công tự động hoặc giám sát công dân Hoa Kỳ.

Sự "vô tình bị lộ" của Mythos ban đầu bắt nguồn từ một sự cố bảo mật dữ liệu vào tháng trước. Tạp chí Fortune tiết lộ rằng bản nháp blog của Anthropic chưa được phát hành chính thức (có tên mã là "Capybara") đã bị lưu nhầm trong một hồ dữ liệu có thể truy cập công khai. Nó được các nhà nghiên cứu bảo mật phát hiện và lan truyền nhanh chóng. Trong bản dự thảo đó, chính Anthropic đã viết rằng Capybara là một lớp mô hình mới lớn hơn và thông minh hơn so với dòng Opus mạnh nhất trước đó và là "mô hình AI mạnh nhất cho đến nay", đồng thời cảnh báo rằng nếu mô hình này bị khai thác độc hại, các lỗ hổng có thể được phát hiện và khai thác nhanh hơn nhiều so với tốc độ mà những người bảo vệ có thể vá chúng, mở ra một làn sóng khai thác mới do AI điều khiển. Anthropic sau đó cho rằng vụ rò rỉ là do "lỗi của con người" và ngay lập tức chặn quyền truy cập của công chúng vào nó.