Mô hình Mythos được cho là đã bị người dùng trái phép truy cập. Anthropic từng nói rằng công nghệ của họ cực kỳ mạnh mẽ

Theo một người quen thuộc với vấn đề và các tài liệu được giới truyền thông xem xét, một số ít người dùng trái phép đã có được quyền truy cập vào mô hình Mythos AI thế hệ mới của Anthropic PBC. Anthropic cho biết công nghệ của mô hình này cực kỳ mạnh mẽ và thậm chí có thể được sử dụng để phát động các cuộc tấn công mạng nguy hiểm.

Cùng ngày Anthropic lần đầu tiên công bố kế hoạch mở mô hình Mythos cho một số công ty để thử nghiệm, một số người dùng trong một diễn đàn trực tuyến riêng tư đã truy cập được Mythos, những người yêu cầu giấu tên vì sợ bị trả thù cho biết. Nhóm này đã sử dụng Mythos thường xuyên nhưng không nhằm mục đích an ninh mạng, những người quen thuộc với vấn đề này cho biết. Những người quen thuộc với vấn đề này cũng đã xác nhận tuyên bố trên với giới truyền thông thông qua ảnh chụp màn hình và trình diễn mô hình trực tiếp.

Anthropic trước đây đã nói rằng Mythos có thể xác định và khai thác "các lỗ hổng trong tất cả các hệ điều hành chính và tất cả các trình duyệt web chính" theo lệnh của người dùng. Vì lý do này, công ty đã đảm bảo rằng công nghệ này chỉ được cung cấp cho một số nhà cung cấp phần mềm thông qua chương trình có tên "Dự án Glassswing" để giúp các công ty này kiểm tra và củng cố hệ thống của họ nhằm ngăn chặn rủi ro tấn công mạng tiềm ẩn.

Việc truy cập trái phép chưa được tiết lộ trước đây nêu bật những thách thức mà Anthropic phải đối mặt trong việc ngăn chặn hoàn toàn công nghệ mạnh nhất và có khả năng nguy hiểm nhất của mình lan rộng ra ngoài các đối tác được ủy quyền. Vụ việc cũng đặt ra nhiều câu hỏi hơn về việc liệu người khác có đang sử dụng Mythos mà không được phép hay không và mục đích của họ là gì.

Những người dùng đó đã có quyền truy cập vào Mythos thông qua nhiều chiến thuật khác nhau, bao gồm tận dụng một trong các đặc quyền của họ với tư cách là nhân viên của nhà thầu bên thứ ba của Anthropic và sử dụng các công cụ tìm kiếm thông tin Internet thường được các nhà nghiên cứu an ninh mạng sử dụng, những người quen thuộc với vấn đề này cho biết. Nhóm này hoạt động trên kênh Discord riêng, chuyên thu thập thông tin về các mẫu chưa được phát hành và sử dụng bot để thu thập thông tin chi tiết liên quan do Anthropic và các tổ chức khác phát hành trên các trang web không được bảo vệ như GitHub.

Người phát ngôn của Anthropic cho biết trong một tuyên bố: "Chúng tôi đang điều tra các báo cáo rằng ai đó đã có quyền truy cập trái phép vào phiên bản xem trước của Claude Mythos thông qua một trong các môi trường nhà cung cấp bên thứ ba của chúng tôi." Công ty nói thêm rằng hiện tại không có bằng chứng nào cho thấy hành vi truy cập được đề cập trong báo cáo của Bloomberg vượt ra ngoài môi trường của nhà cung cấp bên thứ ba hoặc ảnh hưởng đến hệ thống của chính Anthropic.