Meta công nghệ hình mờ hình ảnh AI mới mã nguồn mở, nhưng nó có thực sự đáng tin cậy không?

Việc tạo hình ảnh dựa trên AI đang bùng nổ và vì lý do chính đáng: nó thú vị và dễ sử dụng. Mặc dù những mô hình này mang đến những khả năng sáng tạo mới nhưng chúng có thể gây lo ngại về khả năng bị lạm dụng bởi những kẻ xấu cố tình tạo ra hình ảnh để đánh lừa mọi người. Ngay cả những hình ảnh được tạo ra để giải trí cũng có thể lan truyền và có khả năng gây hiểu lầm cho mọi người.

Ví dụ, đầu năm nay, hình ảnh Giáo hoàng Francis mặc chiếc áo khoác phồng màu trắng lộng lẫy đã lan truyền rộng rãi và những bức ảnh Trump bị bắt đã làm dấy lên cuộc tranh luận sôi nổi. Những hình ảnh này không phải là ảnh thật nhưng nhiều người đã bị lừa vì không có dấu hiệu rõ ràng nào để phân biệt liệu nội dung đó có phải do Generative AI tạo ra hay không.

Các nhà nghiên cứu của Meta gần đây đã phát hành một tài liệu nghiên cứu mới và mã kỹ thuật trình bày chi tiết về kỹ thuật thêm hình mờ vô hình vào hình ảnh AI để phân biệt thời điểm hình ảnh được tạo bởi các mô hình AI tạo nguồn mở. Hình mờ vô hình kết hợp thông tin vào nội dung số. Những hình mờ này không thể nhìn thấy bằng mắt thường nhưng có thể được phát hiện bằng thuật toán - ngay cả khi người ta chỉnh sửa lại hình ảnh. Mặc dù có các hướng nghiên cứu khác xung quanh hình mờ, nhưng nhiều phương pháp hiện có tạo hình mờ sau khi tạo hình ảnh AI.

Theo EverypixelJournal, người dùng đã tạo hơn 11 tỷ hình ảnh bằng cách sử dụng các mô hình từ ba kho lưu trữ nguồn mở. Trong trường hợp này, hình mờ vô hình có thể được loại bỏ bằng cách xóa dòng tạo ra hình mờ. StableSignature đề xuất một cách để tránh loại bỏ hình mờ.

TA GPH6101

TAG PH66Cách thức hoạt động của phương thức StableSignature

Địa chỉ giấy tờ:

https://ar xiv.org/abs/2303.15435

Địa chỉ Github:

https://github.com/facebookre search/stable_signature

StableSignature loại bỏ khả năng xóa hình mờ bằng cách root nó trong mô hình và sử dụng hình mờ có thể truy nguyên được nơi hình ảnh được tạo.

Hãy cùng xem quá trình này hoạt động như thế nào qua sơ đồ bên dưới.

Alice đã đào tạo một mô hình sáng tạo bậc thầy. Trước khi phân phối, cô tinh chỉnh một phần nhỏ của mô hình (được gọi là bộ giải mã) để tạo hình mờ cho Bob. Hình mờ có thể xác định phiên bản mô hình, công ty, người dùng, v.v.

Bob nhận được phiên bản mô hình của mình và tạo ra hình ảnh. Hình ảnh thu được sẽ có hình mờ của Bob trên đó. Alice hoặc bên thứ ba có thể phân tích chúng để xem liệu hình ảnh có phải do Bob tạo ra bằng mô hình AI tổng hợp hay không.

Điều này đạt được qua hai bước:

1. Cùng đào tạo hai mạng lưới thần kinh tích chập. Một mã hóa hình ảnh và tin nhắn ngẫu nhiên thành hình ảnh có hình mờ và cái còn lại trích xuất thông báo từ phiên bản nâng cao của hình ảnh có hình mờ. Mục đích là làm cho các tin nhắn được mã hóa và trích xuất khớp nhau. Sau khi đào tạo, chỉ có trình trích xuất hình mờ được giữ lại.

2. Tinh chỉnh bộ giải mã tiềm ẩn của mô hình tổng quát để tạo ra hình ảnh chứa chữ ký cố định. Trong quá trình tinh chỉnh này, hàng loạt hình ảnh được mã hóa, giải mã và tối ưu hóa để giảm thiểu sự khác biệt giữa thông điệp được trích xuất và thông điệp đích, đồng thời duy trì chất lượng hình ảnh được cảm nhận. Quá trình tối ưu hóa này diễn ra nhanh chóng và hiệu quả, chỉ cần thực hiện các đợt nhỏ và thời gian ngắn để đạt được kết quả chất lượng cao.

Đánh giá hiệu suất của StableSignature

Chúng tôi biết mọi người thích chia sẻ và đăng lại hình ảnh. Điều gì xảy ra nếu Bob chia sẻ hình ảnh anh ấy đã tạo với 10 người bạn và sau đó mỗi người bạn chia sẻ hình ảnh đó với 10 người bạn khác? Trong thời gian này, ai đó có thể đã thực hiện các thay đổi đối với hình ảnh, chẳng hạn như cắt, nén hoặc thay đổi màu sắc. Các nhà nghiên cứu đã xây dựng StableSignature để đối phó với những thay đổi này. Bất kể người ta biến đổi hình ảnh như thế nào, hình mờ ban đầu có thể vẫn còn trong dữ liệu số và có thể được truy ngược về mô hình tổng quát đã tạo ra nó.

Các nhà nghiên cứu đã tìm thấy hai ưu điểm chính của StableSignature so với các phương pháp phát hiện thụ động:

Đầu tiên, nó có thể kiểm soát và giảm việc tạo ra kết quả dương tính giả , xảy ra khi hình ảnh do con người tạo ra bị nhầm lẫn với hình ảnh do AI tạo ra. Điều này rất quan trọng vì sự phổ biến của các hình ảnh không do AI tạo ra được chia sẻ trực tuyến. Ví dụ: các phương pháp phát hiện hiệu quả nhất hiện có có thể phát hiện khoảng 50% hình ảnh được tạo đã chỉnh sửa nhưng vẫn tạo ra tỷ lệ dương tính giả khoảng 1/100. Nói cách khác, trên nền tảng nội dung do người dùng tạo nhận được 1 tỷ hình ảnh mỗi ngày, khoảng 10 triệu hình ảnh sẽ bị gắn nhãn sai, dẫn đến chỉ một nửa số hình ảnh do AI tạo ra được phát hiện.

StableSignature, mặt khác, phát hiện các hình ảnh có độ chính xác tương tự với tỷ lệ dương tính giả là 1e-10 (có thể được đặt thành giá trị mong muốn cụ thể). Ngoài ra, phương pháp tạo hình mờ này cho phép theo dõi hình ảnh của các phiên bản khác nhau của cùng một kiểu máy—một khả năng không thể thực hiện được bằng các kỹ thuật thụ động.

1Nếu mô hình lớn đã được tinh chỉnh thì thực hiện như thế nào

StableSignature phát hiện hình ảnh do phiên bản tinh chỉnh tạo ra?

Một cách tiếp cận phổ biến đối với các mô hình AI lớn là lấy một mô hình cơ sở và tinh chỉnh nó để xử lý một trường hợp sử dụng cụ thể, thậm chí đôi khi được điều chỉnh cho phù hợp với một người. Ví dụ: mô hình có thể được hiển thị hình ảnh con chó của Alice và sau đó Alice có thể yêu cầu mô hình tạo ra hình ảnh con chó của cô ấy ở bãi biển. Điều này được thực hiện thông qua các phương pháp như DreamBooth, TextualInversion và ControlNet. Các phương thức này hoạt động ở cấp mô hình cơ bản và không thay đổi bộ giải mã. Điều này có nghĩa là phương pháp tạo hình chìm mờ của chúng tôi không bị ảnh hưởng bởi những tinh chỉnh này.

Nhìn chung, StableSignature hoạt động tốt với mô hình hóa hình ảnh lượng tử hóa vectơ (chẳng hạn như VQGAN) và các mô hình khuếch tán tiềm ẩn (chẳng hạn như StableDiffusion). Vì cách tiếp cận này không làm thay đổi quá trình tạo khuếch tán nên nó tương thích với các mô hình phổ biến được đề cập ở trên. Với một số điều chỉnh, chữ ký ổn định cũng có thể được áp dụng cho các phương pháp lập mô hình khác.

Hình mờ AI có thực sự đáng tin cậy không?

Công nghệ xác định hình ảnh do AI tạo ra bằng cách thêm hình mờ vô hình đã gây ra rất nhiều tranh cãi gần đây. Google DeepMind gần đây đã công bố ra mắt SynthID, một công cụ để thêm hình mờ vào quá trình tạo hình ảnh và xác định hình ảnh do AI tạo ra. Bằng cách quét hình mờ kỹ thuật số trong hình ảnh, SynthID có thể đánh giá khả năng hình ảnh đó được tạo bởi mô hình Imagen.

Nhưng hình mờ AI có thể dễ dàng xóa được không? Theo báo cáo của các phương tiện truyền thông nước ngoài như Engadget và Wired, một nhóm nghiên cứu tại Đại học Maryland ở Hoa Kỳ đã nghiên cứu độ tin cậy của công nghệ "hình mờ kỹ thuật số" đối với nội dung do AI tạo ra và nhận thấy rằng công nghệ này có thể dễ dàng bị bẻ khóa.

Soheil Feizi, giáo sư khoa học máy tính tại trường, đã thẳng thừng khi đối mặt với tình trạng hình mờ hiện tại trong các hình ảnh do AI tạo ra: "Hiện tại chúng tôi không có bất kỳ công nghệ hình mờ đáng tin cậy nào. Tất cả các hình mờ đều bị bẻ khóa." việc thêm “hình mờ giả” vào hình ảnh không do AI tạo ra sẽ dễ dàng hơn. Đồng thời, nhóm cũng phát triển công nghệ hình mờ “gần như không thể” xóa khỏi hình ảnh mà không ảnh hưởng hoàn toàn đến quyền sở hữu trí tuệ của hình ảnh.

Hình mờ AI vẫn chưa trưởng thành và không thể là công cụ hiệu quả 100%. Chúng ta cần mong đợi sự xuất hiện của các công nghệ mới trong tương lai để bảo vệ hình ảnh AI tổng hợp, tránh sự phổ biến của hình ảnh sai lệch và tránh vi phạm bản quyền.