OpenAI sẽ mở quyền truy cập vào DALL-E 3

OpenAI đang triển khai rộng rãi hơn trình tạo chuyển văn bản thành hình ảnh mới nhất của mình. Vào thứ Năm, công ty sẽ cung cấp mẫu DALL-E3 mới để sử dụng trong ứng dụng ChatGPT cho ChatGPTPlus và khách hàng doanh nghiệp. OpenAI cho biết họ đã chuẩn bị một giải pháp giảm thiểu bảo mật cho mô hình, cho phép nó mở rộng bản phát hành.

DALL-E3 được phát hành lần đầu tiên vào tháng trước và OpenAI đã cho thấy tính năng này được cải thiện như thế nào so với DALL-E2 trước đó bằng cách cho phép người dùng tận dụng ChatGPT để viết lời nhắc mô tả dài hơn, trực quan hơn cho trình tạo hình ảnh sử dụng. DALL-E3 đã được thêm vào Bing Chat và Bing Image Generator, biến nền tảng của Microsoft trở thành nền tảng đầu tiên cung cấp quyền truy cập mô hình rộng hơn cho công chúng -- ngay cả trước ChatGPT.

Các biện pháp bảo vệ được quảng cáo nhằm giảm hình ảnh có hại không phải lúc nào cũng có tác dụng và người dùng đã tạo ra hình ảnh về Trung tâm Thương mại Thế giới cho thấy SpongeBob và các nhân vật khác đang lái máy bay vào tòa nhà. Mặc dù Microsoft đã cố gắng chặn một số lời nhắc nhất định nhưng các cách giải quyết đơn giản khác cũng mang lại kết quả tương tự.

Các trình tạo văn bản thành hình ảnh như Midjourney, StableDiffusion và các phiên bản DALL-E trước đó đều gây ra tranh cãi. Công nghệ này đã xuất khẩu tài liệu hình ảnh có bản quyền, ảnh khỏa thân không có sự đồng thuận, chủ đề thay đổi chủng tộc và xuyên tạc hình ảnh chân thực về các nhân vật của công chúng.

OpenAI lần này hứa hẹn sẽ thực hiện các biện pháp rộng hơn và cung cấp một trang web để giới thiệu nghiên cứu do "DALL-E3" thực hiện. Công ty cho biết họ sẽ "hạn chế khả năng người mẫu tạo ra nội dung theo phong cách của các nghệ sĩ còn sống và hình ảnh của các nhân vật của công chúng, đồng thời cải thiện sự thể hiện nhân khẩu học của các hình ảnh được tạo ra." OpenAI cũng có một công cụ "phân loại xuất xứ" nội bộ, được cho là có độ chính xác 99% trong việc phát hiện xem hình ảnh có được tạo bởi DALL-E3 hay không.