Trợ lý AI mới của Meta sẽ được đào tạo về các bài đăng công khai trên Facebook và Instagram

Các giám đốc điều hành của MetaPlatforms nói với Reuters trong một cuộc phỏng vấn rằng công ty đã sử dụng các bài đăng công khai trên Facebook và Instagram để đào tạo một số tính năng của trợ lý ảo trí tuệ nhân tạo Meta mới, nhưng loại trừ các bài đăng riêng tư chỉ được chia sẻ với gia đình và bạn bè nhằm nỗ lực tôn trọng quyền riêng tư của người tiêu dùng.

Chủ tịch phụ trách các vấn đề toàn cầu của Meta, Nick Clegg, cho biết bên lề hội nghị Connect hàng năm của công ty trong tuần này rằng Meta cũng không sử dụng các cuộc trò chuyện riêng tư trên dịch vụ nhắn tin của mình làm dữ liệu đào tạo cho mô hình và đã thực hiện các bước để lọc các chi tiết riêng tư khỏi tập dữ liệu công khai được sử dụng để đào tạo.

"Chúng tôi đã cố gắng loại trừ các tập dữ liệu nơi thông tin cá nhân hiện diện quá nhiều", Clegg cho biết và nói thêm rằng "đại đa số" dữ liệu mà Meta sử dụng cho đào tạo đều được cung cấp công khai.

Ông lấy LinkedIn làm ví dụ và chỉ ra rằng do lo ngại về quyền riêng tư nên Meta cố tình không sử dụng nội dung của trang web.

Nhận xét của Clegg được đưa ra khi các công ty công nghệ bao gồm Meta, OpenAI và Google của Alphabet đã bị chỉ trích vì sử dụng thông tin thu thập được từ Internet để đào tạo các mô hình trí tuệ nhân tạo của họ mà không được phép.

Hai công ty đang cân nhắc cách xử lý tài liệu riêng tư hoặc có bản quyền mà hệ thống trí tuệ nhân tạo của họ có thể sao chép trong quá trình này, đồng thời phải đối mặt với các vụ kiện từ các tác giả cáo buộc họ vi phạm bản quyền.

CEO Mark Zuckerberg đã phát hành lô công cụ trí tuệ nhân tạo hướng tới người tiêu dùng đầu tiên của công ty tại hội nghị sản phẩm thường niên "Connect" của Meta vào thứ Tư, với MetaAI là sản phẩm quan trọng nhất. Hội nghị năm nay tập trung vào trí tuệ nhân tạo, không giống như các hội nghị trước đó tập trung vào thực tế tăng cường và thực tế ảo.

Meta cho biết trợ lý sử dụng mô hình tùy chỉnh dựa trên mô hình ngôn ngữ quy mô lớn Llama2 mạnh mẽ, được cung cấp cho mục đích thương mại vào tháng 7 năm nay, cũng như một mô hình mới có tên Emu, có thể tạo hình ảnh dựa trên lời nhắc văn bản.

Sản phẩm sẽ có thể tạo văn bản, âm thanh và hình ảnh, đồng thời có thể lấy thông tin theo thời gian thực thông qua hợp tác với công cụ tìm kiếm Bing của Microsoft. Các bài đăng công khai trên Facebook và Instagram được sử dụng để đào tạo MetaAI cũng bao gồm văn bản và ảnh.

Người phát ngôn của Meta nói với Reuters rằng các bài đăng được sử dụng để đào tạo chức năng tạo hình ảnh của Emu, trong khi chức năng trò chuyện dựa trên Llama2 và thêm một số bộ dữ liệu chú thích có sẵn công khai. Người phát ngôn cho biết

Tương tác với MetaAI cũng có thể được sử dụng để cải thiện các tính năng trong tương lai. Meta áp đặt các hạn chế bảo mật đối với những gì công cụ MetaAI có thể tạo ra, chẳng hạn như cấm tạo hình ảnh thực tế của các nhân vật của công chúng.

Về tài liệu có bản quyền, Clegg cho biết ông dự kiến sẽ có "số lượng vụ kiện tụng đáng kể" về việc liệu "nội dung sáng tạo có nằm trong học thuyết sử dụng hợp lý hiện có hay không", vốn cho phép sử dụng hạn chế các tác phẩm được bảo vệ cho các mục đích như bình luận, nghiên cứu và nhại lại.

Một số công ty có công cụ tạo hình ảnh giúp dễ dàng sao chép các nhân vật mang tính biểu tượng như Chuột Mickey, trong khi những công ty khác trả tiền cho cảnh quay hoặc cố tình tránh đưa cảnh quay đó vào dữ liệu đào tạo của họ.

Ví dụ: OpenAI đã ký hợp đồng 6 năm với nhà cung cấp nội dung Shutterstock vào mùa hè này để sử dụng thư viện hình ảnh, video và âm nhạc của công ty cho mục đích đào tạo.

Khi được hỏi liệu Meta có thực hiện bất kỳ bước nào như vậy để tránh sao chép hình ảnh có bản quyền hay không, người phát ngôn của Meta lưu ý rằng các điều khoản dịch vụ mới nghiêm cấm nội dung do người dùng tạo vi phạm quyền riêng tư và quyền sở hữu trí tuệ.