Một nghiên cứu gần đây được công bố trên tạp chí Scientific Reports cho thấy rằng các chatbot trí tuệ nhân tạo mô hình ngôn ngữ lớn (LLM) có thể vượt trội hơn con người bình thường trong các nhiệm vụ sáng tạo, chẳng hạn như động não các cách sử dụng thay thế cho các vật dụng thông thường—phản ánh tư duy khác biệt. Tuy nhiên, những cá nhân đạt điểm cao nhất trong các nhiệm vụ này vẫn vượt xa kết quả của các chatbot hoạt động tốt nhất.
Tư duy khác biệt là một quá trình tư duy thường gắn liền với sự sáng tạo, trong đó nhấn mạnh đến việc tạo ra nhiều ý tưởng hoặc giải pháp khác nhau cho một nhiệm vụ cụ thể.
Nó thường được đánh giá thông qua Nhiệm vụ sử dụng thay thế (AUT), trong đó người tham gia được yêu cầu đưa ra càng nhiều cách sử dụng thay thế cho các đồ vật hàng ngày càng tốt trong một khoảng thời gian ngắn. Các câu trả lời được chia thành bốn loại khác nhau: trôi chảy, linh hoạt, độc đáo và tỉ mỉ.
Mika Koivisto và Simone Grassini đã so sánh phản hồi của 256 người tham gia là con người với phản hồi của ba chatbot AI (ChatGPT3, ChatGPT4 và Copy.Ai) với AUT của bốn vật thể (một sợi dây, một cái hộp, một cây bút chì và một ngọn nến). Các tác giả đánh giá tính độc đáo của các câu trả lời bằng cách đánh giá khoảng cách ngữ nghĩa (mức độ liên quan chặt chẽ của câu trả lời với mục đích sử dụng ban đầu của đối tượng) và tính sáng tạo.
sử dụng các phương pháp tính toán để định lượng khoảng cách ngữ nghĩa theo thang điểm từ 0 đến 2, trong khi những người đánh giá là con người, mù quáng không biết người khởi xướng phản hồi, đánh giá một cách chủ quan tính sáng tạo theo thang điểm từ 1 đến 5. Trung bình, chatbot tạo ra các phản hồi đạt điểm cao hơn đáng kể so với phản hồi của con người về khoảng cách ngữ nghĩa (0,95 so với 0,95). 0,91) và tính sáng tạo (2,91 so với 2,47).
Phản hồi của con người có phạm vi rộng hơn trên cả hai chỉ số—điểm thấp nhất thấp hơn nhiều so với phản hồi của AI, nhưng điểm cao nhất thường cao hơn. Phản hồi tốt nhất của con người vượt trội hơn phản hồi tốt nhất của từng chatbot ở bảy trong số tám hạng mục xếp hạng.
Những phát hiện này cho thấy rằng các chatbot AI hiện có thể tạo ra ý tưởng ít nhất ngang bằng con người bình thường. Tuy nhiên, các tác giả lưu ý rằng họ chỉ xem xét hiệu suất của một nhiệm vụ duy nhất liên quan đến việc đánh giá tính sáng tạo. Các tác giả gợi ý rằng nghiên cứu trong tương lai có thể khám phá cách tích hợp trí tuệ nhân tạo vào quá trình sáng tạo để cải thiện hiệu suất của con người.