8 ChatGPT Người sói giết người của Đại học Thanh Hoa. Âm mưu và ngụy trang đều có trong trò chơi này

Ngoài việc chơi trò chơi điện tử, Người sói “tạo vật xã hội” của con người cũng đã được AI học hỏi. Tám ChatGPT "ngồi" cùng nhau và đóng năm vai trò một cách sống động, giống hệt người thật. Thí nghiệm mô phỏng xã hội loài người mới nhất này được Đại học Thanh Hoa và Phòng thí nghiệm Zhongguancun cùng hoàn thành.

Từ thị trấn nhỏ Stanford đến Công ty trò chơi Thanh Hoa, việc sử dụng AI để mô phỏng xã hội loài người luôn là chủ đề nghiên cứu phổ biến trong cộng đồng học thuật.

Nếu Công ty trò chơi Tsinghua mô phỏng cảnh làm việc của các loài động vật sống theo xã hội thì giờ đây đời sống xã hội của các loài động vật sống trong xã hội trong thời gian rảnh rỗi cũng đã được AI mô phỏng.

Trong trò chơi giết người sói gồm 8 ChatGPT này, sự ngụy trang và tin tưởng, khả năng lãnh đạo và đối đầu trong thế giới thực đều được phản ánh một cách sống động.

Ngay cả khi không có sự giảng dạy của con người, AI vẫn khám phá ra nhiều kỹ năng trong trò chơi thông qua hoạt động khám phá của chính nó.

Tất cả điều này có thể đạt được thông qua lời nhắc thiết kế mà không cần phải điều chỉnh các thông số trong mô hình.

Vậy, những cảnh tượng tuyệt vời trong "Thế giới người sói" này là gì? Chúng ta hãy cùng nhau xem xét nó.

Kỹ năng chiến lược không cần phải dạy

Trước khi hiển thị đoạn hội thoại của 8 ChatGPT này, trước tiên hãy giải thích cấu hình của trò chơi: hai dân làng và hai người sói, mỗi người một người bảo vệ, một phù thủy và một nhà tiên tri, đồng thời còn có một vị thần.

Trong quá trình thử nghiệm, các nhà nghiên cứu phát hiện ra rằng ChatGPT đã sử dụng các chiến lược không được đề cập rõ ràng trong hướng dẫn và lời nhắc của trò chơi.

Này các bạn, các bạn có thể tự học mà không cần bất kỳ sự dạy dỗ nào.

Cụ thể, bảy cuộc trò chuyện ChatGPT này phản ánh sự tin tưởng, ngụy trang, đối đầu và khả năng lãnh đạo trong trò chơi của con người.

Trước hết hãy nói về sự tin tưởng.

Các nhà nghiên cứu định nghĩa người mới là những người tin rằng những người chơi khác có cùng mục tiêu với họ và cùng nhau hướng tới mục tiêu.

Các biểu hiện cụ thể bao gồm việc tích cực chia sẻ những thông tin bất lợi cho bản thân hoặc hợp lực với những người chơi khác để buộc tội ai đó là kẻ thù địch.

Các nhà nghiên cứu đã quan sát quá trình các mối quan hệ tin cậy thay đổi theo thời gian trong trò chơi.

Trong hình bên dưới, vòng tròn màu vàng biểu thị rằng người chơi được đánh số bên trái tin tưởng người chơi được đánh số ở trên và vòng tròn chấm tượng trưng cho sự biến mất của mối quan hệ tin cậy.

Hãy xem xét sự đối đầu, tức là các hành động được thực hiện chống lại phe đối lập, chẳng hạn như người sói tấn công người khác vào ban đêm hoặc buộc tội người khác là người sói vào ban ngày.

Một ngày trong trò chơi, người chơi số 1 (người sói) kêu gọi trục xuất dân làng số 5 nhưng bị người chơi số 3 (người bảo vệ) từ chối.

Thấy âm mưu không thành, sói quyết định trực tiếp giết chết Số 5 ngay trong đêm. Kết quả là lính canh số 3 đã chọn cách bảo vệ dân làng.

Từ đó, chúng ta có thể thấy rằng những ChatGPT này sẽ không mù quáng làm theo những gì người chơi khác làm mà sẽ đưa ra những đánh giá độc lập dựa trên thông tin hiện có.

Ngoài hợp tác và đối đầu, ngụy trang cũng là một kỹ năng thiết yếu trong trò chơi Người sói và là chìa khóa dẫn đến chiến thắng.

Ví dụ, một ngày sau đêm Giáng sinh, Người sói số 1 giả vờ vô tội.

Ngoài việc giả vờ làm người tốt, việc ngụy trang còn có thể dùng để nhận ra những suy nghĩ nhỏ nhặt của người chơi. Ví dụ, chúng ta hãy nhìn vào bài phát biểu của nhà tiên tri.

Nhà tiên tri nói rằng ông nhìn thấy người sói nói chuyện, nhưng thực tế người sói không nói chuyện vào ban đêm.

Tác giả cho biết sau khi đánh giá thì hiện tượng này không phải là ảo giác của ChatGPT mà là cố ý.

Cuối cùng, hãy nói về khả năng lãnh đạo.

Mặc dù không có nhân vật cạnh tranh trong môi trường do nhóm nghiên cứu thiết kế nhưng người chơi vẫn có thể giành quyền kiểm soát quá trình trò chơi.

Ví dụ, hai con sói số 1 và số 4 cố gắng thiết lập nhịp độ và để những người chơi khác làm theo ý mình.

Có lẽ là để tạo cơ hội bằng cách gây bất ngờ.

Có vẻ như những ChatGPT này thực sự đang hoạt động tốt.

Vậy nhóm nghiên cứu đã huấn luyện những ChatGPT này có thể chơi Người sói như thế nào?

Hãy để ChatGPT tổng kết kinh nghiệm của mình

Nhóm nghiên cứu có 4 điểm chính trong việc cải thiện hiệu suất của người chơi ChatGPT, đó là thông tin có giá trị V, câu hỏi chọn Q, cơ chế phản ánh R và lý luận tư duy chuỗi C.

Kết quả thử nghiệm Ablation cho thấy cặp Q và C có tác động lớn nhất đến tính hợp lý trong lời nói của người chơi (do con người đánh giá).

Lời nhắc cũng được thiết kế dựa trên điều này. Tất nhiên, luật chơi phải được giới thiệu trước đó, và cuối cùng cấu trúc này được hình thành:

Giới thiệu về luật chơi và thiết lập vai trò bản ghi trò chuyện, có giá trị Suy ngẫm về thông tin và kinh nghiệm Con người đưa ra gợi ý ChatGPT dựa trên kinh nghiệm Lời khuyên về chuỗi suy nghĩ

Nó Từ đây không khó nhận thấy rằng việc thu thập thông tin lịch sử và đúc kết kinh nghiệm từ đó là một mắt xích quan trọng, vậy những kinh nghiệm này nên tóm tắt như thế nào?

Vào cuối mỗi vòng trò chơi, các câu trả lời, phản ánh và điểm số của tất cả người chơi sẽ được tất cả những người tham gia thu thập, với điểm số được xác định bằng thắng và thua.

Trong một vòng mới của trò chơi, người chơi truy xuất những trải nghiệm liên quan và trích xuất các đề xuất dựa trên hình ảnh phản chiếu của nhân vật hiện tại.

Cụ thể, dựa trên đánh giá về trải nghiệm, mô hình lớn sẽ so sánh sự khác biệt và xác định những trải nghiệm tốt để suy luận tiếp theo.

Điều này cho phép ChatGPT học các kỹ năng chơi trò chơi mà không cần điều chỉnh thông số.

Tuy nhiên, kinh nghiệm rất quan trọng nhưng quá nhiều cũng không hẳn là điều tốt.

Các nhà nghiên cứu nhận thấy rằng khi lượng kinh nghiệm quá lớn, tỷ lệ chiến thắng của phe không phải sói thực sự giảm xuống và thời lượng trò chơi (số ngày) cũng bị rút ngắn lại.

Tôi tự hỏi kết quả sẽ ra sao nếu chúng ta để những ChatGPT này cạnh tranh với người thật?

Địa chỉ trên giấy: https://arxiv.org/abs/2309.04658