Google gần đây đã tung ra bản nâng cấp lớn cho chatbot Gemini của mình: sau khi người dùng đặt câu hỏi, hệ thống không chỉ có thể trả lời bằng văn bản mà còn có thể trực tiếp tạo ra các mô hình 3D tương tác và cảnh mô phỏng vật lý. Điều này có nghĩa là khi người dùng muốn “nhìn thấy một vấn đề”, giờ đây Gemini có thể làm như vậy thông qua hình ảnh trực quan 3D có thể xoay, có thể mở rộng với khả năng kiểm soát tham số.

Theo Google, sau khi kích hoạt các tính năng mới, Gemini sẽ cung cấp nhiều phương thức tương tác cùng lúc khi tạo mô hình hoặc mô phỏng 3D. Người dùng không chỉ có thể kéo để xoay mô hình và phóng to chi tiết mà còn có thể điều chỉnh thủ công các biến thông qua thanh trượt hoặc nhập các giá trị khác nhau để quan sát những thay đổi trong thời gian thực. Đối với các câu hỏi liên quan đến các quá trình vật lý hoặc các khái niệm trừu tượng, kiểu trực quan hóa tương tác này được kỳ vọng sẽ trở thành một dạng câu trả lời mới.

Trong trải nghiệm thực tế, phóng viên đã sử dụng "tạo mô phỏng mặt trăng quay quanh trái đất" làm ví dụ để thử nghiệm. Sau đó, Gemini tạo ra cảnh ba chiều trực quan: người dùng có thể điều chỉnh tốc độ quay của mặt trăng bằng thanh trượt, ẩn hoặc hiển thị các đường quỹ đạo biểu thị quỹ đạo bằng công tắc và tạm dừng hoặc tiếp tục trình diễn bằng các nút. Đồng thời, người dùng cũng có thể phóng to và xoay toàn bộ bộ mô hình 3D để quan sát quá trình chuyển động từ nhiều góc độ khác nhau.

Trước đó, Gemini đã hỗ trợ tạo hình ảnh phẳng tương tác dựa trên lời nhắc của người dùng nhưng vẫn bị giới hạn ở tương tác ở cấp độ hình ảnh. Bản nâng cấp này mở rộng khả năng cho các mô hình 3D và mô phỏng động, làm phong phú hơn nữa các phương tiện để hiểu và trình bày các khái niệm phức tạp được hỗ trợ bởi AI. Bản cập nhật này cũng xuất hiện trong bối cảnh cạnh tranh giữa các nhà cung cấp mô hình lớn về “câu trả lời trực quan”: Cách đây không lâu, Anthropic đã giới thiệu khả năng tự động tạo biểu đồ, sơ đồ và các hình ảnh trực quan tương tác khác cho Claude, trong khi OpenAI cũng bổ sung các công cụ trực quan hóa cho các khái niệm toán học và khoa học vào ChatGPT.

Hiện tại, tất cả người dùng ứng dụng Gemini có thể trải nghiệm tính năng mới này bằng cách chọn mẫu “Pro”. Cách thực hiện là: chuyển mô hình sang Pro trong ứng dụng, sau đó đưa ra các yêu cầu tới Gemini như "Hiển thị hệ thống con lắc đôi" và "Giúp tôi hình dung hiệu ứng Doppler." Sau khi Gemini trả về mô tả văn bản, nút "Cho tôi xem trực quan" sẽ xuất hiện ở cuối giao diện. Nhấp vào nó để tạo mô hình 3D hoặc cảnh mô phỏng tương ứng.