Google đã thông báo vào thứ Ba rằng ứng dụng Google Maps sẽ ra mắt một tính năng mới: khi người dùng muốn chia sẻ ảnh hoặc video về một địa điểm, hệ thống sẽ sử dụng Gemini để tạo chú thích. Quy trình hoạt động cụ thể là trước tiên người dùng lọc ra ảnh hoặc video họ muốn tải lên và Gemini sẽ tự động phân tích nội dung của màn hình và tạo mô tả văn bản để người dùng xác nhận, sửa đổi hoặc trực tiếp áp dụng.

Google cho biết tính năng này chủ yếu là để "giúp người dùng có khởi đầu khi chia sẻ nội dung", chứ không phải thay thế hoàn toàn mô tả của con người, để người dùng có thể tự chỉnh sửa hoặc xóa mô tả do AI tạo ra.
Hiện tại, chức năng mô tả hình ảnh này đã được ra mắt ở một số khu vực: nó được hỗ trợ trong môi trường tiếng Anh và được sử dụng trong phiên bản iOS của Google Maps tại thị trường Hoa Kỳ. Nó sẽ dần dần được mở rộng ra phạm vi toàn cầu và hệ thống Android trong tương lai. Đồng thời, Google cũng đang tối ưu hóa thiết kế bài đăng để đóng góp nội dung. Khi người dùng bật "Quyền truy cập phương tiện" trong cài đặt điện thoại, tab "Đóng góp" của Google Maps sẽ hiển thị trực tiếp các ảnh và video ngắn được chụp gần đây, giúp người dùng dễ dàng chọn và xuất bản chúng chỉ bằng một cú nhấp chuột. Google giải thích rằng ảnh và video do người dùng tải lên có thể giúp người khác hiểu rõ hơn về "cảm giác chung" của một địa điểm hoặc những gì đang diễn ra với thực đơn của địa điểm đó và giờ đây, nội dung đó dễ dàng tìm thấy và chia sẻ hơn.
Để khuyến khích người dùng tiếp tục tham gia xây dựng nội dung cộng đồng, Google cũng đã bổ sung số liệu thống kê về kết quả đóng góp trong tab "Đóng góp": người dùng có thể xem tổng số điểm đóng góp mà họ đã kiếm được, từ đó hiểu rõ hơn về tác động lâu dài của nội dung của họ trên nền tảng. Ở cấp độ chiến lược tổng thể, việc tự động tạo mô tả cho ảnh chỉ là một phần trong "lớp dịch vụ AI" của Google được xây dựng xung quanh Gemini vào năm 2026. Trước đây, Google đã tích hợp sâu Gemini vào các kịch bản cốt lõi như giọng nói đàm thoại và điều hướng sống động trong Maps, giúp giảm hơn nữa chi phí nhận thức và vận hành của người dùng khi tìm kiếm và lập kế hoạch hành trình.