Google mới đây đã âm thầm ra mắt một ứng dụng mới trên iOS mang tên "Google AI Edge Eloquent". Đây là công cụ đọc chính tả bằng giọng nói "ngoại tuyến đầu tiên" sử dụng loạt mô hình Gemma để hoàn thành nhận dạng giọng nói cục bộ, hỗ trợ phiên âm theo thời gian thực và tự động xóa các phần dư thừa và mô thức, đồng thời sắp xếp lời nói thành văn bản giống ngôn ngữ viết trang trọng hơn. Ứng dụng

hoàn toàn miễn phí, không có phí đăng ký và không có giới hạn trên về số lần hoặc thời lượng sử dụng. Nó được định vị là một công cụ năng suất dành cho người dùng thông thường và là một "dự án kiểu mẫu" để Google thể hiện khả năng Gemma trên thiết bị của mình.

Trong thực tế sử dụng, người dùng tải xuống và cài đặt dựa trên Gemma Sau khi cài đặt mô hình nhận dạng giọng nói, bạn có thể đọc chính tả ngoại tuyến và giao diện sẽ hiển thị dạng sóng giọng nói và phụ đề thời gian thực; sau khi tạm dừng ghi âm, ứng dụng sẽ tự động xóa các từ được nói như "ừm", "ah" và trau chuốt câu nói. Sau khi phiên âm xong, người dùng có thể chuyển đổi nội dung thành các kiểu văn bản khác nhau như “dấu đầu dòng”, “trang trọng”, “ngắn gọn” và “chi tiết” chỉ bằng một cú nhấp chuột. Nếu họ cần khả năng đánh bóng mạnh mẽ hơn, họ cũng có thể bật chế độ đám mây tùy chọn và mô hình Gemini sẽ đánh bóng văn bản thêm.

Quyền riêng tư và cá nhân hóa là một trọng tâm khác của ứng dụng này: ở chế độ "hoàn toàn ngoại tuyến", tất cả âm thanh chỉ được xử lý cục bộ và sẽ không được tải lên máy chủ; khi bật tính năng nâng cao trên đám mây, tính năng nhận dạng giọng nói vẫn được thực hiện cục bộ trước tiên và chỉ quá trình xóa văn bản tiếp theo mới được hoàn tất trên đám mây. Người dùng có thể thêm tên, thuật ngữ và biệt ngữ phổ biến vào tính năng Từ điển tích hợp sẵn hoặc chọn nhập các từ có tần suất cao từ các tin nhắn Gmail đã gửi gần đây của họ để cải thiện tỷ lệ nhận dạng.

Hiện tại, Google AI Edge Eloquent có sẵn trên Apple App Store nhưng chỉ có trên nền tảng iOS; mô tả ứng dụng đề cập đến "tích hợp Android liền mạch" nhiều lần và có thể được sử dụng làm lớp nhập bàn phím và nút nổi ở cấp hệ thống. Người ta thường tin rằng phiên bản Android đang được triển khai nhưng Google vẫn chưa chính thức công bố thời gian biểu. Nhiều phương tiện truyền thông nước ngoài chỉ ra rằng ứng dụng này cạnh tranh trực tiếp với các công cụ đọc chính tả AI thế hệ mới như Wispr Flow, SuperWhisper, Willow, đồng thời củng cố hơn nữa sự hiện diện của Google trong chiến lược "local AI (AI Edge)".