Các mô hình lớn AI nguồn mở hiện đang được các công ty công nghệ Trung Quốc thống trị. Những gã khổng lồ công nghệ Mỹ về cơ bản đã chuyển sang sử dụng nguồn đóng trong kỷ nguyên AI. Tuy nhiên, để ngăn chặn các công ty Trung Quốc chiếm lĩnh hoàn toàn thị trường, các đại gia Mỹ cũng sẽ đưa ra các mô hình lớn nguồn mở một cách tượng trưng. Gemma 4 của Google sẽ sớm được phát hành.

Tin tức về Gemma 4 sẽ được phát hành đã được lan truyền một thời gian. Hiện người sáng lập và Giám đốc điều hành GoogleDeepmind Demis Hassabis cũng đã tweet một gợi ý - Nội dung của anh ấy là 4 viên kim cương và tên của mẫu Gemma xuất phát từ đá quý Gemma trong tiếng Latin, vì vậy gợi ý này rất rõ ràng.


Mẫu Gemma 3 hiện tại đã được ra mắt vào tháng 3 năm ngoái. Nó dựa trên Gemini 2.0 của Google. Đã đúng một năm trôi qua và đã đến lúc Song Tử phải ra đi. 3.0 đã ra mắt được hơn nửa năm, thậm chí cả Gemini 3.1 cũng đã ra mắt. Sự chênh lệch thời gian này sẽ không ảnh hưởng đến việc tính phí và kiếm tiền theo mô hình nguồn đóng lớn của Google.

Điều đáng quan tâm nhất chính là khả năng của mẫu lớn Gemma 4. Gemma 3 hiện tại được coi là nhẹ, với kích thước thông số tối đa chỉ 27B. Nó có thể chạy trên một GPU thẻ đơn và cũng hỗ trợ các khả năng đa phương thức. Tất nhiên, khả năng của nó không thể so sánh với các mô hình lớn chính của Google, nhưng nó vẫn có danh tiếng tốt trong cộng đồng nguồn mở.

Gemma 4 Trước đây có tin đồn rằng ngoài mô hình tham số nhỏ trước đó, cũng sẽ bổ sung thêm một mô hình mới với tham số 120B, gấp 4 lần kích thước của thế hệ trước nhưng sẽ áp dụng kiến ​​trúc MoE và kích hoạt tham số 15B. có thể giảm bớt yêu cầu và vẫn có thể chạy cục bộ ngoại tuyến.


Hãy để Song Tử của chính Google phân tích dự đoán khả năng của Gemma 4. Những câu trả lời mà nó đưa ra rất hay và mạnh mẽ, thậm chí còn đưa ra cả khả năng suy nghĩ sâu sắc. Khả năng theo ngữ cảnh được tăng lên gấp 1-2 lần và nó có khả năng thực thi logic phức tạp.

Nhưng đừng mong đợi quá nhiều. Các công ty công nghệ của Mỹ như Google và Meta không có mức độ ưu tiên cao khi tạo ra các mô hình nguồn mở lớn và họ sẽ không để khả năng của mô hình nguồn mở ảnh hưởng đến tiền của chính họ. Nếu Gemma 4 có thể chạy cục bộ và ngoại tuyến, giới hạn trên về khả năng của nó sẽ không quá cao. Khó có thể so sánh với các mô hình mã nguồn mở lớn trong nước có cùng thông số.