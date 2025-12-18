Ngày 18/12, đại diện Google, bà Tulsee Doshi - Giám đốc Cấp cao phụ trách Quản lý Sản phẩm - đã chính thức giới thiệu Gemini 3 Flash. Đây là phiên bản mở rộng mới nhất của hệ sinh thái Gemini 3, được định vị để giải quyết bài toán cân bằng giữa hiệu suất trí tuệ nhân tạo và chi phí vận hành.

Gemini 3 Flash được giới thiệu nhanh gấp 3 lần nhưng sử dụng ít token hơn so với Gemini 3 Pro. Ảnh: Google

Theo công bố từ nhà sản xuất, Gemini 3 Flash được thiết kế để kế thừa nền tảng lập luận của phiên bản cao cấp Gemini 3 Pro nhưng tối ưu hóa cho các tác vụ cần phản hồi nhanh. Các kết quả thử nghiệm (benchmark) cho thấy mô hình này đạt điểm số cao trên các bài kiểm tra chuyên sâu. Cụ thể, AI này đạt 90,4% trên thang đo GPQA Diamond (kiến thức cấp độ Tiến sĩ) và 81,2% trên MMMU Pro, tương đương với hiệu suất của các mô hình lớn nhất trên thị trường hiện nay.

Điểm đáng chú ý nhất của phiên bản này nằm ở tốc độ. Dựa trên đánh giá của Artificial Analysis, Gemini 3 Flash có tốc độ xử lý thực tế nhanh gấp 3 lần so với phiên bản cũ là Gemini 2.5 Pro. Đồng thời, nhờ khả năng linh hoạt điều chỉnh mức độ "suy nghĩ" tùy theo độ khó của tác vụ, mô hình này sử dụng ít hơn trung bình 30% lượng token cho các tác vụ hàng ngày.

Đối với người dùng phổ thông, Gemini 3 Flash mang đến những thay đổi lớn về trải nghiệm đa phương thức. Tính năng nổi bật được Google nhấn mạnh là "vibe coding" (lập trình theo cảm hứng). Theo đó, người dùng không cần kiến thức chuyên sâu về lập trình vẫn có thể tạo ra các ứng dụng hoặc bản mẫu thử nghiệm (prototype) hoàn chỉnh trong vài phút. Chỉ cần thông qua các lệnh giọng nói hoặc văn bản mô tả ý tưởng, AI sẽ tự động chuyển hóa thành mã lệnh và ứng dụng thực tế.

Khả năng thị giác máy tính cũng được nâng cấp đáng kể. Người dùng có thể tải lên video hoặc hình ảnh để AI phân tích và đưa ra tư vấn. Ví dụ, hệ thống có thể phân tích video quay chậm một cú đánh golf, từ đó đưa ra kế hoạch cải thiện kỹ thuật chi tiết chỉ trong vài giây.

Hiện tại, Gemini 3 Flash đã thay thế phiên bản 2.5 Flash để trở thành mô hình mặc định trên ứng dụng Gemini cho người dùng toàn cầu. Bên cạnh đó, Google cũng đang triển khai mô hình này cho chế độ AI Mode trong Google Tìm kiếm.

Với khả năng lập luận mới, công cụ tìm kiếm có thể xử lý các truy vấn phức tạp, nhiều lớp nghĩa thay vì chỉ trả về danh sách đường dẫn website. Hệ thống sẽ phân tích câu hỏi, tổng hợp thông tin và trình bày câu trả lời theo bố cục trực quan, đồng thời cập nhật dữ liệu địa phương theo thời gian thực. Tính năng này đặc biệt hữu ích cho các tác vụ như lên kế hoạch du lịch phút chót hay tìm hiểu các khái niệm học thuật khó.

Ở góc độ thương mại, Google đưa ra mức giá cạnh tranh cho các nhà phát triển sử dụng API. Mức phí được ấn định là 0,50 USD cho 1 triệu token đầu vào và 3 USD cho 1 triệu token đầu ra. Các nhà phát triển có thể tiếp cận mô hình này thông qua Google AI Studio, Vertex AI và nền tảng tự động hóa mới mang tên Google Antigravity.

Động thái ra mắt Gemini 3 Flash được xem là bước đi chiến lược của Google nhằm phổ cập trí tuệ nhân tạo thế hệ mới tới hàng triệu người dùng, đồng thời cạnh tranh trực tiếp về tốc độ và giá thành với các đối thủ trên thị trường AI tạo sinh.

Chỉ vài ngày trước, đối thủ lớn nhất của Google là OpenAI cũng vừa tung ra bản cập nhật lớn cho tính năng tạo ảnh trên ChatGPT. Phiên bản mới sử dụng mô hình "GPT Image 1.5", được công bố là có tốc độ tạo ảnh nhanh gấp 4 lần so với trước đây.

Điểm nhấn của bản cập nhật này là khả năng chỉnh sửa chính xác. Người dùng có thể yêu cầu thay đổi các chi tiết cụ thể trong ảnh (như thay đổi màu áo, thêm vật thể) mà vẫn giữ nguyên ánh sáng và bố cục gốc, thay vì phải tạo lại bức ảnh mới hoàn toàn. Ngoài ra, OpenAI cũng bổ sung giao diện "Images" chuyên biệt trên thanh công cụ bên, cung cấp các bộ lọc có sẵn giúp người dùng phổ thông dễ dàng thao tác.