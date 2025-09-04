Google DeepMind vừa giới thiệu một bước tiến lớn trong lĩnh vực trí tuệ nhân tạo tạo sinh (GenAI): mô hình Gemini 2.5 Flash Image.

Được cộng đồng gọi với cái tên thân mật "Nano Banana", mô hình này là công cụ mạnh mẽ, có khả năng biến đổi văn bản thành hình ảnh và chỉnh sửa hình ảnh hiện có với độ chính xác và tính linh hoạt cao.

Đây là sản phẩm tiếp nối của dòng mô hình Gemini, nhưng được tối ưu hóa riêng cho các tác vụ liên quan đến hình ảnh.

Từ khóa Gemini đứng đầu danh sách thịnh hành trên Google Trends tại Việt Nam ngày 4/9. Ảnh chụp màn hình.

Với những ưu điểm vượt trội trong khả năng tạo và chỉnh sửa ảnh, Nano Banana đang thu hút sự chú ý lớn của người dùng công nghệ toàn cầu, bao gồm Việt Nam.

Theo Google Trends, trong 24 giờ qua, lượng tìm kiếm Gemini và Nano Banana tăng vọt. Thống kê ngày 4/9 cho thấy từ khóa “Gemini” đứng đầu bảng xếp hạng Thịnh hành ở tất cả chủ đề.

Trên các diễn đàn và hội nhóm mạng xã hội, người dùng cũng chia sẻ và thử nghiệm các câu lệnh tạo ảnh và kịch bản sử dụng Nano Banana.

Phần lớn đều đánh giá cao khả năng tạo ảnh “nhanh, gọn, lẹ” cũng như chất lượng sản phẩm đầu ra của công cụ.

Không chỉ đơn thuần tạo ảnh từ các mô tả văn bản, Gemini 2.5 Flash Image còn vượt trội ở một số khía cạnh cốt lõi: chỉnh sửa ảnh theo lệnh, duy trì tính nhất quán của nhân vật, tốc độ xử lý ấn tượng và công nghệ bảo mật SynthID.

Người dùng có thể sử dụng ngôn ngữ tự nhiên để thay đổi các yếu tố trong một bức ảnh. Ví dụ, chỉ cần nhập lệnh "thêm một chiếc ghế màu đỏ bên cạnh cái bàn" hoặc "thay đổi phông nền thành một khu rừng", mô hình sẽ thực hiện chỉnh sửa một cách chính xác và liền mạch.

Duy trì tính nhất quán của nhân vật được xem là tính năng đột phá nhất. Mô hình có thể ghi nhớ và tái tạo hình ảnh một nhân vật hoặc vật thể với các đặc điểm nhất quán (như khuôn mặt, trang phục, phong cách) trong nhiều bức ảnh khác nhau.

Điều này đặc biệt hữu ích cho các dự án sáng tạo cần tạo ra một chuỗi hình ảnh liên quan, từ truyện tranh cho đến các chiến dịch marketing.

Ảnh gốc và ảnh sau khi chỉnh sửa bằng Gemini 2.5 Flash Image

Với kiến trúc được tối ưu hóa, Gemini 2.5 Flash Image có thể tạo ra các kết quả chất lượng cao chỉ trong vài giây, giúp tăng tốc đáng kể quy trình sáng tạo.

Tất cả các hình ảnh được tạo ra hoặc chỉnh sửa bởi mô hình đều được gắn một dấu nhận diện kỹ thuật số vô hình (invisible digital watermark) độc quyền của Google, cho phép nhận biết hình ảnh được tạo ra bằng AI, góp phần đảm bảo tính minh bạch và nguồn gốc của nội dung.

Mô hình Gemini 2.5 Flash Image đang mở ra nhiều tiềm năng ứng dụng, từ người dùng cá nhân đến các nhà phát triển chuyên nghiệp.

Các nhà phát triển có thể truy cập mô hình thông qua Gemini API và Google AI Studio để xây dựng các ứng dụng của riêng mình, trong khi các doanh nghiệp có thể sử dụng mô hình trên nền tảng Vertex AI.

Đối với người dùng phổ thông, mô hình này được tích hợp trực tiếp vào Google Gemini và các ứng dụng khác, biến AI tạo ảnh thành một công cụ dễ tiếp cận và trực quan.

Với các tính năng vượt trội, đặc biệt là khả năng duy trì tính nhất quán của nhân vật, Gemini 2.5 Flash Image được kỳ vọng sẽ trở thành đối thủ cạnh tranh đáng gờm với các phần mềm chỉnh sửa ảnh truyền thống như Photoshop, thay đổi cách thức các nhà sáng tạo và người dùng tương tác với hình ảnh số.