Google vừa công bố Nano Banana Pro, công cụ tạo ảnh thế hệ mới có khả năng hiển thị văn bản chính xác – một trong những bài toán khó nhất mà các mô hình AI tạo sinh lâu nay chưa thể xử lý trọn vẹn.
Theo thông báo ngày 21/11, Nano Banana Pro được phát triển dựa trên Gemini 3 Pro, mô hình AI tiên tiến nhất của Google hiện nay. Nhờ khả năng lập luận nâng cao và hiểu biết sâu về ngữ cảnh thực tế, phiên bản mới có thể trực quan hóa thông tin tốt hơn bản Nano Banana trước đó và vượt trội so với nhiều mô hình AI đang phổ biến trên thị trường.
Tạo văn bản chính xác trong ảnh – bước tiến lớn của AI
Trong khi nhiều công cụ tạo ảnh chỉ có thể tạo ra những ký tự “tựa chữ” nhưng sai nét hoặc vô nghĩa, Google khẳng định Nano Banana Pro có thể tạo văn bản rõ ràng, dễ đọc, xuất hiện trực tiếp trong hình ở nhiều ngôn ngữ, bao gồm cả tiếng Việt.
“Đây là mô hình tốt nhất để tạo hình ảnh có chữ hiển thị chính xác, từ tiêu đề ngắn đến đoạn văn dài”, Google nhấn mạnh.
Thử nghiệm thực tế cho thấy công cụ có thể tạo hình minh họa chứa văn bản tiếng Việt chuẩn. Theo Google, sự chính xác này đến từ khả năng lập luận mạnh mẽ của Gemini 3 Pro kết hợp với kho tri thức từ Google Search, cho phép AI tạo hình ảnh nhanh và phù hợp với nội dung người dùng yêu cầu.

Nhờ đó, Nano Banana Pro mở ra nhiều ứng dụng mới trong thiết kế infographic, biển quảng cáo, sơ đồ, bản ghi chú, công thức nấu ăn và các nội dung thị giác có văn bản.
Hỗ trợ đa dữ liệu và đảm bảo tính nhất quán hình ảnh
Nano Banana Pro cũng được nâng cấp mạnh về khả năng xử lý dữ liệu đầu vào. Người dùng có thể:
- Tải lên tối đa 14 hình ảnh tham chiếu.
- Yêu cầu AI tạo ra một thiết kế thống nhất dựa trên các hình mẫu.
- Giữ được sự đồng nhất của tối đa 5 nhân vật trong ảnh, giúp nhận diện liền mạch.
Đầu ra của mô hình có thể đạt chất lượng 2K hoặc 4K, phù hợp cho cả mục đích sáng tạo nội dung lẫn sản xuất hình ảnh chuyên nghiệp.
Cách sử dụng và thực tế vận hành
Người dùng có thể truy cập Nano Banana Pro thông qua ứng dụng Gemini trên điện thoại hoặc máy tính:
- Vào mục Tạo hình ảnh (biểu tượng quả chuối)
- Nhập câu lệnh
- Chờ khoảng một phút để mô hình xử lý

Với các yêu cầu phức tạp, AI sẽ hiển thị tiến trình và đặt thêm câu hỏi để làm rõ. Tuy nhiên, Google cũng thừa nhận một số trường hợp công cụ phản hồi chưa ổn định, yêu cầu người dùng thực hiện lại.
Tăng cường biện pháp an toàn và xác minh nguồn gốc ảnh
Trước lo ngại AI bị lạm dụng, Google cho biết mọi hình ảnh được tạo bởi Nano Banana Pro đều được gắn SynthID – mã nhận diện kỹ thuật số vô hình giúp xác minh nguồn gốc.
Ngoài ra, người dùng có thể kiểm tra một hình ảnh có được tạo bởi AI của Google hay không bằng cách tải ảnh lên ứng dụng Gemini và yêu cầu hệ thống xác minh. Đại diện Google cho biết hãng hiện mới áp dụng cơ chế nhận diện cho hình ảnh và sẽ sớm mở rộng sang âm thanh và video. Bên cạnh đó, Google tiếp tục duy trì watermark trên các hình ảnh tạo bởi người dùng gói miễn phí và gói Google AI Pro, trong khi phiên bản Google AI Ultra dành cho người dùng chuyên nghiệp sẽ không kèm watermark.
◾ Xem thêm: FOXAi ký kết hợp tác chiến lược cùng CUSCEN
◾ Xem thêm: Data Warehouse là gì? Tìm hiểu từ A-Z về Data Warehouse

