Google giải quyết thách thức tạo chữ trong ảnh với Nano Banana Pro

Tạo chữ trong ảnh với Nano Banana Pro

Google vừa công bố Nano Banana Pro, công cụ tạo ảnh thế hệ mới có khả năng hiển thị văn bản chính xác – một trong những bài toán khó nhất mà các mô hình AI tạo sinh lâu nay chưa thể xử lý trọn vẹn.

Theo thông báo ngày 21/11, Nano Banana Pro được phát triển dựa trên Gemini 3 Pro, mô hình AI tiên tiến nhất của Google hiện nay. Nhờ khả năng lập luận nâng cao và hiểu biết sâu về ngữ cảnh thực tế, phiên bản mới có thể trực quan hóa thông tin tốt hơn bản Nano Banana trước đó và vượt trội so với nhiều mô hình AI đang phổ biến trên thị trường.

Tạo văn bản chính xác trong ảnh – bước tiến lớn của AI

Trong khi nhiều công cụ tạo ảnh chỉ có thể tạo ra những ký tự “tựa chữ” nhưng sai nét hoặc vô nghĩa, Google khẳng định Nano Banana Pro có thể tạo văn bản rõ ràng, dễ đọc, xuất hiện trực tiếp trong hình ở nhiều ngôn ngữ, bao gồm cả tiếng Việt.

“Đây là mô hình tốt nhất để tạo hình ảnh có chữ hiển thị chính xác, từ tiêu đề ngắn đến đoạn văn dài”, Google nhấn mạnh.

Thử nghiệm thực tế cho thấy công cụ có thể tạo hình minh họa chứa văn bản tiếng Việt chuẩn. Theo Google, sự chính xác này đến từ khả năng lập luận mạnh mẽ của Gemini 3 Pro kết hợp với kho tri thức từ Google Search, cho phép AI tạo hình ảnh nhanh và phù hợp với nội dung người dùng yêu cầu.

Mẫu chuyển đổi ngôn ngữ do Nano Banana Pro thực hiện
Mẫu chuyển đổi ngôn ngữ do Nano Banana Pro thực hiện

Nhờ đó, Nano Banana Pro mở ra nhiều ứng dụng mới trong thiết kế infographic, biển quảng cáo, sơ đồ, bản ghi chú, công thức nấu ăn và các nội dung thị giác có văn bản.

Hỗ trợ đa dữ liệu và đảm bảo tính nhất quán hình ảnh

Nano Banana Pro cũng được nâng cấp mạnh về khả năng xử lý dữ liệu đầu vào. Người dùng có thể:

  • Tải lên tối đa 14 hình ảnh tham chiếu.
  • Yêu cầu AI tạo ra một thiết kế thống nhất dựa trên các hình mẫu.
  • Giữ được sự đồng nhất của tối đa 5 nhân vật trong ảnh, giúp nhận diện liền mạch.

Đầu ra của mô hình có thể đạt chất lượng 2K hoặc 4K, phù hợp cho cả mục đích sáng tạo nội dung lẫn sản xuất hình ảnh chuyên nghiệp.

Cách sử dụng và thực tế vận hành

Người dùng có thể truy cập Nano Banana Pro thông qua ứng dụng Gemini trên điện thoại hoặc máy tính:

  1. Vào mục Tạo hình ảnh (biểu tượng quả chuối)
  2. Nhập câu lệnh
  3. Chờ khoảng một phút để mô hình xử lý
Hình ảnh Nano Banana Pro tạo ra khi có câu lệnh: "Tưởng tượng bạn là thầy giáo dạy kỹ năng sống, hãy tạo infographic hướng dẫn cách rán trứng, để trẻ 10 tuổi cũng hiểu và thích thú làm theo."
Hình ảnh Nano Banana Pro tạo ra khi có câu lệnh: “Tưởng tượng bạn là thầy giáo dạy kỹ năng sống, hãy tạo infographic hướng dẫn cách rán trứng, để trẻ 10 tuổi cũng hiểu và thích thú làm theo.”

Với các yêu cầu phức tạp, AI sẽ hiển thị tiến trình và đặt thêm câu hỏi để làm rõ. Tuy nhiên, Google cũng thừa nhận một số trường hợp công cụ phản hồi chưa ổn định, yêu cầu người dùng thực hiện lại.

Tăng cường biện pháp an toàn và xác minh nguồn gốc ảnh

Trước lo ngại AI bị lạm dụng, Google cho biết mọi hình ảnh được tạo bởi Nano Banana Pro đều được gắn SynthID – mã nhận diện kỹ thuật số vô hình giúp xác minh nguồn gốc.

Ngoài ra, người dùng có thể kiểm tra một hình ảnh có được tạo bởi AI của Google hay không bằng cách tải ảnh lên ứng dụng Gemini và yêu cầu hệ thống xác minh. Đại diện Google cho biết hãng hiện mới áp dụng cơ chế nhận diện cho hình ảnh và sẽ sớm mở rộng sang âm thanh và video. Bên cạnh đó, Google tiếp tục duy trì watermark trên các hình ảnh tạo bởi người dùng gói miễn phí và gói Google AI Pro, trong khi phiên bản Google AI Ultra dành cho người dùng chuyên nghiệp sẽ không kèm watermark.

Xem thêm: FOXAi ký kết hợp tác chiến lược cùng CUSCEN

◾ Xem thêm: Data Warehouse là gì? Tìm hiểu từ A-Z về Data Warehouse

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *