Google vừa ra mắt Gemini 2.0 Flash Experimental, một công cụ AI chỉnh sửa ảnh mới đang tạo nên làn sóng phấn khích trong cộng đồng công nghệ. Với khả năng chỉnh sửa ảnh thông qua ngôn ngữ tự nhiên, nhiều người dùng đã bày tỏ sự kinh ngạc trước tiềm năng của công cụ này, thậm chí có người còn cho rằng, công cụ này còn có thể khai tử Photoshop trong tương lai.
Oriol Vinyals, một trong những người dùng đầu tiên, đã giới thiệu về khả năng tạo ảnh gốc của Gemini 2.0 Flash. Theo Vinyals, công cụ này có thể tạo ra những hình ảnh phù hợp với ngữ cảnh, chỉnh sửa thông qua trò chuyện và tạo văn bản dài trong hình ảnh - tất cả đều được tối ưu hóa cho việc tương tác qua chat.
Thay đổi các chi tiết trong ảnh chưa bao giờ đơn giản đến thế
Không chỉ vậy, Poonam Soni, một người dùng khác, còn chia sẻ cách đơn giản để sử dụng công cụ này: chỉ cần truy cập Google AI Studio, chọn mô hình 'Gemini 2.0 Flash Experimental', đảm bảo đã chọn "Images and text", sau đó tải lên hình ảnh và yêu cầu thay đổi bằng ngôn ngữ tự nhiên.
Thao tác chỉnh sửa cũng đơn giản hơn nhiều nếu so với Photoshop
Người dùng có thể dễ dàng thay đổi màu sắc trang phục, sắp xếp nội thất trong ảnh, hay tạo ra ảnh hộ chiếu chỉ bằng cách nhập yêu cầu bằng ngôn từ tự nhiên. Ví dụ, một số bình luận cho biết việc thay đổi màu áo, chuyển đổi góc chụp từ mặt trước sang góc bên hay hậu cảnh đều được thực hiện một cách nhanh chóng và mượt mà, mang lại hiệu quả chỉnh sửa ấn tượng mà không cần phải dùng đến chuột, bàn phím hay các thao tác phức tạp như trên Photoshop.
Thậm chí xoay ảnh từ trước ra sau
Ngoài ra, tính năng chỉnh sửa văn bản trực tiếp trên hình ảnh cũng được nhiều người dùng đánh giá cao. Các thao tác như thêm chữ, xóa bỏ đối tượng không mong muốn hay ghép các phần của ảnh khác nhau chỉ cần đưa ra lệnh bằng lời nói.
Nếu không phải là người chuyên dùng Photoshop, sẽ không dễ để thêm chữ vào hình ảnh như trên
Điều này không chỉ giúp tiết kiệm thời gian mà còn mở ra khả năng sáng tạo mới cho những người không chuyên trong lĩnh vực thiết kế đồ họa. Tuy nhiên, ví dụ trên chỉ là các chữ đơn giản, nhiều phản hồi khác cho thấy việc chỉnh sửa các văn bản phức tạp hơn sẽ dễ mắc lỗi hơn.
Giả sử bạn muốn thay đổi phông nền phía sau hình ảnh của mình - có thể dùng để minh họa cho lý do tại sao mình đi muộn - bạn chỉ cần mô tả được mong muốn của mình cho công cụ của Google .
Chỉ một câu lệnh và bạn có minh họa hoàn hảo cho lý do đi muộn của mình
Đáng chú ý là người dùng cũng cho thấy các nhân vật được tạo ra trong hình ảnh có thể duy trì tính nhất quán như thế nào. Trong bài đăng dưới đây, người dùng này cho biết, hình ảnh thứ 2 được người dùng tạo ra bằng ImageFX từ hình ảnh đầu, sau đó Gemini 2.0 Flash sẽ tạo ra các hình ảnh còn lại (hình ảnh thứ 3, thứ 4). Và cuối cùng tất cả được ghép lại bằng Sora AI để thành một clip ngắn.
Ngoài ra, người dùng Denis Shiryaev đã thử nghiệm một ứng dụng rất thực tế của công cụ này: khả năng khôi phục ảnh cũ và tô màu cho ảnh đen trắng, cho thấy tiềm năng lớn của Gemini 2.0 Flash, mặc dù vẫn còn một số hạn chế nhất định.
Tô màu và phục chế ảnh cũ có lẽ chưa bao giờ dễ dàng đến thế
Tuy nhiên, Shiryaev cũng chỉ ra một số hạn chế của Gemini Flash 2.0. Một số tác vụ như xử lý độ phân giải cao hoặc chỉnh sửa văn bản trên ảnh, công cụ này vẫn chưa thể đáp ứng được mọi yêu cầu chuyên sâu. Các lỗi nhỏ như hiện tượng artifact trong quá trình colorize ảnh cũng được ghi nhận, cho thấy công nghệ vẫn cần được hoàn thiện thêm để đạt được sự ổn định và chính xác tối đa.
Dù có thể tô màu cho ảnh cũ, nhưng nó lại mang đến cảm giác giả tạo trong hình ảnh cuối cùng
Điểm nổi bật của Gemini Flash 2.0 experimental còn nằm ở khả năng tương tác linh hoạt với hình ảnh. Người dùng có thể “điều khiển” ảnh theo ý muốn, từ việc thu phóng góc nhìn đến việc tạo ra những hình ảnh mang tính sáng tạo như làm cho một đối tượng “bay”, “duỗi” hay “co lại” chỉ bằng lời nói.
Chỉ bằng 2 bức ảnh, một người dùng có thể tạo ra hình ảnh quảng cáo phù hợp. Điều đáng ngạc nhiên là ngay cả nhãn dán trên chai nước cũng được giữ lại chính xác trong hình ảnh cuối.
Sự kết hợp giữa khả năng chỉnh sửa trực quan và hiệu suất làm việc ấn tượng đã khiến nhiều người tin rằng, trong tương lai gần, công cụ này có thể sẽ thay thế hoặc ít nhất là bổ sung những chức năng chỉnh sửa ảnh hiện có trên các phần mềm truyền thống.
Nếu bạn còn nhớ, những lần ra mắt các công cụ chỉnh sửa ảnh bằng AI trước đây của Google thường kết thúc với một sự cố đáng xấu hổ nào đó - từ việc sử dụng ảnh đã được chỉnh sửa trước cho đến tạo ra các bức ảnh mang tính thiên vị chủng tộc. Điều đó ít nhiều đã gây ra tiếng xấu cho Google đối với mảng công nghệ AI .
Tuy nhiên, các phản hồi từ cộng đồng cho thấy Google Gemini Flash 2.0 experimental đang mở ra một hướng đi mới cho lĩnh vực chỉnh sửa ảnh bằng cách tận dụng sức mạnh của trí tuệ nhân tạo và khả năng xử lý qua ngôn ngữ tự nhiên. Những ưu điểm vượt trội về tính đơn giản, tốc độ xử lý và khả năng sáng tạo đã được đông đảo người dùng đón nhận, trong khi các hạn chế nhỏ đang được cải tiến dần theo phản hồi thực tế. Đây hứa hẹn sẽ là bước tiến quan trọng, không chỉ đối với công cụ của Google mà còn cho toàn bộ ngành công nghiệp chỉnh sửa ảnh trong thời đại số.
Nguyễn Hải