Thử nghiệm tính năng thay phông và viết chữ của Gemini 2.0 Flash, nhận về kết quả ngoài mong đợi
Google công bố một phiên bản tiên tiến hơn của Gemini. Hiệu năng nó ra sao?
- Người Việt tại Google tạo AI giải Toán 'hạ gục' huy chương vàng Olympic quốc tế
- Dân mạng "phát sốt" vì công cụ chỉnh sửa ảnh bằng AI mới của Google: Có người tự hỏi liệu Photoshop có còn cần thiết?
- Google sẽ mang toàn bộ game Android lên Windows, game thủ có thể chính thức chơi Free Fire trên PC ngay từ bây giờ
- Google công bố một "hệ điều hành" chung cho robot, giúp người máy sớm gia nhập lực lượng lao động
- Ông lớn Google ra mắt mô hình AI 'siêu nhẹ': Khẳng định hiệu suất vượt trội hơn loạt mô hình của DeepSeek, ChatGPT hay Facebook
Sau một thời gian thử nghiệm với một số người dùng có độ tín nhiệm cao, công cụ Gemini 2.0 Flash đã chính thức có mặt tại các quốc gia hỗ trợ Google AI Studio, trong đó có Việt Nam. Ngay bây giờ, bạn có thể thử các tính năng tiên tiến của Gemini 2.0 Flash thông qua trang chủ của Google AI Studio hoặc qua API chính thức của Gemini.
Được biết, Gemini 2.0 Flash có thể tiếp nhận nhiều loại đầu vào khác nhau - như văn bản, hình ảnh, âm thanh, sở hữu khả năng suy luận và khả năng hiểu ngôn ngữ tự nhiên tiên tiến, và kết hợp những yếu tố này để tạo ra hình ảnh.
Thử nghiệm một số tính năng của Gemini 2.0 Flash đã đem lại một số kết quả ấn tượng.
Đầu tiên, trong thử nghiệm thay đổi phông nền tấm ảnh, Gemini đã có thể tách thành công chủ thể tấm ảnh và thay phông. Đáng chú ý, khả năng hiểu ngôn ngữ tự nhiên của Gemini 2.0 Flash được thể hiện rõ ràng, khi mô hình AI hiểu rõ prompt đầu vào.

Gemini 2.0 Flash có thể thay phông nền của ảnh một cách gọn gàng. Tuy chưa thuyết phục, nhưng người dùng có thể tiếp tục tùy biến prompt để ảnh chân thực hơn - Ảnh chụp màn hình.

Toàn bộ phông là do AI sản sinh ra.

Người dùng có thể tiếp tục chỉnh sửa ảnh bằng prompt - Ảnh chụp màn hình.
Từ trước tới nay, các hệ thống AI vẫn gặp phải một số vấn đề trong công tác sinh chữ. Theo thời gian, khi các mô hình AI tạo sinh tiên tiến hơn, chúng sẽ khắc phục được những vướng mắc cố hữu này. Ở thời điểm hiện tại, Gemini 2.0 Flash vẫn gặp phải vấn đề tương tự. Ví dụ dưới đây cho thấy rõ điều đó:

Mô hình AI của Google gặp lỗi khi sinh chữ trên ảnh - Ảnh: Facebook nhân vật.
Trong một ví dụ khác, Gemini 2.0 Flash của Google lại cho thấy khả năng hiểu bối cảnh và sinh chữ một cách tài tình.

Gemini 2.0 Flash nhanh chóng "nhìn" ra nội dung ảnh, thậm chí biết được bối cảnh của "một cụm từ phổ biến" - Ảnh chụp màn hình.

Kết quả ấn tượng cho prompt yêu cầu giữ nguyên font chữ nhưng trình bày một nội dung khác - Ảnh chụp màn hình.
Thấy gì từ những trường hợp này? Người dùng chỉ có thể đi đến một kết luận, rằng mô hình AI của Google vẫn chưa hoàn chỉnh, nhưng vẫn đã cho thấy những tiềm năng lớn. Khi người dùng tiếp tục sử dụng và Google tiếp tục hoàn thiện Gemini, chúng ta sẽ chứng kiến những tiến bộ vượt bậc khác.
Gemini 2.0 Flash, hay bất cứ mô hình nào khác, có thể hiệu quả đến đâu, hãy để thời gian cung cấp một câu trả lời thực tế.
Bạn có thể trải nghiệm Gemini 2.0 Flash tại đường link này.
NỔI BẬT TRANG CHỦ
Laptop lắp ghép như LEGO trở lại, dùng chip AMD xịn, muốn bao nhiêu RAM, bộ nhớ cả TB, pin khủng, màn siêu nét đều tự thay được
Phiên bản 13 inch của Framework vừa trở lại, bên cạnh dòng 16 inch và mẫu PC cũng nhấn mạnh triết lý lắp ghép, tùy biến tối đa mà người dùng ưa chuộng.
Dân mạng "phát sốt" vì công cụ chỉnh sửa ảnh bằng AI mới của Google: Có người tự hỏi liệu Photoshop có còn cần thiết?