Thử nghiệm tính năng thay phông và viết chữ của Gemini 2.0 Flash, nhận về kết quả ngoài mong đợi

    Kim,  

    Google công bố một phiên bản tiên tiến hơn của Gemini. Hiệu năng nó ra sao?

    Sau một thời gian thử nghiệm với một số người dùng có độ tín nhiệm cao, công cụ Gemini 2.0 Flash đã chính thức có mặt tại các quốc gia hỗ trợ Google AI Studio, trong đó có Việt Nam. Ngay bây giờ, bạn có thể thử các tính năng tiên tiến của Gemini 2.0 Flash thông qua trang chủ của Google AI Studio hoặc qua API chính thức của Gemini.

    Được biết, Gemini 2.0 Flash có thể tiếp nhận nhiều loại đầu vào khác nhau - như văn bản, hình ảnh, âm thanh, sở hữu khả năng suy luận và khả năng hiểu ngôn ngữ tự nhiên tiên tiến, và kết hợp những yếu tố này để tạo ra hình ảnh.

    Thử nghiệm một số tính năng của Gemini 2.0 Flash đã đem lại một số kết quả ấn tượng.

    Đầu tiên, trong thử nghiệm thay đổi phông nền tấm ảnh, Gemini đã có thể tách thành công chủ thể tấm ảnh và thay phông. Đáng chú ý, khả năng hiểu ngôn ngữ tự nhiên của Gemini 2.0 Flash được thể hiện rõ ràng, khi mô hình AI hiểu rõ prompt đầu vào.

    Thử nghiệm tính năng thay phông và viết chữ của Gemini 2.0 Flash, nhận về kết quả ngoài mong đợi- Ảnh 1.

    Gemini 2.0 Flash có thể thay phông nền của ảnh một cách gọn gàng. Tuy chưa thuyết phục, nhưng người dùng có thể tiếp tục tùy biến prompt để ảnh chân thực hơn - Ảnh chụp màn hình.

    Thử nghiệm tính năng thay phông và viết chữ của Gemini 2.0 Flash, nhận về kết quả ngoài mong đợi- Ảnh 2.

    Toàn bộ phông là do AI sản sinh ra.

    Thử nghiệm tính năng thay phông và viết chữ của Gemini 2.0 Flash, nhận về kết quả ngoài mong đợi- Ảnh 3.

    Người dùng có thể tiếp tục chỉnh sửa ảnh bằng prompt - Ảnh chụp màn hình.

    Từ trước tới nay, các hệ thống AI vẫn gặp phải một số vấn đề trong công tác sinh chữ. Theo thời gian, khi các mô hình AI tạo sinh tiên tiến hơn, chúng sẽ khắc phục được những vướng mắc cố hữu này. Ở thời điểm hiện tại, Gemini 2.0 Flash vẫn gặp phải vấn đề tương tự. Ví dụ dưới đây cho thấy rõ điều đó:

    Thử nghiệm tính năng thay phông và viết chữ của Gemini 2.0 Flash, nhận về kết quả ngoài mong đợi- Ảnh 4.

    Mô hình AI của Google gặp lỗi khi sinh chữ trên ảnh - Ảnh: Facebook nhân vật.

    Trong một ví dụ khác, Gemini 2.0 Flash của Google lại cho thấy khả năng hiểu bối cảnh và sinh chữ một cách tài tình.

    Thử nghiệm tính năng thay phông và viết chữ của Gemini 2.0 Flash, nhận về kết quả ngoài mong đợi- Ảnh 5.

    Gemini 2.0 Flash nhanh chóng "nhìn" ra nội dung ảnh, thậm chí biết được bối cảnh của "một cụm từ phổ biến" - Ảnh chụp màn hình.

    Thử nghiệm tính năng thay phông và viết chữ của Gemini 2.0 Flash, nhận về kết quả ngoài mong đợi- Ảnh 6.

    Kết quả ấn tượng cho prompt yêu cầu giữ nguyên font chữ nhưng trình bày một nội dung khác - Ảnh chụp màn hình.

    Thấy gì từ những trường hợp này? Người dùng chỉ có thể đi đến một kết luận, rằng mô hình AI của Google vẫn chưa hoàn chỉnh, nhưng vẫn đã cho thấy những tiềm năng lớn. Khi người dùng tiếp tục sử dụng và Google tiếp tục hoàn thiện Gemini, chúng ta sẽ chứng kiến những tiến bộ vượt bậc khác.

    Gemini 2.0 Flash, hay bất cứ mô hình nào khác, có thể hiệu quả đến đâu, hãy để thời gian cung cấp một câu trả lời thực tế.

    Bạn có thể trải nghiệm Gemini 2.0 Flash tại đường link này.

    Tin cùng chuyên mục
    Xem theo ngày

    NỔI BẬT TRANG CHỦ