Nhà sản xuất ChatGPT ra mắt công cụ phát hiện văn bản viết bởi AI, nhưng tự thừa nhận nó ‘không hoàn toàn đáng tin cậy’
(Tổ Quốc) - Công cụ mới được cho là “mang tính hình thức” vì chỉ xuất hiện sau khi có những lo ngại rằng các chatbot AI có thể thúc đẩy sự không trung thực trong học thuật và cản trở việc dạy học.
Những người tạo ra chatbot ChatGPT - công cụ AI đang gây xôn xao vì khả năng bắt chước văn phong của con người - vừa phát hành một công cụ được thiết kế để phát hiện khi các tác phẩm được viết ra bởi các công cụ trí tuệ nhân tạo.
Thông báo được OpenAI đưa ra trong bối cảnh những tranh luận gay gắt đang nổ ra tại các trường học và đại học trên toàn thế giới, liên quan tới những lo ngại rằng ChatGPT có thể được sử dụng để hỗ trợ học sinh làm bài tập và giúp họ gian lận trong các kỳ thi.
Trong một bài đăng trên blog hôm 31/1, công ty có trụ sở tại Mỹ cho biết công cụ phát hiện của họ đã được đào tạo “để phân biệt giữa văn bản do con người viết và văn bản do AI viết từ nhiều nhà cung cấp khác nhau”.
Tuy nhiên, OpenAI cũng cảnh báo rằng công cụ của họ có thể mắc lỗi, đặc biệt là với các văn bản chứa ít hơn 1.000 ký tự. Công ty cũng cho biết họ khuyến nghị chỉ sử dụng công cụ phân loại này với văn bản bằng tiếng Anh, vì nó hoạt động kém hơn ở các ngôn ngữ khác.
“Công cụ phân loại của chúng tôi không hoàn toàn đáng tin cậy”, OpenAI cho biết trong thông cáo báo chí, nhấn mạnh bằng việc in đậm dòng thông tin này.
“Mặc dù không thể phát hiện tất cả văn bản do AI viết một cách đáng tin cậy, nhưng chúng tôi tin rằng các trình phân loại tốt có thể cung cấp thông tin để giảm thiểu cho những tuyên bố sai lầm rằng văn bản do AI tạo ra được viết bởi con người”, OpenAI cho biết. “Ví dụ như các mục đích chạy các chiến dịch thông tin sai lệch một cách tự động, sử dụng các công cụ AI cho hành vi gian lận trong học thuật và việc định vị một chatbot AI như một con người.”
Một trường đại học hàng đầu của Pháp tuần trước đã cấm sinh viên sử dụng ChatGPT để hoàn thành bài tập. Quyết định được đưa ra ngay sau khi có tin ChatGPT đã vượt qua kỳ thi tại một trường luật của Mỹ sau khi viết các bài luận về các chủ đề khác nhau, từ luật hiến pháp đến thuế.
“Chúng tôi nhận ra rằng việc xác định văn bản do AI viết là một vấn đề quan trọng cần thảo luận giữa các nhà giáo dục, và một điều quan trọng không kém là nhận ra các giới hạn và tác động của các trình phân loại văn bản do AI tạo ra trong lớp học”, công ty viết trong bài đăng. “Chúng tôi cũng đang hợp tác với các nhà giáo dục ở Mỹ để tìm hiểu những gì họ đang thấy trong lớp học của mình và thảo luận về các khả năng cũng như hạn chế của ChatGPT.”
Các quan chức chính quyền thành phố New York và một số khu vực pháp lý ở Mỹ đã cấm sử dụng chatbot AI này trong trường học. Một nhóm các trường đại học Úc cho biết họ sẽ thay đổi định dạng bài kiểm tra để loại bỏ các công cụ AI và coi chúng là hành vi gian lận.
Theo PCWorld, công cụ phân loại văn bản mới của OpenAI đã bộc lộ một điểm yếu chí tử. Đó là nó “hơi dễ bị đánh lừa”. Trên thực tế bản thân nhà sản xuất OpenAI cũng cho biết bộ phân loại đã xác định 26% văn bản do AI viết là do con người thực sự viết, đồng thời coi 9% văn bản do con người viết là do AI viết.
Trong một thử nghiệm nhanh, công cụ này không thể biết liệu một đoạn văn ngẫu nhiên trong cuốn Bắt trẻ đồng xanh của nhà văn JD Salinger có phải do AI viết hay không.
“Công cụ của OpenAI không chỉ tạo ra những kết luận mơ hồ mà còn không đủ để xác định kết quả nào do AI tạo ra”, bài viết trên PCWorld nhận định.
Rõ ràng, không thể bắt một công ty sản xuất chatbot AI đưa ra thị trường một công cụ có thể làm hạn chế sức mạnh trên sản phẩm chính của họ, cho dù họ có thực sự làm được việc đó hay không. Một số chuyên gia nhận định đây chỉ là động thái mang tính hình thức, nhằm làm dịu đi các luồng dư luận phản đối ChatGPT vì sức mạnh đáng sợ của nó trong lĩnh vực học thuật và giáo dục.
Để thay thế, trên thị trường hiện cũng có một công cụ miễn phí dùng để phân biệt các văn bản có phải do AI viết hay không. Nó được cho là có hiệu suất cao hơn sản phẩm mới của OpenAI, với tên gọi Hive Moderation.
Hive Moderation trả về kết quả đi kèm tỷ lệ phần trăm tin cậy hoặc khả năng bao nhiêu phần trăm mẫu văn bản chứa nội dung do AI tạo ra. Thậm chí khi thử yêu cầu trong ChatGPT rằng hãy viết một đoạn văn theo cách khó có thể nhận ra nó là do AI viết, Hive Moderation cũng không bị đánh lừa.
Đại học Stanford mới đây cũng tuyên bố tìm ra phương pháp 'lật mặt' ChatGPT có tên gọi mới gọi là DetectGPT. Dựa trên phương pháp "zero-shot" trong lĩnh vực học máy, DetectGPT có thể phát hiện văn bản do AI viết mà không cần biết về loại AI đã được sử dụng để tạo văn bản đó. Nó hoạt động hoàn toàn trái ngược với các phương pháp kiểm tra khác thường yêu cầu đào tạo ra một 'bộ phân loại' và sử dụng bộ dữ liệu của các đoạn văn bản thật và giả.
Các thử nghiệm cho thấy kết quả đầy hứa hẹn khi nó tỏ ra vượt trội so với các phương pháp khác trong việc phát hiện các văn bản không phải do con người sản xuất.
Tham khảo PCWorld, SCMP
NỔI BẬT TRANG CHỦ
Cận cảnh độc quyền Galaxy S25 Edge trực tiếp tại Mỹ: Phiên bản siêu mỏng của Galaxy S25 Ultra
Galaxy S25 Edge đã có màn ra mắt đầy bất ngờ, mặc dù chưa chính thức được bán ra.
Đây là Galaxy S25 Ultra: Galaxy AI tiếng Việt “như con người”, thiết kế mới với viền màn hình siêu mỏng, chip Snapdragon 8 Elite for Galaxy, giá từ 33.9 triệu đồng