ChatGPT có thể tạo ra bài luận với cấu trúc tốt mà không bị giáo viên phát hiện, song một số thông tin trả về chưa chính xác.

Cây viết Joanna Stern của WSJ thử dùng ChatGPT làm bài tập trong lớp văn học. Ảnh: WSJ.

ChatGPT được công ty nghiên cứu trí tuệ nhân tạo OpenAI ra mắt vào đầu tháng 12. Công cụ này có thể trò chuyện, thậm chí viết văn bản dựa trên yêu cầu của người dùng.

Để thử nghiệm ChatGPT, cây viết Joanna Stern của WSJ đã mang công cụ này đến lớp văn học tại một trường phổ thông ở New Jersey (Mỹ). Trong một ngày, phần mềm được giao bài tập, thảo luận nhóm như học sinh bình thường.

Viết bài luận 800 chữ chỉ trong một phút

Trong bài tập đầu tiên, Michael Diamond, giáo viên văn học đứng lớp yêu cầu: "Viết bài 500-1.000 chữ, lập luận chứng minh chủ nghĩa hiện sinh trong phim Ferris Bueller’s Day Off, sử dụng bằng chứng và dữ kiện thảo luận trong lớp, đồng thời đưa ra so sánh, mối liên hệ giữa các nhân vật, bối cảnh và/hoặc chủ đề giữa Ferris Bueller’s Day Off và The Metamorphosis".

Stern dán đề bài vào ChatGPT trên website chat.openai.com rồi nhấn Enter. Công cụ viết khoảng 400 chữ trước khi báo lỗi mạng. Theo phát ngôn viên OpenAI, ChatGPT có thể gặp lỗi do nhu cầu sử dụng quá cao.

Bài luận được ChatGPT viết trong một phút dựa trên yêu cầu. Ảnh: WSJ.

Chỉ trong một phút, ChatGPT tạo ra bài viết khoảng 800 chữ, với lập luận chứng minh Ferris Bueller’s Day Off là tác phẩm theo chủ nghĩa hiện sinh. Stern dán bài luận vào phần mềm soạn thảo, sau đó hỏi ChatGPT cách định dạng văn bản theo chuẩn AP (giãn dòng kép, font Times New Roman cỡ 12, dòng đầu đoạn thụt vào trong).

Do nộp trễ, Stern yêu cầu ChatGPT viết thêm dòng xin lỗi giáo viên. Sau đó, thầy Diamond cũng phản hồi bằng ChatGPT.

"Joanna thân mến, tôi muốn bạn biết rằng tôi đã nhận bài tập của bạn và đánh giá cao việc bạn dành thời gian để hoàn thành. Tuy nhiên, nó được nộp sau thời hạn nên sẽ bị đánh dấu nộp trễ" là nội dung phản hồi của thầy Diamond.

Vẫn mắc một số lỗi

Thầy Diamond đánh giá cao bài luận với cấu trúc chặt chẽ, đi thẳng vào vấn đề. Tuy nhiên, đoạn đầu bài mắc lỗi khi một lời thoại được trích dẫn sai nhân vật và vị trí. ChatGPT ghi rằng lời thoại được nhân vật Ferris nhắc đầu phim, nhưng thực chất nó được nói bởi Cameron vào cuối phim.

Tiếp theo, đoạn văn ghi Ferris có tính cách dè dặt, hiếm xuất hiện cạnh bạn bè, thực chất nhân vật là Cameron. Ngoài ra, The Metamorphosis lấy bối cảnh một thành phố không tên ở châu Âu, nhưng ChatGPT ghi bối cảnh tác phẩm ở ngoại ô.

Những sai sót trong bài luận của ChatGPT được thầy Diamond tô vàng. Ảnh: WSJ.

Bài viết được chấm 3/6 điểm, nằm trong phạm vi từ B- đến C theo tiêu chí của AP. Dù đạt điểm chất lượng, kết quả của ChatGPT không đáp ứng yêu cầu của Stern.

"Chất lượng tổng thể bài viết nằm trong khoảng 30% tệ nhất lớp", thầy Diamond cho biết.

Khi được hỏi có nghi ngờ bài luận được viết bởi AI hay không, Diamond thừa nhận ông không nghĩ đến khả năng đó bởi một số học sinh vẫn có thể viết bài với cấu trúc tốt như trên.

Kiểm tra đạo văn trên Grammarly, chỉ một số cụm từ phổ biến trong bài bị đánh dấu. Dù vậy, các phần mềm đạo văn đã lên kế hoạch bổ sung tính năng phát hiện văn bản viết bởi AI.

Eric Wang, Phó chủ tịch AI của Turnitin, công cụ phát hiện đạo văn cho biết phần mềm có thể phát hiện văn bản viết bởi AI dựa trên một số chi tiết mà con người không thể nhận ra. Dự kiến đến năm 2023, Turnitin sẽ bổ sung tính năng phát hiện văn bản viết bởi AI.

Giao diện chính của ChatGPT. Ảnh: WSJ.

Chưa hoàn hảo

Một thử thách khác dành cho ChatGPT là giúp Stern tham gia thảo luận nhóm về một văn bản nhưng cô không thực sự đọc.

Văn bản được thảo luận là truyện ngắn Car Crash While Hitchhiking trong tập Jesus' Son. Trong khi bạn cùng nhóm sôi nổi thảo luận, ChatGPT không giúp ích nhiều cho Stern.

Khi tìm kiếm thông tin về cuốn sách, phần mềm trả về một số dữ liệu cơ bản, nhưng tên nhân vật chính bị ghi sai. Tổng kết, thầy Diamond chấm điểm C cho phần thảo luận của Stern và ChatGPT.

Sam Altman, CEO OpenAI cho biết tại thời điểm này, phần mềm không đáng tin cậy cho những tác vụ quan trọng. Tuy nhiên, các kỹ sư sẽ làm việc để cải thiện tốc độ, hiệu quả tìm kiếm dữ liệu của ChatGPT trong tương lai.