Chỉ vài ngày sau khi ChatGPT ra mắt, lượng người dùng thử ứng dụng này đông đến mức gây quá tải và bị crash.
Trong khi các giáo viên đang gióng lên hồi chuông cảnh báo về nguy cơ sinh viên lạm dụng chatbot AI để "viết hộ" luận văn, một sinh viên khác lại đang tạo ra công cụ để ngăn chặn nguy cơ này.
Edward Tian, sinh viên năm cuối đại học Princeton, đã phát triển một ứng dụng giúp phát hiện các văn bản được viết bằng ChatGPT – chatbot đang nổi như cồn khi cho mọi người thấy tiềm năng của AI lớn đến mức nào nếu biết cách khai thác sức mạnh của nó.
Dù đang học chuyên ngành khoa học máy tính, bản thân Tian cũng đang theo học về báo chí. Do vậy Tian cũng sẽ hiểu được sự khác nhau giữa một đoạn văn bản do người viết và AI tạo ra như thế nào. Tian đã dành thời gian nghỉ vừa qua để tạo nên GPTZero, với mục đích tạo ra một con bot có thể chống lại nạn đạo văn bằng AI đang gia tăng mạnh kể từ khi ChatGPT ra mắt.
Kể từ khi GPTZero ra mắt vào ngày 2 tháng Một vừa qua, Tian cho biết, nhiều giáo viên đã liên hệ với anh và nói về kết quả tích cực mà họ thấy khi sử dụng nó. Chỉ trong vòng 1 tuần sau khi ra mắt, hơn 30.000 lượt người đã sử dụng – thậm chí có lúc ứng dụng này còn bị crash vì quá đông người truy cập. Sau đó, Streamlit, một nền tảng miễn phí lưu trữ GPTZero đã đứng ra hỗ trợ Tian khi cung cấp nhiều bộ nhớ và tài nguyên hơn để xử lý lưu lượng truy cập web.
GPTZero hoạt động như thế nào
Để xác định xem bài viết này có phải do AI viết hay không, GPTZero sử dụng 2 dấu hiệu: "sự rối rắm" và "sự bùng nổ" trong bài viết.
"Sự rối rắm" đo lường mức độ phức tạp trong đoạn văn bản – nếu GPTZero phát hiện bài viết có mức độ rối rắm, phức tạp cao thì nhiều khả năng nó là do con người viết. Bởi vì ChatGPT hay các chatbot AI được huấn luyện dựa trên dữ liệu từ internet nên nếu GPTZero cảm thấy thân thuộc với các đoạn văn bản đó – nghĩa là mức độ rối rắm thấp, nhiều khả năng nó đã được sản sinh ra bởi một AI.
Trong khi đó "sự bùng nổ" được đo lường bằng cách so sánh giữa các câu với nhau. Con người có xu hướng viết văn với mục đích "bùng nổ" bên trong, ví dụ thường xen kẽ các câu dài hơn và phức tạp hơn bên cạnh các câu ngắn. Còn AI có xu hướng tạo ra các câu văn đồng nhất hơn.
Trong đoạn video trình diễn của mình, Tian so sánh một bài viết trên trang The New Yorker với một bài đăng trên LinkedIn được viết bằng ChatGPT. GPTZero đã phân biệt được bài viết do người viết với AI. Mặc dù vậy, Tian cũng thừa nhận rằng không phải lúc nào bot của mình cũng thành công dựa trên các báo cáo thử nghiệm từ người dùng gửi về. Tian cho biết vẫn đang nỗ lực cải thiện mức độ chính xác trong mô hình của mình.
Cuộc chiến ngăn chặn nạn đạo văn bằng AI
Sinh viên này cũng không phải người duy nhất trong hành trình ngăn chặn nạn gian lận và đạo văn bằng AI. Chính OpenAI, nhà phát triển nên ChatGPT, cũng đã ký một cam kết sẽ ngăn chặn nạn đạo văn bằng AI và các mục đích sử dụng bất chính khác. Tháng trước, Scott Aaronson, một nhà nghiên cứu chuyên về an toàn AI tại OpenAI cho biết, công ty đang phát triển một hình thức như "watermark" đối với các đoạn văn bản do GPT sản sinh ra – một dấu hiệu bí mật không thể bị phát hiện để xác định được nguồn gốc của nội dung này.
Cộng đồng AI mã nguồn mở Hugging Face cũng đã đưa vào một công cụ để phát hiện liệu đoạn văn bản có được tạo ra bởi GPT-2 - một phiên bản tiền nhiệm của mô hình AI làm nên ChatGPT - hay không. Một giáo sư triết học tại Nam Carolina cho biết công cụ này đã giúp ông phát hiện ra một sinh viên dùng AI để làm bài tập hộ mình.
Vào thứ Năm vừa qua, Sở giáo dục thành phố New York cho biết, họ đã chặn truy cập vào ChatGPT đối với các hệ thống mạng trong trường học do các lo ngại về "những tác động tiêu cực đến việc học cũng như các lo ngại về tính an toàn và chính xác của nội dung."
Dù là người phát triển GPTZero, nhưng Tian không phản đối việc sử dụng các công cụ AI như ChatGPT. Tian cho biết: "GPTZero không phải là công cụ để ngăn việc sử dụng những công cụ này. Nhưng với bất kỳ công nghệ mới nào, chúng ta cần có thể chấp nhận nó một cách có trách nhiệm và chúng ta cần các lớp bảo vệ."
Tham khảo NPR