📘 Giới thiệu tài liệu
Vào ngày 25/06/2025, một tài liệu nội bộ có tên “Hướng Dẫn Kiểm Duyệt của ChatGPT (Jailbroken)” đã bị tiết lộ thông qua một phiên bản ChatGPT bị “bẻ khóa” (jailbroken) và được đăng công khai trên mạng xã hội X bởi tài khoản @WhiteRabbiHole. Đây là một trong những lần hiếm hoi cộng đồng có thể tiếp cận trực tiếp với thông tin hậu trường về cách mà ChatGPT – một trong những mô hình AI nổi tiếng nhất thế giới – thực hiện việc kiểm duyệt nội dung.
0:00
/0:12
Tài liệu chia sẻ cơ chế kiểm duyệt nội dung của chatGPT
🚨 Có gì trong tài liệu?
Tài liệu cung cấp cái nhìn sâu sắc và cụ thể về:
- 🎯 Cách phân loại và xử lý chủ đề nhạy cảm: như xung đột Israel-Palestine, Holocaust, thống kê tội phạm theo chủng tộc, v.v.
- 🧠 Quy trình kiểm duyệt tự động của hệ thống: bao gồm gắn cờ (flag), chuyển nội dung cho nhân viên đánh giá và đưa ra quyết định chặn hoặc cho phép.
- 🛡️ Cơ chế phân biệt nhóm “bảo vệ” (protected) và “không được bảo vệ” (unprotected): giúp xác định mức độ kiểm soát khi nội dung liên quan đến các nhóm xã hội khác nhau.
- 📊 Ví dụ minh họa cụ thể: về các trường hợp ChatGPT được huấn luyện để phản hồi, từ chối, hoặc né tránh trả lời những câu hỏi “nhạy cảm về chính trị và xã hội”.

📢 Tại sao tài liệu này quan trọng?
- 🧩 Minh bạch hóa thuật toán: Những gì người dùng từng nghi ngờ về thiên kiến và sự kiểm duyệt có hệ thống trong ChatGPT giờ đây được chứng thực bằng tài liệu chi tiết.
- 🧭 Gây tranh cãi về tự do ngôn luận: Khi AI đang dần trở thành công cụ định hình tư duy đại chúng, tài liệu này đặt ra câu hỏi: “Liệu AI có nên kiểm soát tư tưởng con người?”
- 🌐 Liên hệ xu hướng toàn cầu: Trùng hợp với báo cáo của UNESCO (2024) cho thấy kiểm duyệt do AI thúc đẩy đã tăng 30% kể từ năm 2020.