Trong khi các hãng công nghệ đang thi nhau khoe về “trí tuệ siêu việt” của thế hệ AI mới, một bài đăng trên X đã bất ngờ trở thành trò cười cộng đồng khi GPT-5… trượt vỏ chuối ngay ở một phương trình đơn giản:
Bài toán:
5.9 = x + 5.11
GPT-5 giải:
5.9 − 5.11 = −0.21 → x = −0.21
Gemini 2.5 Flash giải:
x = 0.79 (chuẩn không cần chỉnh)
Trong khi “đồng nghiệp” của Google bình tĩnh tính toán và đưa ra đáp án đúng, GPT-5 lại quyết đoán… cộng nhầm, trừ lệch, và vẫn tự tin chốt kết quả sai.

Theo một nghiên cứu của AI Safety Institute (2024), các mô hình AI hàng đầu, kể cả GPT-4o hay hậu duệ, đôi khi vẫn “đi lạc” ở những phép tính sơ đẳng. Nguyên nhân? Quá dựa vào “ghi nhớ mẫu câu” thay vì thật sự suy luận logic. Nói cách khác: làm toán bằng… cảm giác.
Đằng sau lớp áo PR hào nhoáng “siêu thông minh” vẫn là những cỗ máy có thể vấp ngã ở mức toán tiểu học.
Điều thú vị là ngay sau vụ việc, phía OpenAI cho biết:
“GPT-5 will seem smarter starting today. Yesterday, the autoswitcher broke and was out of commission for a chunk of the day, and the result was GPT-5 seemed way dumber. Also, we are making some interventions to how the decision boundary works that should help you get the right model more often.”
Tạm dịch: “Bắt đầu từ hôm nay, GPT-5 sẽ có vẻ thông minh hơn. Hôm qua, bộ chuyển tự động gặp trục trặc và ngừng hoạt động một thời gian, khiến GPT-5 trông… ngớ ngẩn hơn thường lệ. Chúng tôi cũng đang thực hiện một số điều chỉnh ở ranh giới quyết định để bạn nhận được đúng mô hình thường xuyên hơn.”
Câu chuyện không chỉ khiến cộng đồng mạng bật cười mà còn thổi bùng sự hoài nghi về cuộc đua AI năm 2025, khi các ông lớn như OpenAI và Google vẫn đang mải mê chứng minh ai mới là “chúa tể trí tuệ” — trong khi đôi khi, trí tuệ đó lại thua… một chiếc máy tính Casio 50k.

📌 GPT-5 là gì?
GPT-5 là thế hệ tiếp theo của dòng mô hình ngôn ngữ lớn (LLM) do OpenAI phát triển, kế nhiệm GPT-4o. Được quảng bá là “siêu thông minh” với khả năng viết, phân tích và lý luận nâng cao, GPT-5 hỗ trợ nhiều ngôn ngữ, xử lý đa phương thức (văn bản, hình ảnh, âm thanh) và được thiết kế để đáp ứng nhu cầu từ sáng tạo nội dung đến trợ lý công việc.

🔹 Điểm mới và nổi bật của GPT-5
1️⃣ 🧠 Hiểu & phản hồi như chuyên gia
GPT-5 mang lại cảm giác như đang trò chuyện với một chuyên gia cấp độ tiến sĩ (PhD-level expert) ở bất kỳ lĩnh vực nào.
- Trên bài benchmark GPQA Diamond – kiểm tra mức độ hỏi đáp khoa học sâu – GPT-5 Pro đạt 89.4% ngay lần thử đầu tiên, vượt Claude Opus 4.1 (80.9%) và Grok 4 Heavy (88.9%).
- Khả năng phân tích sâu, giải thích mạch lạc và gợi mở hướng giải quyết như một cố vấn thực thụ.
2️⃣ 🎯 Giảm “ảo giác”, tăng độ chính xác
- Tỉ lệ trả lời sai sự thật giảm mạnh nhờ cơ chế kiểm soát và truy xuất ngữ cảnh nâng cao.
- HealthBench Hard Hallucinations: GPT-5 (bật “thinking”) chỉ 1.6%, so với GPT-4o (12.9%) và o3 (15.8%).
- TechCrunch: GPT-5 (thinking) sai 4.8%, giảm đáng kể so với o3 (22%) và GPT-4o (20.6%).
- Medium: Bật chuỗi suy luận (“thinking”) giúp giảm sai lệch gấp 4–10 lần so với GPT-3/4.
3️⃣ 🧩 Suy luận logic mặc định
- Tự động chia nhỏ vấn đề phức tạp, giải từng bước logic mà trước đây cần bật thủ công.
- SWE-bench Verified: GPT-5 (thinking) đạt 74.9%, tăng từ 52.8% và vượt o3 (69.1%).
- Aider Polyglot (code editing): GPT-5 (thinking) đạt 88.0%, tăng mạnh từ 26.7%, vượt o3 (79.6%).
4️⃣ ⚡ Tốc độ xử lý vượt trội
- Phản hồi nhanh hơn đáng kể, ngay cả khi xử lý tác vụ nặng.
- GPT-5 cần 22% ít tokens và 45% ít tool calls hơn so với o3 ở mức reasoning effort cao.
5️⃣ 🔄 Trải nghiệm đồng nhất, không cần chọn mô hình
- Hệ thống định tuyến thông minh tự nhận biết độ phức tạp câu hỏi và chọn mô hình tối ưu.
- Người dùng chỉ cần đặt câu hỏi, mọi việc còn lại GPT-5 xử lý.
6️⃣ 📦 Đa phiên bản linh hoạt
- GPT-5-mini và GPT-5-nano: tốc độ cao, tiết kiệm tài nguyên và chi phí.
- Phù hợp từ học tập nhanh đến nghiên cứu chuyên sâu.
7️⃣ 🎨 Tùy biến cá nhân hóa sâu hơn
- Chọn giao diện, tông màu, phong cách phản hồi (hoài nghi, hài hước, robot khoa học).
- Trải nghiệm mang dấu ấn cá nhân rõ rệt.
8️⃣ 🔗 Kết nối mở rộng với công cụ bên ngoài
- Liên kết với Gmail, Google Calendar, Danh bạ…
- GPT-5 có thể tra cứu email, hẹn lịch, soạn thư cá nhân hóa, tự động hóa công việc.
9️⃣ 🖼️ Tương tác đa phương tiện thế hệ mới
- GPT-5 là mô hình multimodal thống nhất (text, hình ảnh, video, âm thanh).
- MMMU benchmark: 84.2% (bản high), vượt các đời trước.
- Hỗ trợ marketing, sáng tạo nội dung đa nền tảng, phân tích hình ảnh – âm thanh phức tạp.
🔟 📚 Ghi nhớ dài hơn, phân tích tài liệu lớn hơn
- Nhớ mạch hội thoại dài hoặc phân tích tài liệu, hợp đồng pháp lý nhiều trang vẫn mạch lạc.
- Context window lên đến 256.000 tokens (tăng từ ~200.000).
- BrowseComp Long Context (128K–256K): GPT-5 trả lời đúng đến 89%.
Trong trường hợp bạn muốn sử dụng GPT-5 thay vào các mô hình cũ hơn, bạn có thể cài đặt lại trong setting

📌 Xem thêm:
👉 Những bài viết mới về ChatGPT