🤖 GPT-5 gặp “tai nạn” ngay trong một bài toán lớp 3

GPT-5 vừa khiến cộng đồng mạng bật cười khi giải sai một bài toán lớp 3, trong khi đối thủ Gemini 2.5 Flash lại trả lời chính xác. Sự cố này làm dấy lên hoài nghi về “trí tuệ siêu việt” của AI hiện đại.
🤖 GPT-5 gặp “tai nạn” ngay trong một bài toán lớp 3
Photo by Tony Hand / Unsplash

Request Article Update

Loading form...

Trong khi các hãng công nghệ đang thi nhau khoe về “trí tuệ siêu việt” của thế hệ AI mới, một bài đăng trên X đã bất ngờ trở thành trò cười cộng đồng khi GPT-5… trượt vỏ chuối ngay ở một phương trình đơn giản:

Bài toán:
5.9 = x + 5.11

GPT-5 giải:
5.9 − 5.11 = −0.21 → x = −0.21

Gemini 2.5 Flash giải:

x = 0.79 (chuẩn không cần chỉnh)

Trong khi “đồng nghiệp” của Google bình tĩnh tính toán và đưa ra đáp án đúng, GPT-5 lại quyết đoán… cộng nhầm, trừ lệch, và vẫn tự tin chốt kết quả sai.

GPT-5 đưa ra câu trả lời sai lệch cho một bài toán đơn

Theo một nghiên cứu của AI Safety Institute (2024), các mô hình AI hàng đầu, kể cả GPT-4o hay hậu duệ, đôi khi vẫn “đi lạc” ở những phép tính sơ đẳng. Nguyên nhân? Quá dựa vào “ghi nhớ mẫu câu” thay vì thật sự suy luận logic. Nói cách khác: làm toán bằng… cảm giác.

 Đằng sau lớp áo PR hào nhoáng “siêu thông minh” vẫn là những cỗ máy có thể vấp ngã ở mức toán tiểu học.

Điều thú vị là ngay sau vụ việc, phía OpenAI cho biết:

“GPT-5 will seem smarter starting today. Yesterday, the autoswitcher broke and was out of commission for a chunk of the day, and the result was GPT-5 seemed way dumber. Also, we are making some interventions to how the decision boundary works that should help you get the right model more often.”

Tạm dịch: “Bắt đầu từ hôm nay, GPT-5 sẽ có vẻ thông minh hơn. Hôm qua, bộ chuyển tự động gặp trục trặc và ngừng hoạt động một thời gian, khiến GPT-5 trông… ngớ ngẩn hơn thường lệ. Chúng tôi cũng đang thực hiện một số điều chỉnh ở ranh giới quyết định để bạn nhận được đúng mô hình thường xuyên hơn.”

Câu chuyện không chỉ khiến cộng đồng mạng bật cười mà còn thổi bùng sự hoài nghi về cuộc đua AI năm 2025, khi các ông lớn như OpenAI và Google vẫn đang mải mê chứng minh ai mới là “chúa tể trí tuệ” — trong khi đôi khi, trí tuệ đó lại thua… một chiếc máy tính Casio 50k.

Ảnh minh hoạ chatgpt thất bại trong bài toán đơn giản so với Casio

📌 GPT-5 là gì?

GPT-5 là thế hệ tiếp theo của dòng mô hình ngôn ngữ lớn (LLM) do OpenAI phát triển, kế nhiệm GPT-4o. Được quảng bá là “siêu thông minh” với khả năng viết, phân tích và lý luận nâng cao, GPT-5 hỗ trợ nhiều ngôn ngữ, xử lý đa phương thức (văn bản, hình ảnh, âm thanh) và được thiết kế để đáp ứng nhu cầu từ sáng tạo nội dung đến trợ lý công việc.

Giao diện mới của ChatGPT

🔹 Điểm mới và nổi bật của GPT-5

1️⃣ 🧠 Hiểu & phản hồi như chuyên gia

GPT-5 mang lại cảm giác như đang trò chuyện với một chuyên gia cấp độ tiến sĩ (PhD-level expert) ở bất kỳ lĩnh vực nào.

  • Trên bài benchmark GPQA Diamond – kiểm tra mức độ hỏi đáp khoa học sâu – GPT-5 Pro đạt 89.4% ngay lần thử đầu tiên, vượt Claude Opus 4.1 (80.9%) và Grok 4 Heavy (88.9%).
  • Khả năng phân tích sâu, giải thích mạch lạc và gợi mở hướng giải quyết như một cố vấn thực thụ.

2️⃣ 🎯 Giảm “ảo giác”, tăng độ chính xác

  • Tỉ lệ trả lời sai sự thật giảm mạnh nhờ cơ chế kiểm soát và truy xuất ngữ cảnh nâng cao.
  • HealthBench Hard Hallucinations: GPT-5 (bật “thinking”) chỉ 1.6%, so với GPT-4o (12.9%) và o3 (15.8%).
  • TechCrunch: GPT-5 (thinking) sai 4.8%, giảm đáng kể so với o3 (22%) và GPT-4o (20.6%).
  • Medium: Bật chuỗi suy luận (“thinking”) giúp giảm sai lệch gấp 4–10 lần so với GPT-3/4.

3️⃣ 🧩 Suy luận logic mặc định

  • Tự động chia nhỏ vấn đề phức tạp, giải từng bước logic mà trước đây cần bật thủ công.
  • SWE-bench Verified: GPT-5 (thinking) đạt 74.9%, tăng từ 52.8% và vượt o3 (69.1%).
  • Aider Polyglot (code editing): GPT-5 (thinking) đạt 88.0%, tăng mạnh từ 26.7%, vượt o3 (79.6%).

4️⃣ ⚡ Tốc độ xử lý vượt trội

  • Phản hồi nhanh hơn đáng kể, ngay cả khi xử lý tác vụ nặng.
  • GPT-5 cần 22% ít tokens và 45% ít tool calls hơn so với o3 ở mức reasoning effort cao.

5️⃣ 🔄 Trải nghiệm đồng nhất, không cần chọn mô hình

  • Hệ thống định tuyến thông minh tự nhận biết độ phức tạp câu hỏi và chọn mô hình tối ưu.
  • Người dùng chỉ cần đặt câu hỏi, mọi việc còn lại GPT-5 xử lý.

6️⃣ 📦 Đa phiên bản linh hoạt

  • GPT-5-mini và GPT-5-nano: tốc độ cao, tiết kiệm tài nguyên và chi phí.
  • Phù hợp từ học tập nhanh đến nghiên cứu chuyên sâu.

7️⃣ 🎨 Tùy biến cá nhân hóa sâu hơn

  • Chọn giao diện, tông màu, phong cách phản hồi (hoài nghi, hài hước, robot khoa học).
  • Trải nghiệm mang dấu ấn cá nhân rõ rệt.

8️⃣ 🔗 Kết nối mở rộng với công cụ bên ngoài

  • Liên kết với Gmail, Google Calendar, Danh bạ…
  • GPT-5 có thể tra cứu email, hẹn lịch, soạn thư cá nhân hóa, tự động hóa công việc.

9️⃣ 🖼️ Tương tác đa phương tiện thế hệ mới

  • GPT-5 là mô hình multimodal thống nhất (text, hình ảnh, video, âm thanh).
  • MMMU benchmark: 84.2% (bản high), vượt các đời trước.
  • Hỗ trợ marketing, sáng tạo nội dung đa nền tảng, phân tích hình ảnh – âm thanh phức tạp.

🔟 📚 Ghi nhớ dài hơn, phân tích tài liệu lớn hơn

  • Nhớ mạch hội thoại dài hoặc phân tích tài liệu, hợp đồng pháp lý nhiều trang vẫn mạch lạc.
  • Context window lên đến 256.000 tokens (tăng từ ~200.000).
  • BrowseComp Long Context (128K–256K): GPT-5 trả lời đúng đến 89%.

Trong trường hợp bạn muốn sử dụng GPT-5 thay vào các mô hình cũ hơn, bạn có thể cài đặt lại trong setting

📌 Xem thêm:
👉 Những bài viết mới về ChatGPT

🍁
Liên hệ chúng tôi tại support@aiappvn.com nếu bạn cần hỗ trợ
💞
Đăng ký thành viên để xem những phản hồi của người dùng và để lại comment 💬 về trải nghiệm ứng dụng nếu bạn đã sử dụng cho cộng đồng biết nhé. 👇 Click vào thẻ tag phía dưới để xem những ứng dụng liên quan.

Promote Your Tool

Tận dụng sức mạnh AI – Làm việc thông minh hơn, nhanh hơn !

AI không còn là tương lai – nó đã ở đây! AIAppVn giúp bạn khám phá, đánh giá và trải nghiệm những ứng dụng AI hàng đầu, giúp tối ưu công việc và cuộc sống.

AIAppVn

Tuyệt vời! Bạn đã đăng ký thành công.

Chào mừng trở lại! Bạn đã đăng nhập thành công.

Bạn đã đăng ký thành công tại AIAppVn.

Thành công! Kiểm tra email của bạn để nhận liên kết đăng nhập.

Thành công! Thông tin thanh toán của bạn đã được cập nhật.

Thông tin thanh toán của bạn chưa được cập nhật.