Nội dung chính
1. Có một sự thật mà không ai muốn nói thẳng về ChatGPT
Hãy nói thẳng: nhiều người dùng AI lâu năm đang thấy điều gì đó thay đổi — câu trả lời nhạt hơn, kém sáng tạo hơn, đôi khi sai hơn so với trước. OpenAI nói không có chuyện đó. Nhưng dữ liệu từ Stanford lại nói khác.
Câu hỏi thực sự không phải "ChatGPT có đang kém đi không?" mà là: tại sao điều này có thể xảy ra về mặt kỹ thuật, và bạn cần biết gì để dùng AI hiệu quả hơn?
2. Stanford đo được gì?
Nhóm nghiên cứu Stanford & Berkeley so sánh hiệu suất của GPT-3.5 và GPT-4 giữa tháng 3/2023 và tháng 6/2023 — chỉ 3 tháng.
Kết quả đáng chú ý:
| Bài kiểm tra | GPT-4 tháng 3/2023 | GPT-4 tháng 6/2023 |
|---|---|---|
| Nhận biết số nguyên tố | 97,6% chính xác | 2,4% chính xác |
| Tạo code | Ổn định | Xuất hiện lỗi format mới |
Mức giảm từ 97,6% xuống 2,4% không phải suy giảm dần dần — đây là sụp đổ.
OpenAI phó chủ tịch Peter Wellinder phủ nhận: "Chúng tôi không cố tình làm ChatGPT-4 kém đi."
Các nhà nghiên cứu Stanford phản bác: suy giảm là có thể đo được, không chỉ là cảm nhận chủ quan.
Không phép màu ở đây, nhưng: cả hai có thể đúng một phần — OpenAI không cố tình làm kém, nhưng sự suy giảm vẫn xảy ra vì lý do khác.
3. Tại sao AI có thể bị "thối não"? Giải thích không cần biết kỹ thuật
Để dạy AI hoạt động, người ta đưa vào hàng tỷ văn bản để AI học từ đó. Văn bản chất lượng → AI tốt. Văn bản rác → AI kém.
Vấn đề: internet đang ngập tràn nội dung do AI tạo ra. Và các công ty AI đang huấn luyện AI mới bằng... dữ liệu từ internet — trong đó có cả nội dung AI cũ tạo ra.
Đây là vòng lặp nguy hiểm:
AI tạo nội dung → nội dung lên internet →
AI mới học từ nội dung đó → AI mới kém hơn →
tạo nội dung kém hơn → vòng lặp tiếp tục
Bỏ jargon sang một bên: giống như photocopy một bức ảnh, rồi photocopy bản photocopy, rồi photocopy tiếp — sau 10 lần, ảnh mờ nhòe gần hết.
Trong kỹ thuật AI, người ta gọi đây là "model collapse" (sụp đổ mô hình).
4. Số liệu đáng lo ngại: dữ liệu internet đang "ô nhiễm" nhanh
Đây là con số thực tế năm 2025–2026:
- 74,2% nội dung web mới được tạo ra có chứa nội dung AI
- 30–40% toàn bộ văn bản đang hoạt động trên web là do AI tạo hoặc AI chỉnh sửa
- Dữ liệu văn bản chất lượng cao trên internet có thể cạn kiệt trước 2026 (theo dự báo 2023) — nếu xu hướng này tiếp tục
Thêm một điểm đáng chú ý: Nghiên cứu từ Texas A&M/Purdue cho thấy AI model huấn luyện trên 100% nội dung rác có điểm lý luận giảm từ 74,9 → 57,2. Không cần 100% rác — chỉ cần 1 trong 1.000 mẫu là nội dung tổng hợp kém chất lượng để bắt đầu quá trình suy giảm.
5. Điều này xảy ra với ChatGPT chưa?
Bằng chứng cho thấy: đang xảy ra, không phải lo xa.
- Stanford đo được — không phải suy đoán
- Người dùng nhiều năm kinh nghiệm báo cáo giảm chất lượng (forum OpenAI, Reddit)
- 74% web mới đã là AI-generated — nguồn huấn luyện đang ô nhiễm
- AI được train lại thường xuyên bằng dữ liệu mới từ internet
OpenAI và các công ty AI biết vấn đề này — họ đang tìm cách giải quyết (lọc dữ liệu, giữ nguồn con người, hợp tác với publisher). Nhưng giải pháp chưa hoàn chỉnh.
6. Các hiệu ứng "model collapse" người dùng hay gặp
Dựa trên tổng hợp phản hồi người dùng 2025–2026:
- Câu trả lời ngày càng "an toàn" và ít sáng tạo hơn
- AI "quên" bối cảnh giữa chừng trong hội thoại dài
- Tăng hiện tượng hallucination (bịa thông tin) trong một số loại câu hỏi
- Câu trả lời nhiều bài liên quan đến nhau bắt đầu giống nhau — ít đa dạng
Test thực tế cho thấy: Nếu bạn hỏi 10 người dùng AI khác nhau cùng một câu hỏi sáng tạo — câu trả lời họ nhận được ngày càng trùng lặp nhau hơn so với vài năm trước.
Điều này ảnh hưởng gì đến bạn?
Nếu bạn dùng AI để ra quyết định quan trọng:
Đây không phải lý do bỏ AI. Nhưng là lý do để không bao giờ tin 100% vào một câu trả lời duy nhất của AI — đặc biệt với thông tin cụ thể (số liệu, ngày tháng, tên người, quy định pháp lý).
Nếu bạn dùng AI trong công việc sáng tạo:
Câu trả lời AI ngày càng "trung bình hóa" — phản ánh những gì phổ biến nhất trên internet, không phải những gì độc đáo hay phù hợp nhất với bối cảnh cụ thể của bạn. Ý tưởng ban đầu vẫn cần đến từ bạn.
Ba điều nên làm ngay:
- Không bao giờ dùng AI như nguồn thông tin duy nhất cho quyết định quan trọng
- Khi AI đưa ra số liệu hoặc dữ kiện cụ thể → xác minh từ nguồn độc lập
- Đặt câu hỏi phản biện: "AI có thể đang sai ở điểm nào trong câu trả lời này?"
Số liệu & thống kê
| Con số | Ý nghĩa | Nguồn |
|---|---|---|
| 97,6% → 2,4% | GPT-4 giảm độ chính xác nhận biết số nguyên tố trong 3 tháng | Stanford & Berkeley 2023 |
| 74,2% | Nội dung web mới chứa nội dung AI (2026) | Tổng hợp nghiên cứu |
| 30–40% | Toàn bộ văn bản web đang hoạt động là AI-generated/edited | Dự báo 2025 |
| 74,9 → 57,2 | Điểm lý luận AI model sau training trên nội dung rác | Texas A&M/Purdue |
| 1/1.000 | Chỉ 1 mẫu AI giả trong 1.000 mẫu có thể bắt đầu quá trình suy giảm | Nature journal 2024 |
Sources
| # | Tiêu đề | URL | Ghi chú |
|---|---|---|---|
| 1 | Stanford Scientists Find ChatGPT Getting Dumber | https://futurism.com/the-byte/stanford-chatgpt-getting-dumber | Futurism, Stanford research, EN |
| 2 | AI Models Collapse When Trained on Recursively Generated Data | https://www.nature.com/articles/s41586-024-07566-y | Nature journal peer-reviewed, EN |
| 3 | Model Collapse Explained | https://www.techtarget.com/whatis/feature/Model-collapse-explained-How-synthetic-training-data-breaks-AI | TechTarget, EN |
| 4 | Researchers Warn We Could Run Out of AI Training Data | https://theconversation.com/researchers-warn-we-could-run-out-of-data-to-train-ai-by-2026-what-then-216741 | The Conversation, EN |
| 5 | AI Brain Rot: Why ChatGPT Is Getting Dumber | https://elephas.app/blog/ai-brain-rot-bad-data-research | Elephas.app 2026, EN |
| 6 | AI Can Get Brain Rot from Low-Quality Text | https://fortune.com/2025/10/22/ai-brain-rot-junk-social-media-viral-addicting-content-tech/ | Fortune 10/2025, EN |