Vì sao ChatGPT ngày càng 'ngu' hơn? Hiện tượng AI model degradation giải thích

Nội dung chính

1. Có một sự thật mà không ai muốn nói thẳng về ChatGPT

Hãy nói thẳng: nhiều người dùng AI lâu năm đang thấy điều gì đó thay đổi — câu trả lời nhạt hơn, kém sáng tạo hơn, đôi khi sai hơn so với trước. OpenAI nói không có chuyện đó. Nhưng dữ liệu từ Stanford lại nói khác.

Câu hỏi thực sự không phải "ChatGPT có đang kém đi không?" mà là: tại sao điều này có thể xảy ra về mặt kỹ thuật, và bạn cần biết gì để dùng AI hiệu quả hơn?

2. Stanford đo được gì?

Nhóm nghiên cứu Stanford & Berkeley so sánh hiệu suất của GPT-3.5 và GPT-4 giữa tháng 3/2023 và tháng 6/2023 — chỉ 3 tháng.

Kết quả đáng chú ý:

Bài kiểm tra	GPT-4 tháng 3/2023	GPT-4 tháng 6/2023
Nhận biết số nguyên tố	97,6% chính xác	2,4% chính xác
Tạo code	Ổn định	Xuất hiện lỗi format mới

Mức giảm từ 97,6% xuống 2,4% không phải suy giảm dần dần — đây là sụp đổ.

OpenAI phó chủ tịch Peter Wellinder phủ nhận: "Chúng tôi không cố tình làm ChatGPT-4 kém đi."

Các nhà nghiên cứu Stanford phản bác: suy giảm là có thể đo được, không chỉ là cảm nhận chủ quan.

Không phép màu ở đây, nhưng: cả hai có thể đúng một phần — OpenAI không cố tình làm kém, nhưng sự suy giảm vẫn xảy ra vì lý do khác.

3. Tại sao AI có thể bị "thối não"? Giải thích không cần biết kỹ thuật

Để dạy AI hoạt động, người ta đưa vào hàng tỷ văn bản để AI học từ đó. Văn bản chất lượng → AI tốt. Văn bản rác → AI kém.

Vấn đề: internet đang ngập tràn nội dung do AI tạo ra. Và các công ty AI đang huấn luyện AI mới bằng... dữ liệu từ internet — trong đó có cả nội dung AI cũ tạo ra.

Đây là vòng lặp nguy hiểm:

AI tạo nội dung → nội dung lên internet → 
AI mới học từ nội dung đó → AI mới kém hơn → 
tạo nội dung kém hơn → vòng lặp tiếp tục

Bỏ jargon sang một bên: giống như photocopy một bức ảnh, rồi photocopy bản photocopy, rồi photocopy tiếp — sau 10 lần, ảnh mờ nhòe gần hết.

Trong kỹ thuật AI, người ta gọi đây là "model collapse" (sụp đổ mô hình).

4. Số liệu đáng lo ngại: dữ liệu internet đang "ô nhiễm" nhanh

Đây là con số thực tế năm 2025–2026:

74,2% nội dung web mới được tạo ra có chứa nội dung AI
30–40% toàn bộ văn bản đang hoạt động trên web là do AI tạo hoặc AI chỉnh sửa
Dữ liệu văn bản chất lượng cao trên internet có thể cạn kiệt trước 2026 (theo dự báo 2023) — nếu xu hướng này tiếp tục

Thêm một điểm đáng chú ý: Nghiên cứu từ Texas A&M/Purdue cho thấy AI model huấn luyện trên 100% nội dung rác có điểm lý luận giảm từ 74,9 → 57,2. Không cần 100% rác — chỉ cần 1 trong 1.000 mẫu là nội dung tổng hợp kém chất lượng để bắt đầu quá trình suy giảm.

5. Điều này xảy ra với ChatGPT chưa?

Bằng chứng cho thấy: đang xảy ra, không phải lo xa.

Stanford đo được — không phải suy đoán
Người dùng nhiều năm kinh nghiệm báo cáo giảm chất lượng (forum OpenAI, Reddit)
74% web mới đã là AI-generated — nguồn huấn luyện đang ô nhiễm
AI được train lại thường xuyên bằng dữ liệu mới từ internet

OpenAI và các công ty AI biết vấn đề này — họ đang tìm cách giải quyết (lọc dữ liệu, giữ nguồn con người, hợp tác với publisher). Nhưng giải pháp chưa hoàn chỉnh.

6. Các hiệu ứng "model collapse" người dùng hay gặp

Dựa trên tổng hợp phản hồi người dùng 2025–2026:

Câu trả lời ngày càng "an toàn" và ít sáng tạo hơn
AI "quên" bối cảnh giữa chừng trong hội thoại dài
Tăng hiện tượng hallucination (bịa thông tin) trong một số loại câu hỏi
Câu trả lời nhiều bài liên quan đến nhau bắt đầu giống nhau — ít đa dạng

Test thực tế cho thấy: Nếu bạn hỏi 10 người dùng AI khác nhau cùng một câu hỏi sáng tạo — câu trả lời họ nhận được ngày càng trùng lặp nhau hơn so với vài năm trước.

Điều này ảnh hưởng gì đến bạn?

Nếu bạn dùng AI để ra quyết định quan trọng:

Đây không phải lý do bỏ AI. Nhưng là lý do để không bao giờ tin 100% vào một câu trả lời duy nhất của AI — đặc biệt với thông tin cụ thể (số liệu, ngày tháng, tên người, quy định pháp lý).

Nếu bạn dùng AI trong công việc sáng tạo:

Câu trả lời AI ngày càng "trung bình hóa" — phản ánh những gì phổ biến nhất trên internet, không phải những gì độc đáo hay phù hợp nhất với bối cảnh cụ thể của bạn. Ý tưởng ban đầu vẫn cần đến từ bạn.

Ba điều nên làm ngay:

Không bao giờ dùng AI như nguồn thông tin duy nhất cho quyết định quan trọng
Khi AI đưa ra số liệu hoặc dữ kiện cụ thể → xác minh từ nguồn độc lập
Đặt câu hỏi phản biện: "AI có thể đang sai ở điểm nào trong câu trả lời này?"

Số liệu & thống kê

Con số	Ý nghĩa	Nguồn
97,6% → 2,4%	GPT-4 giảm độ chính xác nhận biết số nguyên tố trong 3 tháng	Stanford & Berkeley 2023
74,2%	Nội dung web mới chứa nội dung AI (2026)	Tổng hợp nghiên cứu
30–40%	Toàn bộ văn bản web đang hoạt động là AI-generated/edited	Dự báo 2025
74,9 → 57,2	Điểm lý luận AI model sau training trên nội dung rác	Texas A&M/Purdue
1/1.000	Chỉ 1 mẫu AI giả trong 1.000 mẫu có thể bắt đầu quá trình suy giảm	Nature journal 2024

Sources

#	Tiêu đề	URL	Ghi chú
1	Stanford Scientists Find ChatGPT Getting Dumber	https://futurism.com/the-byte/stanford-chatgpt-getting-dumber	Futurism, Stanford research, EN
2	AI Models Collapse When Trained on Recursively Generated Data	https://www.nature.com/articles/s41586-024-07566-y	Nature journal peer-reviewed, EN
3	Model Collapse Explained	https://www.techtarget.com/whatis/feature/Model-collapse-explained-How-synthetic-training-data-breaks-AI	TechTarget, EN
4	Researchers Warn We Could Run Out of AI Training Data	https://theconversation.com/researchers-warn-we-could-run-out-of-data-to-train-ai-by-2026-what-then-216741	The Conversation, EN
5	AI Brain Rot: Why ChatGPT Is Getting Dumber	https://elephas.app/blog/ai-brain-rot-bad-data-research	Elephas.app 2026, EN
6	AI Can Get Brain Rot from Low-Quality Text	https://fortune.com/2025/10/22/ai-brain-rot-junk-social-media-viral-addicting-content-tech/	Fortune 10/2025, EN

Vì sao ChatGPT cũng có thể bị 'thối não'? Hiện tượng AI model degradation