WEBSITE ĐANG PHÁT TRIỂN

Vì sao ChatGPT cũng có thể bị 'thối não'? Hiện tượng AI model degradation

Các mô hình AI như ChatGPT có thể "kém đi" theo thời gian — không phải vì OpenAI cố tình, mà vì chúng đang dần được huấn luyện bằng nội dung do chính AI tạo ra. Stanford đo được GPT-4 có bài kiểm tra giảm từ 97,6% xuống 2,4% độ chính xác chỉ trong 3 tháng. Đây là hiện tượng "model collapse" — và nó ảnh hưởng trực tiếp đến người dùng AI thường xuyên.

Vì sao ChatGPT cũng có thể bị 'thối não'? Hiện tượng AI model degradation

Nội dung chính

1. Có một sự thật mà không ai muốn nói thẳng về ChatGPT

Hãy nói thẳng: nhiều người dùng AI lâu năm đang thấy điều gì đó thay đổi — câu trả lời nhạt hơn, kém sáng tạo hơn, đôi khi sai hơn so với trước. OpenAI nói không có chuyện đó. Nhưng dữ liệu từ Stanford lại nói khác.

Câu hỏi thực sự không phải "ChatGPT có đang kém đi không?" mà là: tại sao điều này có thể xảy ra về mặt kỹ thuật, và bạn cần biết gì để dùng AI hiệu quả hơn?


2. Stanford đo được gì?

Nhóm nghiên cứu Stanford & Berkeley so sánh hiệu suất của GPT-3.5 và GPT-4 giữa tháng 3/2023 và tháng 6/2023 — chỉ 3 tháng.

Kết quả đáng chú ý:

Bài kiểm tra GPT-4 tháng 3/2023 GPT-4 tháng 6/2023
Nhận biết số nguyên tố 97,6% chính xác 2,4% chính xác
Tạo code Ổn định Xuất hiện lỗi format mới

Mức giảm từ 97,6% xuống 2,4% không phải suy giảm dần dần — đây là sụp đổ.

OpenAI phó chủ tịch Peter Wellinder phủ nhận: "Chúng tôi không cố tình làm ChatGPT-4 kém đi."

Các nhà nghiên cứu Stanford phản bác: suy giảm là có thể đo được, không chỉ là cảm nhận chủ quan.

Không phép màu ở đây, nhưng: cả hai có thể đúng một phần — OpenAI không cố tình làm kém, nhưng sự suy giảm vẫn xảy ra vì lý do khác.


3. Tại sao AI có thể bị "thối não"? Giải thích không cần biết kỹ thuật

Để dạy AI hoạt động, người ta đưa vào hàng tỷ văn bản để AI học từ đó. Văn bản chất lượng → AI tốt. Văn bản rác → AI kém.

Vấn đề: internet đang ngập tràn nội dung do AI tạo ra. Và các công ty AI đang huấn luyện AI mới bằng... dữ liệu từ internet — trong đó có cả nội dung AI cũ tạo ra.

Đây là vòng lặp nguy hiểm:

AI tạo nội dung → nội dung lên internet → 
AI mới học từ nội dung đó → AI mới kém hơn → 
tạo nội dung kém hơn → vòng lặp tiếp tục

Bỏ jargon sang một bên: giống như photocopy một bức ảnh, rồi photocopy bản photocopy, rồi photocopy tiếp — sau 10 lần, ảnh mờ nhòe gần hết.

Trong kỹ thuật AI, người ta gọi đây là "model collapse" (sụp đổ mô hình).


4. Số liệu đáng lo ngại: dữ liệu internet đang "ô nhiễm" nhanh

Đây là con số thực tế năm 2025–2026:

  • 74,2% nội dung web mới được tạo ra có chứa nội dung AI
  • 30–40% toàn bộ văn bản đang hoạt động trên web là do AI tạo hoặc AI chỉnh sửa
  • Dữ liệu văn bản chất lượng cao trên internet có thể cạn kiệt trước 2026 (theo dự báo 2023) — nếu xu hướng này tiếp tục

Thêm một điểm đáng chú ý: Nghiên cứu từ Texas A&M/Purdue cho thấy AI model huấn luyện trên 100% nội dung rác có điểm lý luận giảm từ 74,9 → 57,2. Không cần 100% rác — chỉ cần 1 trong 1.000 mẫu là nội dung tổng hợp kém chất lượng để bắt đầu quá trình suy giảm.


5. Điều này xảy ra với ChatGPT chưa?

Bằng chứng cho thấy: đang xảy ra, không phải lo xa.

  1. Stanford đo được — không phải suy đoán
  2. Người dùng nhiều năm kinh nghiệm báo cáo giảm chất lượng (forum OpenAI, Reddit)
  3. 74% web mới đã là AI-generated — nguồn huấn luyện đang ô nhiễm
  4. AI được train lại thường xuyên bằng dữ liệu mới từ internet

OpenAI và các công ty AI biết vấn đề này — họ đang tìm cách giải quyết (lọc dữ liệu, giữ nguồn con người, hợp tác với publisher). Nhưng giải pháp chưa hoàn chỉnh.


6. Các hiệu ứng "model collapse" người dùng hay gặp

Dựa trên tổng hợp phản hồi người dùng 2025–2026:

  • Câu trả lời ngày càng "an toàn" và ít sáng tạo hơn
  • AI "quên" bối cảnh giữa chừng trong hội thoại dài
  • Tăng hiện tượng hallucination (bịa thông tin) trong một số loại câu hỏi
  • Câu trả lời nhiều bài liên quan đến nhau bắt đầu giống nhau — ít đa dạng

Test thực tế cho thấy: Nếu bạn hỏi 10 người dùng AI khác nhau cùng một câu hỏi sáng tạo — câu trả lời họ nhận được ngày càng trùng lặp nhau hơn so với vài năm trước.


Điều này ảnh hưởng gì đến bạn?

Nếu bạn dùng AI để ra quyết định quan trọng:

Đây không phải lý do bỏ AI. Nhưng là lý do để không bao giờ tin 100% vào một câu trả lời duy nhất của AI — đặc biệt với thông tin cụ thể (số liệu, ngày tháng, tên người, quy định pháp lý).

Nếu bạn dùng AI trong công việc sáng tạo:

Câu trả lời AI ngày càng "trung bình hóa" — phản ánh những gì phổ biến nhất trên internet, không phải những gì độc đáo hay phù hợp nhất với bối cảnh cụ thể của bạn. Ý tưởng ban đầu vẫn cần đến từ bạn.

Ba điều nên làm ngay:

  1. Không bao giờ dùng AI như nguồn thông tin duy nhất cho quyết định quan trọng
  2. Khi AI đưa ra số liệu hoặc dữ kiện cụ thể → xác minh từ nguồn độc lập
  3. Đặt câu hỏi phản biện: "AI có thể đang sai ở điểm nào trong câu trả lời này?"

Số liệu & thống kê

Con số Ý nghĩa Nguồn
97,6% → 2,4% GPT-4 giảm độ chính xác nhận biết số nguyên tố trong 3 tháng Stanford & Berkeley 2023
74,2% Nội dung web mới chứa nội dung AI (2026) Tổng hợp nghiên cứu
30–40% Toàn bộ văn bản web đang hoạt động là AI-generated/edited Dự báo 2025
74,9 → 57,2 Điểm lý luận AI model sau training trên nội dung rác Texas A&M/Purdue
1/1.000 Chỉ 1 mẫu AI giả trong 1.000 mẫu có thể bắt đầu quá trình suy giảm Nature journal 2024

Sources

# Tiêu đề URL Ghi chú
1 Stanford Scientists Find ChatGPT Getting Dumber https://futurism.com/the-byte/stanford-chatgpt-getting-dumber Futurism, Stanford research, EN
2 AI Models Collapse When Trained on Recursively Generated Data https://www.nature.com/articles/s41586-024-07566-y Nature journal peer-reviewed, EN
3 Model Collapse Explained https://www.techtarget.com/whatis/feature/Model-collapse-explained-How-synthetic-training-data-breaks-AI TechTarget, EN
4 Researchers Warn We Could Run Out of AI Training Data https://theconversation.com/researchers-warn-we-could-run-out-of-data-to-train-ai-by-2026-what-then-216741 The Conversation, EN
5 AI Brain Rot: Why ChatGPT Is Getting Dumber https://elephas.app/blog/ai-brain-rot-bad-data-research Elephas.app 2026, EN
6 AI Can Get Brain Rot from Low-Quality Text https://fortune.com/2025/10/22/ai-brain-rot-junk-social-media-viral-addicting-content-tech/ Fortune 10/2025, EN

Bài viết liên quan

Xem thêm
Tin tức AI

Studio game nào đang dùng AI hiệu quả, studio nào đang thất bại? Toàn cảnh 2026

Năm 2026, ngành game toàn cầu đang bị chia đôi: một nhóm nhỏ studio nhỏ và độc lập đang dùng AI để "làm được nhiều hơn với ít người hơn", trong khi nhiều tập đoàn lớn lại dùng AI như cái cớ để sa thải hàng loạt — gây ra làn sóng phẫn nộ từ chính nhân viên của họ. 52% nhà phát triển game toàn cầu hiện cho rằng AI đang gây hại cho ngành.

Tin tức AI

OpenAI vs. Anthropic vs. Google: ai đang giải quyết vấn đề model collapse tốt nhất?

Cả ba ông lớn AI đều biết AI đang có nguy cơ "tự ăn mình" khi học từ nội dung AI tạo ra — nhưng họ xử lý theo 3 cách hoàn toàn khác nhau. OpenAI mua dữ liệu người thật, Anthropic sửa hạ tầng bên trong, Google phát triển công cụ lọc và phát hiện ô nhiễm. Ai đang thắng? Câu trả lời không đơn giản — và điều đó ảnh hưởng trực tiếp đến chất lượng AI bạn đang dùng hằng ngày.

Tin tức AI

Meta sa thải 8.000 người vì AI: 3 bài học cho người đi làm Việt Nam

Ngày 18/4/2026, Meta thông báo sẽ sa thải 8.000 nhân viên — chiếm 10% tổng lực lượng lao động — bắt đầu từ 20/5/2026. Lý do: cắt chi phí nhân sự để đổ vào 135 tỷ USD đầu tư AI trong năm nay. Đây không phải chuyện riêng của Meta: toàn ngành công nghệ đã mất hơn 95.000 việc làm trong 4 tháng đầu 2026. Bài học là gì cho người đi làm Việt Nam?