WEBSITE ĐANG PHÁT TRIỂN

Anthropic ra mắt Claude Mythos: AI tìm được hàng nghìn lỗ hổng bảo mật, nhưng không ai được dùng

Ngày 7/4/2026, Anthropic công bố Claude Mythos Preview — mô hình AI mạnh nhất thế giới tính đến hiện tại, với khả năng tìm và khai thác lỗ hổng bảo mật trong mọi hệ điều hành lớn. Anthropic quyết định không phát hành công khai vì đánh giá mô hình "quá nguy hiểm". Thay vào đó, họ lập Project Glasswing — một liên minh phòng thủ bảo mật với Amazon, Apple, Google, Microsoft, Nvidia. Đây là lần đầu tiên một công ty AI lớn chủ động giữ lại mô hình mạnh nhất của mình vì lý do an toàn.

Anthropic ra mắt Claude Mythos: AI tìm được hàng nghìn lỗ hổng bảo mật, nhưng không ai được dùng

Nội dung chính

1. Claude Mythos là gì và tại sao nó khác biệt

Ngày 7/4/2026, Anthropic ra mắt Claude Mythos Preview tại trang red.anthropic.com — nơi công ty thường công bố các nghiên cứu an toàn AI nhạy cảm.

Theo Anthropic, Mythos là mô hình ngôn ngữ lớn đa năng, nhưng điểm khác biệt nằm ở khả năng bảo mật: mô hình có thể tự động tìm và khai thác lỗ hổng zero-day — tức lỗ hổng chưa từng được phát hiện trước đó — trong mọi hệ điều hành lớn (Windows, macOS, Linux) và mọi trình duyệt phổ biến.

Chỉ trong vài tuần chạy thử nội bộ, Mythos đã phát hiện hàng nghìn lỗ hổng chưa biết. Đáng chú ý nhất: một lỗ hổng trong OpenBSD tồn tại suốt 27 năm mà không ai phát hiện. Mô hình còn viết được một chuỗi khai thác trình duyệt bằng cách ghép bốn lỗ hổng riêng biệt lại với nhau — mức độ kỹ thuật từng chỉ có ở đội hack cấp quốc gia.

2. Con số benchmark và khoảng cách với phần còn lại

Dữ liệu từ Anthropic và các bên kiểm định độc lập cho thấy Mythos tạo ra khoảng cách đáng kể so với các mô hình đang dùng phổ biến:

Benchmark Claude Mythos GPT-5.4 Claude Opus 4.6
SWE-bench Verified 93.9% 80.0% 80.8%
SWE-bench Pro 77.8% 57.7%
USAMO 2026 (toán) 97.6% 95.2%
GPQA Diamond 94.5% 91.3%
Terminal-Bench 2.0 82.0% 75.1%

SWE-bench đo khả năng viết code sửa lỗi phần mềm thực tế. Đạt 93.9% nghĩa là Mythos có thể xử lý gần như toàn bộ các ticket kỹ thuật ở mức kỹ sư cấp cao.

3. Tại sao Anthropic không phát hành công khai

Đây là quyết định hiếm gặp trong ngành. Theo CNN và TechCrunch, Anthropic xác định rằng "việc phát hành mô hình này ra công chúng sẽ làm tăng nguy cơ tấn công mạng quy mô lớn bằng AI."

Thay vì tung ra thị trường để cạnh tranh với OpenAI, Anthropic lập Project Glasswing — một liên minh an ninh phòng thủ. Các tổ chức tham gia bao gồm: Amazon, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, và Nvidia. Anthropic cung cấp 100 triệu USD tín dụng sử dụng và 4 triệu USD tài trợ trực tiếp cho các tổ chức bảo mật mã nguồn mở.

Mục tiêu: dùng Mythos để vá lỗ hổng trước khi kẻ xấu có công cụ tương đương. Anthropic gọi đây là chiến lược "phòng thủ đi trước tấn công."


Điều này ảnh hưởng gì đến bạn?

Với người dùng phổ thông tại Việt Nam, Claude Mythos Preview chưa ảnh hưởng trực tiếp. Bạn vẫn đang dùng Claude Sonnet 4.6 hoặc GPT-5.4 — các mô hình đủ mạnh cho công việc hằng ngày.

Nhưng đặt trong bối cảnh Việt Nam, có ba điểm cần chú ý:

Thứ nhất, hạ tầng số của Việt Nam đang là mục tiêu. Theo Cục An toàn thông tin (Bộ TT&TT), các cuộc tấn công mạng nhắm vào tổ chức Việt Nam tăng 40% trong năm 2025. Nếu các công cụ AI cấp Mythos rơi vào tay nhóm tấn công — dù từ nguồn nào — hạ tầng ngân hàng, y tế, cơ quan nhà nước đều trở thành mục tiêu dễ bị tổn thương hơn.

Thứ hai, khoảng cách bảo mật AI trong khu vực đang doãng ra. Singapore đã có đại diện trong các liên minh an ninh AI quốc tế từ 2024. Thái Lan và Indonesia đang thử nghiệm khung quản trị AI riêng. Việt Nam chưa có mặt trong Project Glasswing hay bất kỳ sáng kiến tương tự. Điều đó không có nghĩa là chúng ta không được bảo vệ — nhưng chúng ta không có ghế ở bàn quyết định.

Thứ ba, quyết định của Anthropic là một tiền lệ quan trọng. Đây là lần đầu một công ty AI hàng đầu công khai nói "mô hình này quá mạnh để phát hành." Nếu xu hướng này lan rộng — các mô hình thế hệ tiếp theo bị kiểm soát theo liên minh — thì khả năng tiếp cận AI mạnh nhất sẽ phụ thuộc vào quan hệ ngoại giao và vị trí địa chính trị, không chỉ vào khả năng kỹ thuật.


Số liệu & thống kê

  • 93.9% — điểm SWE-bench Verified của Mythos (cao nhất từ trước đến nay)
  • 27 năm — tuổi của lỗ hổng OpenBSD mà Mythos phát hiện ra
  • 12 đối tác — số tổ chức tham gia Project Glasswing từ ngày ra mắt
  • $100 triệu USD — tín dụng sử dụng Anthropic cung cấp cho các đối tác Glasswing
  • $30 tỷ USD — doanh thu run rate của Anthropic (tháng 4/2026, theo Bloomberg)
  • Không có mốc thời gian — Anthropic chưa xác định khi nào Mythos sẽ phát hành rộng rãi

Sources

# Title URL Ghi chú
1 Anthropic debuts preview of powerful new AI model Mythos in new cybersecurity initiative https://techcrunch.com/2026/04/07/anthropic-mythos-ai-model-preview-security/ TechCrunch, 7/4/2026
2 Claude Mythos Preview — Anthropic Red Team https://red.anthropic.com/2026/mythos-preview/ Nguồn chính thức Anthropic
3 Project Glasswing https://www.anthropic.com/glasswing Trang chính thức Anthropic
4 Claude Mythos Preview: Anthropic's Most Powerful AI (93.9% SWE-bench) https://www.nxcode.io/resources/news/claude-mythos-preview-anthropic-most-powerful-model-2026 Phân tích benchmark độc lập
5 Anthropic's latest AI model could let hackers carry out attacks faster than ever https://edition.cnn.com/2026/04/07/tech/anthropic-claude-mythos-preview-cybersecurity CNN Business, 7/4/2026
6 Anthropic is giving some firms early access to Claude Mythos https://fortune.com/2026/04/07/anthropic-claude-mythos-model-project-glasswing-cybersecurity/ Fortune, 7/4/2026

Bài viết liên quan

Xem thêm
Tin tức AI

Vì sao ChatGPT cũng có thể bị 'thối não'? Hiện tượng AI model degradation

Các mô hình AI như ChatGPT có thể "kém đi" theo thời gian — không phải vì OpenAI cố tình, mà vì chúng đang dần được huấn luyện bằng nội dung do chính AI tạo ra. Stanford đo được GPT-4 có bài kiểm tra giảm từ 97,6% xuống 2,4% độ chính xác chỉ trong 3 tháng. Đây là hiện tượng "model collapse" — và nó ảnh hưởng trực tiếp đến người dùng AI thường xuyên.

Tin tức AI

Studio game nào đang dùng AI hiệu quả, studio nào đang thất bại? Toàn cảnh 2026

Năm 2026, ngành game toàn cầu đang bị chia đôi: một nhóm nhỏ studio nhỏ và độc lập đang dùng AI để "làm được nhiều hơn với ít người hơn", trong khi nhiều tập đoàn lớn lại dùng AI như cái cớ để sa thải hàng loạt — gây ra làn sóng phẫn nộ từ chính nhân viên của họ. 52% nhà phát triển game toàn cầu hiện cho rằng AI đang gây hại cho ngành.

Tin tức AI

OpenAI vs. Anthropic vs. Google: ai đang giải quyết vấn đề model collapse tốt nhất?

Cả ba ông lớn AI đều biết AI đang có nguy cơ "tự ăn mình" khi học từ nội dung AI tạo ra — nhưng họ xử lý theo 3 cách hoàn toàn khác nhau. OpenAI mua dữ liệu người thật, Anthropic sửa hạ tầng bên trong, Google phát triển công cụ lọc và phát hiện ô nhiễm. Ai đang thắng? Câu trả lời không đơn giản — và điều đó ảnh hưởng trực tiếp đến chất lượng AI bạn đang dùng hằng ngày.