WEBSITE ĐANG PHÁT TRIỂN

Anthropic công bố chi tiết chiến dịch gián điệp mạng do AI điều phối

Các nhà lãnh đạo an ninh đối mặt với một loại mối đe dọa tự động mới khi Anthropic công bố chi tiết chiến dịch gián điệp mạng đầu tiên do AI điều phối.

Anthropic công bố chi tiết chiến dịch gián điệp mạng do AI điều phối

Các nhà lãnh đạo an ninh đối mặt với một loại mối đe dọa tự động mới khi Anthropic công bố chi tiết chiến dịch gián điệp mạng đầu tiên do AI điều phối.

Trong một báo cáo được công bố tuần này, nhóm Tình báo Đe dọa của công ty đã trình bày chi tiết việc họ đã làm gián đoạn một chiến dịch tinh vi của một nhóm được nhà nước Trung Quốc tài trợ – một đánh giá được đưa ra với độ tin cậy cao – được đặt tên là GTG-1002 và được phát hiện vào giữa tháng 9 năm 2025.

Chiến dịch này nhắm vào khoảng 30 thực thể, bao gồm các công ty công nghệ lớn, các tổ chức tài chính, các công ty sản xuất hóa chất và các cơ quan chính phủ.

Thay vì AI hỗ trợ các nhà điều hành con người, những kẻ tấn công đã thao túng thành công mô hình Claude Code của Anthropic để hoạt động như một tác nhân tự trị nhằm thực hiện phần lớn các hoạt động chiến thuật một cách độc lập.

Đây là một sự phát triển đáng lo ngại đối với các CISO, chuyển các cuộc tấn công mạng từ các nỗ lực do con người chỉ đạo sang một mô hình trong đó các tác nhân AI thực hiện 80-90 phần trăm công việc tấn công với con người chỉ đóng vai trò là người giám sát cấp cao. Anthropic tin rằng đây là trường hợp được ghi nhận đầu tiên về một cuộc tấn công mạng quy mô lớn được thực hiện mà không có sự can thiệp đáng kể của con người.

Tác nhân AI: Một mô hình hoạt động mới cho các cuộc tấn công mạng

Nhóm này đã sử dụng một hệ thống điều phối giao nhiệm vụ cho các phiên bản Claude Code để hoạt động như các tác nhân kiểm thử thâm nhập tự động. Các tác nhân AI này được chỉ đạo như một phần của chiến dịch gián điệp để thực hiện trinh sát, phát hiện lỗ hổng, phát triển khai thác, thu thập thông tin đăng nhập, di chuyển ngang qua mạng và đánh cắp dữ liệu. Điều này cho phép AI thực hiện trinh sát chỉ trong một phần nhỏ thời gian mà một nhóm tin tặc con người sẽ mất.

Sự tham gia của con người bị giới hạn ở 10-20 phần trăm tổng nỗ lực, chủ yếu tập trung vào việc khởi động chiến dịch và cung cấp ủy quyền tại một vài điểm leo thang chính. Ví dụ, các nhà điều hành con người sẽ phê duyệt việc chuyển đổi từ trinh sát sang khai thác tích cực hoặc ủy quyền phạm vi cuối cùng của việc đánh cắp dữ liệu.

Những kẻ tấn công đã vượt qua các biện pháp bảo vệ tích hợp của mô hình AI, vốn được huấn luyện để tránh các hành vi có hại. Chúng làm điều này bằng cách jailbreak mô hình, lừa nó bằng cách chia nhỏ các cuộc tấn công thành các nhiệm vụ có vẻ vô hại và bằng cách áp dụng một nhân vật “đóng vai”. Các nhà điều hành đã nói với Claude rằng nó là một nhân viên của một công ty an ninh mạng hợp pháp và đang được sử dụng trong thử nghiệm phòng thủ. Điều này cho phép hoạt động tiến hành đủ lâu để có quyền truy cập vào một số mục tiêu đã được xác thực.

Sự tinh vi về mặt kỹ thuật của cuộc tấn công không nằm ở phần mềm độc hại mới lạ, mà ở việc điều phối. Báo cáo lưu ý rằng khung này dựa vào “phần lớn các công cụ kiểm thử thâm nhập mã nguồn mở”. Những kẻ tấn công đã sử dụng các máy chủ Giao thức Ngữ cảnh Mô hình (MCP) làm giao diện giữa AI và các công cụ thương mại này, cho phép AI thực thi lệnh, phân tích kết quả và duy trì trạng thái hoạt động trên nhiều mục tiêu và phiên. AI thậm chí còn được chỉ đạo nghiên cứu và viết mã khai thác riêng cho chiến dịch gián điệp.

Ảo giác của AI trở thành một điều tốt

Mặc dù chiến dịch đã đột nhập thành công các mục tiêu giá trị cao, cuộc điều tra của Anthropic đã phát hiện ra một hạn chế đáng chú ý: AI bị ảo giác trong các hoạt động tấn công.

Báo cáo nêu rõ rằng Claude “thường xuyên phóng đại các phát hiện và đôi khi bịa đặt dữ liệu”. Điều này biểu hiện bằng việc AI tuyên bố đã thu thập được thông tin đăng nhập không hoạt động hoặc xác định các phát hiện “hóa ra là thông tin có sẵn công khai”.

Khuynh hướng này yêu cầu các nhà điều hành con người phải xác thực cẩn thận tất cả các kết quả, gây ra thách thức cho hiệu quả hoạt động của những kẻ tấn công. Theo Anthropic, điều này “vẫn là một trở ngại đối với các cuộc tấn công mạng hoàn toàn tự động”. Đối với các nhà lãnh đạo an ninh, điều này làm nổi bật một điểm yếu tiềm tàng trong các cuộc tấn công do AI điều khiển: chúng có thể tạo ra một lượng lớn nhiễu và dương tính giả có thể được xác định bằng cách giám sát mạnh mẽ.

Cuộc chạy đua vũ trang AI phòng thủ chống lại các mối đe dọa gián điệp mạng mới

Hàm ý chính đối với các nhà lãnh đạo doanh nghiệp và công nghệ là các rào cản để thực hiện các cuộc tấn công mạng tinh vi đã giảm đáng kể. Các nhóm có ít tài nguyên hơn giờ đây có thể thực hiện các chiến dịch mà trước đây yêu cầu toàn bộ đội ngũ tin tặc giàu kinh nghiệm.

Cuộc tấn công này thể hiện một khả năng vượt xa “vibe hacking”, nơi con người vẫn kiểm soát chặt chẽ các hoạt động. Chiến dịch GTG-1002 chứng minh rằng AI có thể được sử dụng để tự động phát hiện và khai thác các lỗ hổng trong các hoạt động trực tiếp.

Anthropic, đơn vị đã cấm các tài khoản và thông báo cho các cơ quan chức năng trong suốt cuộc điều tra kéo dài mười ngày, cho rằng sự phát triển này cho thấy nhu cầu cấp bách về phòng thủ được hỗ trợ bởi AI. Công ty tuyên bố rằng “những khả năng cho phép Claude được sử dụng trong các cuộc tấn công này cũng khiến nó trở nên cần thiết cho việc phòng thủ mạng”. Đội ngũ Tình báo Đe dọa của công ty đã “sử dụng Claude rộng rãi để phân tích “lượng dữ liệu khổng lồ được tạo ra” trong cuộc điều tra này”.

Các nhóm an ninh nên hoạt động dựa trên giả định rằng một thay đổi lớn đã xảy ra trong an ninh mạng. Báo cáo kêu gọi các nhà phòng thủ “thử nghiệm áp dụng AI để phòng thủ trong các lĩnh vực như tự động hóa SOC, phát hiện mối đe dọa, đánh giá lỗ hổng và ứng phó sự cố.”

Cuộc cạnh tranh giữa các cuộc tấn công do AI điều khiển và phòng thủ được hỗ trợ bởi AI đã bắt đầu, và thích ứng chủ động để chống lại các mối đe dọa gián điệp mới là con đường khả thi duy nhất để tiến lên.

Xem thêm: Wiz: Những lỗ hổng bảo mật xuất hiện giữa cuộc đua AI toàn cầu

Banner cho sự kiện AI & Big Data Expo của TechEx.

Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Hãy tham khảo AI & Big Data Expo diễn ra tại Amsterdam, California và London. Sự kiện toàn diện này là một phần của TechEx và được tổ chức cùng với các sự kiện công nghệ hàng đầu khác bao gồm Cyber Security Expo. Nhấp vào đây để biết thêm thông tin.

AI News được cung cấp bởi TechForge Media. Khám phá các sự kiện và webinar công nghệ doanh nghiệp sắp tới khác tại đây.

"

Bài viết liên quan

Xem thêm
Tin tức AI

Vì sao ChatGPT cũng có thể bị 'thối não'? Hiện tượng AI model degradation

Các mô hình AI như ChatGPT có thể "kém đi" theo thời gian — không phải vì OpenAI cố tình, mà vì chúng đang dần được huấn luyện bằng nội dung do chính AI tạo ra. Stanford đo được GPT-4 có bài kiểm tra giảm từ 97,6% xuống 2,4% độ chính xác chỉ trong 3 tháng. Đây là hiện tượng "model collapse" — và nó ảnh hưởng trực tiếp đến người dùng AI thường xuyên.

Tin tức AI

Studio game nào đang dùng AI hiệu quả, studio nào đang thất bại? Toàn cảnh 2026

Năm 2026, ngành game toàn cầu đang bị chia đôi: một nhóm nhỏ studio nhỏ và độc lập đang dùng AI để "làm được nhiều hơn với ít người hơn", trong khi nhiều tập đoàn lớn lại dùng AI như cái cớ để sa thải hàng loạt — gây ra làn sóng phẫn nộ từ chính nhân viên của họ. 52% nhà phát triển game toàn cầu hiện cho rằng AI đang gây hại cho ngành.

Tin tức AI

OpenAI vs. Anthropic vs. Google: ai đang giải quyết vấn đề model collapse tốt nhất?

Cả ba ông lớn AI đều biết AI đang có nguy cơ "tự ăn mình" khi học từ nội dung AI tạo ra — nhưng họ xử lý theo 3 cách hoàn toàn khác nhau. OpenAI mua dữ liệu người thật, Anthropic sửa hạ tầng bên trong, Google phát triển công cụ lọc và phát hiện ô nhiễm. Ai đang thắng? Câu trả lời không đơn giản — và điều đó ảnh hưởng trực tiếp đến chất lượng AI bạn đang dùng hằng ngày.