Nhiều chuyên gia mạng nghi ngờ xác nhận của Anthropic về cuộc tấn công mạng thực hiện gần như bằng AI

Anthropic vừa công bố phát hiện về một chiến dịch tấn công mạng quy mô lớn, trong đó nhóm hacker nhà nước Trung Quốc đã sử dụng AI Claude để tự động hóa phần lớn quá trình tấn công. Anthropic mô tả đây là trường hợp đầu tiên AI đóng vai trò “gần như tự động” khi ước tính Claude đã thực hiện tới 90% các bước trong chuỗi tấn công, chỉ cần con người can thiệp ở vài điểm quyết định quan trọng. Khi đó, hệ thống AI không chỉ hỗ trợ mà còn trực tiếp thao tác từ việc dò quét lỗ hổng, xác thực tài khoản, khai thác, di chuyển qua hệ thống đến việc trích xuất dữ liệu với hoạt động theo mô hình phân cấp và phối hợp các luồng công việc mà không cần giám sát liên tục.
Tuy nhiên, các chuyên gia an ninh mạng độc lập xem nhận định này một cách cẩn trọng. Nhiều chuyên gia cho rằng tính “tự động hóa hoàn toàn” vẫn bị phóng đại: AI có thể rút ngắn thời gian thao tác, nhưng mọi bước then chốt, kiểm tra kết quả và quyết định tấn công quan trọng vẫn cần sự giám sát và điều hướng của con người. Trong chiến dịch, chỉ một số ít trong hàng chục mục tiêu bị xâm nhập thành công. Điều này đặt câu hỏi về hiệu quả thực tiễn khi so sánh với các phương pháp truyền thống do hacker chủ động kiểm soát. AI Claude chủ yếu sử dụng các mã nguồn mở, kỹ thuật phổ biến dễ bị các hệ thống phòng thủ nhận diện và ngăn chặn, chưa tạo ra những mối nguy mới hay tăng độ tinh vi của kỹ thuật tấn công.
Những lo ngại về AI “tự động hóa việc tấn công” là có cơ sở khi công nghệ ngày càng mạnh, nhưng hiện tại việc sử dụng AI vẫn mang tính bổ trợ, giúp tăng tốc và quy mô tấn công thay vì thay thế hoàn toàn con người. Điểm mấu chốt là mọi tác động từ AI đều cần được kiểm chứng, kiểm soát khi nguy cơ lạm dụng có thật nhưng hiệu quả thực tế còn chưa đạt tới mức “tự động hóa” như những gì các hãng AI công bố