
Anthropic cảnh báo mô hình AI sắp ra mắt của họ, mang tên Mythos, cùng các nền tảng tương tự có thể khai thác lỗ hổng với tốc độ chưa từng có.
Anthropic không phải là trường hợp duy nhất. OpenAI cũng từng cảnh báo vào tháng 12/2025 rằng các mô hình sắp tới của họ đặt ra rủi ro an ninh mạng ở mức "cao". Các chuyên gia nhận định AI có thể khuếch đại các mối nguy hiểm hiện hữu và nhanh chóng tạo ra các phương thức bẻ khóa phần mềm mới.
Tuy nhiên, sự trỗi dậy của các tác nhân AI (AI agent) đã nâng rủi ro này lên một tầm cao mới. Một AI agent duy nhất có thể quét và khai thác lỗ hổng nhanh hơn, kiên trì hơn hàng trăm tin tặc con người.
Shlomo Kramer, nhà sáng lập kiêm CEO công ty mạng và an ninh mạng Cato Networks, cho biết: "Những kẻ tấn công bằng tác nhân AI đang đến. Đây là một sự kiện mang tính bước ngoặt trong lịch sử an ninh mạng".
Vụ rò rỉ Mythos
Chi tiết về Mythos bị rò rỉ trong một bài đăng blog chưa xuất bản. Anthropic không phản hồi yêu cầu bình luận, nhưng công ty này thừa nhận với Fortune rằng vụ rò rỉ là do lỗi con người trong hệ thống quản lý nội dung.

Bản thảo của Anthropic nêu rõ: "Dù Mythos hiện đang vượt xa bất kỳ mô hình AI nào khác về năng lực không gian mạng, nó báo trước một làn sóng mô hình sắp tới có khả năng khai thác lỗ hổng theo những cách vượt xa nỗ lực của lực lượng phòng thủ". Công ty đang cho phép một số tổ chức thử nghiệm trước mô hình nhằm gia cố hệ thống để chống lại "làn sóng khai thác lỗ hổng do AI điều khiển sắp xảy ra".
Theo Axios, Anthropic cũng đang âm thầm cảnh báo các quan chức Chính phủ Mỹ về nguy cơ xảy ra các cuộc tấn công mạng quy mô lớn do Mythos tiếp tay. Dù vậy, mô hình tiếp theo của mọi trung tâm nghiên cứu đều sẽ gây ra các mối đe dọa an ninh mạng ngày càng nghiêm trọng.
Tấn công mạng bằng AI gia tăng
Evan Peña, Giám đốc an ninh tấn công tại công ty an ninh mạng Armadin, nhận định AI đang giúp việc khai thác lỗ hổng diễn ra gần như ngay lập tức sau khi phát hiện. Tuy nhiên, các mô hình tiên tiến vẫn thiếu bối cảnh mà một hacker con người có được để biết đâu là thông tin giá trị nhất của một tổ chức cần đánh cắp.
Một ví dụ điển hình về việc AI làm cho những tin tặc ít kỹ năng trở nên nguy hiểm hơn đã xảy ra vào tháng 1. Theo nhóm nghiên cứu bảo mật của Amazon Web Services (AWS), một tội phạm mạng nói tiếng Nga đã sử dụng nhiều công cụ AI để tấn công hơn 600 thiết bị chạy phần mềm tường lửa phổ biến ở hơn 55 quốc gia. Tin tặc này đã sử dụng các dịch vụ AI tạo sinh để triển khai kỹ thuật tấn công xuyên suốt mọi giai đoạn hoạt động, bất chấp năng lực kỹ thuật hạn chế.

Eyal Sela, Giám đốc tình báo mối đe dọa tại Gambit Security, tiết lộ tin tặc đã sử dụng mô hình Claude của Anthropic cũng như DeepSeek của Trung Quốc. Theo nhật ký trò chuyện, có thời điểm hacker yêu cầu Claude bằng tiếng Nga tạo ra một bảng điều khiển web để quản lý hàng trăm mục tiêu. Sela cho biết AI mang lại "siêu năng lực" cho tin tặc ở nhiều trình độ khác nhau bằng cách đơn giản hóa kiến thức kỹ thuật cần thiết.
Hồi tháng 2, Bloomberg đưa tin một tin tặc đã sử dụng Claude trong hàng loạt cuộc tấn công nhằm vào các cơ quan Chính phủ Mexico, đánh cắp thành công thông tin bầu cử và thuế nhạy cảm.
Sự tiến bộ của AI trong an ninh mạng là con dao hai lưỡi. Những kẻ tấn công có thể sử dụng AI agent để tăng cường năng lực, trong khi các tính năng này cũng cho phép lực lượng phòng thủ giám sát liên tục, xác định mối đe dọa nhanh hơn và vá lỗi tự động ở quy mô vượt xa con người.
Tuy nhiên, phe tấn công chỉ cần tìm ra một lỗ hổng, trong khi lực lượng phòng thủ phải bảo vệ toàn bộ hệ thống. Ông Kramer ví von điều này giống như việc xây dựng "một đội quân người tốt" để "chiến đấu với đội quân kẻ xấu" nhằm giữ vững phòng tuyến.
"Bạn phải chạy nhanh hết sức có thể chỉ để đứng yên tại chỗ", ông nhận định.
(Theo CNN)
