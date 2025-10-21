Amazon Web Services – nhà cung cấp dịch vụ điện toán đám mây lớn nhất thế giới – xác nhận hệ thống của họ đã phục hồi hoàn toàn sau sự cố diện rộng khiến nhiều trang web và ứng dụng quan trọng bị gián đoạn vào chiều 20/10.

Amazon cho biết lỗi xuất phát từ một cổng kết nối khu vực (regional gateway) tại bờ Đông nước Mỹ, gây ra tình trạng gián đoạn trong nhiều giờ.

Sự cố được khắc phục sau hơn ba tiếng, tuy nhiên một số người dùng vẫn ghi nhận tốc độ phản hồi chậm và tỷ lệ lỗi cao hơn bình thường trong quá trình phục hồi, theo bảng trạng thái hệ thống của AWS.

Các khiếu nại bắt đầu tăng mạnh sau 13h30 ngày 20/10, theo dữ liệu từ trang Downdetector. Sự cố ảnh hưởng đến nhiều khách hàng lớn của AWS, bao gồm các cơ quan chính phủ, công ty AI và nền tảng tài chính.

Do AWS vận hành gần một phần ba thị trường điện toán đám mây toàn cầu, bất kỳ sự cố nào cũng tạo hiệu ứng domino trên diện rộng.

Trong vài giờ, hàng nghìn dịch vụ trực tuyến trên khắp thế giới – từ ngân hàng, mạng xã hội, đặt vé máy bay đến mua sắm trực tuyến – bị tê liệt, khiến hàng triệu người không thể truy cập các ứng dụng thường ngày.

Tại Mỹ, nhiều người dùng trên bờ Đông cho biết họ không thể đặt cà phê trên di động, kiểm tra tài khoản hoặc truy cập các nền tảng công việc.

Các công ty bị ảnh hưởng như Robinhood, Coinbase, Perplexity AI và Cơ quan Thuế Vương quốc Anh (HMRC) cho biết dịch vụ của họ đã được khôi phục sau khi Amazon sửa lỗi. Các sản phẩm của chính Amazon như Alexa và Ring cũng trở lại hoạt động bình thường.

Phần lớn Internet mất trí nhớ tạm thời

Nguyên nhân chính được xác định là sự cố với Hệ thống Tên Miền (DNS) – cơ chế chuyển đổi tên website thân thiện (như amazon.com) thành địa chỉ IP mà máy chủ có thể hiểu được.

AWS cho biết dịch vụ DynamoDB, nơi lưu trữ dữ liệu khách hàng cho nhiều doanh nghiệp, bị gián đoạn do DNS không thể truy cập được. “Dữ liệu vẫn được lưu trữ an toàn, nhưng trong nhiều giờ không ai có thể tìm thấy chúng”, chuyên gia an ninh mạng Mike Chapple từ Đại học Notre Dame ví von. “Giống như một phần lớn của Internet bỗng rơi vào trạng thái mất trí nhớ tạm thời”.

Một sự cố của AWS tại bờ Đông nước Mỹ cũng đủ khiến Internet toàn cầu tê liệt. Ảnh: Shutterstock

Vài tiếng sau, sự cố DNS đã được khắc phục, Amazon khuyến nghị các công ty xóa bộ nhớ đệm để tăng tốc độ phục hồi. Tuy nhiên, một số dịch vụ khác như EC2 – nền tảng máy chủ ảo của Amazon – vẫn bị ảnh hưởng sau đó.

Theo Rob Jardin, Giám đốc kỹ thuật số của công ty an ninh mạng NymVPN, không có bằng chứng cho thấy đây là một cuộc tấn công mạng. “Nó có vẻ chỉ là lỗi kỹ thuật xảy ra tại một trong những trung tâm dữ liệu chính của Amazon”, ông nói.

Ông cũng nhận định, “Internet vốn được thiết kế để phi tập trung và bền bỉ, nhưng ngày nay, phần lớn hạ tầng trực tuyến lại tập trung ở một vài vùng đám mây. Khi một vùng gặp sự cố, tác động lan rộng ngay lập tức”.

Dù sự cố được xử lý nhanh chóng, nó tiếp tục cho thấy sự phụ thuộc nguy hiểm của thế giới vào hạ tầng đám mây của một số ít công ty công nghệ.

Các chuyên gia cho rằng nhiều doanh nghiệp “đặt tất cả trứng vào một giỏ” – sử dụng độc quyền một nền tảng như AWS – khiến rủi ro lan nhanh khi có sự cố.

Trong vài năm gần đây, những trục trặc quy mô lớn không còn hiếm gặp. Năm 2024, sự cố phần mềm của CrowdStrike đã khiến máy tính toàn cầu sập hàng loạt, gây ra thiệt hại hơn 5 tỷ USD, khiến hàng không tê liệt và bệnh viện đình trệ.

Cùng năm, AT&T cũng trải qua nhiều lần mất kết nối, bao gồm một đợt kéo dài 11 giờ khiến hàng nghìn lao động tự do phải tạm dừng làm việc.

Thực tế, theo Mike Chapple, việc Amazon hay các nhà cung cấp dịch vụ đám mây lớn khác có thể vận hành mà không gặp sự cố thường xuyên là “điều đáng kinh ngạc”.

“Lý do những sự cố như thế này thu hút nhiều sự chú ý”, ông nói với CNN, “là vì tác động của chúng quá lớn. Chỉ cần một công ty gặp trục trặc trong trung tâm dữ liệu của mình, toàn bộ các sản phẩm và dịch vụ của công ty đó sẽ bị ảnh hưởng theo”.

AWS ra đời từ chính nhu cầu nội bộ của Amazon – công ty cần thêm máy chủ để xử lý lưu lượng khổng lồ trong mùa mua sắm cuối năm. Sau đó, họ thương mại hóa hạ tầng này và biến AWS thành nền tảng điện toán đám mây lớn nhất hành tinh.

Giờ đây, sự cố mới nhất là lời cảnh tỉnh cho cả ngành: khi Internet phụ thuộc vào vài “đám mây” khổng lồ, một trục trặc nhỏ cũng có thể khiến cả thế giới trực tuyến tê liệt.

Amazon cho biết họ sẽ tiến hành điều tra chi tiết trong những ngày tới để làm rõ nguyên nhân và ngăn chặn sự việc tái diễn.

(Theo CNN, Bloomberg)