Этим свежим октябрьским утром кажется, что половина интернета страдает от похмелья. Серьезный сбой в работе Amazon Web Services привел к отключению множества веб-сайтов, приложений, игр и других сервисов, работа которых зависит от облачного подразделения Amazon.
Согласно странице состояния сервиса AWS, Amazon изучала «повышенную частоту ошибок и задержек в работе нескольких сервисов AWS» в регионе US-EAST-1 (то есть в центрах обработки данных в Северной Вирджинии) по состоянию на 3:11 утра по восточному времени в понедельник. К 5:01 утра AWS выяснила, что причиной сбоя была проблема с разрешением DNS с помощью API DynamoDB. DynamoDB — это база данных, в которой хранится информация для клиентов AWS.
“Данные Amazon были надежно сохранены, но никто другой не мог их найти в течение нескольких часов, в результате чего приложения были временно отделены от своих данных”, — говорит Майк Чаппл, профессор-преподаватель ИТ, аналитики и операций. в университете Нотр-Дам, сообщил CNN. “Это похоже на временную амнезию значительной части Интернета”.
По состоянию на 6:35 утра AWS сообщила, что полностью устранила проблему с DNS и что «большинство сервисных операций AWS в настоящее время выполняются в обычном режиме». это привело к проблемам с другими сервисами AWS, включая EC2, сервис виртуальных машин, на основе которого многие компании создают онлайн-приложения.
В 8:48 утра AWS сообщила, что «добилась прогресса в решении проблемы с запуском новых инстансов EC2 в регионе US-EAST-1». Она рекомендовала клиентам не привязывать новые развертывания к конкретным зонам доступности (т. е. к одной или нескольким зонам хранения данных центры в данном регионе), «чтобы EC2 обладал гибкостью» при выборе зоны, которая может оказаться лучшим вариантом.
В 9:42 утра Amazon отметил на странице статуса, что, хотя он применил «многочисленные меры по снижению доступности» в нескольких зонах доступности в US-EAST-1, «все еще возникают повышенные ошибки при запуске новых экземпляров EC2». Таким образом, AWS «ограничила скорость запуска новых инстансов, чтобы ускорить восстановление». В 10:14 компания сообщила, что обнаружила «значительные ошибки API и проблемы с подключением к нескольким сервисам в регионе US-EAST-1». Даже после того, как все проблемы были устранены. если они будут устранены, у AWS возникнет значительное количество нерассмотренных запросов и других факторов, требующих обработки, поэтому потребуется некоторое время, чтобы все восстановилось.
Многие, очень, очень многие компании используют US-EAST-1 для развертывания AWS, поэтому в понедельник утром казалось, что половина Интернета отключена. По состоянию на середину утра множество веб-сайтов и других служб работали вяло или выдавали сообщения об ошибках. Сообщения о сбоях в работе широкого спектра служб поступали с помощью детектора сбоев. Наряду с собственными сервисами Amazon, пользователи сообщали о проблемах с банками, авиакомпаниями, Disney +, Snapchat, Reddit, Lyft, Apple Music, Pinterest, Fortnite, Roblox и New York Times — приносим извинения всем, чьи словарные пристрастия могут оказаться под угрозой.
AWS предлагает клиентам множество полезных функций, таких как возможность для веб-сайтов и приложений автоматически увеличивать или уменьшать вычислительную мощность и серверные мощности по мере необходимости, чтобы справляться с приливами и отливами трафика. У нее также есть центры обработки данных по всему миру. Такая инфраструктура привлекательна для компаний, которые обслуживают глобальную аудиторию и которым необходимо круглосуточно оставаться в сети. По состоянию на середину 2025 года, по оценкам, доля AWS на мировом рынке облачной инфраструктуры составляла 30%. Однако подобные инциденты свидетельствуют о том, что использование всего нескольких провайдеров в качестве основы для большей части Интернета является некоторой проблемой.