Ранее сегодня несколько сервисов Google стали недоступны. Google теперь предложил объяснение простоя и принес извинения пострадавшим пользователям. Проблема возникла, когда внутренняя система, отвечающая за настройку сайтов Google, случайно создала неверную конфигурацию и вывела из строя несколько других сайтов.
Система вскоре самостоятельно исправилась, что вернуло недоступные сайты в онлайн.
Сегодня утром в 10:55 по тихоокеанскому стандартному времени (PST) внутренняя система, генерирующая конфигурации — по сути, информацию, которая указывает другим системам, как себя вести — столкнулась с программной ошибкой и сгенерировала неверную конфигурацию. Неверная конфигурация была отправлена в рабочие сервисы в течение следующих 15 минут, из-за чего запросы пользователей на получение их данных игнорировались, а сами сервисы, в свою очередь, генерировали ошибки. Пользователи начали видеть эти ошибки на затронутых сервисах в 11:02 утра, и в это время наша внутренняя система мониторинга оповестила команду Google по надежности сайтов (Site Reliability Team). Инженеры все еще отлаживали систему 12 минут спустя, когда та же система, автоматически устранив первоначальную ошибку, сгенерировала новую правильную конфигурацию в 11:14 утра и начала ее рассылать; ошибки быстро исчезали, начиная с этого времени. К 11:30 утра правильная конфигурация была активирована повсеместно, и работа сервисов почти всех пользователей была восстановлена.
Google заявляет, что внедряет дополнительные проверки и меры безопасности, чтобы предотвратить повторение этой проблемы.