Google делится исследованиями в области машинного обучения для прогнозирования осадков, которые точнее текущих прогнозов

Машинное обучение имеет потенциал для применения в каждой области. Сегодня Google поделился исследованием «Машинное обучение для краткосрочного прогнозирования осадков по радиолокационным изображениям», направленным на решение проблемы того, что прогнозы локализованных ливневых дождей и других краткосрочных погодных явлений остаются «особенно сложными».

Современные численные методы, которые напрямую моделируют атмосферную динамику, океанические эффекты, тепловое излучение и другие процессы/эффекты, ограничены пределами вычислительных ресурсов. Например, Национальное управление океанических и атмосферных исследований (NOAA) собирает почти 100 терабайт данных в день.

Численные методы также требуют нескольких часов для выполнения. Если для расчета прогноза требуется 6 часов, это позволяет выполнить только 3-4 запуска в день, в результате чего прогнозы основаны на данных 6-часовой давности, что ограничивает наше понимание того, что происходит прямо сейчас.

Компания стремится решать проблемы краткосрочных прогнозов, известных как «nowcasting», которые плохо обслуживаются текущими методами. Это полезно для «немедленных решений», таких как маршрутизация трафика, логистика и даже планирование эвакуации.

Реклама — прокрутите дальше для просмотра контента

Подход Google использует радиолокационные данные и рассматривает прогнозирование погоды как задачу компьютерного зрения. Нейронная сеть будет изучать «атмосферную физику исключительно на основе обучающих примеров, не включая априорные знания о том, как на самом деле работает атмосфера».

Как типичный пример типа прогнозов, которые может генерировать наша система, рассмотрим проблему прогнозирования от радара к радару: на основе последовательности радиолокационных изображений за последний час предсказать, каким будет радиолокационное изображение через N часов, где N обычно составляет от 0 до 6 часов.

Слева: существующая модель. По центру: фактическая. Справа: модель Google.

По сравнению с тремя широко используемыми моделями прогнозирования, основанный на машинном обучении прогноз осадков от Google «превосходит все три эти модели» в краткосрочной перспективе.

Одним из преимуществ метода машинного обучения является то, что прогнозы фактически мгновенны, что означает, что наши прогнозы основаны на свежих данных, в то время как HRRR страдает от вычислительной задержки в 1-3 часа. Это приводит к лучшим прогнозам для методов компьютерного зрения при очень краткосрочном прогнозировании.

В дальнейшем Google планирует объединить свою систему с текущим методом, известным как High Resolution Rapid Refresh (HRRR), который лучше подходит для долгосрочных прогнозов за счет использования 3D-физической модели.

Как видно, качество прогноза нашей нейронной сети превосходит все три эти модели (поскольку синяя линия находится выше результатов всех других моделей).