Как снизить издержки на 12 млрд. USD, предсказав вероятность задержки авиарейсов?

Одно из заданий студентам на курсе Data Mining for Business Intelligence (извлечение данных для бизнес-анализа, глубинный анализ данных) в бизнес-школе Wharton — предсказать вероятность задержки авиарейса. Об этом на своих страницах пишет сайт Knowledge@Wharton.

В настоящее время компании собирают огромное количество самой разнообразной информации, например, от пользователей в социальных сетях, ведут всевозможные базы данных и т.п. В этих массивах данных есть много скрытой информации стратегического значения. При помощи специального программного обеспечения из этих массивов данных извлекается что-то новое, полезное, например, определенные взаимосвязи, которые сразу не видны. При этом используются специальные алгоритмы типа нейронных сетей, генетических алгоритмов, деревьев решений, технологии OLAP и т.п.

В ходе занятий студенты объединяются в группы и работают над проектами, используя специальные методы и технологии извлечения данных для решения тех или иных бизнес-проблем. С первого же дня им приходится думать над тем, что означает «новшество» в той области, где они трудятся, над чем работают. Среди задач, которые решают студенты, — предсказание успеха небольших ссуд, вероятность задержек авиарейсов, вероятность того или иного результата в баскетболе. Например, группе студентов из 5 человек на программе MBA дают задание реализовать проект по предсказанию задержек авиарейсов. Студенты собрали подробную информацию о погоде и вылетах самолетов. Группа сфокусировалась на рейсе из аэропорта Д. Кеннеди в Нью-Йорке в Международный аэропорт Лос-Анджелеса и разработала модель, которая может помочь путешественникам выбирать рейс с минимальной возможностью его отмены. По мнению студентов, это очень важная проблема, поскольку задержки авиарейсов приносят экономике США убытков на 12 млрд. долларов. Если бы люди могли заранее знать, будет ли отложен или отменен тот или иной рейс (даже через несколько недель), они могли бы найти другой вариант. Таким образом, в год они могли бы сберечь от 500 млн. до 1 млрд. долларов.