Модель Пуассона для прогнозов на футбол — теория и практика
Что такое распределение Пуассона
Распределение Пуассона — это математическая модель, описывающая вероятность определённого количества событий, происходящих за фиксированный период времени. Она была разработана французским математиком Симеоном Дени Пуассоном в 1837 году и с тех пор нашла применение в самых разных областях — от телекоммуникаций до эпидемиологии.
В контексте футбола «событие» — это забитый гол, а «период» — один матч (90 минут). Модель предполагает, что голы забиваются независимо друг от друга, а средняя частота голов (λ, лямбда) определяет всё распределение вероятностей.
Параметр λ (лямбда)
Лямбда — это сердце модели Пуассона. Она представляет ожидаемое количество голов команды в конкретном матче. Для расчёта лямбды мы учитываем несколько факторов.
Атакующая сила команды рассчитывается как среднее количество забитых голов за сезон, разделённое на среднее по лиге. Оборонительная сила оппонента — это среднее количество пропущенных голов оппонентом, делённое на среднее по лиге. Домашний фактор также учитывается, поскольку команды забивают в среднем на 0.2-0.4 гола больше дома.
Итоговая формула выглядит так: λ домашних = средние голы по лиге × атакующая сила дома × оборонительная слабость гостей × коэффициент домашнего поля. Аналогично рассчитывается λ гостей.
Построение матрицы вероятностей
Имея λ для каждой команды, мы строим полную матрицу вероятностей. Каждая ячейка матрицы содержит вероятность конкретного счёта. Например, для матча с λ домашних = 1.5 и λ гостей = 0.8 вероятность счёта 0:0 составляет примерно 10.1%, 1:0 — 15.1%, 1:1 — 12.1%, а 2:1 — 9.1%.
Эта матрица — ключевой инструмент. Суммируя нужные ячейки, мы получаем вероятности для любого типа ставки.
От матрицы к ставкам
Для расчёта вероятности победы хозяев суммируются все ячейки ниже диагонали (где домашние голы больше гостевых). Ничья — сумма диагональных ячеек. Победа гостей — сумма ячеек выше диагонали.
Для тотала Over 2.5 суммируются все ячейки, где сумма голов больше 2. Для Under 2.5 — наоборот, где сумма 2 или меньше. Аналогично рассчитываются «Обе забьют» (BTTS) и другие рынки.
Коррекция модели
Базовая модель Пуассона имеет важные ограничения. Она предполагает независимость голов — но в реальности после первого гола динамика матча меняется. Она не учитывает тактические перестроения, «эффект красной карточки», погодные условия и мотивационные факторы (борьба за чемпионство vs. ничего не значащий матч).
Для компенсации этих ограничений наша система включает несколько коррекционных параметров. Фактор формы анализирует последние 5-10 матчей с затухающим весом (недавние матчи важнее). Учитываются травмы и дисквалификации ключевых игроков — потеря основного голеадора может снизить λ на 15-25%. Контекстуальные факторы включают дерби, матчи с особой мотивацией. А исторические очные встречи, хотя и с низким весом, позволяют учитывать «неудобных» соперников.
Точность и валидация
Как проверить, работает ли модель? Мы используем два метода. Бэктестинг — запуск модели на исторических данных и сравнение с реальными результатами. И калибровка — если модель говорит 60% на победу хозяев, то в ~60% таких случаев хозяева должны побеждать.
На текущий момент наша модель показывает хорошую калибровку на основных рынках (1X2, Over/Under), что подтверждается открытыми результатами на нашем сайте.
Преимущества перед экспертными прогнозами
Модель Пуассона выигрывает у экспертов в нескольких ключевых аспектах. Объективность — нет когнитивных искажений и эмоциональных привязанностей. Масштабируемость — может анализировать десятки матчей ежедневно с одинаковым качеством. Последовательность — не бывает «плохих дней», когда эксперт устал или отвлечён. И проверяемость — каждый расчёт можно воспроизвести и проверить.
Именно поэтому мы выбрали математический подход и публикуем все результаты открыто — это наше главное конкурентное преимущество.