Сколько туров надо ждать с начала сезона, прежде чем начать делать ставки
Вступление
Я люблю время года, когда клубный футбол возвращается после летнего перерыва, и впереди целый футбольный сезон, богатый множеством футбольных прогнозов. Посмотрим правде в глаза, у всех есть надежда в это время года, кого бы они ни поддерживали, от «Аахена» до «Зульте Варегема». Несмотря на то, что мне нравится начало сезона, я не склонен в это время делать большие ставки. Я нахожу игры непредсказуемыми, потому что много изменилось с прошлого сезона, появились новые игроки и наставники в клубах. Также нужно учитывать вопрос с игроками, которые набрали или потеряли форму, находясь «на пляже». Вопрос, который встаёт передо мной каждый год, заключается в том, как долго мне ждать, пока я сделаю ставку?
Какое количество игр показывает нам правду
Сколько игр должно пройти в начале сезона, прежде чем я смогу быть достаточно уверенным в том, что уже знаю, как будут играть команды, чтобы оправдать риск, связанный с моими тяжело заработанными деньгами.
Я думал об этом на днях и понял, что ответ на этот вопрос будет не только полезным в начале сезона. Я всегда стараюсь составить мнение о форме обеих команд перед любой ставкой, это может быть полезно на протяжении всего сезона, чтобы знать, сколько игр я должен учитывать. Многие газеты и сайты показывают последние шесть игр команды, некоторые показывают только пять, но почему это так? Есть ли какое-то волшебное качество в пятой самой последней игре, которая при добавлении к последним четырем играм дает им полную картину шансов команд на победу в следующем поединке? Не упускают ли некоторые газеты наиболее важное, не показывая шестую самую последнюю игру?
У меня было ощущение, что для ответа на этот вопрос необходимо найти число, которое является балансом между играми, чтобы рассказать нам достаточно о команде сейчас. Надо, чтобы было достаточно игр, дающих нам честный взгляд, который не будет искажён ни одним странным результатом. Но мы все знаем, какие неприятности может вызвать у нас слушание «интуиции», поэтому я решил попытаться найти ответ на этот вопрос, применив более научный подход к рассмотрению вопроса.
Подход, который я решил использовать, состоял в следующем. Что, если предположить: когда набор игр представляет форму, в которой находится команда, то среднее количество голов, забитых домашней командой в этих играх, будет более сильно коррелировать с количеством, которое они проведут в следующей игре, чем, если учитывать, сколько они в среднем забили при другом количестве игр.
Статистика английской Премьер-лиги
Я посмотрел пять сезонов английской Премьер-лиги, начиная с сезона 2007-08 и заканчивая сезоном 2011-12. Для каждого количества игр я проходил сезон и прогнозировал количество голов, которые забьет хозяева поля, взяв среднее количество голов, забитых командой в предыдущих 2-х, 3-х, 4-х, 5-ти, 6-ти, 7-ми, 8-ми, 9-ти играх. Для значения количества игр я затем рассчитал статистику под названием «R» для корреляции между совершёнными прогнозами и фактическим количеством забитых голов. «R» — это показатель силы корреляции. Для положительной корреляции (как я и ожидал здесь) «R» всегда больше «0» и меньше (или иногда равен) «1». Чем больше значение «R», тем сильнее корреляция.
Количество игр | Показатель силы корреляции «R» |
2 | 0,135 |
3 | 0,136 |
4 | 0,145 |
5 | 0,150 |
6 | 0,152 |
7 | 0,157 |
8 | 0,147 |
9 | 0,151 |
Я начал с двух игр и продолжил до девяти игр. Для двух игр я мог делать сравнения в течение 36-ти недель сезона. Для трёх игр я мог делать сравнения в течение 35-ти недель сезона. И так далее, пока в течение девяти игр я смог сделать сравнения только в течение 29-ти недель сезона (я использовал игры только из того же сезона, поэтому не проводил сравнения в конце одного сезона, чтобы предсказать игры в начале следующего).
Это означало, что размер моей выборки становился тем меньше, чем было больше значение «R». Д думаю, что результаты получились интересные. Первое, что следует сказать, все значения «R» относительно низкие. Простое взятие среднего числа голов, забитых в предыдущих играх, не кажется особенно хорошим показателем того, сколько команда получит в данной игре. Однако, кажется, что этот метод становится более надёжным по мере увеличения количества игр. Значения «R» для 2-х и 3-х игр явно ниже, чем для остальных, и это значение неуклонно увеличивается с ростом количества игр от 3-х до 7-ми.
Теперь обратите внимание на следующую таблицу.
Количество игр | Показатель силы корреляции «R» |
2 | 0,100 |
3 | 0,108 |
4 | 0,106 |
5 | 0,109 |
6 | 0,109 |
7 | 0,135 |
8 | 0,159 |
9 | 0,158 |
Здесь я сделал то же самое для голов, забитых гостевой командой. Здесь также значение для 2-х игр самое низкое из всех, 3 имеет немного большее значение, чем 4, но кроме этого есть постепенная тенденция к более высокому значению «R», с увеличением количества игр смотрелось. Особенно это заметно вышло после получения результатов 7-ми игр.
Заключение (от автора)
Конечно, это очень грубая модель. Я не учёл оппозицию, тот факт, сколько предыдущих игр было дома и в гостях или сколько голов пропустил любая команда. Но из этого очень ограниченного взгляда может показаться, что имеет смысл посмотреть хотя бы последние семь игр, в которые играла команда, пытаясь оценить её форму. Это, по крайней мере, на одну единицу больше, чем указано во многих публикациях, поэтому, надеюсь, стоит поделиться моими наблюдениями с каждым, кто хочет делать ставки с большей для себя выгодой.
Заключение (от редакции)
Наш опыт показывает, что чем более далёкие результаты берутся во внимание при составлении прогноза, тем более искажённым получается представление прогнозиста о нынешней силе коллективов.
В подборке ничего не указано, например, про период дозаявок. Автор указывает, что не брал игры из двух соседних сезонов. Но ведь время зимних дозаявок – это практически, то же самое межсезонье. В этот период в коллективах порой проходят такие изменения, что мы вовсе не узнаём коллектив, стартовавший в сезоне. Иногда составы меняются сильнее, чем летом.
А почему не учитываются перерывы, связанные с международными встречами? Известно ведь, что они весьма сильно влияют на сборников, вынужденных рвать жилы, в то время, как аутсайдеры имеют возможность спокойно в течение недели-двух готовиться к предстоящей встрече.
Если и брать длительные отрезки, то лишь чистые, во время уплотнения календарей, например, месяц, в ходе которого игры чемпионата проходили дважды в неделю. Таковых отрезков, кстати, именно в Англии много и поэтому система, предложенная автором способна, хорошо, проявить себя в Англии. Но она вряд ли будет работать в России, где команды за месяц порой проводят всего две-три игры чемпионата.
Во всяком случае, появляется мысль, что параллельно с количеством игр надо учитывать ещё и длительность временного отрезка, в ходе которого они проводились. Одно дело, когда семь поединков проведены за месяц, и другое, когда за три месяца. Вообще, любой выбираемый отрезок нужно ограничивать месяцем, ведь за пределами месячного отрезка мы можем увидеть совсем другой коллектив. И неважно, сколько матчей дружина провела за месяц, два или девять.
Ну, впрочем, это наше личное мнение, так же как в статье высказано личное мнение автора. Вы можете поделиться своим мнением или испытать предложенную автором систему. В любом случае желаем успеха на выбранном поприще!