Вступление
Все знакомы с Законом Средних Чисел и с большинством проблем, которые может вызвать неправильное его применение. А вот с законом больших чисел люди знакомы меньше. Сегодня мы рассмотрим то и другое понятие.
Основы
Чтобы проиллюстрировать закон больших чисел, я буду использовать старый метод подбрасывания монеты. Истинные шансы «орла» и «решки» равны, однако некоторые люди до сих пор полагают, что, если три «орла» появились последовательно, следующий бросок, скорее всего, будет «решкой», а не «орлом»
Немного другая (но прогрессивная) аналогия — это вытягивание карты из новой колоды. Если каждый раз используется полная колода карт, вероятность появления красной или черной карты снова становится равной, и закон средних значений обречён. Если три красные карты были разыграны подряд, люди могут сказать, что вероятность требует, чтобы следующая карта была скорее чёрной, чем красной.
Это действительно так, однако это не имеет ничего общего с Законом Средних Чисел. Это просто случай, поскольку при вытягивании красных карт становится доступными больше чёрных карт, чем красных. В крайнем случае, когда первые 26 карт (из 52-х) выпадают красные, следующая гарантированно будет чёрной.
Последний пример. Известно, что в лошадиных скачках около 30% фаворитов выигрывают. Допустим, в определённый день ни один из фаворитов не выиграл ни одну из первых шести гонок. Наш закон гласит, что фавориту уже давно пора выиграть. Но только глупец может применить это в равной степени к коэффициенту 2,50 в гонке с четырьмя скакунами.
Закон больших чисел
Возвращаясь к броску монеты, закон средних значений будет диктовать, что для любых четырёх бросков монеты наиболее вероятный результат будет таков: два «орла» появляются один раз, две «решки» появляются один раз, и каждый из них («орла» или «решки») появляется дважды. Порядок при этом не имеет значения.
Закон больших чисел опровергает закон средних чисел. Закон больших чисел более точен, чем закон средних величин, ведь события в нём включают более длительный срок и, следовательно, большее число попыток.
С четырьмя бросками монеты, результат будет таким же, как выше, потому что это наиболее вероятный результат. Но никакая другая комбинация не будет сюрпризом. При 4000 бросков монетки мы обнаружим, что разделение будет примерно следующее: в 1000 выпадут два «орла», в 1000 случаев выпадут две «решки» и в 2000 случаев выпадут смешанные результаты. Основное отличие состоит в том, что закон больших чисел гласит: такое точное распределение маловероятно, но чем больше выборка, тем ближе к этой цифре в процентном выражении будут получены результаты.
При контрольном испытании (бросках монетки) распределение может быть таким.
Выпало два «Орла» (О) | Выпало две «Решки» (Р) | Выпало по одному «Орлу» и «Решке» (ОР) | |
После 20 бросков | 4 (20%) | 7 (35%) | 9 (45%) |
После 100 бросков | 23 (23%) | 29 (29%) | 48 (48%) |
Следует отметить, что происходит приближение к 25, 25 и 50 процентам.
Закон больших чисел предполагает, что это может произойти, что будет происходить приближение к номинальным значениям, тогда как закон средних значений ожидал бы, что во второй выборке будет больше «О», чем «Р», чтобы компенсировать разницу в первой выборке.
После 1000 бросков закон больших чисел будет ожидать, что цифры будут ещё ближе, но, хотя они могут быть разделены между значениями 250, 250 и 500, но это всё ещё очень маловероятный результат.
Аналогично происходит с 6 или 7 лошадиными скачками, выигрыш фаворита является номинальным результатом. Любое число от одного до всех (фаворитов) может выиграть в данный день и, возможно, в следующие два или три дня, но, ни один экстремум не может продолжаться в течение сезона.
Резюме
Закон средних значений говорит: «Что-то произойдёт очень скоро, если не сразу», тогда как закон больших чисел ожидает, что исправление произойдет в течение более длительного периода.
Закон средних значений может использоваться для расчёта наиболее вероятного результата однократного действия, не связанного с каким-либо предыдущим или последующим результатом. Как было показано ранее, это неправильное толкование или применение процентов или статистики.
Закон больших чисел гласит, что в любой ситуации результаты в течение длительного периода времени будут приближаться к процентным ожиданиям, так как известно больше результатов, но из-за потенциально огромных чисел, возможно, они никогда не достигнут идеальной цифры.
Заключение (от редакции)
Мы полагаем, вместо законов средних или больших чисел, вероятно, следует просто придерживаться разницы между зависимыми и независимыми событиями и их вероятностями.
Вытаскивание карты из колоды карт без замены вероятности 2-го розыгрыша зависит от результата 1-го, 3-го розыгрыша зависит от результата 1-го и 2-го и пр.
А если вы подбрасываете монету, результат 2-го броска монеты не зависит от 1-го, результат 3-го не зависит от 1-го и 2-го и пр. Это означает, что у независимых событий результаты предыдущих событий не играют никакой роли для текущего события. Последствия для скачек очевидны: поскольку отдельные гонки в гоночный день не зависят друг от друга, результаты дней предыдущих гонок не влияют на вероятности следующих гонок.
Вполне можно обойтись без какого-либо закона, если вы считаете, являются ли события независимыми друг от друга или нет. Например, шестая гонка не зависит от первых пяти гонок, следовательно, исход шестой гонки не зависит от первых пяти гонок. Это означает, что ничего не меняет то обстоятельство, выиграли фавориты в этих первых пяти гонках или нет. Если пять предыдущих гонок не были выиграны фаворитом, это не изменит шансы фаворитов в последней гонке.
Аналогичное соображение относится и к полному сезону: результат 1000-й гонки сезона, по крайней мере, в целом не зависит от результатов предыдущих 999-ти гонок. Конечно, есть некоторая форма зависимости от предыдущих результатов для каждой лошади, но это не имеет ничего общего с вопросом о том, насколько вероятно, что эта гонка выиграна фаворитом.
Или, если выразить это другими словами: закон больших чисел — это правильное описание поведения независимых событий, тогда как закон средних значений создает совершенно неверную зависимость между независимыми событиями.
Таким образом, всё, что беттер должен сделать на самом деле, это спросить себя: от чего зависит исход предстоящей гонки? Всё, от чего этот результат не зависит, прогнозист может и должен полностью игнорировать и забыть.