Что не так? Три парадокса теории вероятностей
- воскресенье, 25 мая 2025 г. в 00:00:03
Парадокс двух детей Вы встретили на прогулке соседей с сыном. Известно, что у них двое детей. Какова вероятность, что второй — тоже мальчик?
Казалось бы, детская задачка, где нужно просто “вспомнить формулу”, но всё не так однозначно. Если задать этот вопрос прохожему, он, скорее всего, скажет ½. Преподаватель математики, возможно, ответит ⅓. Кто из них прав?
В каком-то смысле, правы оба. Просто каждый представляют себе свой способ, как была получена информация о ребёнке. На самом деле это и есть условие задачи. Только скрытое.
Вопреки распространенному мнению, теория вероятностей не говорит, возможна ли та или иная ситуация. Прежде чем что-то считать, придется подготовить фундамент — идеализировать наблюдение, понять, что именно мы считаем случайным и построить модель эксперимента. Без этого никакие формулы не помогут.
Парадоксы, о которых пойдет речь, — не логические ошибки. Это ситуации, в которых само понятие вероятности начинает колебаться. Они не ломают теорию, но обнажают, где она требует особенной осторожности. Именно в таких местах теория вероятностей становится особенно странной — и особенно интересной.
В этой статье — три таких истории. В первой один и тот же факт даёт разные вероятности, если по-разному устроено наблюдение. Во второй один и тот же объект может быть “случайным” множеством способов. А в третьей невозможно придумать, как сделать задачу математически строгой.
По дороге мы обсудим, что такое вероятностная модель, геометрическая вероятность и математическое ожидание. А в конце поговорим о том, почему в теории вероятностей у одной задачи могут быть несколько ответов и как с этим жить. А еще, вас ждет красивая задача — бонус для тех, кто дочитает статью до конца.
А пока — вернёмся к соседям с мальчиком. Разберемся, почему эта задачка не так проста, как кажется на первый взгляд.
В 1959 году знаменитый американский популяризатор науки Мартин Гарднер опубликовал в Scientific American две почти одинаковые задачи
У мистера Джонса двое детей, старшая — девочка. Какова вероятность, что оба ребенка — девочки?
У мистера Смита двое детей. Известно, что хотя бы один из них — мальчик. Какова вероятность, что оба — мальчики?
Первая задача совсем простая. Если старший ребенок — девочка, то младший либо мальчик либо девочка. Значит, вероятность двух девочек ½.
Для второй задачи Гарднер рассуждал так: всего возможных пар четыре — мальчик/мальчик, мальчик/девочка, девочка/мальчик и девочка/девочка. Мы знаем, что в семье есть мальчик, так что остается три варианта, из которых подходит только один. Значит, вероятность ⅓.
Красота в том, что два почти одинаковых вопроса дают разные ответы. Их легко перепутать — и именно поэтому ошибиться. Еще больше удивления вызывает ответ в следующей задаче (в решении может помочь формула Байеса)
Упражнение Известно, что у мистера Смита двое детей. Один из них — мальчик, родившийся в понедельник. Какова вероятность, что и второй — мальчик?
После публикации в редакцию пришло сотни писем, в которых читатели объясняли, почему ответ на второй вопрос ½. Позже Гарднер признал: задача действительно неоднозначная. Один и тот же текст может описывать разные способы получения информации — и приводить к разным ответам.
Чтобы разобраться, что происходит в этой задаче, нужно сделать то, без чего не работает теория вероятностей: построить модель.
Вероятность нельзя приписывать единичному событию. Сколько шансов, что мистер Смит — отец двух мальчиков? Вопрос не имеет смысла, пока мы не представим себе эксперимент, который можно повторять. Например: мы выбираем случайную семью из большого города и смотрим, кто в ней родился. Будем запускать этот эксперимент снова и снова и смотреть, в какой доле случаев оба ребёнка оказываются мальчиками. После большого числа экспериментов эта доля примерно равна одному и тому же числу, которое мы и называем вероятностью.
Сформулируем второй вопрос математически. В городе живут семьи с двумя детьми. С какой вероятностью в случайно выбранной семье с сыном оба ребенка — мальчики?
Но как выбрать такую семью? Можно перебирать их, пока не найдём ту, где есть мальчик, и выбрать ее — тогда рассуждение Гарднера верно и двое мальчиков будет в каждом третьем случае. А можно перебирать детей, пока не встретим мальчика, и выбрать его семью — у него есть брат ровно в половине случаев, так что ответ ½!
Разные ответы возникают не из-за формулировки, а из-за того, как устроен эксперимент. Мы вроде бы задаём один и тот же вопрос — но имеем в виду разные процедуры. В этом и кроется парадокс.
Чтобы получше прочувствовать эту мысль, разберем такую задачу
Задача В поход идут пятеро детей: Андрей, Борис, Вася, Глеб и Даша. Все друг с другом знакомы, кроме пар Андрей–Вася и Борис–Глеб. С какой вероятностью случайно выбранная пара знакомых окажется разнополой?
Пар друзей всего восемь. Четыре из них — два мальчика, четыре — мальчик и Даша. Значит, если просто выбирать случайную пару, шанс — 1/2
А теперь выберем ребенка, а потом его друга. Если это Даша пара точно разнополая. Если мальчик — с вероятностью 1/3. Получается: 1/5 + 4/5 × 1/3 = 7/15.
И здесь, и в предыдущем парадоксе мы сталкиваемся с одним и тем же вопросом: как выбрать случайное ребро в графе? (Вершины нашего графа — дети, рёбра — пары родственников или друзей) Можно выбрать ребро напрямую, а можно — сначала вершину, а потом одно из ребер, которые из нее выходят. Каждая из этих моделей по своему естественна, но они дают разные ответы.
Для понимания следующего парадокса придется вспомнить школьную геометрию.
Парадокс Бертрана В окружности проведена хорда. Какова вероятность что она длиннее стороны правильного треугольника, вписанного в окружность?
Тут, кажется, все понятно: это задача на аккуратный расчет. Но как только начинаешь уточнять, что именно значит “случайно проведенная хорда”, оказывается, что ответ зависит от этого. Есть целых три красивых решения — и все с разными результатами.
Этот парадокс впервые описал в 1889 году французский математик Жозеф Бертран в книге «Исчисление вероятностей». Но сама идея — гораздо старше. Она восходит к модели геометрической вероятности, предложенной другим французом — Жоржем-Луи Бюффоном — еще в XVIII веке.
Представьте: в мишень случайно падает точка. Какова вероятность, что она окажется в выделенной области? Считается, что вероятность пропорциональна площади. Это мы и будем использовать, разбирая три разных способа выбрать случайную хорду.
Соединим две случайные точки на окружности. Из-за симметрии всё равно, откуда начинать — один конец можно зафиксировать, а второй выбрать случайно. Впишем в круг правильный треугольник с вершиной в фиксированной точке. Он делит окружность на три равные дуги. Хорда окажется длиннее стороны треугольника, если ее второй конец попадает на среднюю дугу. Значит, вероятность — 1/3.
Зафиксируем радиус круга. Выбираем на нём случайную точку и проводим хорду перпендикулярно радиусу. Впишем в круг правильный треугольник так, чтобы одна из его сторон была параллельна хорде. Сторона вписанного треугольника делит радиус пополам: если точка ближе к центру, хорда длиннее стороны. Это происходит в 1/2 случаев.
Выберем случайную точку в круге. Проведем радиус к точке и через неё — хорду, перпендикулярную радиусу. Она будет длиннее стороны треугольника, если и только если точка лежит внутри круга, вписанного в треугольник. Радиус вписанной окружности — в два раза меньше радиуса описанной. Значит, площадь — в четыре раза меньше. Отсюда вероятность — 1/4.
Упражнение Докажите все геометрические факты, которые мы использовали в этих вычислениях.
Вот и весь парадокс. Мы задали простой вопрос и получили три разных ответа — не потому что кто-то ошибся, а потому что “случайный выбор” может означать совсем разные вещи. Каждая из моделей кажется естественной, но каждая описывает свой эксперимент. А значит — свою вероятность.
Следующий парадокс популяризовал всё тот же Мартин Гарднер — тот самый, который опубликовал парадокс двух детей.
Парадокс кошельков Два игрока вскрывают кошельки, и тот, у кого денег меньше, отдаёт всё второму. Честная ли это игра?
Для начала нужно понять, что вообще означает “честная игра”. Допустим, вы играете сто раз. В каждом раунде вы либо теряете деньги, либо получаете. Посмотрим, насколько вы в плюсе (или в минусе) в сумме и поделим это число на сто. Получится средний выигрыш за игру.
При большом числе повторений этот средний результат будет стремиться к какому-то постоянному значению — его называют математическим ожиданием выигрыша. Если оно положительное — игра выгодна вам, если отрицательное — невыгодна. Если математическое ожидание равно нулю — честная.
Чтобы вычислить математическое ожидание, нужно усреднить результат по всем возможным ситуациям. Обозначим сумму в вашем кошельке через X, в кошельке соперника — Y. Тогда результат эксперимента — это пара случайных чисел (X, Y), а ваш выигрыш — либо −X, либо Y.
Усреднение можно организовать по-разному — например, сначала зафиксировать X и рассматривать все игры, в которых в вашем кошельке была именно эта сумма. Пусть X = 1000. В половине случаев соперник богаче: вы теряете 1000. В другой половине — беднее, и вы выигрываете какую-то сумму Y, которая меньше 1000. В среднем вы теряете. Значит, игра — невыгодная.
Но можно рассуждать наоборот: зафиксировать сумму в кошельке противника. Пусть Y = 500. Тогда в половине случаев у вас больше — вы выигрываете 500. В другой половине — проигрываете сумму, которая меньше 500. В среднем вы выигрываете. Значит, игра — выгодная.
А ещё можно сказать проще: игра симметрична. Правила одинаковы для обоих, значит, математическое ожидание должно быть ноль, то есть игра честная.
В чем же ошибка? Как вы уже наверняка догадались, в том, что мы понимаем под случайным числом. Все рассуждения, которые мы только что привели, предполагают такое странное свойство: при любом X вероятности “получить меньше X” и “получить больше X” — равны. Это звучит разумно — но такой модели не существует.
У генератора случайных чисел вероятность “получить меньше X” растёт с увеличением X от 0 до 1. Эта называется функцией распределения вероятности. У равномерного распределения на отрезке она растет линейно. У нормального — по функции Лапласса. А у генератора с нашими свойствами она всё время должна равняться ½. Значит, всё наше рассуждение опирается на несуществующую модель.
А если задать генератор честно — с конкретным, существующим распределением — окажется, что игра может быть и выгодной, и проигрышной. Но парадокса уже не будет.
Теперь, когда мы разобрались с парадоксом двух кошельков, подумайте, где сбой в другом знаменитом парадоксе — про два конверта.
Упражнение. Ведущий выбирает случайное натуральное число X и кладёт X рублей в один конверт, а в другой — 2X. Вы случайным образом получаете один из конвертов. Вы можете забрать эти деньги или поменять конверт. Докажите, что обмен увеличивает математическое ожидание выигрыша. Что здесь не так?
Парадоксы в математике не возникают “вопреки” — их ищут специально. Они появляются в тот момент, когда старые объяснения вдруг перестают работать. Это значит, что пора заново разобраться и понять, о чём вообще идёт речь.
Все три задачи, о которых мы говорили, устроены одинаково: формулировка вроде ясна, но решений несколько, и каждое даёт свой ответ. И это не спор о формулах, а разговор о том, что вероятность — не свойство события, а часть модели. Она зависит от того, как именно устроен эксперимент.
Если вы сейчас чувствуете легкую растерянность — это совершенно нормальная реакция. Допустим моделей может быть несколько — но как понять, какая из них правильная? На этот вопрос сама теория вероятностей не отвечает. Она помогает считать вероятности — когда модель уже задана. Но в жизни всё наоборот: модель мы подбираем под ситуацию, и не всегда ясно, какая подходит лучше.
Здесь на сцену выходит статистика. Мы рассматриваем несколько моделей, считаем для каждой ее вероятностные характеристики, а потом сравниваем их с тем, что видим в реальных данных. Если модель предсказывает, что событие почти невозможно, а оно происходит часто — с моделью что-то не так. Есть разные методы, но идея одна: мы не ищем истину, мы проверяем гипотезу. Какая из моделей лучше согласуется с реальностью — та и считается рабочей.
Если вы дочитали до этого места и чувствуете, что доверие к вероятностной интуиции пошатнулось — это хорошо. Теперь она не будет подсказывать вам неправильный ответ — прежде чем вы успели сформулировать правильный вопрос.
Ну и напоследок, в качестве бонуса, еще один парадокс
Упражнение Выберите ответ на этот вопрос случайно. Какова вероятность того, что вы выберете правильный ответ? а) 25% (б) 50% (в) 0% (г) 25%
Автор текста Иван Яковлев. Картинки Полины Романовой
Больше материалов в канале Кроссворд Тьюринга