habrahabr

Что не так? Три парадокса теории вероятностей

  • воскресенье, 25 мая 2025 г. в 00:00:03
https://habr.com/ru/articles/912270/

Парадокс двух детей Вы встретили на прогулке соседей с сыном. Известно, что у них двое детей. Какова вероятность, что второй — тоже мальчик?

Казалось бы, детская задачка, где нужно просто “вспомнить формулу”, но всё не так однозначно. Если задать этот вопрос прохожему, он, скорее всего, скажет ½. Преподаватель математики, возможно, ответит ⅓. Кто из них прав?

В каком-то смысле, правы оба. Просто каждый представляют себе свой способ, как была получена информация о ребёнке. На самом деле это и есть условие задачи. Только скрытое. 

Вопреки распространенному мнению, теория вероятностей не говорит, возможна ли та или иная ситуация. Прежде чем что-то считать, придется подготовить фундамент — идеализировать наблюдение, понять, что именно мы считаем случайным и построить модель эксперимента. Без этого никакие формулы не помогут.

Парадоксы, о которых пойдет речь, — не логические ошибки. Это ситуации, в которых само понятие вероятности начинает колебаться. Они не ломают теорию, но обнажают, где она требует особенной осторожности. Именно в таких местах теория вероятностей становится особенно странной — и особенно интересной.

В этой статье — три таких истории. В первой один и тот же факт даёт разные вероятности, если по-разному устроено наблюдение. Во второй один и тот же объект может быть “случайным” множеством способов. А в третьей невозможно придумать, как сделать задачу математически строгой.

По дороге мы обсудим, что такое вероятностная модель, геометрическая вероятность и математическое ожидание. А в конце поговорим о том, почему в теории вероятностей у одной задачи могут быть несколько ответов и как с этим жить. А еще, вас ждет красивая задача — бонус для тех, кто дочитает статью до конца.

А пока — вернёмся к соседям с мальчиком. Разберемся, почему эта задачка не так проста, как кажется на первый взгляд.

Задача с двумя ответами  

В 1959 году знаменитый американский популяризатор науки Мартин Гарднер опубликовал в Scientific American две почти одинаковые задачи

У мистера Джонса двое детей, старшая — девочка. Какова вероятность, что оба ребенка — девочки?

У мистера Смита двое детей. Известно, что хотя бы один из них — мальчик. Какова вероятность, что оба — мальчики?

Первая задача совсем простая. Если старший ребенок — девочка, то младший либо мальчик либо девочка. Значит, вероятность двух девочек ½.

Для второй задачи Гарднер рассуждал так: всего возможных пар четыре — мальчик/мальчик, мальчик/девочка, девочка/мальчик и девочка/девочка. Мы знаем, что в семье есть мальчик, так что остается три варианта, из которых подходит только один. Значит, вероятность ⅓.

Красота в том, что два почти одинаковых вопроса дают разные ответы. Их легко перепутать — и именно поэтому ошибиться. Еще больше удивления вызывает ответ в следующей задаче (в решении может помочь формула Байеса)

Упражнение Известно, что у мистера Смита двое детей. Один из них — мальчик, родившийся в понедельник. Какова вероятность, что и второй — мальчик?

После публикации в редакцию пришло сотни писем, в которых читатели объясняли, почему ответ на второй вопрос ½. Позже Гарднер признал: задача действительно неоднозначная. Один и тот же текст может описывать разные способы получения информации — и приводить к разным ответам.

Чтобы разобраться, что происходит в этой задаче, нужно сделать то, без чего не работает теория вероятностей: построить модель.

Вероятность нельзя приписывать единичному событию. Сколько шансов, что мистер Смит — отец двух мальчиков? Вопрос не имеет смысла, пока мы не представим себе эксперимент, который можно повторять. Например: мы выбираем случайную семью из большого города и смотрим, кто в ней родился. Будем запускать этот эксперимент снова и снова и смотреть, в какой доле случаев оба ребёнка оказываются мальчиками. После большого числа экспериментов эта доля примерно равна одному и тому же числу, которое мы и называем вероятностью.

Сформулируем второй вопрос математически. В городе живут семьи с двумя детьми. С какой вероятностью в случайно выбранной семье с сыном оба ребенка — мальчики? 

Но как выбрать такую семью? Можно перебирать их, пока не найдём ту, где есть мальчик, и выбрать ее — тогда  рассуждение Гарднера верно и двое мальчиков будет в каждом третьем случае. А можно перебирать детей, пока не встретим мальчика, и выбрать его семью — у него есть брат ровно в половине случаев, так что ответ ½!

Разные ответы возникают не из-за формулировки, а из-за того, как устроен эксперимент. Мы вроде бы задаём один и тот же вопрос — но имеем в виду разные процедуры. В этом и кроется парадокс.

Чтобы получше прочувствовать эту мысль, разберем такую задачу

Задача В поход идут пятеро детей: Андрей, Борис, Вася, Глеб и Даша. Все друг с другом знакомы, кроме пар Андрей–Вася и Борис–Глеб. С какой вероятностью случайно выбранная пара знакомых окажется разнополой?

Пар друзей всего восемь. Четыре из них — два мальчика, четыре — мальчик и Даша. Значит, если просто выбирать случайную пару, шанс — 1/2

А теперь выберем ребенка, а потом его друга. Если это Даша пара точно разнополая. Если мальчик — с вероятностью 1/3. Получается: 1/5 + 4/5 × 1/3 = 7/15.

И здесь, и в предыдущем парадоксе мы сталкиваемся с одним и тем же вопросом: как выбрать случайное ребро в графе? (Вершины нашего графа — дети, рёбра — пары родственников или друзей) Можно выбрать ребро напрямую, а можно — сначала вершину, а потом одно из ребер, которые из нее выходят. Каждая из этих моделей по своему естественна, но они дают разные ответы.

Самая случайная хорда

Для понимания следующего парадокса придется вспомнить школьную геометрию. 

Парадокс Бертрана В окружности проведена хорда. Какова вероятность что она длиннее стороны правильного треугольника, вписанного в окружность?

Тут, кажется, все понятно: это задача на аккуратный расчет. Но как только начинаешь уточнять, что именно значит “случайно проведенная хорда”, оказывается, что ответ зависит от этого. Есть целых три красивых решения — и все с разными результатами.

Этот парадокс впервые описал в 1889 году французский математик Жозеф Бертран в книге «Исчисление вероятностей». Но сама идея — гораздо старше. Она восходит к модели геометрической вероятности, предложенной другим французом — Жоржем-Луи Бюффоном — еще в XVIII веке.

Представьте: в мишень случайно падает точка. Какова вероятность, что она окажется в выделенной области? Считается, что вероятность пропорциональна площади. Это мы и будем использовать, разбирая три разных способа выбрать случайную хорду.

Способ 1. Случайная точка на окружности

Первый способ выбора хорды
Первый способ выбора хорды

Соединим две случайные точки на окружности. Из-за симметрии всё равно, откуда начинать — один конец можно зафиксировать, а второй выбрать случайно. Впишем в круг правильный треугольник с вершиной в фиксированной точке. Он делит окружность на три равные дуги. Хорда окажется длиннее стороны треугольника, если ее второй конец попадает на среднюю дугу. Значит, вероятность — 1/3.

Способ 2. Случайная точка на радиусе

Второй и третий способ выбора хорды
Второй и третий способ выбора хорды

Зафиксируем радиус круга. Выбираем на нём случайную точку и проводим хорду перпендикулярно радиусу. Впишем в круг правильный треугольник так, чтобы одна из его сторон была параллельна хорде. Сторона вписанного треугольника делит радиус пополам: если точка ближе к центру, хорда длиннее стороны. Это происходит в 1/2 случаев.

Способ 3. Случайная точка внутри круга

Выберем случайную точку в круге. Проведем радиус к точке и через неё — хорду, перпендикулярную радиусу. Она будет длиннее стороны треугольника, если и только если точка лежит внутри круга, вписанного в треугольник. Радиус вписанной окружности — в два раза меньше радиуса описанной. Значит, площадь — в четыре раза меньше. Отсюда вероятность — 1/4.

Упражнение Докажите все геометрические факты, которые мы использовали в этих вычислениях.

Вот и весь парадокс. Мы задали простой вопрос и получили три разных ответа — не потому что кто-то ошибся, а потому что “случайный выбор” может означать совсем разные вещи. Каждая из моделей кажется естественной, но каждая описывает свой эксперимент. А значит — свою вероятность.

Невероятная игра 

Следующий парадокс популяризовал всё тот же Мартин Гарднер — тот самый, который опубликовал парадокс двух детей. 

Парадокс кошельков Два игрока вскрывают кошельки, и тот, у кого денег меньше, отдаёт всё второму. Честная ли это игра?

Для начала нужно понять, что вообще означает “честная игра”. Допустим, вы играете сто раз. В каждом раунде вы либо теряете деньги, либо получаете. Посмотрим, насколько вы в плюсе (или в минусе) в сумме и поделим это число на сто. Получится средний выигрыш за игру.

При большом числе повторений этот средний результат будет стремиться к какому-то постоянному значению — его называют математическим ожиданием выигрыша. Если оно положительное — игра выгодна вам, если отрицательное — невыгодна. Если математическое ожидание равно нулю — честная.

Чтобы вычислить математическое ожидание, нужно усреднить результат по всем возможным ситуациям. Обозначим сумму в вашем кошельке через X, в кошельке соперника — Y. Тогда результат эксперимента — это пара случайных чисел (X, Y), а ваш выигрыш — либо −X, либо Y.

Усреднение можно организовать по-разному — например, сначала зафиксировать X и рассматривать все игры, в которых в вашем кошельке была именно эта сумма. Пусть X = 1000. В половине случаев соперник богаче: вы теряете 1000. В другой половине — беднее, и вы выигрываете какую-то сумму Y, которая меньше 1000. В среднем вы теряете. Значит, игра — невыгодная.

Но можно рассуждать наоборот: зафиксировать сумму в кошельке противника. Пусть Y = 500. Тогда в половине случаев у вас больше — вы выигрываете 500. В другой половине — проигрываете сумму, которая меньше 500. В среднем вы выигрываете. Значит, игра — выгодная.

А ещё можно сказать проще: игра симметрична. Правила одинаковы для обоих, значит, математическое ожидание должно быть ноль, то есть игра честная.

В чем же ошибка? Как вы уже наверняка догадались, в том, что мы понимаем под случайным числом. Все рассуждения, которые мы только что привели, предполагают такое странное свойство: при любом X вероятности “получить меньше X” и “получить больше X” — равны. Это звучит разумно — но такой модели не существует.

У генератора случайных чисел вероятность “получить меньше X” растёт с увеличением X от 0 до 1. Эта называется функцией распределения вероятности. У равномерного распределения на отрезке она растет линейно. У нормального — по функции Лапласса. А у генератора с нашими свойствами она всё время должна равняться ½. Значит, всё наше рассуждение опирается на несуществующую модель.

А если задать генератор честно — с конкретным, существующим распределением — окажется, что игра может быть и выгодной, и проигрышной. Но парадокса уже не будет. 

Теперь, когда мы разобрались с парадоксом двух кошельков, подумайте, где сбой в другом знаменитом парадоксе — про два конверта.

Упражнение. Ведущий выбирает случайное натуральное число X и кладёт X рублей в один конверт, а в другой — 2X. Вы случайным образом получаете один из конвертов. Вы можете забрать эти деньги или поменять конверт. Докажите, что обмен увеличивает математическое ожидание выигрыша. Что здесь не так?

Как правильно? 

Парадоксы в математике не возникают “вопреки” — их ищут специально. Они появляются в тот момент, когда старые объяснения вдруг перестают работать. Это значит, что пора заново разобраться и понять, о чём вообще идёт речь.

Все три задачи, о которых мы говорили, устроены одинаково: формулировка вроде ясна, но решений несколько, и каждое даёт свой ответ. И это не спор о формулах, а разговор о том, что вероятность — не свойство события, а часть модели. Она зависит от того, как именно устроен эксперимент. 

Если вы сейчас чувствуете легкую растерянность — это совершенно нормальная реакция. Допустим моделей может быть несколько — но как понять, какая из них правильная? На этот вопрос сама теория вероятностей не отвечает. Она помогает считать вероятности — когда модель уже задана. Но в жизни всё наоборот: модель мы подбираем под ситуацию, и не всегда ясно, какая подходит лучше.

Здесь на сцену выходит статистика. Мы рассматриваем несколько моделей, считаем для каждой ее вероятностные характеристики, а потом сравниваем их с тем, что видим в реальных данных. Если модель предсказывает, что событие почти невозможно, а оно происходит часто — с моделью что-то не так. Есть разные методы, но идея одна: мы не ищем истину, мы проверяем гипотезу. Какая из моделей лучше согласуется с реальностью — та и считается рабочей.

Если вы дочитали до этого места и чувствуете, что доверие к вероятностной интуиции пошатнулось — это хорошо. Теперь она не будет подсказывать вам неправильный ответ — прежде чем вы успели сформулировать правильный вопрос. 

Ну и напоследок, в качестве бонуса, еще один парадокс

Упражнение Выберите ответ на этот вопрос случайно. Какова вероятность того, что вы выберете правильный ответ? а) 25% (б) 50% (в) 0% (г) 25%

Автор текста Иван Яковлев. Картинки Полины Романовой

Больше материалов в канале Кроссворд Тьюринга

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.
Выберите ответ на этот вопрос случайно. Какова вероятность того, что вы выберете правильный ответ?
16.91% 25%46
41.18% 50%112
27.21% 0%74
14.71% 25%40
Проголосовали 272 пользователя. Воздержались 56 пользователей.