Принцип симметрии и случайные процессы
Предположим, что несколько точек брошены случайным образом на отрезок [0; 1]. Например, пусть это точкиw, xиy, как показано на рисунке
Эти три точки делят наш отрезок на четыре части с длинами
х,у – х,w – y,1 – w.
Если процедура бросания повторяется, то по-прежнему мы получаем четыре отрезка (левый, второй, третий и правый), и можно поставить вопрос о распределении длины, скажем, левого промежутка.
Фиксируем некоторое число t. Какова вероятность того, что все три точки упадут справа от t? Так как бросания независимы, и вероятность того, что каждая точка упадет справа от t, равна 1 – t, то ответом на поставленный вопрос является (1 – t)3.
Итак,
P (левая точка лежит справа от t) = (1 – t)3.
В то время как распределение длины левого промежутка находится просто, а распределение длины правого из соображений симметрии совпадает с распределением левого, задача нахождения распределения длин второго и третьего промежутков может представить известные трудности. Может быть, читатель уже догадался, что эти распределения равны распределению длины левого промежутка, но так, впрочем, думают совсем немногие. Целью следующих замечаний и является разъяснение этого факта.
Вместо того, чтобы бросать точки на единичный отрезок, будем бросать их на окружность единичной длины. При этом вместо трех точек используем четыре, причем четвертую точку обозначим через z.
Таким образом, точки x, y и w, как и раньше, размещены на единичном интервале, у которого, однако, случайные концы. В силу равноправности всех четырех точек длины дуг
(z; x), (x; y), (y; w) и (w; z)
имеют одно и то же распределение. Если процесс бросания производится несколько раз, и при каждом бросании вычисляется длина дуги от точки z до следующей против часовой стрелки, от этой – так же до следующей и т.д., то имеет смысл говорить о распределении длин этих дуг, причем для всех дуг это распределение одинаково.
Разрывая окружность в точке z и разворачивая ее в отрезок, видим, что бросание четырех точек на окружность, одна из которых используется как начало отсчета, эквивалентна бросанию трех точек на единичный интервал.
Мы не дадим здесь строгого доказательства, хотя читатель, быть может, и не вполне убежден предыдущими рассуждениями. Верен общийпринцип симметрии:
При бросании n точек наудачу на отрезок, распределение длин n + 1 получающихся при этом отрезков одинаково.Рассмотрим теперь несколько задач, где можно использовать этот принцип.
Неуклюжий химик
В лаборатории имеется несколько стеклянных трубок, каждая длиной в 9 см, помеченных с одного конца красной меткой, а с другого - синей. Споткнувшийся лаборант роняет эти трубки на пол, в результате чего многие из них разбиваются на три части. Какова для таких трубок средняя длина куска с синей меткой?
Решение
В предположении того, что трубка разбивается случайно, из принципа симметрии выводим, что распределение длины каждой части с красной меткой, средней и с синей меткой одинаково и, значит, равны и их математические ожидания. Так как сумма этих величин постоянна и равна 9 см, то средняя длина куска трубки с красной меткой равна 3 см.
Первый туз
Из хорошо перетасованной колоды в 52 карты, содержащей четыре туза, извлекаются сверху карты до появления первого туза. На каком месте в среднем появляется первый туз?
Решение
Естественно считать, что принцип симметрии сохраняется и для дискретных распределений. Четыре туза делят колоду на 5 частей, каждая из которых содержит от 0 до 48 карт. Если два туза лежат подряд, то будем говорить, что длина соответствующего куска колоды равна нулю. Аналогично нулевую длину имеют части колоды, которые находятся до первого туза, если он лежит сверху, и за четвертым тузом, если он является последней картой в колоде. Согласно принципу симметрии средняя длина каждой части равна 48/5 = 9,6. Последующей картой должен быть туз, который является, таким образом, в среднем 10,6 картой.
Задача о поездах
a) На железной дорогеnпоездов с номерами 1, 2, ... ,n. Однажды вам встретился поезд с номером 60. Угадайте, сколько поездов на железной дороге.
б) Вы повстречали 5 поездов, причем 60 по-прежнему наибольший номер. Снова постарайтесь угадать, сколько всего поездов на железной дороге.
Решение
Хотя на поставленные вопросы вряд ли можно дать «правильный» ответ, все же возможно разумное объяснение этих задач. Например, согласно принципу симметрии, если на отрезок бросается одна точка, то в среднем два полученных отрезка имеют одинаковую длину, так что в пункте (а) ответ равен 119, так как длина левого промежутка равна 59,
2 · 59 = 118
и
118 + 1 = 119.
Аналогично в пункте (б) можно предположить, что пять наблюденных номеров разбивают весь отрезок на шесть равных частей. Так как
60 – 5 = 55,
то средняя длина первых пяти отрезков равна 11, и общее число номеров может быть оценено как
60 + 11 = 71
Графическое решение задачи в случае пяти наблюдений с максимальным значением, равным 60
Конечно, оценка не может быть абсолютно точной при многократном употреблении.
Указанный метод заставляет думать, однако, что в среднем при многократном использовании такие оценки мало отличаются от истинного значения n при большом числе наблюдений. Если неизвестное число n подлежит оценке во многих задачах, то, следуя каждый раз приведенному методу (извлечь выборку, построить оценку), мы в среднем будем близки к истинному значению при достаточно больших объемах выборок.
С другой стороны, может быть и так, что вас не интересует приближение в среднем или недоступно большое число наблюдений, но вы хотите угадать значение n, несмотря на то, что это маловероятно. Тогда разумно оценить n как наблюденный максимум из номеров. Если вы, например, знаете номера двух локомотивов, то вероятность того, что один из двух номеров – максимально возможный, равна
(n – 1) / Cn2 = 2/n.
Примечание: Cnm - число сочетаний из n элементов по m.
Иногда пользуются методом доверительного оценивания, при котором в качестве оценки предлагается некоторый интервал для неизвестного параметра. Ограничимся случаем одного наблюдения. Если наудачу извлечь один из номеров 1, 2, ... , n, то вероятность появления каждого номера равна 1/n. Поэтому вероятность того, что наш номер принадлежит некоторому множеству, равна числу элементов этого множества, деленному на n.
Так, если, скажем, k – это случайный номер, а n – четное число, то
P (k > n/2) = 1/2,
для нечетных значений n эта вероятность несколько больше. Таким образом, если k случайно, то вероятность события k > n/2 не меньше 1/2. Если мы наблюдаем значение k, а n не известно, то в качестве верхней границы для n мы можем предложить 2k. В каждом отдельном случае утверждение 2k > n верно или нет, однако, оно справедливо более, чем в половине случаев. Если желать увеличения процента правильных высказываний, то надо изменить доверительный предел.
Так, например,
P ( k ≥ 1/3 · n ) ≥ 2/3
и утверждение 3k ≥ n справедливо по крайней мере в 2/3 случаях. В нашей задаче, если мы хотим быть уверенными в справедливости нашего высказывания о значении числа n в 2/3 из 100% случаев, то можем сказать, что n лежит в промежутке с концами 60 и 180.
Другим часто используемым методом для оценивания является метод максимального правдоподобия, согласно которому значение n выбирается таким образом, чтобы сделать наблюденную выборку наиболее вероятной. Так, например, если n = 100, то наше наблюденное значение 60 имеет вероятность 1/100, в случае же n = 60 эта вероятность равна 1/60. Мы не можем оценить n значением, меньшим 60, так как для n = 59 или меньшем вероятность появления номера 60 равна нулю. Следовательно, если k - наблюденный номер, то оценкой максимального правдоподобия для n является само k.
В задаче не предполагалось наличие добавочной информации, такой, как "это большая железная дорога, и на ней по крайней мере 100 поездов, но, наверное, меньшее, чем 100 000", которая, конечно, может быть полезна.
Короткий кусок стержня
а) Если стержень ломается случайным образом на две части, то какова средняя длина меньшего куска?
б) Каково среднее отношение длины короткого куска к длине длинного куска?
Решение
а) Случайность разлома стержня означает равномерную распределенность точки деления. Таким образом, вероятность того, что точка разлома находится в левой или правой половине стержня, одинакова. Если эта точка находится в левой половине, то левый кусок и является меньшим, его средняя длина равна половине от этой половины, что составляет четвертую часть длины стержня. Подобные рассуждения применимы и тогда, когда точка деления – на правой половине, так что ответ таков: одна четверть длины стержня.
б) Можно считать, что точка перелома лежит в правой половине стержня. Тогда
(1 – x) / x
является отношением короткого куска к длинному при условии, что сам стержень имеет единичную длину. Так как величина x равномерно распределена на отрезке [1/2; 1], то среднее отношение равно, вместо интуитивно ожидаемого ответа 1/3,
2 · 0,5∫1 (1 – x)/x dx = 2 · 0,5∫1 (1/x – 1) dx = 2 ln2 – 1 ≈ 0,386.
Источник: Ф. Мостеллер «Пятьдесят вероятностных задач с решениями» (Москва, «Наука», 1985)
Смотрите так же:
Задачи математических олимпиад. Элементы теории вероятностей