bannerbannerbanner
Форма реальности

Джордан Элленберг
Форма реальности

Полная версия

Именно из-за этого небрежного комментария Пирсона мы обычно сравниваем случайное блуждание с путем выпившего человека, а не с движением комара – переносчика болезни. Часто его называют «прогулкой пьяницы», хотя в нынешнее доброжелательное время большинство людей больше не думают о пагубной привычке как о забавном гвоздике, на который можно повесить математическое понятие.

СЛУЧАЙНОЕ БЛУЖДАНИЕ И БИРЖА

В начале нового века о случайных блужданиях думали не только Росс и Пирсон. Молодой человек из Нормандии Луи Башелье работал на крупнейшей финансовой бирже в Париже. Он начал изучать математику в Сорбонне в 1890-х годах, проявляя повышенный интерес к курсам вероятности, которые читал Анри Пуанкаре. Башелье не был типичным студентом: будучи сиротой, он был вынужден зарабатывать на жизнь, а потому не получил лицейского образования, которое вырабатывало стиль занятий французской математикой у большинства его сверстников. Он пытался[139] сдавать экзамены, едва наскребая на проходной балл. А его интересы вообще были странными. Высоким статусом в то время обладали небесная механика и физика; сюда относилась, например, задача трех тел, которую решал Пуанкаре, чтобы выиграть премию короля Оскара. Башелье же хотел изучать колебания цен на облигации, которые он наблюдал при работе на бирже, – он предлагал изучать их математически, так же как его профессора исследовали движения небесных тел.

Пуанкаре крайне скептически относился к применению математики к человеческим действиям, что проявилось еще во времена его неохотного участия в деле Дрейфуса – жарких спорах по поводу виновности французского офицера еврейского происхождения, обвиненного в шпионаже в пользу Германии. Пуанкаре не был склонен к политическим баталиям и каким-то образом умудрялся сохранять нейтралитет, даже когда конфликт охватил все французское общество. Однако его коллега Поль Пенлеве, ярый дрейфусар (и кроме того, второй француз, летавший на аэроплане, а гораздо позже и ненадолго – премьер-министр Франции во время президентства Раймона Пуанкаре, двоюродного брата Анри), смог убедить его вмешаться. Эксперт Альфонс Бертильон, известный научным подходом, выступил против Дрейфуса, заявив, что невиновность офицера исключается законами вероятности. Пенлеве заявил, что самый выдающийся математик страны не может молчать, когда дело стало вопросом вычислений. Пуанкаре написал письмо с оценкой расчетов Бертильона для прочтения жюри присяжных при повторном рассмотрении дела Дрейфуса в Ренне. Как и надеялся Пенлеве, когда Пуанкаре прочитал работу Бертильона, он обнаружил там преступления против математики. Бертильон выявил множество «совпадений», которые, по его мнению, неопровержимо указывали на вину Дрейфуса. Пуанкаре заметил, что методы Бертильона давали ему столько возможностей отыскать «совпадения», что было бы крайне необычно, если бы он ничего не нашел. Пуанкаре заключил, что метод Бертильона «абсолютно лишен научной ценности». Однако ученый пошел дальше и заявил, что «применение исчисления вероятностей к моральным наукам» – сейчас мы назвали бы их общественными науками – «скандально для математики». Он сказал: «Желание устранить моральные элементы и заменить их числами столь же опасно, сколь и бессмысленно. Короче говоря, исчисление вероятностей – это вовсе не та чудесная наука, которая (как, похоже, полагают люди) избавляет овладевших ею людей от необходимости обладать здравым смыслом».

Дрейфуса все равно признали виновным[140][141].

А год спустя в своей диссертации ученик Пуанкаре Луи Башелье изложил методы определения подходящей цены для опциона – финансового инструмента, который позволяет вам купить облигацию по определенной цене в какой-либо определенный момент в будущем. Конечно, опцион имеет смысл только в случае, если рыночная цена облигации превышает зафиксированную вами цену. Таким образом, чтобы понимать ценность опциона, нужно представлять, с какой вероятностью цена облигации пойдет вверх или вниз. Идея Башелье для анализа этого вопроса сводилась к предложению рассматривать цену облигации как случайный процесс, который каждый день двигается вверх или вниз независимо от предыдущих дней. Звучит знакомо? Все тот же комар Росса, только на этот раз в обличье денег. И Башелье пришел к тем же выводам, к которым придет и Росс через пять лет (а лорд Рэлей – двадцатью годами ранее). Величина блуждания цены за определенное время обычно пропорциональна квадратному корню из этого времени.

Пуанкаре проглотил свой скептицизм и написал о диссертации теплый отзыв, подчеркнув умеренность целей его ученика: «Можно было опасаться[142], что автор преувеличил применимость теории вероятностей, как это часто бывало. К счастью, в данном случае это не так… он стремится установить границы, внутри которых можно законным образом применять подобные вычисления». Однако диссертация получила оценку «похвально» (honorable), которой хватало для принятия, а не «превосходно» (très honorable, буквально «весьма похвально»), которая требовалась Башелье для поступления во французскую академию. Его работа была слишком далека от основного русла, во всяком случае так казалось до начала революции случайных блужданий. В итоге Башелье получил должность[143] профессора в Безансоне и прожил до 1946 года – достаточно долго, чтобы увидеть, как оригинальность его работы оценили другие математики, но недостаточно долго, чтобы узнать, что случайные блуждания стали стандартным инструментом в финансовой математике. Сведения об этом распространились даже среди широкой публики: книга Бёртона Мэлкила об инвестировании «Случайная прогулка по Уолл-стрит»[144] разошлась тиражом свыше миллиона экземпляров. Суть идеи Мэлкила отрезвляет: постоянные колебания курса вверх и вниз выглядят так, словно ими движут какие-то события, однако они могут быть такими же случайными, как перемещения комара. Не тратьте время попусту, пытаясь отследить взлеты и падения рынка, советует автор. Вместо этого положите деньги в индексные фонды и забудьте о них. Никакие размышления не смогут предсказать следующее перемещение комара и дать вам преимущество. Башелье еще в 1900 году изложил утверждение, названное им фундаментальным принципом:

L’espérance mathématique du spéculateur est nulle

(«Математическое ожидание прибыли игрока на бирже равно нулю»).

ВЕСЬМА НЕОЖИДАННЫЙ ФАКТ КАЖУЩЕЙСЯ ЖИЗНЕСПОСОБНОСТИ

В июле 1905 года, в том же месяце, когда Пирсон опубликовал вопрос Росса в журнале Nature, Альберт Эйнштейн опубликовал в журнале Annalen der Physik статью «О движении взвешенных в покоящейся жидкости частиц, требуемом молекулярно-кинетической теорией теплоты». Статья описывала броуновское движение – загадочное перемещение мелких частиц, находящихся в жидкости. Впервые это движение заметил Роберт Броун во время изучения частиц растительной пыльцы под микроскопом и задался вопросом, не этот ли «весьма неожиданный факт кажущейся жизнеспособности» отражает некий фактор жизни, который остался в пыльце, несмотря на ее отделение от растения. Однако в последующих экспериментах он наблюдал точно такой же эффект в частицах неорганического происхождения: в мелких частицах стекла со своего окна, порошках марганца, висмута и мышьяка, волокнах асбеста и… (Броун упоминает об этом так буднично, словно иметь такую вещь в доме нормально для любого ботаника) во фрагменте сфинкса[145].

 

Объяснение броуновского движения вызывало ожесточенные споры. Одна из популярных теорий утверждала, что частицы пыльцы или сфинкса двигаются под воздействием еще более мелких частиц – молекул жидкости, которые слишком малы, чтобы их можно было увидеть в микроскопы XIX века. Молекулы постоянно случайным образом сотрясали пыльцу, заставляя ее выплясывать настоящий броуновский танец. Однако вспомните: не все тогда верили, что материя состоит из невидимых частиц! Это и было сутью масштабной дискуссии, где на стороне «крохотных частиц» выступал Людвиг Больцман, а противоположную точку зрения отстаивал Вильгельм Оствальд. Для оствальдианцев объяснение физического явления посредством постулирования крохотных ненаблюдаемых молекул было немногим лучше, чем призыв невидимых демонов, подталкивающих пыльцу. Сам Карл Пирсон в книге 1892 года «Грамматика науки» писал: «Ни один физик никогда не видел и не ощущал отдельный атом». Однако Пирсон все равно был атомистом; по его словам, будут когда-либо обнаружены атомы или нет, гипотеза об их существовании привнесла бы ясность и единство в физику и породила эксперименты для проверки. В 1902 году Эйнштейн организовал в своей бернской квартире общество научных дискуссий и обеденный клуб «Олимпийская академия». Скромный ужин обычно включал «ломтик болонской колбасы, кусочек сыра грюйер, какой-нибудь фрукт, немножко меда и одну-две чашки чая» (Эйнштейн, еще не получивший должность в швейцарском патентном бюро, наскребал на жизнь преподаванием физики за три франка в час и подумывал о подработке уличным скрипачом ради пропитания). В «Академии» читали[146] Спинозу, Юма, книгу Дедекинда «Что такое числа и для чего они служат?», работу Пуанкаре «Наука и гипотеза», однако самой первой изучили «Грамматику науки» Пирсона. И прорыв Эйнштейна три года спустя во многом был вполне в духе Пирсона.

Невидимые демоны непредсказуемы; не существует математической модели того, что эти негодяи будут делать дальше. С другой стороны, молекулы подчиняются законам вероятности. Если какую-то частицу ударяет молекула воды, двигающаяся в случайном направлении, то и частица под воздействием этого импульса продвинется на крохотное расстояние в этом направлении. Если каждую секунду происходит триллион таких ударов, то частица пыльцы перемещается на небольшое расстояние в случайно выбранном направлении каждую триллионную долю секунды. Что будет с частицей в долгосрочной перспективе? Это можно предсказать, даже если отдельные толчки не видны.

Это именно тот вопрос, которым задавался Росс. Вместо частицы пыльцы у него был комар, а вместо триллионов движений в секунду – одно в день, но математическая идея тут одинакова. Эйнштейн, как и Рэлей ранее, определил, как будут двигаться частицы пыльцы в результате последовательности толчков в случайных направлениях. В итоге оказалось, что молекулярную теорию можно проверить экспериментально, что впоследствии с успехом и сделал Жан Перрен; это стало решающим ударом сторонников Больцмана. Эффект совокупного воздействия триллиона беспорядочно толкающихся молекул был виден, хотя сами они оставались невидимы.

Анализировать одновременно броуновское движение, биржу и перемещение комара с помощью математики случайного блуждания – значит следовать высказыванию Пуанкаре и давать одно и то же название разным вещам. Пуанкаре сформулировал свой знаменитый совет в обращении 1908 года к Международному конгрессу математиков в Риме. Он трогательно говорил о том, что выполнение сложных вычислений может выглядеть «поиском вслепую», пока вы не сталкиваетесь с ситуацией, когда в основе двух разных проблем лежит одна и та же математическая структура, и тогда одна проблема проливает свет на другую. «Одним словом, – подытожил Пуанкаре, – это позволило мне обнаружить возможность обобщения. Тогда это будет не просто новый результат, а и новая сила»[147].

СВОБОДА ВОЛИ ПРОТИВ НЕИСТОВОГО АНДРЕЯ

Тем временем в России яростно враждовали две математические группы из-за разногласий в отношении связей между вероятностью, свободой воли и Богом. Московской школой руководил Павел Алексеевич Некрасов, который, прежде чем заняться математикой, получил образование в духовной семинарии. Некрасов был архиконсерватором, убежденным христианином вплоть до мистицизма и, по мнению некоторых, участником ультранационалистического черносотенного движения. Он был во всех отношениях человеком царизма. Один источник отмечал, что Некрасов резко противится[148] всем политическим изменениям, где участвуют народные массы, и считает частную собственность главным принципом, который обязан защищать царский режим. Консервативные убеждения сделали его популярным у политиков антиреволюционного толка, которые хотели сдерживать студенческий радикализм, и Некрасов неуклонно поднимался по административной лестнице, став сначала ректором[149] Московского университета, а затем попечителем Московского учебного округа.

Его противником был Андрей Андреевич Марков из санкт-петербургской математической школы, атеист и ярый враг православной церкви[150]. Он написал в газеты много резких писем по социальным проблемам и получил прозвище Неистовый Андрей[151]. В знак протеста[152] против решения Синода об отлучении Льва Толстого Марков потребовал в 1912 году, чтобы Святейший правительствующий синод Русской православной церкви отлучил и его (хотя это желание было удовлетворено, церковь не стала предавать академика анафеме – самой суровой мере).

Некрасов, как можно догадаться, после революции впал в немилость; он выжил, но его роль математического авторитета была утеряна; он, как говорили, казался странной тенью прошлого[153]. После его смерти в 1924 году «Известия» опубликовали умеренно лестный некролог, где хвалили Некрасова за решительное стремление[154] понять марксизм – последнее оскорбление покойного.

Удивительно, но судьба Маркова сложилась не лучше. При царизме Некрасов обвинял его в симпатиях к марксизму, однако Марков пользовался коммунистической идеологией не больше Священного синода; его неистовый дух обнаружил новую цель. В 1921 году, за год до своей смерти, Марков сообщил в Академию наук, что не может посещать ее заседания из-за отсутствия обуви. Полученную от государства обувь Марков счел настолько плохой, что потребовалось его последнее гневное публичное заявление:

Наконец я получил обувь[155]; но она не только дурно сшита, но и совершенно не подходит по своим размерам. Таким образом, я по-прежнему лишен возможности правильно посещать заседания Академии. Полученную мною обувь я предлагаю поместить в Этнографическом музее как образец материальной культуры текущего момента, ради чего я готов ее пожертвовать[156].

 

Разногласия между Марковым и Некрасовым можно было разрешить полюбовно, если бы они не перешли от религиозных и политических тем к более серьезному предмету – математике. И Марков, и Некрасов интересовались вероятностью, в частности так называемым законом больших чисел, – той теоремой, которую демонстрировал на лекции Карл Пирсон, бросив на пол десять тысяч пенсов. Исходная версия теоремы, доказанная Якобом Бернулли за двести лет до Маркова, утверждает примерно следующее: если подбросить монету достаточно большое количество раз, доля орлов будет близка к 50 %. Конечно, нет никакого физического закона, который заставляет монету падать именно так, и она может выпасть одной стороной столько раз, сколько вы захотите. Однако это крайне маловероятно, и с увеличением числа подбрасываний монеты становится все более неправдоподобной любая фиксированная процентная доля, отличная от 50 %, будь то 60, 51 или 50,00001 % орлов. Человеческое существование подчиняется тем же законам, что и подбрасывание монеты. Статистика поведения и действий людей[157], например частота различных преступлений или возраст первого вступления в брак, также демонстрирует тенденцию концентрироваться около определенных средних значений[158], как если бы люди в совокупности были просто кучей бессмысленных монет.

В течение двух столетий после Бернулли многие математики, включая учителя Маркова Пафнутия Львовича Чебышева, совершенствовали закон больших чисел, распространяя его на все новые и новые случаи. Однако все результаты требовали предположения о независимости: одно подбрасывание монеты не должно зависеть от другого.

Пример с выборами 2016 года показывает, почему это условие важно. В каждом штате разницу между оценкой по опросу и реальным голосованием можно рассматривать как случайную величину (ошибку прогноза). Если бы все эти ошибки были независимы друг от друга, то вероятность того, что все они будут в пользу одного кандидата, была бы крайне мала; гораздо вероятнее, что некоторые будут в одну сторону, некоторые в другую, и в среднем получится величина, близкая к нулю, то есть наша общая оценка будет недалека от истины. Но если ошибки зависимы, как часто бывает в реальной жизни, то наше предположение неверно, и тогда наш избирательный аппарат системно недооценивает одного кандидата – в Висконсине, Аризоне и Северной Каролине.

Некрасова беспокоила наблюдаемая статистическая закономерность человеческого поведения. Для него идея, что люди в своей основе предсказуемы и могут выбирать собственный путь во Вселенной не больше чем комета или астероид, была несовместима с церковной доктриной и потому неприемлемой. Он увидел выход в теореме Бернулли. Закон больших чисел гласил, что средние значения ведут себя предсказуемо, когда отдельные переменные независимы. Некрасов сделал вывод, что закономерности, которые мы видим в природе, не означают, что все мы – просто детерминистские частицы, двигающиеся по пути, предначертанному природой, а говорят о том, что все мы независимы друг от друга и способны делать собственный выбор. Иными словами, эта теорема – математическое доказательство свободы воли. Он изложил свою теорию в нескольких сумбурных статьях объемом в сотни страниц, опубликованных в журнале своего учителя, близкого ему по националистическим взглядам, Николая Васильевича Бугаева; итогом этих усилий стала увесистая книга, вышедшая в 1902 году.

Для Маркова это было мистической ерундой. Хуже того, эта мистическая ерунда рядилась в математические одежды. Марков жаловался одному из коллег, что труд Некрасова злоупотреблял математикой. Он не мог исправить то, что считал метафизическими ошибками Некрасова, но с математикой он разобраться мог.

На мой взгляд, нет ничего более интеллектуально бесплодного, чем словесная перепалка между истинно верующими и сторонниками атеизма. Однако на этот раз борьба привела к серьезному математическому прогрессу, и ее отголоски чувствуются до сих пор. Марков сразу увидел, что ошибка Некрасова – в прочтении теоремы задом наперед. Бернулли и Чебышев утверждали, что средние сходятся, когда рассматриваемые переменные независимы. Отсюда Некрасов заключил, что переменные независимы всякий раз, когда средние сходятся. Однако этот вывод неверен! Каждый раз, когда я ем гуляш, у меня появляется изжога, но это не означает, что каждый раз, когда у меня изжога, я ел гуляш.

Чтобы реально победить соперника, Маркову требовалось придумать контрпример: найти последовательность случайных величин, поведение средних у которых было бы полностью предсказуемым, но которые не были бы независимыми. В результате он изобрел то, что сейчас называют цепями Маркова. В основу легла та же идея Росса для моделирования перемещений комара, которую Башелье применил к фондовому рынку, а Эйнштейн – для объяснения броуновского движения. Первая работа Маркова на эту тему появилась в 1906 году; ему было пятьдесят лет, годом ранее он ушел с должности, так что это было отличное время, чтобы по-настоящему погрузиться в интеллектуальную дискуссию.

Марков рассмотрел комара[159], ведущего весьма стесненный образ жизни: он может летать всего в два места, назовем их Болото 0 и Болото 1. Где бы ни находился комар, он предпочитает оставаться, если может напиться достаточно крови. Предположим, что в любой день, когда комар находится в Болоте 0, он с вероятностью 90 % останется в нем же и на следующий день и с вероятностью 10 % перелетит в Болото 1, чтобы узнать, не лучше ли там ситуация с питанием. Болото 1 представляет собой несколько менее перспективные охотничьи угодья, так что здесь комар остается с вероятностью 80 % и перелетит в Болото 0 с вероятностью 20 %. Мы можем изобразить эту ситуацию на диаграмме.


Мы внимательно следим за перемещением комара, отмечая, где он проводит каждый день. Вероятнее всего, у вас будут длинные последовательности нулей (Болото 0) и единиц (Болото 1), потому что перелетать из болота в болото менее вероятно, чем в нем оставаться. Цепочка может выглядеть примерно так:

0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0…

Марков доказал следующий факт: если долго наблюдать за комаром, то средняя доля времени, которую он провел в Болоте 1, будет стремиться к фиксированной вероятности – так же, как сходилась к 50 % доля орлов при подбрасывании монеты. Вы можете подумать, что комар, летая наугад, окажется в каждом болоте с равными шансами. Нет! Та асимметрия, которую мы заложили в условия, сохранится. В нашем случае среднее будет сходиться к числу 2/3. То есть комар 2/3 жизни проведет в Болоте 0 и только 1/3 – в Болоте 1.

Я не утверждаю, что это очевидно, но постараюсь вас убедить, что это хотя бы разумно. В любой день в Болоте 0 шансы комара улететь из него составляют 1/10, поэтому вы можете ожидать, что типичное время пребывания комара в Болоте 0 равно 10 дням. По тем же причинам типичное время пребывания комара в Болоте 1 равно 5 дням. Следовательно, в целом комар должен проводить в Болоте 0 вдвое больше времени, чем в Болоте 1, что и было сказано выше.

Однако – и это было смертельным ударом для Павла Алексеевича – величины в этой последовательности не независимы. Ничего подобного! Нынешнее и завтрашнее местоположение комара очень сильно зависимы и в подавляющем большинстве случаев будут совпадать. Но тем не менее закон больших чисел применим. Независимость не нужна. О математическом доказательстве свободы воли можно забыть.

Последовательность таких случайных величин называется цепью Маркова в случае, если каждая следующая величина зависит только от одной предыдущей, но не от тех, что были в цепи ранее. Если вы хотите знать, где будет завтра комар, неважно, где он был вчера или позавчера, – важно только то, где он находится сегодня[160]. Каждая случайная величина связана со следующей, как звенья цепи. Даже если сеть болот и путей между ними будет более сложной (но останется при этом конечной[161]), доля времени, которую комар проведет на каждом из болот, будет стремиться к некоторому фиксированному числу, как и в случае монет или игральных костей. Если раньше у нас был только закон больших чисел, то теперь появился закон долгих блужданий.

В первом десятилетии XX века не существовало мирового научного сообщества в современном виде, и математические работы пересекали границы с большим трудом. Эйнштейн не знал о работе Башелье со случайными блужданиями. Марков не знал об Эйнштейне. Никто из них не знал о Рональде Россе. И тем не менее все они пришли к одним и тем же заключениям. Невозможно избавиться от ощущения, что в начале 1900-х годов нечто витало в воздухе – какое-то болезненное осознание неизбежной пузырящейся случайности, лежащей в основе вещей. (Не говоря уже о развитии квантовой механики, которая в итоге вплетет вероятность в физику совершенно другим путем.) Говорить о геометрии пространства (вне зависимости от того, является ли оно сосудом с жидкостью, пространством рыночных состояний или кишащим комарами болотом) – значит говорить о том, как что-то в нем движется, и, похоже, во всем мире геометрии не найдется области, где случайное блуждание не оказалось бы иллюстративным инструментом. Позже мы увидим, что цепи Маркова играют крайне важную роль при изучении способов разделения штатов на избирательные округа, а прямо сейчас посмотрим, как они применяются к чисто абстрактному пространству самого английского языка.

PONDENOME OF DEMONSTURES OF THE REPTAGIN

Оригинальная работа Маркова была чисто абстрактным упражнением по теории вероятностей. Есть ли у нее практические применения? В одном из писем Марков писал, что его заботят только вопросы чистой науки, а вопрос применимости теории вероятностей ему безразличен. Согласно Маркову, выдающийся статистик и специалист по биометрике Карл Пирсон не сделал ничего заслуживающего упоминания. Узнав через несколько лет о предыдущей работе Башелье о случайных блужданиях на бирже, он заметил, что, конечно же, видел ее[162], но она ему сильно не понравилась, и что он не берется судить о ее значимости для статистики, но для математики, на его взгляд, она совершенно бесполезна.

Однако в итоге Марков таки сдался и применил свою теорию к области, которая объединяет в России и атеистов, и православных, – поэзии Александра Сергеевича Пушкина. Смысл и искусство пушкинской поэзии, разумеется, не поддаются механике вероятности, поэтому Марков ограничился первыми 20 000 букв романа в стихах «Евгений Онегин», которые рассмотрел как последовательность согласных и гласных, а если точнее, то 43,2 % гласных и 56,8 % согласных. Возможно, кто-то наивно надеялся, что буквы независимы друг от друга, а значит, буква, следующая за согласной, будет согласной ровно с такой же вероятностью, с какой согласные встречаются во всем тексте, то есть 56,8 %.

Однако Марков обнаружил, что это не так. Он тщательно подсчитал все пары последовательных букв, разбив их на четыре комбинации – согласная-согласная, согласная-гласная, гласная-согласная и гласная-гласная, – и получил следующую диаграмму:



Эта марковская цепь похожа на ту, что управляла комаром на двух болотах; просто вероятности поменялись. Если искомая буква – согласная, то следующая буква будет гласной с вероятностью 66,3 % и согласной с вероятностью 33,7 %. Двойные гласные встречаются еще реже: шансы, что одна гласная сменит другую, составляют всего 12,8 %. Эти числа статистически устойчивы по всему тексту. Вы можете рассматривать их как статистическую подпись пушкинского текста. В самом деле, позднее Марков вернулся к задаче и изучил 100 000 букв из романа Сергея Аксакова «Детские годы Багрова-внука». Процентное содержание гласных у Аксакова не особо отличалось от пушкинского: 44,9 %. Но эта марковская цепь выглядит совершенно иначе:



Если по какой-нибудь причине вам нужно определить, принадлежит неизвестный текст на русском языке Аксакову или Пушкину, есть один хороший способ (особенно если вы не умеете читать по-русски) – посчитать пары последовательных гласных, к которым Аксаков, похоже, благоволил, а Пушкин их избегал.

Нельзя винить Маркова, что он свел литературные тексты к двоичной последовательности гласных и согласных; ему приходилось все считать вручную на бумаге. С появлением компьютеров возможности значительно расширились. Вместо двух болот у вас может быть 26 – по числу букв английского алфавита. А с учетом огромного количества текстов можно оценить все вероятности, необходимые для определения цепи Маркова для английских букв. Питер Норвиг, директор по исследованиям[163] компании Google, задействовал для вычисления этих вероятностей набор текстов объемом около 3,5 триллиона букв. Приблизительно 445 миллиардов букв, то есть 12,5 % от общего количества, – это буква Е, наиболее часто употребляемая в английском языке. Однако следующая за ней снова буква Е встречалась только в 10,6 миллиарда случаев, что дает нам вероятность немногим более 2 %. Гораздо чаще за Е следовала буква R, что наблюдалось 57,8 миллиарда раз; таким образом, доля буквы R среди «следующих за Е» составила почти 13 %, что примерно вдвое превышает частоту R среди всех букв. На деле сочетание («биграмма») ER – четвертое по частоте среди всех двухбуквенных сочетаний в английском языке. (Прежде чем посмотреть в сноске первые три, попробуйте их угадать[164].)

Мне нравится представлять буквы как места на карте, а вероятности – как дорожки, которые в различной степени привлекательны и проходимы. От E к R ведет широкая дорога с хорошим покрытием. Дорожка от E к B намного уже и заросла колючками. От T к H дороги почти односторонние: добраться в двадцать с лишним раз проще, чем от H к T. (Носители английского языка часто употребляют слова the, there, this и that, а вот light и ashtray реже[165].) Цепь Маркова сообщает нам, какой извилистый путь вероятнее, когда мы идем по карте английского текста.

Ну раз уж вы здесь, почему бы не пойти дальше? Вместо последовательности букв мы можем представить текст как последовательности биграмм; например, первое предложение этого абзаца будет начинаться так[166]:

ON, NC, CE, EY, YO, OU…

Теперь на наших дорогах есть определенные ограничения. От ON нельзя перейти к произвольному буквосочетанию: следующее должно начинаться на N. Данные Норвига показывают, что самое распространенное продолжение – NS (14,7 %), а затем NT (11,3 %). Это дает еще более четкое представление о структуре английского текста.

Инженер и математик Клод Шеннон[167] первым понял, что цепи Маркова можно использовать не только для анализа, но и для создания текста. Предположим, вы хотите создать фрагмент текста с теми же статистическими характеристиками, что и текст на английском языке, и он начинается с ON. Тогда вы можете использовать для выбора следующей буквы генератор случайных чисел, который выдаст букву S с вероятностью 14,7 %, букву T с вероятностью 11,3 % и так далее. Как только выберете следующую букву (например, T), у вас есть следующее буквосочетание (NT), и вы можете аналогично делать следующий шаг и так далее, пока не получите текст желаемой длины. Статья Шеннона «Математическая теория связи» (положившая начало всей теории информации) появилась в 1948 году, а потому ученый не имел доступа к 3,5 триллиона букв английских текстов на нынешних магнитных носителях. Поэтому он применял цепи Маркова иначе. Если у него было буквосочетание ON, он брал с полки какую-нибудь книгу и просматривал ее, пока не натыкался на стоящие рядом буквы O и N. Если после них шла буква D, то следующим буквосочетанием он брал биграмму ND. Затем искал в очередной книге сочетание ND и так далее. (Если после ON следует пробел, вы тоже можете это учитывать, тогда у вас будет получаться текст, разделенный на отдельные слова.) Вы записываете выстроенную таким образом последовательность букв и получаете знаменитую фразу Шеннона:

IN NO IST LAT WHEY CRATICT FROURE BIRS GROCID PONDENOME OF DEMONSTURES OF THE REPTAGIN IS REGOACTIONA OF CRE.

Простой марковский процесс создал текст, который не является английским, но выглядит как английский[168]. Такова жуткая сила этой цепи.

Конечно, цепь Маркова будет зависеть от набора текстов, выбранных для определения вероятностей, – «обучающих данных», как мы говорим в сфере машинного обучения. Норвиг задействовал огромный набор текстов, собранных Google с сайтов и ваших электронных писем; Шеннон использовал книги со своей полки, а Марков – Пушкина. Вот текст, который[169] я сгенерировал с помощью марковской цепи, обученной на списке имен, которые давали младенцам, родившимся в США в 1971 году:

139Он пытался: по крайней мере, так говорит Бернар Брю в работе Murad S. Taqqu, “Bachelier and His Times: A Conversation with Bernard Bru,” Finance and Stochastics 5, no. 1 (2001): 5, откуда взята большая часть информации. Жан-Мишель Курто и другие авторы работы “Louis Bachelier on the Centenary of Theorie de la Speculation,” Mathematical Finance 10, no. 3 (July 2000): 341–53, указывают на с. 343, что оценки Башелье были вполне хорошими.
140Дрейфуса осудили и приговорили к пожизненному заключению в 1894 году. У автора речь идет о пересмотре дела в 1899 году, когда виновность подтвердили, но срок снизили до 10 лет в силу смягчающих обстоятельств. В 1906 году очередной суд оправдал капитана. Прим. пер.
141Дрейфуса все равно признали виновным: весь материал по делу Дрейфуса взят из книги Gray, Henri Poincaré, 166–69.
142Можно было опасаться: Courtault et al., “Louis Bachelier on the Centenary of Théorie de la Spéculation,” 348.
143В итоге Башелье получил должность: история Башелье взята из книги Taqqu, “Bachelier and His Times,” 3–32.
144Издана на русском языке: Мэлкил Б. Случайная прогулка по Уолл-стрит. Минск: Попурри, 2006. Прим. пер.
145Во «фрагменте сфинкса»: Robert Brown, “XXVII. A Brief Account of Microscopical Observations Made in the Months of June, July and August 1827, on the Particles Contained in the Pollen of Plants; and on the General Existence of Active Molecules in Organic and Inorganic Bodies,” Philosophical Magazine 4, no. 21 (1828): 167.
146В «Академии» читали: материал об «Олимпийской академии» взят из введения Мориса Соловина к книге Albert Einstein, Letters to Solovine, 1906–1955 (New York: Philosophical Library/Open Road, 2011). В качестве первой прочитанной книги Соловин ссылается на неуказанную «научную работу Карла Пирсона», однако другие источники говорят, что это была «Грамматика науки».
147На самом деле Пуанкаре в Риме заболел, и его доклад «Будущее математики» на конгрессе прочитал Жан Гастон Дарбу. Прим. пер.
148Некрасов резко противится: факты и цитаты о Некрасове взяты из работы E. Seneta, “The Central Limit Problem and Linear Least Squares in Pre-Revolutionary Russia: The Background,” Math Scientist 9 (1984): 40.
149Став сначала ректором: E. Seneta, “Statistical Regularity and Free Will: L. A. J. Quetelet and P. A. Nekrasov,” International Statistical Review/Revue Internationale de Statistique 71, no. 2 (Aug. 2003): 325.
150Отец Маркова – Андрей Григорьевич Марков – был, как и Некрасов, выпускником семинарии и государственным чиновником. Делайте из этого какой угодно вывод, поклонники психоанализа.
151А также Боевой Академик. Прим. пер.
152В знак протеста против: G. P. Basharin, A. N. Langville, and V. A. Naumov, “The Life and Work of A. A. Markov,” Linear Algebra and Its Applications 386 (2004): 8.
153Некрасов ушел в отставку еще в 1908 году. После революции он, наоборот, вернулся на работу в Московский университет и стал преподавать. Прим. пер.
154Решительное стремление: E. Seneta, “Statistical Regularity and Free Will,” 331.
155Наконец я получил обувь: история с обувью взята из работы Basharin et al., “The Life and Work of A. A. Markov,” 8. Связь отправителей обуви с партией взята из работы N. Kremenstov, “Big Revolution, Little Revolution: Science and Politics in Bolshevik Russia,” Social Research 73, no. 4 (Baltimore: Johns Hopkins University Press, 2006): 1173–1204.
156Это заявление Марков сделал на заседании физико-математического отделения Академии наук 25 мая 1921 года. Цитируется по книге: Гродзенский С. Андрей Андреевич Марков. М.: Наука, 1987. Прим. пер.
157Статистика поведения и действий людей: E. Seneta, “Statistical Regularity and Free Will,” 322–23.
158Но необязательно в согласии с гауссовым распределением, как в случае подбрасывания монеты. Прим. науч. ред.
159Разумеется, в статье Маркова не было ни слова о комарах, он работал в других терминах. Прим. пер.
160Математики записывают это так: P(St + 1 | St, St – 1, St – 2, …, S1) = P(St + 1 | St). Иными словами, вероятность того, что в момент времени t + 1 система находится в состоянии St + 1, при условии, что в предыдущие моменты она была в состояниях St, St – 1, St – 2, …, S1, равна вероятности того, что в момент t + 1 система находится в состоянии St + 1, при условии, что в предыдущий момент она была в состоянии St. Все остальные предыдущие состояния не оказывают на вероятность никакого влияния. [Точнее, это цепь Маркова первого порядка. Естественное обобщение, которое также называют цепями Маркова, – считать, что состояние сейчас зависит от состояния в k предыдущих моментов: это будет цепь Маркова k-го порядка. Прим. науч. ред.]
161Можно рассматривать и цепи Маркова с бесконечным числом состояний, и при определенных условиях предельные вероятности для них тоже существуют. Прим. пер. [Да, это будет называться марковский процесс. Прим. науч. ред.]
162Что, конечно же, видел ее: Basharin et al., “The Life and Work of A. A. Markov,” 13.
  Питер Норвиг, директор по исследованиям: P. Norvig, “English Letter Frequency Counts: Mayzner Revisited, or ETAOIN SRHLDCU,” 2013; norvig.com/mayzner.html. Частоты некоторых диграмм и триграмм взяты из более ранней статьи Норвига Natural Language Corpus Data в работе T. Segaran and J. Hammerbacher, eds., Beautiful Data (Sebastopol, CA: O’Reilly, 2009).
164На первом месте TH, затем HE и IN. Однако обратите внимание, что это вовсе не закон природы: в другом наборе текстов, который Норвиг собрал в 2008 году, IN потеснило TH с первого места, а в пятерке лидеров – ER, RE и HE. Каждый набор обладает несколько различной частотой биграмм.
165Соответственно: определенный артикль, там, этот, тот, свет, пепельница. Прим. пер.
166Текст оригинала: Once you’re here… Прим. пер.
167Инженер и математик Клод Шеннон первым понял: Claude E. Shannon, “A Mathematical Theory of Communication,” Bell System Technical Journal 27, no. 3 (1948): 388.
168Для русского языка аналогичные эксперименты проводил Роланд Львович Добрушин. Для цепи Маркова порядка 3 у него получилось «ВЕСЕЛ ВРАТЬСЯ НЕ СУХОМ И НЕПО» (Добрушин Р. Математические методы в лингвистике. Математическое просвещение, 1961, вып. 6). Прим. науч. ред.
  Вот текст, который: весь текст на основе цепей Маркова был создан невероятно забавной программой Брайана Хайеса Drivel Generator («Генератор бреда»), которая доступна по адресу: http://bit-player.org/wp-content/extras/drivel/drivel.html. Данные об именах взяты у Администрации социального обеспечения США. Более серьезная попытка «марковизовать» сочинение детских имен требует учета частоты их использования; я же просто взял полный список имен, не обращая никакого внимания на их популярность. Смотрите работу Brian Hayes, “First Links in the Markov Chain,” American Scientist 101, no. 2 (2013): 252, которая охватывает ряд вопросов этого раздела, а также содержит отличные иллюстрации.
1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26  27 
Рейтинг@Mail.ru