Записи с меткой «вероятность»
Распределение вероятности
Если распределения вероятностей Р и Q различны, то эта величина всегда положительна. Она обращается в нуль только тогда, когда наблюдение оставляет распределение Р неизменным. Величина I(Q\P) гораздо более определенно характеризует прирост информации, нежели разность энтропии Н (Q) —Н (Р) , которая может быть как положительной, так и отрицательной. Последняя величина представляет собой разность двух средних значений, и поэтому ее информативность в отношении отдельного события очень ограничена. В величине I(Q\P), напротив, результат наблюдения для каждого отдельного события сравнивается с вероятностью этого события до наблюдения, и лишь после этого делается усреднение по всем отдельным значениям. Таким образом, эта величина как среднее значение разностей более адекватно отражает истинный прирост информации, отнесенный к отдельному событию, чем разность средних значений. Учитывая важность этого понятия для эволюционного учения, дадим еще один пример, иллюстрирующий его отличие от более употребительного в теории информации понятия энтропии.
В заключительную стадию конкурса по архитектуре прошли три проекта. Имена авторов неизвестны жюри. Известно только, что среди них — архитектор А, который пользуется международным признанием и которому жюри охотнее всего доверило бы строительство. В одном из проектов по некоторым деталям вроде бы узнают «почерк» А. Конечно, полной уверенно-
Энтропия, как усредненная величина, в действительности очень мало отрая^ает изменепие информации,, проистекающее из отдельных наблюдений, и это демонстрирует дальнейший ход конкурса.
Осталось два проекта, которым раньше уделялось не очень-то много внимания. Но теперь их изучают более детально. Результатом будет модифицированное распределение вероятностей (Р’) того, что определенный проект принадлежит А:
Р* = 0,8,
Ръ = 0,2,-Я(Р’) ^0,72 бита.
Теперь остаются две возможности.
а) Предположение Р’ было верным, т. е. вскрытие конверта 2 показывает, что автором этого проекта является А. Тогда
д’г = 1,
q’z = 0.
б) Опять ошибка: А — автор не второго, а третьего проекта. В этом случае
q’z - 0,
g 3 = 1-
Так как решение означает полную определенность, в обоих случаях энтропия будет равна нулю. Таким образом, эти два очень разных результата не отличаются по энтропии. Изменепие энтропии в обоих случаях составляет
Н = II{Q) —Н{Р) ж —0,72 бита.
Значение I{Q’\P’), напротив, дает возможность дифференцировать эти случаи. Случай а) означает лишь подтверждение гипотезы, т. е. сравнительно небольшой прирост информации:
Случай б), наоборот, дает новые сведения. Соответственно прирост информации получается много больше:
Распределение вероятностей совсем не исключало возможности ошибки (случай б). Нужно следить за тем, чтобы событию никогда ие приписывалась нулевая вероятность, пока существует конечный интервал ошибок, т. е пока ошибка еще возможна. Учет средних ошибок всегда приводит к конечным положительным значениям ри Это особеппо важно для возникновения информации в природе, ибо все естественные элементарные процессы сопровождаются флуктуация-ми конечной величины.
В рассмотренном примере информация «возникает» только в мозгу наблюдателя. Отдельные наблюдения используются для того, чтобы последовательно сужать неопределенность, пока, наконец, не будет достигнуто исчерпывающее знание ситуации, которая сама по себе остается неизменной.
Не может ли то, что совершается вторично в мозгу «информируемого», происходить первично в системе, способной к самоорганизации и, следовательно, к последовательным сужениям (сначала произвольного) распределения вероятностей? Источником, производящим информацию, при этом может быть статистический флуктуациопный процесс, т. е. «генератор шума». Такая система, несомненно, должна обладать известной способностью к фильтрации, или к отбору. Это означает, что появление «нестабильпостей» делает невозможным возврат к первоначальному распределе-иию вероятностей.
В своей монографии «Наука и теория ипформации» Леон Бриллюэн отмстил, что рассмотрение семантического аспекта информации делает необходимым введение параметра ценности. Такой параметр должен пметь физическую интерпретацию. Оценивание равнозначно отбору, а способность к отбору как материальное свойство должна найти свое обоснование в динамических критериях. Ее нельзя объяснить, оставаясь в рамках одной лишь теории вероятностей. Возникновение и исчезновение, т. е. временность существования, является необходимой предпосылкой любой самоорганизации, основанной на отборе, а также предпосылкой возникновения информации. Но, кроме этого, нужны
еще особые закономерности, обусловленные природой * системы.
Здесь перед нами встает фундаментальный вопрос: а может ли информация вообще возникать? Или же она лишь выявляется? Не сводится ли в конечном сче-!*| те вся семантика к прасемаптике, и не определяется ли она в таком случае неотъемлемыми свойствами материи? На этот вопрос — кореппой вопрос для па-стоящей работы — мы сможем дать ответ только в четвертой главе. Сначала нужно рассмотреть еще несколько предпосылок *). I
*) Как указано в Предисловии, вопрос о смысле, содержа-? нии или ценности информации особенно существен для биологии и требует специального рассмотрения. Очень важен также вопрос о возникновении информации, поставленный авторами I (см. далее). (Прим. ред.) j
Физические процессы
Конечно, в случае физических процессов, доступных нашему наблюдению, мы имеем дело с очень большими числами, которые по порядку величины сравнимы с числом Авогадро ( ~ 10 24 ). Для таких больших чисел флуктуации еле заметны. Законы равновесной термодинамики (например химический закон действия масс) можно поэтому с хорошим приближением считать детерминистическими. Можно считать, что два ящика в игре Эренфестов представляют собой различные состояния, между которыми идут взаимопревращения, например химическая реакция. Эта игра непосредственно обобщается на большое число различных состояний (или «ящиков») с различными вероятностями их заселенности. Такая игра совершенно аналогичным образом описывает установление равновесного распределения и флуктуационное поведение. Результаты справедливы для любых реакций, идущих вблизи равновесия, независимо от того, насколько слоясен их механизм. Нумерация шаров существенна только для проведения игры. Она гарантирует эквивалентность всех шаров в статистическом процессе превращения. В остальном индивидуальность шаров нас не интересует — молекулы, находящиеся в одном и том же состоянии, неразличимы. Различимыми являются отдельные состояния — химические формы или индивидуальные макромолекулярные последовательности, а в случае нашей игры — ящики.
Чему моя^ет научить нас эта игра в связи с про-* блемой возникновения информации? Для любой материальной системы вблизи равновесия флуктуации имеют саморегулируемый характер. Этот самоконтроль является неотъемлемым свойством флуктуационного процесса, и поэтому равновесие является устойчивым состоянием. Распределение населенностей удерживается в рамках определенных флуктуационных границ энергетическим параметром, присущим системе. Эта игра ясно показывает, что возвращение системы в состояние равновесия тем более вероятно, чем более она отклонилась от равновесия. Экстремальные флуктуации, например вымирание сильно населенного в среднем состояния, едва ли будут реализоваться в пределах разумных пространственных и временных масш-
Рис. 11. «Орел» или «решка». Игра иллюстрирует неконтролируемый флуктуационный процесс, а) При выпадении «орла» шар переходит из левого ящика в правый, при выпадении «решки» « наоборот, из правого в левый, б) Распределение вероятностей теперь совершенно равномерно, т. е. любое отклонение п от равнораспределения (N/2 в
каждом ящике) одинаково вероятно 8
табов. Даже в том случае, когда имеется большое число альтернативных состояний и вероятность того, что какое-то определенное состояние населено, очень мала, система будет беспорядочно пробегать через эти состояния снова и снова, так что для такой эргоди-ческой системы при усреднении во времени будут выполняться детерминистические законы физики. Для того, что мы называем возникновением информации, подобное поведение «противопоказано». Информация здесь не изменяется вследствие неизменности распределения вероятностей. Она зависит от характера внутренних взаимодействий, которые определяют усредненное поведение системы.
Вторая игра (рис. 11), которая будет служить контрпримером, иллюстрирует полностью недетерминированный флуктуационный процесс. Здесь можно обойтись сравнительно кратким разбором, потому что мы снова придем к выводу, что на этом пути, как к в первой игре, невозможно возникновение информации.
Нам снова понадобятся два ящика (в общем случае к ящиков) и некоторое количество шаров, которые следует распределить по разным ящикам. На этот раз мы будем исходить из равномерного распределения. Итак, в простейшем случае мы имеем два ящика, каждый из которых содержит сначала N/2 шаров. Для этой игры шары не нужно нумеровать и можно пользоваться лотерейной машиной, которая способна лишь выдавать решения типа «да — нет»; для монеты это будет «орел или решка», а для игральной кости — четные или нечетные числа. При выпадении «решки» будем переносить один шар из ящика 1 в ящик 2, при выпадении «орла» — наоборот. Каким здесь окажется результат?
Чтобы его найти, нуяшо долго играть. Вместо этого мы попытаемся его предсказать. Перед нами снова азартная игра, в которой отдельный результат непредсказуем. Но здесь утрачена существенная для первой игры способность к регулированию — зависимость вероятности переноса от населенности ящика. Результат одного бросания, «орел» или «решка», и, следовательно, вероятность определенного переноса полностью независимы от населенности ящиков, т. е. от предыстории флуктуации. До тех пор, пока в ящике останется хоть один шар, эта вероятность неизменно равняется 50% для любого бхюсапия.
Существует по теперешним временам не такая уж веселая история о человеке, который всегда брал с собой бомбу, когда ему приходилось летать. Оп верил, что при этом увеличивается его безопасность: ведь две бомбы в одном самолете — событие куда менее вероятное, чем одна, его бомба. Этот человек перепутал, очевидно, правила обеих игр. Сотрудники органов безопасности вряд ли удовлетворились бы подобным объяснением.
Итак, когда при не зависимых друг от друга флуктуа-пиях пет саморегулирования, никакое состояние не будет предпочтительнее любого другого. Это означает, что распределение вероятностей представляется прямоугольником (см. рис. 11): при усреднении по времени все состояния оказываются равноценными или равновероятными. Система беспорядочно «дрейфует» по всем возможным состояниям. В отличие от модели Эренфестов, экстремальное состояние здесь легко достижимо — в среднем примерно уже через /V 2 бросаний. Если перейти к к ящикам (состояниям), то результат в принципе не меняется. Поскольку теперь имеется к(к —1) возможностей переноса, то для проведения игры требуется несколько более хитроумная лотерейная машина. Как и раньше, система будет пробегать через все состояния в процессе случайного блуждания.
Вывод: если никакое состояние ничем не выделяется, то в процессе ненаправленного дрейфа не может порождаться информация, понятие информации теряет здесь всякий смысл.
Гибель
Типичными конечными ситуациями являются гибель, неограниченный рост или стационарное поведение, представленное устойчивыми или осциллирующими конфигурациями. Некото рые примеры даны на рис. 13. Коиууй сначала предполагал, что из-за «правила перенаселения» неограниченный рост невозможен. Однако это предположение было опровергнуто открытием таких конфигураций, как «планерное ружье» — это незатухающий, пространственно фиксированный осциллятор («ружье»), который за каждый период испускает фигуру, двигающуюся по доске («планер»). Такие конфигурации, которые производят новые двигающиеся фигуры или уничтожают их, придают игре стратегический характер и делают ее одной из самых интересных стратегических игр.
необозримое многообразие взаимодействующих друг с другом популяционных структур с крайне интересными «функциональными» способностями. Однако весь ход игры подчиняется диктату заранее заданных правил отбора и однозначно определяется начальной конфигурацией. Не происходит ничего такого, что не было бы запланировано с самого начала «полностью информированным Создателей!» или по крайней мере не было бы предсказуемо. Вся информация, которая выявляется в ходе игры, содержится уже в начальных условиях. Какой богатой в действительности может оказаться информация, функциональная семантика, показывают примеры рис. 13.
Какой бы интересной и захватывающей ни была бы эта игра, детерминистическое поведение не соответствует концепциям и экспериментальным данным молекулярной биологии — разве что мы захотим их игнорировать, ссылаясь на Создателя. Многие биологи склоняются скорее к другой крайности. Они верят в догму «абсолютного», «слепого» случая. В детерминистической модели постулируемые физические закономерности в большой степени покрыты мраком неизвестности, здесь же физическое объяснение становится вообще неуместным — действия Создателя полиостью ускользают от нашего понимания. Флуктуация, находящаяся за пределами всякого ожидания, в принципе непредсказуема, хотя ее и нельзя исключить. Эту ситуацию можно сравнить с лотереей, только здесь «выигрыш» неизмеримо менее вероятен — вспомним примеры из первой главы, иллюстрирующие сложность и неповторимость биологических объектов. После этого ясно, что в действительности означает ссылка на абсолютный случай при объяснении «акта творения».
Рис. 13. а —д. Характерные конфигурации в игре «Жизнь» Кояуэя. Временная последовательность конфигураций заменена пространственной последовательностью. Последовательные конфигурации «движущихся» фигур изображены на соседних участках доспи, а) Триплет, который гибнет, б) Триплет, который переходит в устойчивый блок, в) Осциллирующий триплет «сигнальные огни», г) «Планер», или «парусник»,— фигура, которая переходит сама в себя через каждые четыре поколения, сдвинувшись при этом вправо и вниз на один квадрат, д) «Тумблер» — осциллирующая фигура, которая через каждые семь поколении переворачивается, сдвинувшись при этом вниз на один квадрат, а через каждые 14 поколений снова возвращается к исходному состоянию. Необходимо отметить, что этот осциллятор, так гке как и «сигнальные огни», не движется по полю как «планер», а все время остается в определенной области доски,
Рис. 13 е. «Планерное ружье» и «пожиратель». «Ружье» — это пространственно фиксированный осциллятор, который через каждые тридцать поколений возвращается в исходное состояние и в течение каждого периода испускает один «планер» (т. е. один раз за 30 поколений). «Планер» передвигается по доске и сталкивается с «пентадекат-лоном» (это осциллятор с периодом 15 поколений). Последний «проглатывает» «планер», но сам при этом не изменяется,
Однако мы знаем, что существует еще и средний путь между обеими крайностями- Он тоже исходит из случайных событий, но только из таких, которые имеют конечную вероятность реализации.
Почти во всех лотереях один или несколько игроков выигрывают, хотя их нельзя установить заранее никаким хитроумным способом. Эта исходная ситуация, а именно то, что в лотерее всегда имеются различные выигрыши, уже является ограничением, кото-rjoe сильно уменьшает неопределенность. В природе или в лабораторном эксперименте эта ситуация будет существенно изменять ожидания по сравнению с гипотезой абсолютного случая, не ограниченного никакими условиями. Если всегда имеется «победитель», то исход каждого эксперимента должен быть положи-тельиым, т. е. при воспроизведении условий, аналогичных тем, которые существовали в критическую фазу истории нашей планеты, снова должны были бы возникнуть живые структуры. В деталях — например в генетическом коде, в структурах ферментов и т. д.— они могли бы не иметь никакого сходства с известными нам структурами: они были бы лишь построены по тем же принципам и, таким образом, могли бы тоже оптимально приспособляться к окружающей среде. Но точное «случайное попадание» в истории, которое привело бы опять к современным формам жизни, невозможно. Крайне невероятно, чтобы во второй раз в каком-нибудь малом элементе объема в благоприятный момент собрался такой же набор молекул и, воспроизвелся исторический процесс эволюции.
Вспомним, что третья «игра в бисер», описанная в предыдущей главе, всегда давала «победителя», при безошибочном воспроизведении даже в том случае, когда для всех конкурирующих видов шаров шансы были абсолютно равны. Конкурирующее поведение и выбор «победителя» — это свойства стационарной самовоспроизводящейся системы реакций вдали от равновесия. Учитывая эти свойства, можно указать третий, непрерывный путь к «Творению». При этом должны быть выполнены два условия:
1. Необходимо, чтобы существовал внутренний механизм отбора, который из любого случайного распределения отбирал «победителя», как в третьей «игре в бисер». «Выигрыш» здесь берется по отношению к соответствующему распределению вероятностей и в общем случае означает не «главный выигрыш», а только «достаточно денег, чтобы можно было играть дальше» или даже лишь «остаться при своих». Победитель (в случае игры — доминирующий, или отобранный, тип шаров) постоянно порождает новых конкурентов вследствие ошибок при воспроизведении. При этом выигрыш становится все выше и выше, как на аукционе.
2. Непрерывный путь эволюции, характеризующийся последовательностью селективных ценностей, должен вести к вершине, т. е. к главному выигрышу. Это означает, что изменчивость должна быть достаточно велика, чтобы победитель всегда мог быть превзойден каким-нибудь конкурентом. Этот оптимизирующий путь к вершине не должен непременно быть монотонным ростом, но, с другой стороны, его «направление» в основном уже определяется дополнительными условиями отбора и точностью воспроизведения.
Играет ли бог в кости?
Идея творения допускает две совершенно противоположные иитерпретации:
1. «Начало» однозначно определяется взаимодействиями, присущими материи. Начальные условия предопределяют путь и цель эволюции.
2. «Начало» является случайным событием. При этом имеется в виду, что вероятность этого события практически равна нулю, но, с другой стороны, все-таки нельзя с уверенностью утверждать, что оно не может произойти. Чтобы такая флуктуация, реализовавшись однажды, могла проявиться в макроскопических масштабах, она должна обладать известной устойчивостью или даже способностью распространяться.
Первая интерпретация означала бы, что высокоразвитые формы жизни, сходные с земными, должны встречаться во многих местах Вселенной. Кроме того, это означает, что если когда-либо в будущем удастся воссоздать в лаборатории начальные условия возникновения жизни на нашей планете — перспективы для этого более благоприятны, чем для полета к другим планетным системам,— то при этом с фатальной неизбежностью должна возникнуть жизнь с„ таким же кодом и с такими же механизмами, как и существующая ныне. В отношении этой гипотезы — если опа правильна — мы можем лишь сказать, что физические законы, в соответствии с которыми мог бы произойти такой воспроизводимый процесс самоорганизации, следует еще найти. Многие физики склоняются именно к такому представлению. Они ответили бы отрицательно также на вопрос, стоящий в названии этой
главы, по крайней мере в отношении возникновения макроскопического феномена жизни.
Знаменитая фраза Эйнштейна «Бог не играет в пости» относилась к вопросу о принципиальной непредсказуемости элементарных событий, поставленному квантовой механикой. В письме от 4 декабря 1926 года Альберт Эйнштейн пишет Максу Борну:
«…Квантовая механика внушает большое почтение. Но внутренний голос говорит мне, что это не истинный Иаков. Теория дает много, но едва ли она подводит нас ближе к тайне Старика. Во всяком случае, я убежден, что Он не играет в кости…»
Английский математик Конуэй придумал оригинальную игру, которую он назвал «Жизнь» [15], потому что она превосходно имитирует рост, распад и изменения, происходящие в популяции живых организмов. Игра подробно описана в табл. 2. Простые правила рождения, выживания и гибели порождают
Игру проводят на плоской поверхности, разбитой на квадратные клетки, например, на доске для игры в го. Каждая клетка может либо оставаться пустой, либо может быть, занята фишкой. Состояние зависит от занятости соседпих клеток. Соседними считаются восемь клеток, непосредственно примыкающих к данной. Игра складывается из последовательности дискретных шагов, или ходов. Этим имитируется схема поколений. Переход от данного поколения к следующему происходит но определенным правилам, которые применяются одновременно ко всем клеткам доски. Правила:
1. Выживание. Фишка выживает в следующем поколении, если заняты две или три соседпих клетки.
2. Гибель. Фишка удаляется с доски, если занято более трех или менее двух соседпих клеток. В первом случае система слишком перенаселена, во втором — индивидуум слишком изолирован.
3. Рождение. Пустая клетка занимается фишкой, если занято три, и только три, соседних с ней клетки.
Эти правила относятся всегда к состоянию, которое существует к началу «хода». Начальное расположение занятых клеток задается самим игроком (здесь заключается единственная возможность для игрока влиять на ход игры). Игра великолепным образом демонстрирует кооперативные изменения в популяции под действием отдельных ее составляющих.
Вероятности имеют свойство мультипликативности
Это значит, что" вероятность одновременной реализации (например, V). Таким образом, Н — это среднее значение всех информационных вкладов Id р и Величины p t являются одновременно весовыми множителями для этих отдельных вкладов. Если все они равны, то получается простое выражение Н = —Id р; Н обращается в нуль, если из п возможных расположения все, кроме одного, имеют вероятность нуль. При этом состояние с единичной вероятностью не будет иметь альтернатив, т. е. для его идентификации не требуется более никакой информации.
Примером такой ситуации может служить молекулярная структура, которая воспроизводимо обхзазуется из стехиометрической смеси предшественников, специфично взаимодействующих друг с другом, причем тепловые флуктуации практически не могут помешать этому процессу. Для низкомолекулярных соединений этот случай реализуется очень часто. Другой пример — это пространственная укладка полипептидной цепи или цепи рибонуклеиновой кислоты, которая во многих случаях однозначно определяется последовательностью соответствующих элементов. Такой процесс укладки поэтому не включает в себя никакого изменения информации.
Рассмотрим теперь, чем могут быть обусловлены отклонения от равномерного распределения априорных вероятностей,— мы будем называть эти отклонения избыточностью. Имеются две принципиальные причины избыточности [12].
1. Символы различного сорта могут встречаться с различной частотой. Это означает, что в суммарном множестве символов v символы различного сорта представлены не в равных количествах v/X.
2. Могут существовать предпочтительные последовательности символов. Специфичные взаимодействия между символами вызывают отклонения от случайного расположения. Эти взаимодействия не обязательно должны ограничиваться лишь ближайшими соседями. Так, например, в молекуле белка могут возникать очень сложные «условия соседства» по сравнению с линейной последовательностью (см. рис. 4—6).
Действие обоих этих факторов отчетливо выражено также в нашем языке. Здесь между ними имеется даже причинная связь: поскольку определенные комбинации букв встречаются чаще, чем другие, соответст-
Таблица 1
Нуклеиновые кислоты
1. Нуклеиновые кислоты — это линейные ценные молекулы. Каждая субъединнца (отдельный нуклео-тид) представляет собой букву генетического алфавита. Этот алфавит состоит только из четырех букв, которые принято обозначать первыми буквами соответствующих химических названии
А, У (соответственно Т)*), Г, Ц.
Триплет, составленный из этих букв (например АУГ), является кодовым словом (кодоном) для элемента молекулы белка, т. е. для буквы белкового алфавита.
2. Белки — это тоже цепные молекулы. Их субъедн-ницами являются аминокислотные остатки, соединенные друг с другом пептидными связями. В природных белках встречается около 20 различных аминокислот.
*) Элемент У в рибонуклеиновых кислотах (РНК) соответствует элементу Т в дезокснрибоиуклешговых кислотах (ДНК). Для переноса информации, т. е. для взаимодействия с элементом А, это различие не играет большой роли [4].
Это означает, что белковый алфавит содержит примерно двадцать различных букв — примерно столько же, сколько наш язык. Система соответствий «кодон — аминокислота», т.. е. генетический код, является однозначной и универсальной: животные, растения и люди пользуются одной и той же схемой. Этот код, однако, «вырожден»: каждой аминокислоте, за немногими исключениями, соответствуют два, три, четыре или даже шесть кодонов. Это необходимо для того, чтобы перевод некоторой последовательности нуклеотидов, где могут встретиться все 4 3 = 64 различных кодона, в последовательность аминокислот ‘ имел однозначный смысл. В природе передача информации происходит лишь в направлении от нуклеиновой кислоты к белку, но между различными типами нуклеиновых кислот (ДНК, РНК) информация может передаваться в обоих направлениях.
3. Полипептидпая цепь молекулы белка определенным образом свернута в пространстве. Поэтому элементы из любых положений в последовательности могут в каком-то месте контактировать друг с другом. Таким образом возникает активный центр, т. е. группировка аминокислот, которые кооперативно выполняют свою функцию: например, специфичное узнавание и связывание субстрата, перенос протонов или — при помощи координационно связанного иона металла — обмен электронов и т. д. Оптимальные расстояния в активном центре поддерживаются определенной пространственной укладкой тех участков последовательности, которые располагаются между действующими группами. Это определяет минимальную длину полипептидной цепи, которая для хорошо адаптированного белка с четырьмя — пятью действующими группами составляет примерно сотню аминокислотных остатков. Так используется полное информационное содержание полипептидной цепи, т. е. окончательно оптимизированный эволюционный продукт представляет собой избранную, единственную в своем роде последовательность. Сверх того, посредством изменений в укладке, обусловленных тем, что по ходу реакции возникают новые специфичные взаимодействия, каталитическая активность может регулироваться, иногда даже нацело выключаться или включаться. Итак, белки можно сравнить со сложными, регулируемыми машинами. Действительно, они
контролируют все химические превращения в клетке, т. е. все ее функционирование. Однако принцип строения, которым определяются эти достижения белков, совершенно не приспособлен для самовоспроизведения.
4. В отличие от белков нуклеиновые кислоты имеют сравнительно простое пространственное строение. Их
Рис. 1. Комплементарность оснований создается специфичными водородными связями — с одной стороны, между аденином (А) и ураци-лом (У) или тимином (Т) и, с другой стороны, между гуанином (Г) и цитозином (Ц). В результате образуются геометрически почти идентичные пары оснований.
Рис. 2. В молекуле нуклеиновой кислоты отдельные элементы (нуклео-тиды) соединены друг с другом в линейную последовательность. Каждое основание прикрепляется к остатку сахара (к рибозе или к де-зоксирибозе), который, в свою очередь, висит на фосфатной группе. В остове полннуклеотидной цепи остатки сахара и фосфата непрерывно чередуются»
структурный мотнв определяется простым принципом — попарными взаимодействиями звеньев нуклеиновой кислоты, а именно
Элементы А и У(Т)’, а также Г и Ц называются комплементарными друг другу. Предпочтительные взаимодействия приводят к тому, что молекулярная цепь свертывается таким образом, что комплементарные нуклеотиды оказываются спаренными и располагаются друг против друга (рис. 1—3).
Однако особенно стабильной должна быть двухцё-почеяная структура, состоящая из двух отдельных,
Рис. 3. Две цепи могут соединяться в двухнитовую структуру, скрепленную комплементарными взаимодействиями. Спираль ДНК [5] — э-ш винтообразно скрученная двухцепочечная структура, имеющая очень большую стабильность. Молекулы РНК в большинстве случаев одно-цепочечны, однако в них тоже имеются спиральные двухцепочечные участки, образующиеся в результате свертывания цепи. В качестве примера изображена двумерная укладка цепи тирозиновой т-РНК — структура «клеверного листа». В действительности эта молекула не плоская — она имеет определенную трехмерную структуру. Рентгенострук-турный анализ показал, что фенилаланиновая т-РНК имеет вид слегка изогнутой буквы Т {Rich et al.— Science, 1973, v, 179, p, 285),
полностью комплементарных друг к другу цепей. Примером такой структуры является двойная спираль ДНК по Уотсону и Крику [5]. Узнавание комплексен-
тарных элементов является простым основным принципом воспроизведения нуклеиновых кислот. Нуклеиновые кислоты могут служить поэтому в качестве универсальных накопителей информации, в противоположность белкам. Любая последовательность имеет неотъемлемую способность инструктировать построенпе своей копии. Процесс копирования — как и при фотографической репродукции — проходит через промежуточную стадию негатива. Точность копирования ограничена. Она определяется разностями энергий взаимодействия для комплементарных и некомплементарных пар. Точность распознавания может быть значительно повышена с помощью специальных копирующих машин — т. е. опять-таки с помощью специально адаптированных белковых структур. На высших ступенях эволюции вероятность ошибки при воспроизведении становится значительно меньше, чем Ю -9 . По сравнению с этим простое комплементарное взаимодействие в отсутствие копирующих ферментов дало бы вероятность ошибки от 1 до 10%.
5. Бесклеточная система, содержащая существенные компоненты — белки и нуклеиновые кислоты — и снабженная необходимым высокоэнергетическим строительным материалом, может репродуцировать свои составные части in vitro. Она проявляет все существенные функции живой клетки, но не является индивидуальным живым существом и не развивается как таковое [6].
Логическое построенпе этой молекулярной схемы биологической переработки информации в сжатом виде представлено на рис. 1 — 7 (рис. 4—6 иллюстрируют принцип строения белков. На модели рис. 6 показаны лишь пространственные положения аминокислотных остовов и расположения боковых цепей (R*)- по ~ мощью рентгеноструктурного анализа можно определить положение каждого отдельного атома в этой ог ромной молекуле с точностью до 2 А). Многие детали — как пространственные структуры, так и динамические взаимосвязи — в настоящее время уже известны.
Насколько проста эта грандиозная концепция природы, настолько сложны ее проявления и многообразны те индивидуальные структуры, в которых она реализуется. Это неиссякающий источник информации для неограниченной эволюции: от анаэробной бакте-
рии, через дышащую эукариотическую клетку, ассимилирующую растительную клетку, через дифференцированные и, наконец, управляемые центральной нервной системой организмы к «осознающему себя» человеку,— отсюда эволюция может идти вперед уже на новой основе, управляемая разумом, и этой эволюции нигде не предвидится конца.
С биологической сложностью и, вместе с ней, с индивидуальной неповторимостью структур мы сталкиваемся уже на уровне макромолекул, что является непосредственным следствием именно той концепции, которая была описана выше. В специальной главе мы обсудим, что нуяшо понимать под информацией. Здесь же мы даем лишь некоторые примеры сложности и уникальности.
Цитохром с, транспортирующий электроны,— одна из самых маленьких белковых молекул, встречающихся
Рис. 4. Две аминокислоты соединяются в дипептид, отщепляя при этом молекулу воды. Индивидуальность аминокислотных блоков, выражающаяся в различиях боковых цепей R, и R 2 , остается при этом неизменной.
в природе. Его молекулярный вес равняется примерно 13 000, а полипептидная цепь состоит примерно из ста аминокислотных остатков.
Сколько различных последовательностей аминокислот могут иметь белковые молекулы такой длины? Этот вопрос напоминает старинную детскую песенку «Сколько звездочек на небе…?» Это «ужасно большое число» легко вычислить. Для каждого из ста положений в полипептидной цепи имеется двадцать возможностей. Итак, ответ гласит:
20- 20- 20… = 20 шо « 10 130 .
Единица со ста тридцатью нулями!
Для реализации всех этих возможностей потребовалось бы в невообразимое число раз больше вещества,
Рис. 5, Многократное повторение процесса, изображенного на рис. 4, приводит к образованию линейной полпнептидяой цепи (первичная структура белка). В качестве примера дана последовательность цито-
хрома с.
|
Сокращенные обозначения аминокислотных блоков; |
||
|
Ала — ала нин, |
Лей |
— лейцин. |
|
Apr — аргинин," |
Лиз |
— лизин. |
|
Асн — аспарагин, |
Мет |
— метпоннн, |
|
Асп — аспарагиновая кислота, |
Пяо |
— пролин, |
|
Вал — валин. |
Сер |
— серия, |
|
Гис — гистидпн. |
Тир |
— тирозин. |
|
Гли — глицин, |
Тре |
— треонин, — триптофан. |
|
Глу — глутаминовая кислота, |
Топ |
|
|
Глн — глутамик, |
Фен |
— фенилаланин. |
|
Иле — изолейцин, |
Кружками с различной штриховкой обозначены четыре группы боковых цепей: I — положительно заряженные, II — отрицательно заряженные, III — полярные и амбивалентные, IV -— неполярные (гидрофобные). (Эта классификация не вполне свободна от произвола. Заряды кислотных и основных групп относятся к рН 7. К категории незаряженных, но полярных относятся аминокислоты с кислотными и основными функциональными группами. Большие участки боковых частей таких остатков могут иметь преимущественно гидрофобный характер. Глицин (R — Н) также относится к этой группе, потому что его поведение в основном определяется полярной пептидной связью.)
Рис. б. Линейная полипептидная цепь пространственно свернута. Различают вторичную и третичную структуру. Вторичная структура возникает в результате образования мостиков водородных связей между группами —СО—• и —NH—. Особенно часто образуется «складчатая структура» (два антипараллельных участка полипептидной цепи связываются между собой мостиками ■—СО .. . NH—), и а-спираль (полипептидная цепь скручивается в спираль вследствие замыкания водородных связей между группами —СО—. и группами —NH—, удаленными от соответствующих групп —СО— на четыре аминокислотных остатка). В цитохроме участки цепи 1 — 12 я 89 — 101 имеют спиральную структуру. Еще важнее пространственная, или третичная, структура, которая определяется взаимодействиями между боковыми цепями и создает активный центр. В активном центре цитохрома с находится комплекс железа с порфирином, который играет роль донора (Fe^+) или акцептора (Ре^+) электронов. Вследствие строго определенной укладки по-липептидпой цепи активный центр абсолютно специфичен по отношению к субстрату. Эффективность железного комплекса поддерживается боковыми цепями аминокислот. Изменение пространственной структуры, привело бы к резкому изменению каталитической активности.
чем можно найти на всем «небесном своде». Все вещество во Вселенной, по оценкам физиков, эквивалентно «только» 10 78 атомам водорода. Для сравнения: масса Земли соответствует 10 51 атомам водорода. За
Рис. 7. Упрощенная схема цикла воспроизведения нуклеиновых кислот и биосинтеза белков. Ферменты, которые служат для репликации генетических сообщений (ДНК-полимеразы), для их транскрипции (ДНК-завасимые РНК-полимеразы) и трансляции (белки рибосом), а также для активации различных аминокислот (аминоацилсинтетазы), довольно хорошо изучены. Полная схема с обратными связями включает и другие белковые факторы регуляции и контроля.
этим сравнением с «астрономическими масштаоамиа скрывается некая цель. Мы хотим показать, что при таком расхождении в порядках величин (10 130 , 10 78 ,
20
10 5? ) не имеет смысла уходить во Вселенную, чтобы реализовать концепцию, для которой «нет места» на |3емле.
I При таком соотношении чисел в принципе мало что изменится, если мы введем з рассмотрение временную координату. Возраст Вселенной или, точнее, возраст такого состояния Вселенной, в котором могут разыгрываться реакции органической химии, составляет «только» 10 17 секунд. Даже с помощью хорошо адаптированного ферментативного аппарата для разрыва цли для образования одной пептидной связи потребуется время порядка 10~ 3 —10~ 2 с. Если для решения задачи использовать все время существования Вселенной, то и в этом случае можно было бы испробовать лишь ничтожно малую долю из 10 130 возможных последовательностей.
В этом числовом примере для наглядности мы взяли только одну, да и то маленькую молекулу белка. Молекула ДНК, в которой записана вся генетическая информация клетки кишечной бактерии, состоит из 4*Ю 6 элементов. Последовательность такого числа букв соответствует книге объемом в 1500 мелко набранных страниц. Число альтернативных последовательностей составляет здесь примерно Ю 1 000 000 .
Конечно, именно в связи с этим возникает вопрос об уникальности подобных последовательностей и соответствующих структур. Что такое «уникальный»? Если это свойство означает «единственный в своем роде» не только в смысле неповторимости выбора, но и в смысле функционирования, то его следует отоя^дествить со свойством быть оптимальным, т. е. наилучшим.
Факторы узнавания
Факторы узнавания, происходящие из abc-алфави-та,— это предшественники амипоацилсинтетаз. т. е.
ферментов, активирующих аминокислоты (а, Ь, с, . . •) и переносящих их на соответствующие транспортные РНК (А, В, С, . ..). С какой вероятностью в наборе случайных аминокислотных последовательностей может встретиться однозначная кодирующая активность, следует выяснить экспериментальным путем. Что такая а-ктивность возможна, показывает ее существование в природе. Если не предъявлять слишком высоких требований к избирательности узнавания, то можно надеяться, что кодирующая активность будет обнаруживаться достаточно часто. При этом должен возникать целый спектр молекул, различающихся по сродству, как, например, в случае антител. Как выглядели первые адапторы-— предшественники транспортных РНК,— пока совершенно неясно. Возможно, что это были олигонуклеотиды, например тетра-, пен-та- или гексануклеотиды, поскольку все различные олигонуклеотиды встречались, по-видимому, достаточно часто и в относительно больших количествах. Но возможно также, что они были составной частью первоначального генетического материала и представляли собой длинные полинуклеотидные последовательности, которые выполняли двойную функцию накопителей информации и адапторов. В настоящее время транспортные РНК на уровне генов представлены длинными последовательностями, от которых лишь после транскрипции «отрезаются» участки, соответствующие функционирующим молекулам адапторов.
Возникновение генетического кода и аппарата трансляции следует считать решающим шагом в молекулярной самоорганизации живых структур. Только благодаря этому стало возможным эволюционное развитие практически неограниченной информационной емкости на чисто функциональной основе. Модельные соображения показывают, что этот шаг предопределяется известными свойствами белков и нуклеиновых кислот, но кодовый ключ не обязательно должен быть предопределен с самого начала. С другой стороны, еще нельзя исключить, что существуют предпочтительные взаимодействия мея^ду отдельными аминокислотами и структурами антикодонов, которые склоняют природу в пользу определенного кода. Если такие специфичные взаимодействия будут найдены — а на это может дать отзет лишь эксперимент,— то в соответствии с этим придется модифицировать распределение вероятностей для различных вариантов кода, которое сначала считалось равномерным. Во всяком случае это облегчило бы старт процессов трансляции. Однако для однозначной фиксации кода требуется очень большая точность узнавания. До сих пор пе получено никаких экспериментальных данных, которые указывали бы на существование таких достаточно избирательных взаимодействий.
С другой стороны, расчеты показывают, что в отсутствие специфичных взаимодействий должна была начаться трансляция, использующая «классифицирующий» код. Различение четырех классов аминокислот, например неполярных, полярных, положительно и отрицательно заряженных (они обозначены по-разному на рис 4, 5, 6 и 8),— это минимальное требование для возникновения воспроизводимых исполнительных свойств. Восемь классов аминокислот дают уже почти неограниченные функциональные возможности. Возникновение такого «классифицирующего» кода имеет еще реализуемую вероятность. Однако 10 50 вариантов уже нельзя разместить в земных масштабах. Это означает, что генетический код в известной нам сейчас дифференцированной форме никоим образом не мог возникнуть спонтанно — он должен был развиться из «классифицирующего» кода. Таблица кода (см. рис. 8 и 9) на самом деле дает целый ряд оснований для такого предположения.
II если вряд ли когда-нибудь удастся реконструировать в лаборатории историческую случайность, проблему возникновения кода в принципе все же можно, по-видимому, решить экспериментально.
Нуклеиновые кислоты
Из соображений, изложенных выше, следует, что нуклеиновые кислоты своими силами не могут подняться на «следующий этаж», где они могли бы использовать свои выдающиеся способности накапливать информацию для создания эффективно функционирующей системы своей собственной репликации. Они не могут обойтись без помощи функционально действенных белков. Но в таком случае нельзя ли построить самовоспроизводящуюся систему из одних белков?
Для этого белки должны были бы использовать свой практически неограниченный каталитический потенциал. Например, из аминокислот можно было бы строить специфичные олигопептиды, а затем — в несколько приемов — соединять их друг с другом, пока не получатся длинные цепи — первичные структуры белков. Эта способность к самоорганизации отличается, однако, в двух отношениях от изначальной способности нуклеиновых кислот к комплементарному распознаванию:
1. Способность к самовоспроизведению здесь может поязиться лишь у довольно сложной сети каталитических реакций, в которой имеются циклически замкнутые реакционные пути. О «комплементарностп» здесь можно говорить только в широком смысле, например А дает В, В —>- С и т. д. до X, который снова должен давать А (рис. 17).
2. Если каталитическое самовоспроизведение имеет место, то оно всегда является результатом специфических взаимодействий. Оно не является неотъемлемым свойством пространственно свернутых белковых структур. Например, в случае мутации данная каталитическая актпвность может быть полностью утрачена.
Оба эти свойства резко ограничивают способность эволюционировать. Сложные зацикленные сети реакций не могут освобождаться от «предшественников», нет также простого способа реализовать селективное преимущество, ибо для этого благоприятная мутация всегда должна была бы вызывать серию других определенных мутаций, чтобы подействовать на свой собственный источник и посредством этого селективно усилиться (см. рис. 17).
Рис. 17. Каталитический цикл. В каталитическом цикле вещество воспроизводится, проходя через ряд каталитически активных промежуточных стадий. Поскольку белки изначально не обладают способностью инструктировать образование идентичной или комплементарной последовательности и в то же время отдельные структуры могут быть каталитически активны, образование такого цикла являлось бы для Сел-ков единственной возможностью самовоспроизведения. Для этого некоторые компоненты цикла или сами по себе, или с помощью связанных с ними ферментов должны были бы катализировать синтез олигопеп-тидов («предшественников») из активированных аминокислот. (В природе такие ферменты известны: например, один декапептид может синтезироваться непосредственно из аминокислот, «Предшественники» большего размера могли бы образоваться путем соединения олиго-пептидов друг с другом.) В цикле из олигопептидов каталитическим путем снова образуются каталитически активные структуры А. В, С, . . ., X, причем X должен быть катализатором образования А. Поскольку цикл должен продуцировать «предшественников», число промежуточных стадий должно быть относительно велико.
В таком каталитическом цикле мутация дает преимущество только в том случае, если она будет избирательно способствовать своему собственному воспроизведению. Но это означает, что она должна вызывать серию новых определенных мутаций, которые приводят к образованию совершенно нового цикла (революция). Вероятность такой выгодной серии мутаций крайне мала. Поэтому белки не могут эволюционировать самостоятельно. Но их функциональные способности настолько велики, что при синтезе de novo всегда образуется какая-то доля функционально активных (хотя и мало адаптированных) структур.
Правда, в смеси полпнептидных цепей со случайными: последовательностями были найдены воспроизводимые каталитические свойства, которые были интерпретированы как самоорганизация. Но это обстоятельство только еще один раз демонстрирует большие функциональные способности белков. В каждом случайном распределении имеется достаточно большое число активных структур. Они адаптированы не оптимально, но тем не менее проявляют определенные каталитические качества. Воспроизводится не отдельная последовательность, а только наличие определенной функции, которая представлена большим набором каталитически активных структур. Но для эволюции, т. е. для оптимальпой адаптируемости, последовательности — причем любые — должны были бы обладать способностью к самовоспроизведению, носящей характер неотъемлемого свойства полипептидных цепей. У белков подобные свойства по меньшей мере не обнаружены.
Итак, мы приходим к выводу, что генотип и фенотип с необходимостью долиты быть представлены двумя различными классами молекул.
Как же могла возникнуть однозначная система трансляции, особенно если вначале не существовало никаких избирательных взаимодействий между соответствующими друг другу элементами обопх молекулярных классов?
Рассмотрим два алфавита, каждый из которых состоит из двух элементарных знаков, т. е. из двух букв: А, В и а, Ь. Наша система будет состоять из произвольных последовательностей букв, таких как
Допустим, что любые последовательности заглавных букв имеют способность к самовоспроизведению. Последовательности маленьких букв сами по себе такой способностью не обладают, для этого им требуются инструкций в виде последовательностей заглавных букв. Допустим, что последовательности маленьких букв способны зато выполнять любые функции, например, устанавливать соответствие маленьких и заглавных букв.
Вероятно, будет излишним еще раз напоминать, что здесь речь идет всего лишь об абстрактной моде ли. В природе вряд ли удалось бы реализовать систему функционирования, использующую только два класса единиц. Но эта модель легко обобщается на случай произвольного числа классов.
Для трансляции необходимо ввести однозначное соответствие меяеду заглавными и маленькими буквами. Допустим, что такого соответствия, основанного, например, на изначальных взаимодействиях между А п а, между В и b (как это имеет место в случае нуклеиновых кислот и выражается в комплементарпости АА’, ВВ’), вначале не существует. Иначе проблема была бы тривиальной. Вместо этого допустим, что в наборе случайных последовательностей, состоящих из маленьких букв, для каждого из возможных соответствий
Aa, Ab, Ва, ВЬ .
имеется по меньшей мере один «фактор узнавания», т. е. некоторая специальная последовательность маленьких букв (мы знаем, что такая ситуация действительно имеет место в случае белков). В случайном наборе этому условию могут удовлетворять многие различные последовательности, если только пе предъявлять слишком высокие требования — пе требовать оптимального функционирования.
Теперь разделим нашу систему на отсеки, которые достаточно велики для того, чтобы они содержали в среднем два «фактора узнавания». Всего может получиться десять различных вариантов:
|
1 |
2 |
3 |
4 - 5 |
|||
|
"■……’■ Аа |
А а |
АЬ |
Ва Ва |
|||
|
Аа |
АЬ |
АЬ |
Ва ВЬ |
|||
|
6 |
7 |
8 |
9 10 |
|||
|
ВЬ |
Аа |
АЬ |
Аа АЬ |
|||
|
вь |
Ва |
- ВЬ |
ВЬ Ва |
Однозначная трансляция могла бы происходить только в двух последних отсеках из десяти. Однако она была бы устойчивой только в том случае, если бы соответствующие факторы узнавания также постоянно воспроизводились. Но для этого нужно, чтобы АВ-по-следовательности содержали информацию для факторов узнавания. При трансляциии АВ-поеледовательностек
по правилам девятого или десятого отсека снова с равной вероятностью может образоваться любое из десяти возможных сочетаний факторов узнавания. Конечно, при этом имеется в виду только совпадение функций, а не индивидуальных последовательностей — вероятность последнего события много меньше. Из этого можно сделать еще один вывод: если количества последовательностей АВ- и ab-типа одинаковы, то только один из десяти отсеков, содержащих один и тот же набор факторов узнавания, будет содеря^ать также информацию, необходимую для воспроизведения своего типа трансляции.
Итак, самоподдерживающаяся система трансляции будет всего в одном из
1/2-10.10 = 50 отсеков."
Эти соображения легко обобщить. Если имеется не два, а Я различных классов букв, то теперь из А, 2 возможных сопоставлений между буквами мояшо образовать 1-2-3. ..Я = XI взаимно однозначных соответствий между двумя алфавитами. Таким образом, множитель 1/2 из нашего примера в общем случае нужно заменить на 1/(Х!). Взаимно однозначные соответствия составляют, однако, лишь малую долю всех возможных соответствии, число которых (в нашем примере — десять) равняется «числу всех сочетаний с повторениями из X 2 элементов по Я». Некоторые числовые примеры создают впечатление, что эта модель дает ожидаемые вероятности для спонтанного старта трансляции. Для двух букв надо было просмотреть в среднем 50 отсеков заданного размера, чтобы найти одну самоподдерживающуюся устойчивую систему трансляции. Для четырех букв это число увеличивается до 10 6 , для восьми — до 2,5 • 10 15 и, наконец, для двадцати классов букв — до 10 50 .
Вернемся к действительности. Что нужно понимать под двумя алфавитами, совершенно ясно: А, В, С, . . .— это классы кодонов, которые надо сопоставить двадцати белковым единицам — аминокислотам а, Ь, с, Поскольку между кодоном и антикодоном существует однозначная связь, этот код будет относиться также к соответствующим адаптерам — транспортным РНК.
В третьей игре объединим закон и случай
Введем снова пронумерованные шары. На этот раз различия в номерах будут соответствовать истинному различию состояний. Для игры нам понадобится один ящик. Для хранения запаса шаров необходим еще один ящик, в котором каждый из N номеров должен быть представлен N шарами.
В игровой ящик кладут N шаров, щэичем каждый номер может быть представлен сначала только одним шаром. Правила игры снова очень просты: не загля дывая в ящик, из него вынимают произвольно выбранный шар. Шары всегда должны быть хорошо перемешаны, чтобы шапсы быть вынутым для каждого из них были одинаковы. Судьба вынутого шара может быть двоякой: он либо «удваивается», т. е. его кладут обратно в игровой ящик вместе со вторым шаром, имеющим тот же номер, либо его просто удаляют из игрового ящика и кладут обратно в запасной ящик. Если оба процесса чередовать строго попеременно, то общее число шаров в игровом ящике будет оставаться всегда постоянным ( — N).
Чередование событий можно, конечно, предоставить случаю. Тогда число шаров в игровом ящике будет флуктуировать: оно может увеличиваться или, с равной вероятностью, уменьшаться. При этом рано или поздно оно обязательно упадет до нуля, в среднем это происходит уже через N 2 ходов. Этот случай иллюстрирует необратимую флуктуационную катастрофу, сравнимую с финансовым крахом игрока в рулетку.
Число шаров с определенным номером будет флуктуировать, как и общее число шаров. Некоторые номера будут быстро вымирать, зато другие будут представлены несколькими шарами. То же самое будет происходить, коиечно, и при строгом чередовании удвоения и удаления шаров, только в этом случае общее число шаров N в игровом ящике остается постоянным. Разберем подробнее этот более прозрачный случай. Номера, которые были представлены в игровом ящике только одним шаром и были удалены прежде, чем им удалось удвоиться, не имеют шансов вернуться в игру. Напротив, те номера, которые удвоились или даже размножились и приобрели в результате этого повышенную устойчивость — они не так легко могут стать жертвой флуктуационной катастрофы. Эта игра всегда приводит к неизбежному результату — «выживание» одного-единственного номера, который зато будет представлен N шарами.
Перед нами, очевидно, случай «отбора», хотя никто здесь специально не занимался отбором, следуя какому-либо критерию. Таким образом, отбор здесь является лишь следствием определенного флуктуационного поведения. Для рассмотренного варианта игры никак нельзя предсказать, какой" именно номер будет ото-
Рис. 12. Игра в селекцию. Если для каждого сорта шаров задать функцию Р (п), т. е. распределение вероятностей того, что соответствующий сорт будет представлен п шарами, то в конце игры для всех сортов, кроме одного, эти функции при всех значениях п будут равны нулю. Однако всегда будет существовать сорт, для которого Р(п) будет принимать ненулевые значения. Если нет ошибок, то Р(га)=0 для всех n < N, но Р{?г) = i для n=2V (б-функция). При конечной вероятности ошибки эта кривая расширяется, но в общем случае она будет оставаться гораздо уже, чем распределение Гаусса, показанное на рис. 10.
бран. Все номера имеют в точности равные Шансы. В начале игры распределение вероятностей строго равномерно. Для каждого номера вероятность выжить равняется 1 /N. Это распределение все время изменяется вследствие флуктуации. Каждый раз, когда вымирает какой-либо номер, мы регистрируем прирост информации. Это продолжается до тех пор, пока, наконец, вероятности отбора для всех номеров, кроме одного, не обратятся в нуль. Этот единственный номер i отбирается, для него вероятность выживания Pi становится равной единице, т. е. превращается в достоверность. Вместо размытого распределения Гаусса в первой игре или совершенно выровненного прямоугольного распределения во второй игре здесь мы имеем дело с однозначным выбором (рис. 10—12). Рис. 12 иллюстрирует игру в селекцию. Два графика здесь характеризуют распределения шаров в начале и в конце игры. Распределение вероятностей было бы здесь малоинформативно, так как a priori любой сорт шаров моя^ет вылшть с равной вероятностью. Но в действительности в конце игры всегда происходит выбор лишь одного сорта или, при конечной вероятности ошибки, лишь немногих сортов.
Дарвин характеризовал отбор как «выживание наиболее приспособленных». Часто задают вопросы, как охарактеризовать это состояние «наибольшей приспособленности» для живого существа и по каким критериям должна происходить такая «оценка». Если бы максимальная приспособленность определялась лишь при помощи самого факта выживания, то дарвиновский принцип выражал бы лишь тавтологию «выживание выживающих».
Только что рассмотренный вариант третьей игры демонстрирует именно такую ситуацию. Кроме самого факта выживания не имеется других критериев. «Выживание» здесь является абсолютно непредсказуемым результатом флуктуационного процесса. Дарвин, наверняка, не имел в виду этот случай, когда он формулировал свой принцип. Тем не менее, этот пример делает очевидным, что самоорганизация, основанная: на отборе, является по существу следствием определенного физического поведения системы, когда флуктуации способны усиливаться. При этом отдельные флуктуации непредсказуемы. Они сводятся к элемен тарным событиям, т. е. к квантовым явлениям, подчиняющимся соотношениям неопределенностей Гей-зенберга. В игре Эренфестов элементарный процесс тоже не детерминирован. Однако там непредсказуемость отдельных событий настолько ограничивается законом больших чисел, что для макроскопических систем вероятностные законы поведения превращаются в детерминистические. Последний же вариант игры допускает усиление флуктуации, и поэтому микроскопическая неопределенность может здесь отображаться в макроскопических явлениях. Паскуаль Иордан указывал на возможность макроскопического отображения микроскопических событий еще на заре квантовой механики.
Только что описанная игра является лишь мысленным экспериментом, который в таком виде по самой своей сути совершенно непригоден для описания реальных физических систем. Процесс удвоения требует инструктирования на молекулярном уровне, который может реализоваться лишь посредством определенных селективных взаимодействий. Такие взаимодействия имеют конечную величину и всегда подвержены тепловым возмущениям, вследствие чего некоторая доля инструкций оказывается ошибочной. Для молекулярного процесса невозможен абсолютно правильный выбор между альтернативами. Таким образом, наша игра нереалистична. Чтобы верно отобразить действительность, какую-то долго удвоений мы должны заменить введением новых номеров. Это легко достигается изменением правил игры. Сохранил! строгое чередование «рождения» и «смерти», но пусть теперь некоторая наперед выбранная часть всех редупликаций — например, в зависимости от вероятности ошибки, каждая десятая, сотая или миллионная часть, не будет происходить. Вместо этого система пополняется шаром с «новым» номером > N. Теперь, конечно, ие может быть никакого устойчивого отбора, во всяком случае, пока сумма всех шаров может увеличиваться и уменьшаться с равной вероятностью. При постоянной сумме N из ящика в среднем удаляется столько же шаров, сколько в него попадает, однако одновременно из-за конечной вероятности ошибки в ящик постоянно приходят новые шары. Поэтому для каждого сорта (номера) шаров вероят ность удвоения должна быть несколько меньше, чем вероятность удаления из ящика. Это означает, что каждый номер должен через конечное время вымереть. Номера шаров, находящихся в ящике, блуждают по всему набору чисел. Никакого устойчивого отбора больше нет.
Игры в бисер
Правило, случай и выбор относятся к существенным элементам игры. Многие игры целиком определяются диктатом правил, и потому их ход полностью закономерен. В других преобладает случай — мы говорим об азартных играх. Сочетание обоих элементов ведет к третьей категории игр, в которых на переднем плане стоит выбор, управляемый определенными критериями, т. е. оптимизирующая стратегия. К этой категории относятся наиболее интересные стратегические игры, такие, как шахматы и го. Очевидно, что здесь развитие игровой ситуации соответствует возникновению информации, обладающей семантикой, обусловленной правилами. По такому принципу «играет» и живая природа.
В дальнейшем мы будем постепеипо развивать идею взаимодействия закона и случая, руководствуясь моделями — «играми в бисер». Мы будем называть их так не только потому, что шарики, необходимые для игры, могут быть и бисером, по прежде всего потому, что эти игры, основанные на простых правилах, на высшей стадии своего развития реализуют то представление о единстве Природы и Духа, которое изложено в «Игре в бисер» Германа Гессе:
«Эти правила, язык знаков и грамматика Игры суть не что иное, как высокоразвитая тайнопись, к которой причастнъг многие науки и искусства, особенно математика и музыка (соответственно музыковедение), и которая способна выразить и связать друг с другом содержание и результаты почти всех наук».
Здесь перед нами встает фундаментальный вопрос: а может ли информация вообще возникать? Или же; она лишь выявляется? Не сводится ли в конечном сче-*§ те вся семантика к прасемаптике, и не определяется ли она в таком случае неотъемлемыми свойствами материи? На этот вопрос — кореппой вопрос для па-стоящей работы — мы сможем дать ответ только в четвертой главе. Сначала нужно рассмотреть еще несколько предпосылок *) I.
*) Как заказано в Предисловии, вопрос о смысле, содержа-?! нии или ценности информации особенно существен для биологии и требует специального рассмотрения. Очень важен также | вопрос о возникновении информации, поставленный авторами i (см. далее). (Прим. ред.) |
Правило, случай и выбор относятся к существенным элементам игры. Многие игры целиком определя ются диктатом правил, и потому их ход полностью закономерен. В других преобладает случай — мы говорим об азартных играх. Сочетание обоих элементов ведет к третьей категории игр, в которых на переднем плане стоит выбор, управляемый определенными критериями, т. е. оптимизирующая стратегия. К этой категории относятся наиболее интересные стратегические игры, такие, как шахматы и го. Очевидно, что здесь развитие игровой ситуации соответствует возникновению информации, обладающей семантикой, обусловленной правилами. По такому принципу «играет» и живая природа.
В дальнейшем мы будем постепенно развивать идею взаимодействия закона и случая, руководствуясь моделями — «играми в бисер». Мы будем называть их так не только потому, что шарики, необходимые для игры, могут быть и бисером, ио прежде всего потому, что эти игры, основанные на простых правилах, на высшей стадии своего развития реализуют то представление о единстве Природы и Духа, которое изложено в «Игре в бисер» Германа Гессе:
Эти правила, язык знаков и грамматика Игры суть не что иное, как высокоразвитая тайнопись, к которой причастны многие науки и искусства, особенно математика и музыка (соответственно музыковедение), и которая способна выразить и связать друг с другом содержание и результаты почти всех наук».
Для первой игры (рис. 10) нам понадобятся два ящика, по которым мы произвольно распределим оп-
Рис. 10. Схема «урновой» игры, а) «Моментальный снимок» отдельного хода игры: шар 13 переносится из левого ящика в правый, б) Распределение вероятностей Р(п) того, что флуктуация будет иметь величину п. Это гауссово распределение, интеграл по которому (т. е. площадь под кривой) нормирован на единицу. Величина п задает отклонение от равномерного распределения (2y /2 шаров в каждом ящике), в) Запись ходов одной игры по Кольраушу и Шредиигеру (Physik, Zeitschr., 1926, Bd. 27, S. 307). По оси абсцисс отложено число ходов Z, по оси ординат—разность чисел шаров в обоих ящиках 2n, iV=100 t
ределенное число (TV) шаров. «Произвольно» означает, что начальное распределение шаров совершенно безразлично, например, можно положить их все в один ящик, а другой оставить пустым, или распределить их поровну по обоим ящикам. Важно, чтобы все шары были пронумерованы и чтобы каждый номер (от 1 до 7V) встречался только один раз. Кроме того, нам понадобится лотерейная машина — колесо счастья или барабан, с помощью которой можно было бы «вытянуть» с равной априорной вероятностью любое число от 1 до N. Теперь можно начинать игру. Правила игры очень просты: каждый раз, когда выбор падает на определенное число, шар с соответствующим номером следует вынуть из того ящика, где он находился, д переложить его в другой ящик.
Допустим, что продолжительность игры не очень мала — это выполняется для большинства лотерей. Игрока больше всего интересует выигрыш. Мы занялись этой игрой тоже лишь из-за ее результата, который полностью воспроизводим,— уже после сравнительно небольшого числа ходов в каждом ящике будет находиться в среднем N[2 шаров. Впрочем, здесь важна оговорка — в среднем, ибо если считать точно, то в одном из ящиков мы будем находить то большее, то меньшее число шаров, т. е. N/2 ± п, а в другом ящике, соответственно, N/2 п шаров. Величина флуктуации п также имеет воспроизводимое среднее значение — она пропорциональна у’ N. Это означает, что относительная флуктуация убывает с ростом числа шаров N, хотя абсолютная флуктуация при этом растет. Чем больше шаров взято для игры, тем точнее будет выполняться равномерное распределение. При очень больших значениях N флуктуации будут едва заметны, и в пределе мы получим детерминистический закон распределения. Распределение вероятностей для п можно задать в явном виде. При достаточно больших N это распределение близко к гауссову, т. е. к колоколообразной кривой с полушириной порядка V^iV и относительной высотой порядка 1/У N (см. рис. 10).
Каждое состояние, на языке физиков*^ микросостояние, которое характеризуется перечислением всех номеров в каждом из ящиков, имеет вероятность 2.
Впрочем, нас не так уж интересуют эти мпкросостоя-ния. Мы гораздо больше хотим узнать что-нибудь о макросостояниях, которые характеризуются числами п. Существуют всего два макросостояния, которым соответствует только по одному микросостоянию, т. е, которые можно реализовать лишь, одним распределением шаров по ящикам. Эти состояния характеризуются величиной
n = zhN/2,
т. е. все шары находятся в одном ящике, второй ящик пуст. Естественно, что такие флуктуации реализуются очень редко, особенно при больших N. Напротив, состояние равномерного распределения п = О реализуется чаще всего, потому что его можно получить наибольшим числом способов размещения шаров. Энтропия достигает здесь максимума. Однако при больших iV число способов реализации даже этого состояния .очень мало по сравнению с числом всех состояний 2 jV .
Только примерно (l/i/"iV)-я доля всех микросостояний соответствует состоянию с п = О. Поэтому игра почти всегда будет заканчиваться с ненулевой, хотя и относительно малой, флуктуацией п, _заключенной
обычно в интервале между ~\-~\/ г N и— V N. Мы можем ^назвать выигрышем положительную флуктуацию и проигрышем — отрицательную. Такая игра обещает быть интересной только при малых N благодаря относительно большим флуктуациям. Для N = 6 можно пользоваться обычной игральной костью. В этом случае экстремальные флуктуации
jz=zbN/2
имеют вероятность 1/64, таким образом, в среднем через 32 хода мы придем к одной из экстремальных ситуаций, которую можно считать концом игры.
В физике эта игра известна как «модель Эренфес-тов». Ее придумали голландские физики — супруги Эренфесты примерно на рубеже нашего века. Она сыграла существенную роль при выяснении природы флуктуации в молекулярных распределениях. Не кто иные, как Кольрауш и Шредингер, имели даже терпение действительно «играть» в эту игру и опубликовать полученные результаты.
На рпс. 10 приведена часть подобного ряда на^ блгодений.