Записи с меткой «информация»
Распределение вероятности
Если распределения вероятностей Р и Q различны, то эта величина всегда положительна. Она обращается в нуль только тогда, когда наблюдение оставляет распределение Р неизменным. Величина I(Q\P) гораздо более определенно характеризует прирост информации, нежели разность энтропии Н (Q) —Н (Р) , которая может быть как положительной, так и отрицательной. Последняя величина представляет собой разность двух средних значений, и поэтому ее информативность в отношении отдельного события очень ограничена. В величине I(Q\P), напротив, результат наблюдения для каждого отдельного события сравнивается с вероятностью этого события до наблюдения, и лишь после этого делается усреднение по всем отдельным значениям. Таким образом, эта величина как среднее значение разностей более адекватно отражает истинный прирост информации, отнесенный к отдельному событию, чем разность средних значений. Учитывая важность этого понятия для эволюционного учения, дадим еще один пример, иллюстрирующий его отличие от более употребительного в теории информации понятия энтропии.
В заключительную стадию конкурса по архитектуре прошли три проекта. Имена авторов неизвестны жюри. Известно только, что среди них — архитектор А, который пользуется международным признанием и которому жюри охотнее всего доверило бы строительство. В одном из проектов по некоторым деталям вроде бы узнают «почерк» А. Конечно, полной уверенно-
Энтропия, как усредненная величина, в действительности очень мало отрая^ает изменепие информации,, проистекающее из отдельных наблюдений, и это демонстрирует дальнейший ход конкурса.
Осталось два проекта, которым раньше уделялось не очень-то много внимания. Но теперь их изучают более детально. Результатом будет модифицированное распределение вероятностей (Р’) того, что определенный проект принадлежит А:
Р* = 0,8,
Ръ = 0,2,-Я(Р’) ^0,72 бита.
Теперь остаются две возможности.
а) Предположение Р’ было верным, т. е. вскрытие конверта 2 показывает, что автором этого проекта является А. Тогда
д’г = 1,
q’z = 0.
б) Опять ошибка: А — автор не второго, а третьего проекта. В этом случае
q’z - 0,
g 3 = 1-
Так как решение означает полную определенность, в обоих случаях энтропия будет равна нулю. Таким образом, эти два очень разных результата не отличаются по энтропии. Изменепие энтропии в обоих случаях составляет
Н = II{Q) —Н{Р) ж —0,72 бита.
Значение I{Q’\P’), напротив, дает возможность дифференцировать эти случаи. Случай а) означает лишь подтверждение гипотезы, т. е. сравнительно небольшой прирост информации:
Случай б), наоборот, дает новые сведения. Соответственно прирост информации получается много больше:
Распределение вероятностей совсем не исключало возможности ошибки (случай б). Нужно следить за тем, чтобы событию никогда ие приписывалась нулевая вероятность, пока существует конечный интервал ошибок, т. е пока ошибка еще возможна. Учет средних ошибок всегда приводит к конечным положительным значениям ри Это особеппо важно для возникновения информации в природе, ибо все естественные элементарные процессы сопровождаются флуктуация-ми конечной величины.
В рассмотренном примере информация «возникает» только в мозгу наблюдателя. Отдельные наблюдения используются для того, чтобы последовательно сужать неопределенность, пока, наконец, не будет достигнуто исчерпывающее знание ситуации, которая сама по себе остается неизменной.
Не может ли то, что совершается вторично в мозгу «информируемого», происходить первично в системе, способной к самоорганизации и, следовательно, к последовательным сужениям (сначала произвольного) распределения вероятностей? Источником, производящим информацию, при этом может быть статистический флуктуациопный процесс, т. е. «генератор шума». Такая система, несомненно, должна обладать известной способностью к фильтрации, или к отбору. Это означает, что появление «нестабильпостей» делает невозможным возврат к первоначальному распределе-иию вероятностей.
В своей монографии «Наука и теория ипформации» Леон Бриллюэн отмстил, что рассмотрение семантического аспекта информации делает необходимым введение параметра ценности. Такой параметр должен пметь физическую интерпретацию. Оценивание равнозначно отбору, а способность к отбору как материальное свойство должна найти свое обоснование в динамических критериях. Ее нельзя объяснить, оставаясь в рамках одной лишь теории вероятностей. Возникновение и исчезновение, т. е. временность существования, является необходимой предпосылкой любой самоорганизации, основанной на отборе, а также предпосылкой возникновения информации. Но, кроме этого, нужны
еще особые закономерности, обусловленные природой * системы.
Здесь перед нами встает фундаментальный вопрос: а может ли информация вообще возникать? Или же она лишь выявляется? Не сводится ли в конечном сче-!*| те вся семантика к прасемаптике, и не определяется ли она в таком случае неотъемлемыми свойствами материи? На этот вопрос — кореппой вопрос для па-стоящей работы — мы сможем дать ответ только в четвертой главе. Сначала нужно рассмотреть еще несколько предпосылок *). I
*) Как указано в Предисловии, вопрос о смысле, содержа-? нии или ценности информации особенно существен для биологии и требует специального рассмотрения. Очень важен также вопрос о возникновении информации, поставленный авторами I (см. далее). (Прим. ред.) j
Физические процессы
Конечно, в случае физических процессов, доступных нашему наблюдению, мы имеем дело с очень большими числами, которые по порядку величины сравнимы с числом Авогадро ( ~ 10 24 ). Для таких больших чисел флуктуации еле заметны. Законы равновесной термодинамики (например химический закон действия масс) можно поэтому с хорошим приближением считать детерминистическими. Можно считать, что два ящика в игре Эренфестов представляют собой различные состояния, между которыми идут взаимопревращения, например химическая реакция. Эта игра непосредственно обобщается на большое число различных состояний (или «ящиков») с различными вероятностями их заселенности. Такая игра совершенно аналогичным образом описывает установление равновесного распределения и флуктуационное поведение. Результаты справедливы для любых реакций, идущих вблизи равновесия, независимо от того, насколько слоясен их механизм. Нумерация шаров существенна только для проведения игры. Она гарантирует эквивалентность всех шаров в статистическом процессе превращения. В остальном индивидуальность шаров нас не интересует — молекулы, находящиеся в одном и том же состоянии, неразличимы. Различимыми являются отдельные состояния — химические формы или индивидуальные макромолекулярные последовательности, а в случае нашей игры — ящики.
Чему моя^ет научить нас эта игра в связи с про-* блемой возникновения информации? Для любой материальной системы вблизи равновесия флуктуации имеют саморегулируемый характер. Этот самоконтроль является неотъемлемым свойством флуктуационного процесса, и поэтому равновесие является устойчивым состоянием. Распределение населенностей удерживается в рамках определенных флуктуационных границ энергетическим параметром, присущим системе. Эта игра ясно показывает, что возвращение системы в состояние равновесия тем более вероятно, чем более она отклонилась от равновесия. Экстремальные флуктуации, например вымирание сильно населенного в среднем состояния, едва ли будут реализоваться в пределах разумных пространственных и временных масш-
Рис. 11. «Орел» или «решка». Игра иллюстрирует неконтролируемый флуктуационный процесс, а) При выпадении «орла» шар переходит из левого ящика в правый, при выпадении «решки» « наоборот, из правого в левый, б) Распределение вероятностей теперь совершенно равномерно, т. е. любое отклонение п от равнораспределения (N/2 в
каждом ящике) одинаково вероятно 8
табов. Даже в том случае, когда имеется большое число альтернативных состояний и вероятность того, что какое-то определенное состояние населено, очень мала, система будет беспорядочно пробегать через эти состояния снова и снова, так что для такой эргоди-ческой системы при усреднении во времени будут выполняться детерминистические законы физики. Для того, что мы называем возникновением информации, подобное поведение «противопоказано». Информация здесь не изменяется вследствие неизменности распределения вероятностей. Она зависит от характера внутренних взаимодействий, которые определяют усредненное поведение системы.
Вторая игра (рис. 11), которая будет служить контрпримером, иллюстрирует полностью недетерминированный флуктуационный процесс. Здесь можно обойтись сравнительно кратким разбором, потому что мы снова придем к выводу, что на этом пути, как к в первой игре, невозможно возникновение информации.
Нам снова понадобятся два ящика (в общем случае к ящиков) и некоторое количество шаров, которые следует распределить по разным ящикам. На этот раз мы будем исходить из равномерного распределения. Итак, в простейшем случае мы имеем два ящика, каждый из которых содержит сначала N/2 шаров. Для этой игры шары не нужно нумеровать и можно пользоваться лотерейной машиной, которая способна лишь выдавать решения типа «да — нет»; для монеты это будет «орел или решка», а для игральной кости — четные или нечетные числа. При выпадении «решки» будем переносить один шар из ящика 1 в ящик 2, при выпадении «орла» — наоборот. Каким здесь окажется результат?
Чтобы его найти, нуяшо долго играть. Вместо этого мы попытаемся его предсказать. Перед нами снова азартная игра, в которой отдельный результат непредсказуем. Но здесь утрачена существенная для первой игры способность к регулированию — зависимость вероятности переноса от населенности ящика. Результат одного бросания, «орел» или «решка», и, следовательно, вероятность определенного переноса полностью независимы от населенности ящиков, т. е. от предыстории флуктуации. До тех пор, пока в ящике останется хоть один шар, эта вероятность неизменно равняется 50% для любого бхюсапия.
Существует по теперешним временам не такая уж веселая история о человеке, который всегда брал с собой бомбу, когда ему приходилось летать. Оп верил, что при этом увеличивается его безопасность: ведь две бомбы в одном самолете — событие куда менее вероятное, чем одна, его бомба. Этот человек перепутал, очевидно, правила обеих игр. Сотрудники органов безопасности вряд ли удовлетворились бы подобным объяснением.
Итак, когда при не зависимых друг от друга флуктуа-пиях пет саморегулирования, никакое состояние не будет предпочтительнее любого другого. Это означает, что распределение вероятностей представляется прямоугольником (см. рис. 11): при усреднении по времени все состояния оказываются равноценными или равновероятными. Система беспорядочно «дрейфует» по всем возможным состояниям. В отличие от модели Эренфестов, экстремальное состояние здесь легко достижимо — в среднем примерно уже через /V 2 бросаний. Если перейти к к ящикам (состояниям), то результат в принципе не меняется. Поскольку теперь имеется к(к —1) возможностей переноса, то для проведения игры требуется несколько более хитроумная лотерейная машина. Как и раньше, система будет пробегать через все состояния в процессе случайного блуждания.
Вывод: если никакое состояние ничем не выделяется, то в процессе ненаправленного дрейфа не может порождаться информация, понятие информации теряет здесь всякий смысл.
Третья ступень: от гиперцикла к первичной клетке.
Схоластический вопрос «Что возникло раньше, курица, или яйцо?» сводится к абсурду результатами молекулярной биологии. Подобная постановка вопроса, впрочем, и без того теряет смысл, когда события, находящиеся в причинной связи, соединены еще и обратной связью. Не спрашивают, где находится начало или конец окружности.
Взаимосвязь между самовоспроизводящимися «накопителями информации» и «исполнителями» с практически неограниченной широтой функционирования, которая установилась в гр ез У льтате спонтанного воз-
Рис. 18. Гиперцикл. Гиперцикл возникает, когда образуется циклическая цепочка связей между элементарными реакционными циклами (Jj). Элементарные циклы — это цепи нуклеиновой кислоты ограниченной длины I _{), воспроизводящие друг друга по комплементарному механизму. В каждом элементарном цикле идет автономная репликация, т. е. плюс-цепь производит минус-цепь, а минус-цепь снова дает плюс-цепь. Эта репликация катализируется факторами связи (Е{,) которые либо селективно повышают скорость и точность репликации в своем цикле, либо уменьшают в нем скорость распада. Каждый цикл Г$ должен содержать информацию для такого фактора связи Е который действует на следующий элементарный цикл J" i—f— 1 - Кроме того, каждый цикл 1\ может содержать информацию для факторов 15′$^выполняющих общие функции: это могут быть, например, факторы трансляции, репликазы или ферменты метаболизма. Только благодаря замыканию цикла (т. е. обратной связи Е п с 2\) элементарные циклы !{, по отдельности конкурирующие друг с другом, вынуждаются к кооперации. 1-циклы, связанные с гиперциклом независимыми факторами связи, а также «шунты» не допускаются. Это означает, что цикл I i в гиперцикле, независимо от того, сколько белков он кодирует, всегда должен зависеть от общего фактора Е|_1И сам должен содержать информацию для другого фактора связи. Каждый 1-цикл является поэтому координированно регулируемой генетической единицей, которую можно считать предшествен.ником оперона,
никновения системы трансляции, открывает новые перспективы для процесса макромолекулярной самоорганизации. Ограничения возможностей, характерные для обоих классов молекул по отдельности, снимаются благодаря их кооперации. Правда, еще необходим отбор, т. е. избирательная репликация всей системы трансляции. Для этого все индивидуальные носители информации, входящие в эту систему и сначала конкурирующие друг с другом, должны объединиться в один «коллектив». Связи между отдельными нуклеиновыми кислотами должны образовать замкнутый цикл. Этим будет исключена любая дальнейшая конкуренция между членами цикла. Информация для белковых факторов связи, а также для ферментов трансляции должна содержаться в молекулах нуклеиновых кислот. Лишь таким путем весь коллектив сможет постоянно воспроизводиться как целое. Гипериикл, изображенный на рис. 18, можно рассматривать как прототип такой самовоспроизводящейся системы реакций. Это название подразумевает, что индивидуальные молекулы РНК, циклически воспроизводящиеся на основе комплементарного инструктирования, сопряжены между собой дополнительной цепочкой связей, которая образует цикл.
Такой цикл реакций проявляет свойства, которые в других случаях мы находил; только у живых систем.
Любой гиперцикл ведет себя как кооперативная единица с нелинейным законом роста. Если дополнительные условия ограничивают рост, например при постоянной скорости подвода высокоэнергетического строительного материала (пища), или если величина всей популяции поддерживается постоянной при помощи разбавления, то из-за нелинейности получается крайне жесткая конкуренция между различными циклами, и отбор приводит к результату «все или ничего». Это свойство позволяет системе эффективно использовать малые селективные преимущества и эволюционировать быстрее, чем это возможно для линейной системы реакций. Но прежде всего нелинейность приводит к фиксации универсального кода и универсальной хиральности («левого» или «правого» варианта) макромолекулярных структур. Это остается верным и для того случая, когда выбор конкретного варианта обязан лишь случайной флуктуации. Универсальность следует из способности флуктуации усиливаться (это свойство демонстрировала третья «игра в бисер») — в нелинейном случае это ведет к результату «все или ничего». Кинетические параметры и, следовательно, селективные ценности нелинейной системы зависят от концентраций. Если концентрация из-за эффекта усиления хотя бы однажды вырастет до макроскопического уровня (в общем случае это означает усиление на 10—20 порядков), то никакой другой трансляционный коллектив, состоявший вначале лишь из нескольких копий, уже не сможет вырасти в присутствии господствующей системы. В нелинейной системе сосуществование различных вариантов кеда исключается.
Гибель
Типичными конечными ситуациями являются гибель, неограниченный рост или стационарное поведение, представленное устойчивыми или осциллирующими конфигурациями. Некото рые примеры даны на рис. 13. Коиууй сначала предполагал, что из-за «правила перенаселения» неограниченный рост невозможен. Однако это предположение было опровергнуто открытием таких конфигураций, как «планерное ружье» — это незатухающий, пространственно фиксированный осциллятор («ружье»), который за каждый период испускает фигуру, двигающуюся по доске («планер»). Такие конфигурации, которые производят новые двигающиеся фигуры или уничтожают их, придают игре стратегический характер и делают ее одной из самых интересных стратегических игр.
необозримое многообразие взаимодействующих друг с другом популяционных структур с крайне интересными «функциональными» способностями. Однако весь ход игры подчиняется диктату заранее заданных правил отбора и однозначно определяется начальной конфигурацией. Не происходит ничего такого, что не было бы запланировано с самого начала «полностью информированным Создателей!» или по крайней мере не было бы предсказуемо. Вся информация, которая выявляется в ходе игры, содержится уже в начальных условиях. Какой богатой в действительности может оказаться информация, функциональная семантика, показывают примеры рис. 13.
Какой бы интересной и захватывающей ни была бы эта игра, детерминистическое поведение не соответствует концепциям и экспериментальным данным молекулярной биологии — разве что мы захотим их игнорировать, ссылаясь на Создателя. Многие биологи склоняются скорее к другой крайности. Они верят в догму «абсолютного», «слепого» случая. В детерминистической модели постулируемые физические закономерности в большой степени покрыты мраком неизвестности, здесь же физическое объяснение становится вообще неуместным — действия Создателя полиостью ускользают от нашего понимания. Флуктуация, находящаяся за пределами всякого ожидания, в принципе непредсказуема, хотя ее и нельзя исключить. Эту ситуацию можно сравнить с лотереей, только здесь «выигрыш» неизмеримо менее вероятен — вспомним примеры из первой главы, иллюстрирующие сложность и неповторимость биологических объектов. После этого ясно, что в действительности означает ссылка на абсолютный случай при объяснении «акта творения».
Рис. 13. а —д. Характерные конфигурации в игре «Жизнь» Кояуэя. Временная последовательность конфигураций заменена пространственной последовательностью. Последовательные конфигурации «движущихся» фигур изображены на соседних участках доспи, а) Триплет, который гибнет, б) Триплет, который переходит в устойчивый блок, в) Осциллирующий триплет «сигнальные огни», г) «Планер», или «парусник»,— фигура, которая переходит сама в себя через каждые четыре поколения, сдвинувшись при этом вправо и вниз на один квадрат, д) «Тумблер» — осциллирующая фигура, которая через каждые семь поколении переворачивается, сдвинувшись при этом вниз на один квадрат, а через каждые 14 поколений снова возвращается к исходному состоянию. Необходимо отметить, что этот осциллятор, так гке как и «сигнальные огни», не движется по полю как «планер», а все время остается в определенной области доски,
Рис. 13 е. «Планерное ружье» и «пожиратель». «Ружье» — это пространственно фиксированный осциллятор, который через каждые тридцать поколений возвращается в исходное состояние и в течение каждого периода испускает один «планер» (т. е. один раз за 30 поколений). «Планер» передвигается по доске и сталкивается с «пентадекат-лоном» (это осциллятор с периодом 15 поколений). Последний «проглатывает» «планер», но сам при этом не изменяется,
Однако мы знаем, что существует еще и средний путь между обеими крайностями- Он тоже исходит из случайных событий, но только из таких, которые имеют конечную вероятность реализации.
Почти во всех лотереях один или несколько игроков выигрывают, хотя их нельзя установить заранее никаким хитроумным способом. Эта исходная ситуация, а именно то, что в лотерее всегда имеются различные выигрыши, уже является ограничением, кото-rjoe сильно уменьшает неопределенность. В природе или в лабораторном эксперименте эта ситуация будет существенно изменять ожидания по сравнению с гипотезой абсолютного случая, не ограниченного никакими условиями. Если всегда имеется «победитель», то исход каждого эксперимента должен быть положи-тельиым, т. е. при воспроизведении условий, аналогичных тем, которые существовали в критическую фазу истории нашей планеты, снова должны были бы возникнуть живые структуры. В деталях — например в генетическом коде, в структурах ферментов и т. д.— они могли бы не иметь никакого сходства с известными нам структурами: они были бы лишь построены по тем же принципам и, таким образом, могли бы тоже оптимально приспособляться к окружающей среде. Но точное «случайное попадание» в истории, которое привело бы опять к современным формам жизни, невозможно. Крайне невероятно, чтобы во второй раз в каком-нибудь малом элементе объема в благоприятный момент собрался такой же набор молекул и, воспроизвелся исторический процесс эволюции.
Вспомним, что третья «игра в бисер», описанная в предыдущей главе, всегда давала «победителя», при безошибочном воспроизведении даже в том случае, когда для всех конкурирующих видов шаров шансы были абсолютно равны. Конкурирующее поведение и выбор «победителя» — это свойства стационарной самовоспроизводящейся системы реакций вдали от равновесия. Учитывая эти свойства, можно указать третий, непрерывный путь к «Творению». При этом должны быть выполнены два условия:
1. Необходимо, чтобы существовал внутренний механизм отбора, который из любого случайного распределения отбирал «победителя», как в третьей «игре в бисер». «Выигрыш» здесь берется по отношению к соответствующему распределению вероятностей и в общем случае означает не «главный выигрыш», а только «достаточно денег, чтобы можно было играть дальше» или даже лишь «остаться при своих». Победитель (в случае игры — доминирующий, или отобранный, тип шаров) постоянно порождает новых конкурентов вследствие ошибок при воспроизведении. При этом выигрыш становится все выше и выше, как на аукционе.
2. Непрерывный путь эволюции, характеризующийся последовательностью селективных ценностей, должен вести к вершине, т. е. к главному выигрышу. Это означает, что изменчивость должна быть достаточно велика, чтобы победитель всегда мог быть превзойден каким-нибудь конкурентом. Этот оптимизирующий путь к вершине не должен непременно быть монотонным ростом, но, с другой стороны, его «направление» в основном уже определяется дополнительными условиями отбора и точностью воспроизведения.
Как возникает информация?
Понятие информации имеет два аспекта, которые объединяются друг с другом только вопросом, помещенным в заглавии. Во-первых, это количественный аспект абсолютной информации, игнорирующий смысл и значение сообщения. Предполагается только, что сообщение отличается от других содержащимся, в нем смыслом и что расположение символов в сообщении характерно для него. При передаче сообщения должно обеспечиваться сохранение расположения символов — в рамках допустимых отклонений. Этим аспектом занимается теория информации, или теория связи, развитая Шенноном [7], Винером [8] п Колмогоровым [9]. Она представляет собой математическую дисциплину — это прикладная теория вероятностей.
Второй аспект связан с оценкой сообщения, т. е. с его смыслом. Его называют также семантическим аспектом. Любая семантика зависит от известных соглашений, или, в более широком смысле, предполагает существование дополнительной информации (например, наличие определенной окружающей среды), которая локализуется вне сообщения и селективно взаимодействует* с информацией, содержащейся в сообщении. Карл Фридрих фон Вайцзекер [10] выразил эту ситуацию посредством двух взаимно дополнительных тезисов:
1. Информацией является лишь то, что понимается.
2. Информацией является лишь то, что производит информацию.
Обратные утверждения неверны. Например, из второго тезиса нельзя сделать вывод, что информацию можно .производпть только из информации. Сохранение
около 10~ 4 с. За такими реакциями удается непосред-^ ственно следить лишь с помощью современных мето-j дов измерения, таких, как метод магнитного резонанса и релаксационные методы! Скорость химической реак^: цни почти всегда достигает предельного значения, ко-i торое определяется законами физики. Во всех случаям: обнаруживают оптимальное соотношение тенденции; «как можно быстрее» и «настолько точно, как это нужно». Для создания такого оптимального функционирования не потребовалось участия никакого «демона Максвелла» — однако для нас, вторгающихся в микрокосмос со своим опытом и предубеждениями, сформированными окружающей средой, все выглядит так^ как будто все это было «спланировано» каким-то гениальным конструктором. Впечатляющий пример дает упоминавшееся уже выше размножение кишечной палочки: весь план строения, т. е. «книга с 1500 страницами мелкого текста», последовательно прочитывается в течение двадцати минут, и одновременно выполняются все содержащиеся в ней предписания для синтезов. Кишечная палочка может репродуцироваться за двадцать минут. При этом информация, содержащаяся в каждой букве «плана строения», полностью перерабатывается за время, меньшее 10 _3 секунды.
Подведем итог: макромолекулярные структуры, которые мы находим в ныне живущих организмах, являются уникальными — не столько в смысле неповторимости выбора из необозримого множества возможных альтернатив, сколько в смысле их оптимальной пригодности для выполнения соответствующей функции — «цели». Возникновение жизни, возникновение биологической информации — это проблема макромолекуляр-ной самоорганизации.
Понятие информации: имеет два аспекта, которые объединяются друг с другом только вопросом, помещенным в заглавии. Во-первых, это количественный аспект абсолютной информации, игнорирующий смысл и значение сообщения. Предполагается только, что сообщение отличается от других содержащимся в нем смыслом и что расположение символов в сообщении характерно для него. При передаче сообщения должно обеспечиваться сохранение расположения символов —• в рамках допустимых отклонений. Этим аспектом занимается теория информации, или теория связи, развитая Шенноном [7], Винером [8] и Колмогоровым [9]. Она представляет собой математическую дисциплину— это прикладная теория вероятностей.
Второй аспект
Второй аспект связан с оценкой сообщения, т. е. с его смыслом. Его называют также семантическим аспектом. Любая семантика зависит от известных соглашений, пли, в более широком смысле, предполагает существование дополнительной информации (например, наличие определенной окружающей среды), которая локализуется вне сообщения и селективно взаимодействует* с информацией, содержащейся в сообщении. Карл Фридрих фон Вайцзекер [10] выразил эту ситуацию посредством двух взаимно дополнительных тезисов:
1. Информацией является лишь то, "что понимается.
2. Информацией является лишь то, что производит информацию.
Обратные утверждения неверны. Например, из второго тезиса нельзя сделать вывод, что информацию можно.производить только из информации. Сохранение количества или непрерывность информации исключали бы любую форму эволюции.
Если мы хотим понять, как возникает информация— и особенно биологическая информация,— то нам придется более подробно рассмотреть оба аспекта понятия информации. Ибо мы должны, собственно говоря, формулировать свои вопрос следующим образом: как возникает семантика? Нас интересует не столько расположение символов само по себе (ограниченное определенным распределением вероятностей), сколько функциональное значение, инструктированное этим расположением символов.
Пра-семантика биологической информации основа-па на функциональной упорядоченности, которая обеспечивает сохранение и дальнейшее развитие состояния жизни.
Абсолютная информация характеризуется множеством символов и их распределением. Символы должны быть представляемы сигналами, которые могут передаваться физическими способами. Для этого нужен однозначный код, т. е. однозначное соответствие между множеством символов и множеством элементарных знаков, или сигналов. На рис. 8 и 9 даны два примера: генетический код и телеграфный код. Они имеют совершенно различное происхождение. Первый (рис.
возник на раннем этапе существования Земли в результате самоорганизации вещества, второй (рис. 9) придуман только в нашем веке. Оба они, однако, построены по очень сходным логическим принципам. Они равномерны, т. е. все комбинации символов имеют одну н ту же длину: триплеты в генетическом коде я квинтеты в телеграфном коде. Код Морзе, наоборот, неравномерен. Добиться воспроизводимого функционирования такой схемы на молекулярном уровне было бы очень трудно из-за необходимости постоянно изменять «длину кадра».
В телеграфном коде все возможности используются взаимно однозначным образом. При двоичной системе квинтетный код дает 2 5 = 32 комбинации. В немецком алфавите имеется 26 букв. Остаются шесть комбинаций, которые можно использовать для сигналов переключения. Генетический код состоит из 4 3 = 64 три-плетных комбинаций. Эта концепция была более подробно рассмотрена в первой главе. Использование в
Рис. 8. Генетический код (значение штриховки см. на рис. 5). Терм — сигнал терминации, индекс «а» — сигнал инициации, если этот символ
стоит в начале цистрона.
качестве элементарных знаков кода не двух, а четырех нуклеотидов дает богатую палитру феиотипических возможностей выражения уже на уровне генных структур. Это проявляется прежде всего в высокой динамической гибкости двухцепочечных структур во время копирования. Использование только двух элементарных знаков в генетическом алфавите сделало бы необходимым — как и в случае телеграфного кода — введение квинтетов или даже секстетов. Передача информации, зависящая от взаимодействий между отдельными нук-леотндами, происходила бы слишком медленно в случае пяти или шести центров взаимодействия (комплементарных пар нуклеотидов на один ко дон). Из кинетических исследований различных комбинаций нуклеотидов с определенным составом мы знаем [11], что триплет-ный код представляет собой оптимальное решение, найденное природой, не только с точки зрения его рациональности, но и с точки зрения динамической стабильности и гибкости.
Количество абстрактной информации в данном множестве символов можно выразить через распределение вероятности?! всех возможных расположений. Обозначим через v число элементарных знаков в данном множестве, а через X — число различных классов знаков. Тогда число всех возможных расположений (последовательностей) будет X v , Для белковой молекулы типа дитохрома (см. пример из первой главы) это число получилось порядка 10 130 . Если бы все последовательности были равноценны, т. е. априорно равновероятны, то это число уже можно было бы использовать для задания количества информации. Действительно, в случае равномерного распределения вероятностей, чтобы встретить заданную последовательность, потребовалось бы перебрать и испытать все 10 130 возможных последовательностей. При таком просмотре мы не располагаем, конечно, никакой информацией, которая могла бы вести нас к цели. «Красный свет» вспыхивает только тогда, когда появляется совершенно правильная последовательность. Таким «красным светом» может быть, например, тест на ферментативную активность, которая оказывается положительной только в том случае, когда реализована правильная последовательность.
Предисловие редактора
Имя Манфреда Эйгена, иностранного члена Академии наук СССР, хорошо известно советскому читателю. Эйген был удостоен Нобелевской премии за создание и разработку новых методов химической кинетики — релаксационных методов. В последнее десятилетие научная деятельность Эйгена посвящена фундаментальным вопросам добиологической и биологической эволюции, вопросам возникновения и развития жизни на Земле. Ранее на русском языке были опубликованы первая работа Эйгена, трактующая эти вопросы [1], и ее сжатое изложение [2]. В данной книге, написанной Эйгеном вместе с его сотрудницей Рутхильд Винклер, обсуждаются те же проблемы. В отличие от работ [1, 2] здесь не приводится математический формализм теории самоорганизации биологически функциональных макромолекул, но дается лишь качественное описание этой теории. Относящиеся к ней тонкие и сложные вопросы проанализированы на основе игровых моделей с привлечением понятий современной теории информации. В дальнейшем Эйген и Винклер посвятили обширную монографию применениям теории игр в биологии и социологии [3].
Об игровой модели развивающейся Природы писал уже Гёте в 1809 г.: «Представьте себе природу, которая как бы стоит у игорного стола и неустанно выкрикивает: an double! (удваиваю! — М. В.), т. е. пользуясь уже выигранным, счастливо, до бесконечности продолжает игру сквозь все области своей деятельности. Камень, животное, растение — все после таких счастливых ходов постоянно снова идет на ставку, и кто знает, не является ли весь человек, в свою очередь, только ставкой на высшую цель?» (цитируется по [4]),
Гёте по существу указал в этих словах на то, что уже возникшая информация может сохраняться в ходе дальнейшего развития.
Игры, моделирующие явления жизни, описаны в книге популярно, ярко и убедительно. Однако в целом маленькая книжка Эйгена и Винклер требует от читателя серьезных усилий. В ней затронуты — зачастую бегло — очень важные вопросы естествознания, имеющие в конечном счете и общефилософское значение. Читая эту книжку, нужно размышлять, причем не обязательно во всем соглашаться с автором.
Задолго до Эйгена самоорганизацию биологических макромолекул рассматривал Кастлер [5]. Именно Кастлер впервые отметил различие между возникновением информации и выявлением уже имеющейся информации из маскирующих ее шумов. Очевидно, что для биологии существенно и то, и другое.
Можно оценить количество информации, содержащееся в молекуле ДНК или даже в организме в целом. Такие оценки имеются в работе Каетлера [5] и в монографии Блюменфельда [6]. Однако, как об этом говорится и в данной книге, для биологии существенна не столько количественная, сколько качественная характеристика информации — ее ценность. Впервые на это указал Шмальгаузен в своем посмертно изданном труде [7]. Проблема ценности информации непосредственно связана с рецепцией информации — ценность может определяться только по последствиям рецепции. Тем самым возможно лишь условное, относительное определение ценности. Можно определить ценность элемента информационного сообщения как степень его незаменимости. Ряд фактов свидетельствует о том, что ценность информации, определенная таким образом, возрастает в ходе биологического развития — ив филогенезе, и в онтогенезе. Вопросы ценности информации в связи с биологией рассмотрены в работах [8— 10]. В книге [10] содержится также изложение и критический анализ теории Эйгена.
Теория эта — крупное событие в науке. Эйген разработал содержательную модель добиологическоя эволюции, позволяющую понять возникновение порядка из беспорядка. Для этой модели не потребовались какие-либо новые физические принципы — уже установленные иояятня фпзнки и теорни информации оказываются достаточными для моделирования и, тем: самым, понимания фундаментальных биологических процессов. Конечпо, Эйгеи далек от мысли, что предложенная им модель воспроизводит действительные события, происходившие на Земле, когда на ней зарождалась жизнь. Задача модельной теории Эйгена состоит в другом — в том, чтобы доказать возможность самоорганизации материи на основе существующих принципов физики. Эта задача решена Эйгеном. Книжка, предлагаемая вниманию читателя, также служит вкладом в решение этой задачи.
Математические модели
Математические модели [20] клеточной диффереп-пировки и морфогенеза стали появляться только в последние годы и были испытаны на простых объектах: амебах [21] и гидроидных организмах [22]. Они основываются на автокаталитических молекулярных механизмах усиления, очень похожих на уже известные нам механизмы эволюционного поведения на субклеточном уровне. Идея отбора полностью мобилизуется и осуществляется на уровне многоклеточных организмов. Результатом является кажущаяся,— впрочем, нет, реальная — «инструкция». Она основана на отборе индивидуумов, но прирост информации происходит только на уровне вида. Индивидуум выживает или гибнет, сам он не «учится». Опыт идет только на пользу вида. Эволюция всей биосферы представляет собой величественный процесс накопления информации и образования памяти.
А нельзя ли было эту способность к обучению сделать полезной уже для индивидуального объединения клеток в течение его жизни? Для этого требовался новый уровень, на котором — как в генах — моншо было бы селективно, под контролем функции ценности, накапливать опыт и производить его оценку. Этот «метод методов» должен был давать селективное преимущество везде, где он только возникал. Соответствующий эволюционный прорыв был, таким образом, неизбежен. Он начинается на уровне генов. Отбираются системы, у которых развились детекторы, с помощью которых можно реагировать на приходящие из окружающей среды раздражения, таким образом, чтобы повысить свои шансы на выживание. Примером может служить поведение грибка — фикомицета, который отвечает на световое раздражение ростом по направлению к свету (см. статью Макса Дельбрюка и сотрудников в последнем выпуске настоящего сборника).
В ходе эволюции возникают сети нервных клеток, которые центрально перерабатывают приходящие раздражения и превращают их в «успешные действия». С ростом сложности возникла необходимость — как и в случае молекулярного накопителя информации — уметь селективно отвечать па раздражения, т. е. делать выбор между альтернативами. Живое существо получило возможность независимо от генетической программы постоянно приспосабливаться к непредвиденным ситуациям. Только программируемость является здесь частью генетической программы. Для этого понадобилась также запрограммированная способность производить оценку: боль, удовольствие, страх, радость, вплоть до самых тонких эмоции. С помощью этой «вторичной» системы оценок избирательно накапливаются раздражения, идущие из окруя^ающей среды. Их можно, наконец, воспроизводить даже абстрактно и проигрывать в новых комбинациях. Как и в случае мутаций, новые комбинации, возникшие благодаря флуктуациям, подвергаются оценке и отбору.
Уже появились первые модельные паброски теории самоорганизующихся сетей, применимой к централь ной нервной системе [23—25]. Они исходят нз того самоорганизующегося поведения, которое демонстрировали нам селекционные и эволюционные пгры. Информация возникает в результате изменения распределения вероятностей возбуясдения и торможения нервных клеток под действием раздрая^енпы.
Направленность во времени, характерная для всех эволюционных процессов самоорганизации, является и здесь основой нашего внутреннего чувства времени. Недетермниированпость и практическая неограниченность наших мыслей и идей являются следствием сложности схемы: она объединяет около 10 миллиардов нервных клеток, каждая из которых имеет около 10 —100 тысяч контактов (синапсов) с другими клетками.
«Свободная воля» не была бы «свободной», если бы врожденный детерминизм не допускал никаких альтернатив, но, с другой стороны, она не была бы «волей», если бы выбор альтернатив предоставлялся лишь случаю, т. е. статистическим флуктуациям нервных процессов. Индивидуальная свобода — это работа фильтра, локализующегося внутри личности. Этот фильтр складывается из наследственности, опыта и имманентной для системы способности производить оценки. На него подаются статистические флуктуации, управляемые раздражителями, а выходит нз него «информация» в форме наших мыслей и идей*).
Мы еще очепь далеки от полного понимания этого уровня игры игр — от понимания нас самих.
«Итак, напрасно было бы требовать от нас изложения всей истории и теории Игры в бисер: подобная задача сейчас не по плечу и куда более искушенным и достойным авторам. Решение ее — удел будущего, если, разумеется, к тому времени сохранятся как источники, так и духовные предпосылки. Еще того менее наш труд может слуэюитъ учебником Игры — таковой вообще никогда не будет написан. Правила этой Игры игр усваиваются только обычным, предписанным путем, на что уходят годы, и никому из посвященных не придет на ум облегчать процесс их усвоения». (Герман Гессе: из введения к «Игре в бисер».)
Нуклеиновые кислоты
1. Нуклеиновые кислоты — это линейные ценные молекулы. Каждая субъединнца (отдельный нуклео-тид) представляет собой букву генетического алфавита. Этот алфавит состоит только из четырех букв, которые принято обозначать первыми буквами соответствующих химических названии
А, У (соответственно Т)*), Г, Ц.
Триплет, составленный из этих букв (например АУГ), является кодовым словом (кодоном) для элемента молекулы белка, т. е. для буквы белкового алфавита.
2. Белки — это тоже цепные молекулы. Их субъедн-ницами являются аминокислотные остатки, соединенные друг с другом пептидными связями. В природных белках встречается около 20 различных аминокислот.
*) Элемент У в рибонуклеиновых кислотах (РНК) соответствует элементу Т в дезокснрибоиуклешговых кислотах (ДНК). Для переноса информации, т. е. для взаимодействия с элементом А, это различие не играет большой роли [4].
Это означает, что белковый алфавит содержит примерно двадцать различных букв — примерно столько же, сколько наш язык. Система соответствий «кодон — аминокислота», т.. е. генетический код, является однозначной и универсальной: животные, растения и люди пользуются одной и той же схемой. Этот код, однако, «вырожден»: каждой аминокислоте, за немногими исключениями, соответствуют два, три, четыре или даже шесть кодонов. Это необходимо для того, чтобы перевод некоторой последовательности нуклеотидов, где могут встретиться все 4 3 = 64 различных кодона, в последовательность аминокислот ‘ имел однозначный смысл. В природе передача информации происходит лишь в направлении от нуклеиновой кислоты к белку, но между различными типами нуклеиновых кислот (ДНК, РНК) информация может передаваться в обоих направлениях.
3. Полипептидпая цепь молекулы белка определенным образом свернута в пространстве. Поэтому элементы из любых положений в последовательности могут в каком-то месте контактировать друг с другом. Таким образом возникает активный центр, т. е. группировка аминокислот, которые кооперативно выполняют свою функцию: например, специфичное узнавание и связывание субстрата, перенос протонов или — при помощи координационно связанного иона металла — обмен электронов и т. д. Оптимальные расстояния в активном центре поддерживаются определенной пространственной укладкой тех участков последовательности, которые располагаются между действующими группами. Это определяет минимальную длину полипептидной цепи, которая для хорошо адаптированного белка с четырьмя — пятью действующими группами составляет примерно сотню аминокислотных остатков. Так используется полное информационное содержание полипептидной цепи, т. е. окончательно оптимизированный эволюционный продукт представляет собой избранную, единственную в своем роде последовательность. Сверх того, посредством изменений в укладке, обусловленных тем, что по ходу реакции возникают новые специфичные взаимодействия, каталитическая активность может регулироваться, иногда даже нацело выключаться или включаться. Итак, белки можно сравнить со сложными, регулируемыми машинами. Действительно, они
контролируют все химические превращения в клетке, т. е. все ее функционирование. Однако принцип строения, которым определяются эти достижения белков, совершенно не приспособлен для самовоспроизведения.
4. В отличие от белков нуклеиновые кислоты имеют сравнительно простое пространственное строение. Их
Рис. 1. Комплементарность оснований создается специфичными водородными связями — с одной стороны, между аденином (А) и ураци-лом (У) или тимином (Т) и, с другой стороны, между гуанином (Г) и цитозином (Ц). В результате образуются геометрически почти идентичные пары оснований.
Рис. 2. В молекуле нуклеиновой кислоты отдельные элементы (нуклео-тиды) соединены друг с другом в линейную последовательность. Каждое основание прикрепляется к остатку сахара (к рибозе или к де-зоксирибозе), который, в свою очередь, висит на фосфатной группе. В остове полннуклеотидной цепи остатки сахара и фосфата непрерывно чередуются»
структурный мотнв определяется простым принципом — попарными взаимодействиями звеньев нуклеиновой кислоты, а именно
Элементы А и У(Т)’, а также Г и Ц называются комплементарными друг другу. Предпочтительные взаимодействия приводят к тому, что молекулярная цепь свертывается таким образом, что комплементарные нуклеотиды оказываются спаренными и располагаются друг против друга (рис. 1—3).
Однако особенно стабильной должна быть двухцё-почеяная структура, состоящая из двух отдельных,
Рис. 3. Две цепи могут соединяться в двухнитовую структуру, скрепленную комплементарными взаимодействиями. Спираль ДНК [5] — э-ш винтообразно скрученная двухцепочечная структура, имеющая очень большую стабильность. Молекулы РНК в большинстве случаев одно-цепочечны, однако в них тоже имеются спиральные двухцепочечные участки, образующиеся в результате свертывания цепи. В качестве примера изображена двумерная укладка цепи тирозиновой т-РНК — структура «клеверного листа». В действительности эта молекула не плоская — она имеет определенную трехмерную структуру. Рентгенострук-турный анализ показал, что фенилаланиновая т-РНК имеет вид слегка изогнутой буквы Т {Rich et al.— Science, 1973, v, 179, p, 285),
полностью комплементарных друг к другу цепей. Примером такой структуры является двойная спираль ДНК по Уотсону и Крику [5]. Узнавание комплексен-
тарных элементов является простым основным принципом воспроизведения нуклеиновых кислот. Нуклеиновые кислоты могут служить поэтому в качестве универсальных накопителей информации, в противоположность белкам. Любая последовательность имеет неотъемлемую способность инструктировать построенпе своей копии. Процесс копирования — как и при фотографической репродукции — проходит через промежуточную стадию негатива. Точность копирования ограничена. Она определяется разностями энергий взаимодействия для комплементарных и некомплементарных пар. Точность распознавания может быть значительно повышена с помощью специальных копирующих машин — т. е. опять-таки с помощью специально адаптированных белковых структур. На высших ступенях эволюции вероятность ошибки при воспроизведении становится значительно меньше, чем Ю -9 . По сравнению с этим простое комплементарное взаимодействие в отсутствие копирующих ферментов дало бы вероятность ошибки от 1 до 10%.
5. Бесклеточная система, содержащая существенные компоненты — белки и нуклеиновые кислоты — и снабженная необходимым высокоэнергетическим строительным материалом, может репродуцировать свои составные части in vitro. Она проявляет все существенные функции живой клетки, но не является индивидуальным живым существом и не развивается как таковое [6].
Логическое построенпе этой молекулярной схемы биологической переработки информации в сжатом виде представлено на рис. 1 — 7 (рис. 4—6 иллюстрируют принцип строения белков. На модели рис. 6 показаны лишь пространственные положения аминокислотных остовов и расположения боковых цепей (R*)- по ~ мощью рентгеноструктурного анализа можно определить положение каждого отдельного атома в этой ог ромной молекуле с точностью до 2 А). Многие детали — как пространственные структуры, так и динамические взаимосвязи — в настоящее время уже известны.
Насколько проста эта грандиозная концепция природы, настолько сложны ее проявления и многообразны те индивидуальные структуры, в которых она реализуется. Это неиссякающий источник информации для неограниченной эволюции: от анаэробной бакте-
рии, через дышащую эукариотическую клетку, ассимилирующую растительную клетку, через дифференцированные и, наконец, управляемые центральной нервной системой организмы к «осознающему себя» человеку,— отсюда эволюция может идти вперед уже на новой основе, управляемая разумом, и этой эволюции нигде не предвидится конца.
С биологической сложностью и, вместе с ней, с индивидуальной неповторимостью структур мы сталкиваемся уже на уровне макромолекул, что является непосредственным следствием именно той концепции, которая была описана выше. В специальной главе мы обсудим, что нуяшо понимать под информацией. Здесь же мы даем лишь некоторые примеры сложности и уникальности.
Цитохром с, транспортирующий электроны,— одна из самых маленьких белковых молекул, встречающихся
Рис. 4. Две аминокислоты соединяются в дипептид, отщепляя при этом молекулу воды. Индивидуальность аминокислотных блоков, выражающаяся в различиях боковых цепей R, и R 2 , остается при этом неизменной.
в природе. Его молекулярный вес равняется примерно 13 000, а полипептидная цепь состоит примерно из ста аминокислотных остатков.
Сколько различных последовательностей аминокислот могут иметь белковые молекулы такой длины? Этот вопрос напоминает старинную детскую песенку «Сколько звездочек на небе…?» Это «ужасно большое число» легко вычислить. Для каждого из ста положений в полипептидной цепи имеется двадцать возможностей. Итак, ответ гласит:
20- 20- 20… = 20 шо « 10 130 .
Единица со ста тридцатью нулями!
Для реализации всех этих возможностей потребовалось бы в невообразимое число раз больше вещества,
Рис. 5, Многократное повторение процесса, изображенного на рис. 4, приводит к образованию линейной полпнептидяой цепи (первичная структура белка). В качестве примера дана последовательность цито-
хрома с.
|
Сокращенные обозначения аминокислотных блоков; |
||
|
Ала — ала нин, |
Лей |
— лейцин. |
|
Apr — аргинин," |
Лиз |
— лизин. |
|
Асн — аспарагин, |
Мет |
— метпоннн, |
|
Асп — аспарагиновая кислота, |
Пяо |
— пролин, |
|
Вал — валин. |
Сер |
— серия, |
|
Гис — гистидпн. |
Тир |
— тирозин. |
|
Гли — глицин, |
Тре |
— треонин, — триптофан. |
|
Глу — глутаминовая кислота, |
Топ |
|
|
Глн — глутамик, |
Фен |
— фенилаланин. |
|
Иле — изолейцин, |
Кружками с различной штриховкой обозначены четыре группы боковых цепей: I — положительно заряженные, II — отрицательно заряженные, III — полярные и амбивалентные, IV -— неполярные (гидрофобные). (Эта классификация не вполне свободна от произвола. Заряды кислотных и основных групп относятся к рН 7. К категории незаряженных, но полярных относятся аминокислоты с кислотными и основными функциональными группами. Большие участки боковых частей таких остатков могут иметь преимущественно гидрофобный характер. Глицин (R — Н) также относится к этой группе, потому что его поведение в основном определяется полярной пептидной связью.)
Рис. б. Линейная полипептидная цепь пространственно свернута. Различают вторичную и третичную структуру. Вторичная структура возникает в результате образования мостиков водородных связей между группами —СО—• и —NH—. Особенно часто образуется «складчатая структура» (два антипараллельных участка полипептидной цепи связываются между собой мостиками ■—СО .. . NH—), и а-спираль (полипептидная цепь скручивается в спираль вследствие замыкания водородных связей между группами —СО—. и группами —NH—, удаленными от соответствующих групп —СО— на четыре аминокислотных остатка). В цитохроме участки цепи 1 — 12 я 89 — 101 имеют спиральную структуру. Еще важнее пространственная, или третичная, структура, которая определяется взаимодействиями между боковыми цепями и создает активный центр. В активном центре цитохрома с находится комплекс железа с порфирином, который играет роль донора (Fe^+) или акцептора (Ре^+) электронов. Вследствие строго определенной укладки по-липептидпой цепи активный центр абсолютно специфичен по отношению к субстрату. Эффективность железного комплекса поддерживается боковыми цепями аминокислот. Изменение пространственной структуры, привело бы к резкому изменению каталитической активности.
чем можно найти на всем «небесном своде». Все вещество во Вселенной, по оценкам физиков, эквивалентно «только» 10 78 атомам водорода. Для сравнения: масса Земли соответствует 10 51 атомам водорода. За
Рис. 7. Упрощенная схема цикла воспроизведения нуклеиновых кислот и биосинтеза белков. Ферменты, которые служат для репликации генетических сообщений (ДНК-полимеразы), для их транскрипции (ДНК-завасимые РНК-полимеразы) и трансляции (белки рибосом), а также для активации различных аминокислот (аминоацилсинтетазы), довольно хорошо изучены. Полная схема с обратными связями включает и другие белковые факторы регуляции и контроля.
этим сравнением с «астрономическими масштаоамиа скрывается некая цель. Мы хотим показать, что при таком расхождении в порядках величин (10 130 , 10 78 ,
20
10 5? ) не имеет смысла уходить во Вселенную, чтобы реализовать концепцию, для которой «нет места» на |3емле.
I При таком соотношении чисел в принципе мало что изменится, если мы введем з рассмотрение временную координату. Возраст Вселенной или, точнее, возраст такого состояния Вселенной, в котором могут разыгрываться реакции органической химии, составляет «только» 10 17 секунд. Даже с помощью хорошо адаптированного ферментативного аппарата для разрыва цли для образования одной пептидной связи потребуется время порядка 10~ 3 —10~ 2 с. Если для решения задачи использовать все время существования Вселенной, то и в этом случае можно было бы испробовать лишь ничтожно малую долю из 10 130 возможных последовательностей.
В этом числовом примере для наглядности мы взяли только одну, да и то маленькую молекулу белка. Молекула ДНК, в которой записана вся генетическая информация клетки кишечной бактерии, состоит из 4*Ю 6 элементов. Последовательность такого числа букв соответствует книге объемом в 1500 мелко набранных страниц. Число альтернативных последовательностей составляет здесь примерно Ю 1 000 000 .
Конечно, именно в связи с этим возникает вопрос об уникальности подобных последовательностей и соответствующих структур. Что такое «уникальный»? Если это свойство означает «единственный в своем роде» не только в смысле неповторимости выбора, но и в смысле функционирования, то его следует отоя^дествить со свойством быть оптимальным, т. е. наилучшим.
Конечной вероятности ошибки
При конечной вероятности ошибки способность к отбору можно восстановить, если ввести распределение вероятностей индивидуального удвоения и удаления. Эти распределения вероятностей должны быть таковы, чтобы в среднем общее число шаров в ящике оставалось постоянным. В природе такая стационарность в общем случае устанавливается автоматически из-за ограниченности притока высокоэнергетических веществ (пищи). В эксперименте или в игре стационарность всегда можно поддерживать регулирующим воздействием (реакционную систему можно, например, разбавлять или концентрировать). Удельные скорости продукции каждого отдельного «вида» определяются разностью вероятностей удвоения и удаления, а также притоком и оттоком вследствие ошибок. Эти скорости можно выразить через функцию ценности Wu которая содержит энергетические и временные параметры, характеризующие точность узнавания и трансляции, скорость копирования и время жизни. В зависимости от механизма реакций и степени их сопряжения функция ценности может иметь довольно сложный вид. Тем не менее ее физическое обоснование совершенно определенно: единичным процессам соответствуют стохастические законы, макроскопическим приростам — детерминистическая теория. Из величины W { вычитается средняя продуктивность JE(t) t зависящая от времени. Разность обеих величин определяет судьбу отдельного «вида»:
W t — Е (t) > О означает выживание г W t — E(t) <. О означает вымирание.
Величина Е (t) представляет собой переменное во времени пороговое значение. Изменяя его, система может постоянно приспосабливаться к новым ситуациям* Стабильный отбор означает, что
E(t\ —^ W Q9U
Процесс копирования может ограничиваться единичными видами, доминирующими в популяции и окруженными «кометным хвостом» мутантов; эти виды будут поочередно сменять друг друга в процессе прогрессирующей оптимизации системы. Однако этот процесс может включать в себя и целый ансамбль, в котором отдельные виды будут сопряжены друг с другом посредством самых разнообразных связей. Каждый раз, когда среди мутантов возникает вид с большей селективной ценностью и оказывается способным выжить несмотря на флуктуации, которые на первой фазе угрожают его существованию, прежняя (мета-) стабильная популяция гибнет, и устанавливается новое стационарное распределение, в котором доминирует мутант, имеющий селективное преимущество. Несмотря на наличие «ошибочных копий», новое распределение все еще является очень острым. В каждый момент времени в системе представлена лишь относительно малая доля из общего числа всех возможных альтернатив* (мутантов). Распределение числа мутаций аппроксимируется распределением Пуассона.
Итак, эволюция состоит из ряда неустойчивостей, при развитии которых распределения вероятностей необратимо изменяются, причем это сопровождается приростом информации*). Этот процесс оптимизации не обязательно соответствует простому монотонному росту функции ценности, и в то же время он не является ненаправленным флуктуационным процессом. Наша игра с шарами еще достаточно проста для того, чтобы в предельном случае больших чисел она имела однозначно определенный результат, соответствующий абсолютному максимуму IV. «Наиболее приспособленный» здесь однозначно определяется посредством критерия ценности.
Это возвращает нас к фундаментальному вопросу, поставленному в конце предыдущей главы: может ли информация действительно возникать de novo, или же она только выявляется при помощи детерминистического в своей основе физического процесса.
- Другими словами: фильтрующий процесс отбора выбирает ^определенные альтернативы из микроскопи-
*) Прирост информации не обязательно означает возникновение новой информации — речь может идти и о выявлении информации, уже имеющейся, но скрытой «шумами». (Прим. ред.)
ческих недетерминированных элементарных событий, усиливает их и выявляет в макроскопическом процессе эволюции. Прокладывает ли он дорогу к предопределенной цели? Или же он имеет такой характер, что только дорога определяет цель, и, следовательно, никакие исторические пути развития не являются априорно необходимыми? Только в последнем случае прирост информации, связанный с изменением распределения вероятностей, можно приписать истинному возникновению, а не выявлению семантической информации.