Записи с меткой «код»
Исход игры
Однако для исхода игры не столь важно, какое максимальное число пар можно образовать — более важным является, насколько быстро образуется возможно большее число пар. Во-первых, это зависит от удачи при бросаниях кости. Для того чтобы скомнлементировать одну пару, в среднем требуется четыре бросания. Во-вторых, очень существенно, сколько пар можпо образовать из случайной последовательности в самом начале игры. Здесь шпилька со сцепленными концами очень невыгодна, потому что она содержит лишь одну возможность расположения нар. Можно ожидать, что в начале игры будет иметь ся в среднем только -у—~ } -пар. Если улыбнется счастье,
то число пар будет несколько больше, при неудаче их будет меньше. Однако со средним поведением нигде нельзя продвинуться очень далеко. Секрет выигрыша состоит в том," что игру надо начинать с возможно большим положительным отклонением от среднего значения. Относительное отклонение тем больше, чем короче области спаривания. Положительные и отрицательные отклонения встречаются, однако, с равной вероят-
Таблица 4 (продолжение’)
ностью. Для коротких областей пужпо было бы иметь в своем распоряжении очень много альтернативных возможностей спаривания, чтобы выбрать из них наилучшую комбинацию с положительным отклонением. Победителем будет тот, кто сумеет найти оптимальный компромисс между требованием «не очень большого числа петель» и требованием «как можно более коротких последовательностей». Структура шппльки связывает игрока по рукам и ногам. Значительно более благопрпятпой является уже J ‘-crpyKTypa, в которой можно варьировать относительные длины всех трех плеч. Число элементов в каждом плече должно быть не меньше тех минимальных значений, которые указываются правилом кооперативности. При этом для заданной Г-структуры ожидаемое значение начального числа пар
1 N — 10 1 N — 5 снижается до •-:>-(по сравнению с —2-Д ля структуры шпильки). Однако для больших значений N это несущественно. Выигрывается много больше благодаря тому, что теперь можно испробовать большое число возможных Т-структур и выбрать из них ту, которая соответствует наибольшему положительному отклонению. Конечно, останавливаться на Г-структу-рах нет никаких оспования — можпо испробовать структуры трех- или четырехдольного клеверного листа или, наконец, структуру цветка со многими лепестками. Где же граница?
Поскольку для образования одной кооперативной области в среднем необходимы три пары, максимальное число к та ,& лепестков определяется следующим условием;
Левая сторона этого уравнения дает максимальное число пар в структуре, содержащей к петель (лепестков). Правая сторона содержит утверждение, что каждый из к лепестков (а также стебель, т. е. всего к-\-1 область) в среднем должен содержать не менее чем три пары. Конечпо, структура с к тя * лепестками снова крайне неблагоприятна, потому что она (как и шпилька) имеет линь одну возможность расположения пар п, сверх этого, теряет 5к положений для образования петель. Поэтому можно ожидать, что оптимальной окажется некая промежуточная структура с к <Z femax лепестками. Этот оптимум легко рассчитать. Для N = 80 (т-РНК) предпочтительной структурой является трех- или четырехлепестковый клеверный лист (для этого случая kmn-z = Q,7). Для iV = 220 («минивариант» РНК-фага <?р) оптимум следует ожидать для к = 9— 10 (&тах = 19 ,5) . Природа, очевидно, знала этот секрет, о чем свидетельствуют вторичные структуры реальных функционирующих молекул РНК, которые изображены на рис. 1 — 3 и 15. Дальнейшая «пространственная укладка» структуры в этой игре пв учитывается — для этого потребовались бы более сложные правила. Однако при веденные здесь правила легко обобщить как в этом направлении, так н для того, чтобы они учитывали другие, более сложные, селективные преимущества.
Отличие от игры Конуэя состоит в том, что здесь участвует слз’-чай: во-первых, берется произвольная начальная последовательность, во-вторых, для спаривания используется бросание кости. Поэтому в этой игре отдельпые последовательности н структуры не определяются детерминистическим образом, хотя при не очень больших значеппях N число возможных альтернатив еще относительно невелико.
Эту эволюционную игру можно варьировать . многими способами. Например, два игрока могут объединить свои усилия и, обмениваясь участками цепей — т. с. используя генетическую рекомбинацию, могут повысить скорость эволюции (при этом обмен будет одним из исходов при специальном бросании кости). Если ввести кодирование, то можно придумывать самые разнообразные игры с «переводом». Например, с помощью икосаэдра, двадцать грапей которого сим-нолизируют двадцать природных аминокислот, можно было бы «генерировать» белковые структуры. IГанга фантазия так же мало, ограничена, как и страсть природы к вариациям. Самопроизвольный ход эволюционной игры в природе, как и в игре «Жизнь» Конуэя, обеспечивается селекционными свойствами, которые имитировала третья «игра в бисер» (см. стр. 43). Эти свойства позволяют обходиться без игрока и наделяют систему способностью к самоорганизация. Предполагается лишь паличие качеств, общих для всех живых систем: метаболизм, самовоспроизведение и мутабяль-ность. Математическое описание таких «природных» игр требует синтеза различных теорий:
1) теории вероятностей для описания прироста информации,
2) теории случайных процессов для описания «пе-устойчивоетей»,
3) теории игр для определения оптимального пути эволюции.
Теория игр, или теория оптимизации, восходит к Джону фон Нейману [16]. Ее применение к естественной эволюции показывает, что нельзя определенно предсказать ни конечное состояние,, ни путь к нему, их можно только в известной степени ограничить с помощью критериев оптимизации. Для линейной системы оптимальный путь означает монотонное возрастание «селективной ценности». Правда, здесь случайное исходное распределение бесповоротно определяет путь. Вступив на эту горную тропу, монотонно ведущую все выше и выше, ее нельзя более покинуть, даже если имеется другой, более короткий и крутой,’ но местами спускающийся путь. И из всех возможных вершин можно достигнуть только одной, вовсе не обязательно самой высокой. Для этого случая наша эволюционная игра дает впечатляющий пример. Эта игра становится интересной только из-за того, что в ней происходит выбор между возможными альтернативами.
Относительная частота букв в немецком языке
|
Символ |
Р г |
-Р . . 1 г |
|
1 пробел |
0,1515 |
0,4125 |
|
2 Е |
0,1470 |
0,4066 |
|
3 N |
0,0884 |
0,3093 |
|
4 R |
0,0686 |
0,2651 |
|
5 Г |
0,0638 |
0,2532 |
|
6 S |
0,0539 |
0,2271 |
|
7 Т |
0,0473 |
0,2082 |
|
8 D |
0,0439 |
0,1978 |
|
9 Н |
0,0436 |
0,1969 |
|
10 А |
0,0433 |
0,1962 |
|
11 и |
0,0319 |
0,1585 |
|
12 L |
0,0293 |
0,1493 |
|
-13 G |
0,0267 |
0,1397 |
|
14 G |
0,0267 |
0,1395 |
|
15 М |
0,0213 |
0,1184 |
|
16 О |
0,0177 |
0,1039 |
|
17 В |
0,0160 |
0,0959 |
|
18 Z |
0,0142 |
0,0873 |
|
19 W |
0,0142 |
0,0872 |
|
20 F |
0,0136 |
0,0843 |
|
21 К |
0,0096 |
0,0641 |
|
22 V |
0,0073 |
0,0521 |
|
23 U |
0,0058 |
0,0431 |
|
24 Р |
0,0050 |
0,0382 |
|
25- Д |
0,0049 |
0,0376 |
|
26 0 |
0,0025 |
0,0219 |
|
27 J |
0,0016 |
0,0152 |
|
28 Y |
0,0002 |
0,0022 |
|
29 Q |
0,0001 |
0,0018 |
|
30 X |
0,0001 |
0,0017 |
2р* = 1,0000 Н = 4,1146 битов
При равных частотах всех символов (/jf = l/30) эитрошш на один символ была бы Я = 4,9069 битов.
я у ющ iits буквы используются с разными вероятностями. Дешифровка закодированных сообщений на языке с известной структурой основана на принципе такого сопоставления. Относительные частоты букв в немецком языке приведены в табл. 1.
Можно привести также много примеров часто встречающихся последовательностей определенных букв: употребительные окончания, как -en, -ig, -lich, или же помещение гласной между двумя согласными и т. д. Множество всех избыточностей практически необозримо. Они распространяются на тончайшие особенности структуры языка и вовсе не ограничиваются ближним порядком в расположении букв. Значимость различных комбинаций букв также очень различна. Так, иапример, смысл искаженной телеграммы часто можно восстановить однозначно. С другой стороны, существуют ошибки, которые совершенно изменяют смысл, хотя они состоят в замене всего лишь одной буквы *).
В поисках связи между статистическим и семантическим аспектами информации мы прежде всего сталкиваемся с проблемой прироста информации (der Informationsgewinn). Здесь можно опираться непосредственно на теорию вероятностей.
Энтропия множества символов максимальна, когда все расположения символов равновероятны. Любое отклонение от равномерного распре деления вероятностей означает ограничение неопределенности — количество информации, необходимое для полной идентификации ситуации или сообщения, уменьшается. Любое изменение распределения вероятностей в результате наблюдения или в результате того, что становятся известны какие-либо дополнительные условия, означает прирост информации.
*) В одной книге, изданной в 1947 г., было написано: «Не считая вопросы приоритета существенными для истории науки, я все же должен отметить роль великого ученого…». Автора подвергли критике за недостаточное внимание к вопросам приоритета. Оправдываясь, автор сослался на опечатку. Р. рукописи, по его словам, значилось: «Но считая…» и т. д. (Прим. ред.)
Ступени к действительности
В предыдущих главах мы уделяли мало внимания реальным явлениям жизни. Нужно было попять принцип. Однако «жизнь» в полном ее смысле можно понять только в реальных проявлениях. Поэтому в последней главе мы попытаемся подняться по крутым ступеням к действительности.
Первая ступень: накопитель информации.
Ранние стадии возникновения жизни не наблюдаемы нами. В природе не обнаруживаются предшественники живых клеток. Ни филогенез, ни онтогенез, по-видимому, не законсервировали для нас эти ступени. Конечно, можно высказывать догадки о происхождении отдельных клеточных органелл. Так, например, естественно задаться вопросом: нельзя ли рассматривать рибосомы, фабрики белков, как свидетелей докле-точного прошлого, содеря^ащих сведения о начале трансляции, т. е. переводе генетической информации? Сходным образом сейчас думают, что митохондрии и хлоропласты — это остатки прокариотических клеток, симбиоз которых с другими клетками ознаменовал начало перехода к эукариотам. Позволят ли такие дедуктивные умозаключения реконструировать исторический ход доклеточной эволюции, покажет время. Однако возможен также индуктивный подход, и можно пытаться разрешить некоторые вопросы экспериментальным путем. Это, конечно, не означает, что кто-то сразу же серьезно возьмется за получение «синтетической» жизни в пробирке. Как однажды метко ска-вал Жак Моно [17], «великолепную симфонию живой природы не так-то просто исполнить нам — дилетантам».
Воспользуемся еще раз этим сравнением: симфония жизни постоянно исполняется перед нами природой. Нам нужно только присоединиться к ней и подыгрывать на том или другом инструменте. Индустрия
Рис. 16. «Эволюционная машина». Схема эволюционного эксперимента, разработанного в Геттипгепском институте им. Макса Планка (Эйген, Зумпср, Кюпперс и Бибрихер). В реактор втекают регулируемые потоки высоноэнергетнческого строительного материала (нуклеозидтрифое-фаты Л, У, Г и Щ, а также растворитель, в котором содержатся необходимые кофакторы (буфер, соли и т. д.). Из реактора сквозь мембранный фильтр вытекают продукты синтеза (включая новообразованные макромолекулы) и продукты распада (нуклеозядмонофосфаты и пирофосфат). Реактор содержит активный фермент (репликазу) в необходимой концентрации. Мономеры индивидуально мечены радиоактивными изотопами. Макромолекулярный состав содержимого реактора анализируется через определенные интервалы времени. Эксперимент можно проводить либо в непрерывной, либо в периодической форме. В последней форме он во многом соответствует эволюционным опытам
Спигелмапа,
грампластинок давно открыла этот принцип. Пластинки типа «минус один» (Spiel-Mit) позволяют далш дилетанту стать «участником» выдающегося ансамбля.
На самом деле это тот тип экспериментов, которые можно реализовать уже сейчас, используя физический и химический репертуары молекулярной биологии. При этом мы исходим из естественной системы и пытаемся лишь заменить один или несколько ее компонентов на их «дилетантские» варианты, которые, однако, имеют возможность «упражняться», т. е. в нашем случае эволюционировать. Прототипом таких экспериментов были опыты, поставленные Солом Спи-гелманом [6]. Схема эволюционного эксперимента представлена на рис. 16. В принципе такой эксперимент соответствует селекционной игре, которая описана в третьей главе, только здесь вместо бус взяты молекулы нуклеиновой кислоты. Под искусственным давлением отбора генетический материал фага порождает молекулярных «монстров», которые лучше адаптиро-паиы к своей новой ненатуральной среде, чем их «ест е с они ы е » пр а роди т ели.
Теория эволюции [3] позволяет количественно описывать эти опыты. Эксперименты подобного рода — как с естественными, так и с синтетическими нуклеиновыми кислотами — в настоящее время уже проводятся в ряде лабораторий, а в скором времени будут, несомненно, проведены и с белками в качестве фено-типических «мишеней».
Какие проблемы можно разрешить с помощью таких экспериментов? Химиков прежде всего интересует происхождение макромолекул и мономеров. Но это проблема чистой химии. Из лабораторных экспериментов и из анализа космического вещества мы знаем, что при подходящих условиях, т. е. в восстановительной атмосфере под действием ультрафиолетового излучения, электрических разрядов или крайних температурных колебаний, «в принципе» могут возникнуть все известные нам мономеры биологических макромолекул, причем в высокоэнергетической форме, так что они способны спонтанно объединяться с образованием полимеров. Итак, существование материального аккумулятора в достаточной мере оправдывается известными нам законами химии и физики.
Но как же возникла упорядоченность? Здесь существенную поддержку оказывают эволюционные эксперименты, упомянутые выше.
Масштаб воспроизводимой упорядоченности, т. е. емкость накопителя информации, ограничивается точностью узнавания символов!
Этот тезис имеет решающее значение для понимания первой ступени самоорганизации. Рассмотрим молекулу нуклеиновой кислоты, состоящую из v единиц (см., например, рис. 15). При репликации каждая единица должна опознаваться своим комплементарным партнером. Допустим, что это происходит с точностью д. Вероятностный фактор д нормирован на единицу. Например, д — 0,99 означает, что в среднем из 100 процессов копирования только 99 происходит правильно. Для последовательности, состоящей из v единиц, точность, или «качество переноса информации», равняется
В действительности каждая из четырех букв А, У, Г, Ц, более того — каждая из 16 различных комбинаций пар букв характеризуется своим значением фактора точности д. Кроме того, его значение моясет зависеть от степени внутримолекулярного спаривания оснований. Однако для достаточно длинных цепей будет существовать постоянное среднее значение (дУ- Для дальнейших оценок важен тот факт, что значение (дУ близко к единице.
Теперь существенный момент. Оптимизирующий процесс отбора характеризуется следующим пороговым соотношением для ценности:
т. е. селективная ценность доминирующей последовательности (W m ) должна превышать среднюю продуктивность всех конкурентов (E h ^ m )- При заданном распределении кинетических параметров это означает также, что существует критическое значение фактора качества Qm- Обозначим это пороговое значение Q m m- Оно однозначно определяется кинетическими параметрами отобранпой последовательности га и средними значениями кинетических параметров всех ее конкурентов к =ф т. Последовательности, для которых (?<C(?min, не могут быть отобраны воспроизводимым образом. Из связи мея^ду Q, (д) и v следует важное соотношение максимальную длину v ma x последовательности, которая еще может воспроизводимо реплицироваться. Величина v maI мало зависит от различий в кинетических параметрах, влияющих на значенпе Qmm, поскольку Qmm входит в выражение для v ma x только в виде логарифмического члена. Так, увеличение скорости образования отобранной последовательности в 10 6 раз привело бы лишь к шестикратному увеличению емкости информационного аккумулятора. На самом деле в ходе эволюции очень быстро произошла оптимизация скоростей. Эффективность катализаторов вряд ли заметно изменилась от кишечной палочки до человека. С другой стороны, достижимая информационная емкость очень сильно зависит от средней точности распознавания символов Для неферментативного переноса информации (который зависит только от кооперативного взаимодействия комплементарных нук-леотидоз), происходящего в оптимальных условиях, экспериментальное значение (<?> равняется примерно 0,99 (в большинстве случаев меньше 0,99). Повышение точности до 0,99999, как это имеет место в экспериментах Спигелмана и обеспечивается там фагоспе-цифичным ферментом репликации, означает тысячекратное увеличение количества информации, которое может быть накоплено. Для кишечной палочки оно превышает миллион элементарных знаков, для высших организмов оно оказывается более миллиарда. Природе пришлось выдумать для этого уйму всяких приспособлений: кооперативную комплементарность нуклеотидов, регулируемое узнавание в активном центре реплицирующего фермента, контроль посредством специфичных ферментов репарации и т. д.— до избыточности последовательностей нуклеиновых кислот, которая увеличивается с размером генома.
Из этих соображений следуют два существенных вывода относительно строения накопителя информации:
1. В отсутствие ферментативных (или других аналогичных) факторов, повышающих качество узнавания, информационная емкость нуклеиновых кислот настолько мала, что на этой основе нельзя построить никакой эффективной исполнительной системы. Такая система должна содержать ряд факторов, необходимых для репликации, сопряжения (Kopplung) и трансляции. При линейном механизме комплементарной реп ликации конкуренция может привести лишь к отоору одной-единственной, относительно короткой последовательности.
2. После того как на более поздних этапах эволюции наконец были выполнены предпосылки, необходимые для высокой точности узнавания символов, скорость эволюции, основанной на простой репликации, неизбежно должна была становиться все меньше и меньше. Выход из этого тупика дало половое размно-я^ение, т. е. рекомбинационный обмен отдельных участков между гомологическими областями различных молекул нуклеиновой кислоты. Таким образом, сексуальность является необходимым следствием постоянного роста качества переноса информации. Ее появление переместило область воздействия эволюции с индивидуальной последовательности поколений на вид в его целостности. Франсуа Жакоб [18] указал на то, что расплатой за этот прогресс стала эволюционная необходимость смерти, причем запрограммированной, а не случайной смерти от несчастного случая. Когда генофонд вида постоянно перемешивается из-за процессов половой рекомбинации, вклад отдельного индивидуума должен оставаться ограниченным конечным интервалом времени, иначе он в конце концов сам уничтожит весь прогресс. Не сможет ли человек со своими способностями, далеко выходящими за рамки генетической программы, снова устранить смерть?
Наконец, хотелось бы разобрать еще один вопрос. Необходимым условием существования накопителя информации является способность к самовоспроизведению. Действительно ли ее можно было обеспечить лишь на основе комплементарного механизма узнавания? Ответ удалось получить лишь после проведения голичествеппых исследований, и он оказался «да». При неодинаковых распространенностях различных мономеров, как это имеет место в нерегулируемых природных процессах, прямое самовоспроизведение привело бы к отбору гомополимеров, образованных повторением едипиц только одного, наиболее распространенного типа. Лишь комплементарность гарантирует отбор смешанных, по меньшей мере двоичных последовательностей символов, наличие которых является необходимым условием возникновения схемы кодирования. С другой стороны, плюс-минус компле ментарпость дает простейшую я наиболее эффективную систему, обеспечивающую выполнение этого условия. Вторая, ступень: трансляция.
Существует ли ясное разграничение живого и неживого?
В настоящее время биологи ответят на этот вопрос скорее отрицательно. В самом деле, вряд ли можно четко определить эту границу. Например, вирусная частица в подходящей среде — используя метаболизм клетки хозяина — может размножаться, причем иногда столь необузданно, что весь организм хозяина в результате погибает. Таким образом, вирус обладает качествами, которые в других случаях можно найти только у живых организмов — существование которых, как известно, тоже всегда зависит от определенных условий среды. Но, с другой стороны, вирусы — это частицы, характеризующиеся определенной формой и составом и способные, как и неорганические вещества, образовывать кристаллическую решетку. Очевидно, что в такой форме они ие подпадают ни под одно определение живого. Далее, частицы вирусов можно разложить на отдельные молекулярные компоненты п из них снова собрать инфекционные единицы — при этом теряется их первоначальная индивидуальность. Жизнь и смерть теряют здесь свой обычный смысл.
В дальнейшем, однако, мы вовсе не должны отказываться от ясности и определенности физической системы понятий. Мы попытаемся сделать наши определения таким и, чтобы они относились лишь к системам с заданной функциональной организацией, и попытаемся однозначно определить условия существования рассматриваемого уровня организации. Сравнение с известными нам биологическими формами организации должно показать, в какой мере, следуя этим путем, нам удалось ограничить и однозначно охарактеризовать понятие жизнь.
В математике принято различать необходимые и достаточные условия. В нашем случае гораздо легче задать необходимые условия — при этом нужно заботиться лишь об обязательности, но не о полноте.
Из анализа доступных нам живых систем мы знаем, что во всех клетках происходит обмен веществ, или, точнее говоря, метаболизм (так как прежде всего имеются в. виду, превращения .свободной энергии), который является необходимым условием существования любой формы жизни *). Только постоянно используя приток свободной энергии, система может непрерывно обновляться и этим тормозить свое падение в состояние термодинамического равновесия, которое Эр-вин Шредингер [1] метко назвал состоянием смерти. Характерный для процессов жизни динамический порядок может поддерживаться только за счет постоянной компенсации производства энтропии.
Следующим необходимым условием является способность к самовоспроизведению. Все молекулы и специфические упорядоченные надмолекулярные структуры, возникшие благодаря межмолекулярным взаимодействиям, имеют ограниченное время жизни из-за теплового движения. Чтобы не потерять накопленную в них информацию, они должны успевать до своего распада построить хотя бы одну идентичную копию, содержащую план строения и функционирования исходной структуры. Любое биологическое упорядочение направляется информацией **).
Инструктирование требует специфических взаимодействий. Конечные значения энергий взаимодействия и возмущения, создаваемые тепловыми флуктуациями, делают совершенно точное воспроизведение принципиально невозможным. Всегда существует определенный темп ошибок, или мутаций, — наличие этих ошибок является существенным условием возможности эволюционного прогресса.
Конечно, оба последних условия нужно считать необходимыми, только если рассматриваемая система не может постоянно возникать de novo. Только для эволюционирующей системы важно сохранять и развивать однажды достигнутое информационное состояние. В этом состоит непосредственная связь со сложностью живых систем.
В настоящее время общепризнано, что тремя существенными предпосылками образования живых структур являются метаболизм, самовоспроизведение и
*) Авторы называют метаболизмом, в отлпчие от обмена веществ, обмен веществ с окружающей средой, сопровождающийся изменением свободной энергии. В действительности обмен веществ всегда связан с таким изменением. {Прим. р"ед.)
**) Смысл понятия «информация» обсуждается далее. (Прим. ред.)
мутабилъностъ [2]. Эти свойства необходимы, но не достаточны. Количественное теоретическое рассмотрение динамики биологических систем реакций [3] показывает, что не любой вид самовоспроизведения и мутабильности может привести к возникновению систем, способных к неограниченной эволюции.
Одно из величайших научных достижений нашего столетия — выяснение молекулярного механизма переноса информации и наследования в живых организмах. Все живые существа используют одну и ту же универсальную схему для кодирования, переноса (и перевода) информации и биосинтеза, В этих процессах доминируют два класса молекул:
нуклеиновые кислоты как носители законодательного начала,
белки как носители исполнительного начала. Белками определяется вся коррелированная во времени программа синтезов живой клетки. Информация, т. е. план строения клетки и, следовательно, всего организма, заложена в одной молекуле нуклеиновой кислоты. Копии этого плана строения передаются от поколения к поколению. Для дальнейшего нам не потребуется рассматривать детали химического строения и пространственной структуры этих молекул [4]. Сейчас для нас существенна только логика построения системы биологической переработки информации: