Февраль 2008
Исход игры
Однако для исхода игры не столь важно, какое максимальное число пар можно образовать — более важным является, насколько быстро образуется возможно большее число пар. Во-первых, это зависит от удачи при бросаниях кости. Для того чтобы скомнлементировать одну пару, в среднем требуется четыре бросания. Во-вторых, очень существенно, сколько пар можпо образовать из случайной последовательности в самом начале игры. Здесь шпилька со сцепленными концами очень невыгодна, потому что она содержит лишь одну возможность расположения нар. Можно ожидать, что в начале игры будет иметь ся в среднем только -у—~ } -пар. Если улыбнется счастье,
то число пар будет несколько больше, при неудаче их будет меньше. Однако со средним поведением нигде нельзя продвинуться очень далеко. Секрет выигрыша состоит в том," что игру надо начинать с возможно большим положительным отклонением от среднего значения. Относительное отклонение тем больше, чем короче области спаривания. Положительные и отрицательные отклонения встречаются, однако, с равной вероят-
Таблица 4 (продолжение’)
ностью. Для коротких областей пужпо было бы иметь в своем распоряжении очень много альтернативных возможностей спаривания, чтобы выбрать из них наилучшую комбинацию с положительным отклонением. Победителем будет тот, кто сумеет найти оптимальный компромисс между требованием «не очень большого числа петель» и требованием «как можно более коротких последовательностей». Структура шппльки связывает игрока по рукам и ногам. Значительно более благопрпятпой является уже J ‘-crpyKTypa, в которой можно варьировать относительные длины всех трех плеч. Число элементов в каждом плече должно быть не меньше тех минимальных значений, которые указываются правилом кооперативности. При этом для заданной Г-структуры ожидаемое значение начального числа пар
1 N — 10 1 N — 5 снижается до •-:>-(по сравнению с —2-Д ля структуры шпильки). Однако для больших значений N это несущественно. Выигрывается много больше благодаря тому, что теперь можно испробовать большое число возможных Т-структур и выбрать из них ту, которая соответствует наибольшему положительному отклонению. Конечно, останавливаться на Г-структу-рах нет никаких оспования — можпо испробовать структуры трех- или четырехдольного клеверного листа или, наконец, структуру цветка со многими лепестками. Где же граница?
Поскольку для образования одной кооперативной области в среднем необходимы три пары, максимальное число к та ,& лепестков определяется следующим условием;
Левая сторона этого уравнения дает максимальное число пар в структуре, содержащей к петель (лепестков). Правая сторона содержит утверждение, что каждый из к лепестков (а также стебель, т. е. всего к-\-1 область) в среднем должен содержать не менее чем три пары. Конечпо, структура с к тя * лепестками снова крайне неблагоприятна, потому что она (как и шпилька) имеет линь одну возможность расположения пар п, сверх этого, теряет 5к положений для образования петель. Поэтому можно ожидать, что оптимальной окажется некая промежуточная структура с к <Z femax лепестками. Этот оптимум легко рассчитать. Для N = 80 (т-РНК) предпочтительной структурой является трех- или четырехлепестковый клеверный лист (для этого случая kmn-z = Q,7). Для iV = 220 («минивариант» РНК-фага <?р) оптимум следует ожидать для к = 9— 10 (&тах = 19 ,5) . Природа, очевидно, знала этот секрет, о чем свидетельствуют вторичные структуры реальных функционирующих молекул РНК, которые изображены на рис. 1 — 3 и 15. Дальнейшая «пространственная укладка» структуры в этой игре пв учитывается — для этого потребовались бы более сложные правила. Однако при веденные здесь правила легко обобщить как в этом направлении, так н для того, чтобы они учитывали другие, более сложные, селективные преимущества.
Отличие от игры Конуэя состоит в том, что здесь участвует слз’-чай: во-первых, берется произвольная начальная последовательность, во-вторых, для спаривания используется бросание кости. Поэтому в этой игре отдельпые последовательности н структуры не определяются детерминистическим образом, хотя при не очень больших значеппях N число возможных альтернатив еще относительно невелико.
Эту эволюционную игру можно варьировать . многими способами. Например, два игрока могут объединить свои усилия и, обмениваясь участками цепей — т. с. используя генетическую рекомбинацию, могут повысить скорость эволюции (при этом обмен будет одним из исходов при специальном бросании кости). Если ввести кодирование, то можно придумывать самые разнообразные игры с «переводом». Например, с помощью икосаэдра, двадцать грапей которого сим-нолизируют двадцать природных аминокислот, можно было бы «генерировать» белковые структуры. IГанга фантазия так же мало, ограничена, как и страсть природы к вариациям. Самопроизвольный ход эволюционной игры в природе, как и в игре «Жизнь» Конуэя, обеспечивается селекционными свойствами, которые имитировала третья «игра в бисер» (см. стр. 43). Эти свойства позволяют обходиться без игрока и наделяют систему способностью к самоорганизация. Предполагается лишь паличие качеств, общих для всех живых систем: метаболизм, самовоспроизведение и мутабяль-ность. Математическое описание таких «природных» игр требует синтеза различных теорий:
1) теории вероятностей для описания прироста информации,
2) теории случайных процессов для описания «пе-устойчивоетей»,
3) теории игр для определения оптимального пути эволюции.
Теория игр, или теория оптимизации, восходит к Джону фон Нейману [16]. Ее применение к естественной эволюции показывает, что нельзя определенно предсказать ни конечное состояние,, ни путь к нему, их можно только в известной степени ограничить с помощью критериев оптимизации. Для линейной системы оптимальный путь означает монотонное возрастание «селективной ценности». Правда, здесь случайное исходное распределение бесповоротно определяет путь. Вступив на эту горную тропу, монотонно ведущую все выше и выше, ее нельзя более покинуть, даже если имеется другой, более короткий и крутой,’ но местами спускающийся путь. И из всех возможных вершин можно достигнуть только одной, вовсе не обязательно самой высокой. Для этого случая наша эволюционная игра дает впечатляющий пример. Эта игра становится интересной только из-за того, что в ней происходит выбор между возможными альтернативами.
Относительная частота букв в немецком языке
|
Символ |
Р г |
-Р . . 1 г |
|
1 пробел |
0,1515 |
0,4125 |
|
2 Е |
0,1470 |
0,4066 |
|
3 N |
0,0884 |
0,3093 |
|
4 R |
0,0686 |
0,2651 |
|
5 Г |
0,0638 |
0,2532 |
|
6 S |
0,0539 |
0,2271 |
|
7 Т |
0,0473 |
0,2082 |
|
8 D |
0,0439 |
0,1978 |
|
9 Н |
0,0436 |
0,1969 |
|
10 А |
0,0433 |
0,1962 |
|
11 и |
0,0319 |
0,1585 |
|
12 L |
0,0293 |
0,1493 |
|
-13 G |
0,0267 |
0,1397 |
|
14 G |
0,0267 |
0,1395 |
|
15 М |
0,0213 |
0,1184 |
|
16 О |
0,0177 |
0,1039 |
|
17 В |
0,0160 |
0,0959 |
|
18 Z |
0,0142 |
0,0873 |
|
19 W |
0,0142 |
0,0872 |
|
20 F |
0,0136 |
0,0843 |
|
21 К |
0,0096 |
0,0641 |
|
22 V |
0,0073 |
0,0521 |
|
23 U |
0,0058 |
0,0431 |
|
24 Р |
0,0050 |
0,0382 |
|
25- Д |
0,0049 |
0,0376 |
|
26 0 |
0,0025 |
0,0219 |
|
27 J |
0,0016 |
0,0152 |
|
28 Y |
0,0002 |
0,0022 |
|
29 Q |
0,0001 |
0,0018 |
|
30 X |
0,0001 |
0,0017 |
2р* = 1,0000 Н = 4,1146 битов
При равных частотах всех символов (/jf = l/30) эитрошш на один символ была бы Я = 4,9069 битов.
я у ющ iits буквы используются с разными вероятностями. Дешифровка закодированных сообщений на языке с известной структурой основана на принципе такого сопоставления. Относительные частоты букв в немецком языке приведены в табл. 1.
Можно привести также много примеров часто встречающихся последовательностей определенных букв: употребительные окончания, как -en, -ig, -lich, или же помещение гласной между двумя согласными и т. д. Множество всех избыточностей практически необозримо. Они распространяются на тончайшие особенности структуры языка и вовсе не ограничиваются ближним порядком в расположении букв. Значимость различных комбинаций букв также очень различна. Так, иапример, смысл искаженной телеграммы часто можно восстановить однозначно. С другой стороны, существуют ошибки, которые совершенно изменяют смысл, хотя они состоят в замене всего лишь одной буквы *).
В поисках связи между статистическим и семантическим аспектами информации мы прежде всего сталкиваемся с проблемой прироста информации (der Informationsgewinn). Здесь можно опираться непосредственно на теорию вероятностей.
Энтропия множества символов максимальна, когда все расположения символов равновероятны. Любое отклонение от равномерного распре деления вероятностей означает ограничение неопределенности — количество информации, необходимое для полной идентификации ситуации или сообщения, уменьшается. Любое изменение распределения вероятностей в результате наблюдения или в результате того, что становятся известны какие-либо дополнительные условия, означает прирост информации.
*) В одной книге, изданной в 1947 г., было написано: «Не считая вопросы приоритета существенными для истории науки, я все же должен отметить роль великого ученого…». Автора подвергли критике за недостаточное внимание к вопросам приоритета. Оправдываясь, автор сослался на опечатку. Р. рукописи, по его словам, значилось: «Но считая…» и т. д. (Прим. ред.)