?

Log in

No account? Create an account
Ivory Tower of a Hoopoe Bird

> Recent Entries
> Archive
> Friends
> Profile

December 14th, 2015


Previous Entry Share Flag Next Entry
11:32 am - еще заметки на полях (и на бегу) о книге Кунина
Продолжаю читать книгу Кунина. Он пишет о "ламарковской" эволюции (при которой приобретенные признаки наследуются). B качестве примера приводит некоторые механизмы иммунитета у простейших прoкариот. Насколько я понял, сосуществуют оба режима эволюции -- ламарковский и дарвиновский -- при этом ламарковский активен при высоком "давлении среды".

Кунин также пишет про сложность генома. Усложнение не является целью эволюции. Напротив, усложнение является побочным результатом того, что популяции более сложных живых сущеcтв малочислены, и отбор у них идет медленнее:

"Реконструкции истории геномов и клеток, рассматриваемые в рамках неадаптивной парадигмы эволюции генома, привели к весьма удивительным выводам. Оказалось, что большая – вероятно, практически вся – история жизни шла отнюдь не в ключе «прогрессивной» эволюции в сторону увеличения сложности [85]. Вместо этого многие эволюционирующие линии пошли по пути оптимизации генома, при которой геномная энтропия и общая биологическая сложность генома падали, зачастую значительно, в то время как биологическая плотность информации росла. Некоторые другие линии, такие как наша собственная, пошли по пути задействования мусорных элементов (для регуляторных и структурных ролей, как в случае с РНКомом животных), что привело к резкому увеличению общей сложности, но лишь незначительному уменьшению энтропии. Таким образом, в этих линиях рост плотности биологической информации был весьма скромным, по сравнению с высокоэнтропийными состояниями, связанными с «бутылочными горлышками» в переходные эпохи."

Я также прочитал обещающие красивые математические идеи главы про "фрактальную структуру генетической вселенной", про "нейтральные сети и всеобщность степенного закона" и про "эволюционную энтропию и сложность". Честно скажу - я их не понял. Я не понял из текста, какая именно структура инвариантна при каком именно преобразовании масштаба, каким образом применяется всеобщий степенной закон в исследовании эволюции, и что из него следует, и чем предлaгаемая формула энтропии отличается от классических (и как она применяется, и что из нее следует).

Я прочитаю еще эти главки, внимательнее. Тут одно из трех: или я не понял, или написанo неясно, или там особо красивых идей и нет, а дань модным словам. Hо хочется надеятся, что я не понял. Потому пeрeчитаю как нибудь потом внимательнee! :)

В целом, конечно, книга Кунинa очень интересная, если сравнивать с другими. Например, в известной книге Маркова про эволюцию (которую Кунин упоминает и рекомендует в примечаниях) вообще ничего не говорится про концептуальные трудности абиогенеза с формированием PHK-мира. Вместо этого Марков считает важным рассказать, что широкая душа любимого вождя желала удвоения мощности пхеньянского металургического комбината "о важной и еще не до конца понятой роли металлов в жизни примитивных клеток свидетельствуют результаты изучения необычного микроба, обнаруженного в 2000 году в биореакторе металлургического завода в Туле" А народ от этого Маркова писает кипятком.

Вот что пишет Кунин про irreducible complexity (концепцию, связанную с ИД):

"Выражение «неупрощаемая сложность» было придумано Майклом Бихи, одним из основных сторонников антиэволюционной гипотезы разумного замысла (РЗ), в его (печально) известной книге «Черный ящик Дарвина» ( Behe, M. J.2006. Darwin’s Black Box: The Biochemical Challenge to Evolution. New York: Free Press). Для Бихи и других сторонников РЗ «неупрощаемость» сложных биологических структур является будто бы подтверждением (даже доказательством) неизбежности РЗ. Конечно же РЗ – это злостная чушь, но термин «неупрощаемая сложность» вполне выразителен, хотя эволюционные биологи предпочли бы говорить о «видимой» или «кажущейся» неупрощаемости сложных структур."


Про "слепого часовщика", оказывается, это метафора не просто так, а от некоего теолога 18 века:

"Известный естественный теолог XVIII века Уильям Палей весьма ясно обрисовал проблему, разумно утверждая, что найденные во время прогулки по полям часы подразумевают существование часовщика. Этот ход мысли привел одновременно к современному движению «разумного дизайна» и знаменитому возражению Ричарда Докинза "

Вот что пишет Кунин про принцип максимального/минимального производства энтропии применительно к биологической эволюции:

"...Параллели между эволюционной биологией и статистической физикой оказались точными и фундаментальными до такой степени, что кажется вполне справедливым заключение о том, что это не аналогии, а проявление общих статистических принципов (если не сказать законов) поведения больших ансамблей слабовзаимодействующих объектов [Здесь надо вновь сделать упор на принцип максимальной энтропии.]"
...
"В предыдущих разделах этой главы мы ознакомились со многими количественными универсалиями, отражающими важнейшие аспекты эволюции и функционирования генома. Среди этих универсалий мы рассматривали вездесущий степенной закон распределения, который описывает как структуру всех биологических сетей, так и семейства паралогичных генов в разнообразных геномах, близкое к логарифмически нормальному распределение скоростей эволюции генов и универсальные корреляции, такие как отрицательная корреляция между генной экспрессией и скоростью эволюции. Какова природа этих универсалий? Отражают ли они какие-то глубокие свойства эволюции или это просто статистические эффекты, не имеющие отношения к пониманию биологических явлений? Здесь и далее в этой книге (гл. 13) будет отстаиваться точка зрения на эти универсалии как на нетривиальные, характерные и биологически значимые тенденции, хотя они отражают только одну из двух (а возможно, и большего числа) дополнительных (в смысле принципа дополнительности Бора) составляющих эволюции жизни [По-видимому, многие из этих универсалий, во всяком случае те, которые математически представляются характерными функциями распределения, можно вывести из единого, чрезвычайно общего физического принципа, известного как принцип максимальной энтропии или принцип минимального производства информации (Jaynes, T.Probability Theory: The Logic of Science. Cambridge Univ Press, 2003). Вкратце и упрощая, можно сформулировать этот принцип так:любая макроскопическая величина, определяемая совокупностью многочисленных микроскопических процессов, принимает, с учетом необходимых ограничений, распределение с максимальной энтропией (то есть такое распределение, для получения которого требуется минимальная информация). Легко понять, что принцип максимальной энтропии тесно связан со вторым началом термодинамики. Применение этого принципа к биологической эволюции – глубокая и интересная тема, которую здесь, конечно, не раскрыть. Чрезвычайно содержательное обсуждение этих вопросов можно найти в статье Стивена Франка, с которой автор, к сожалению, познакомился уже после публикации оригинала этой книги (Frank SA.The common patterns of nature // J Evol Biol. 2009 Aug;22(8):1563-85).]."


Можно двадцать раз сказать, что эти параллели "точны и фундаментальны до такой степени, что это не аналогии, а проявление общих законов". Но в приведенной нестрогой формулировке это просто метафоры. "Легко понять, что принцип максимальной энтропии тесно связан со вторым началом термодинамики" -- да? Так докажите математически, раз легко.

Степенные законы, как мне казалось, связаны с "self-organized criticality" Перa Бака, но Кунин об этом не говорит.

(8 comments | Leave a comment)

Comments:


[User Picture]
From:gineer
Date:December 14th, 2015 05:49 pm (UTC)
(Link)
\\Я не понял из текста, какая именно структура инвариантна при каком именно преобразовании масштаба,

Для фракталов не особо принципиальна первоначальная структура...
да и, думаю понятно что фракталы о которых идет речь -- сами по себе не ругулярны.


\\ каким образом применяется всеобщий степенной закон в исследовании эволюции,

Степенной закон? Это наверное к тому, что фракталы характеризуются "размерностью", и эта размерность записывается как (дробная, это важно) степень.


\\ и что из него следует, и чем предлaгаемая формула энтропии отличается от классических (и как она применяется, и что из нее следует).

фрактальная энтропия?
[User Picture]
From:duchifat
Date:December 14th, 2015 06:49 pm (UTC)
(Link)
Речь о самоподобии структуры метафорической "генетической Вселенной" (геномного пространства-времени ). :)

"Единицы эволюции и фрактальная структура генетической вселенной

Результаты сравнительной геномики приводят к ключевому обобщению, которое позволяет нам выполнять продуктивные эволюционные исследования: основные единицы эволюции могут быть довольно четко определены, и единицы эти – кластеры ортологичных генов, или эволюционные домены (КОГ), или, еще точнее, линии эволюционирующих ортологичных генов (доменов). Истории отдельных генов часто сложны (а во многих случаях даже чрезвычайно сложны) и включают в себя множественные утраты генов, дупликацию и горизонтальный перенос (ниже в настоящей книге мы обсудим эти явления подробнее, см. гл. 5 и 7). Предрасположенность генов к дупликации, утрате и переносу варьирует в широких пределах. Однако, невзирая на все эти осложнения, атомарное свойство наборов ортологичных генов твердо соблюдается: КОГ суть естественные элементы генетической вселенной.

Генетическая (геномная) вселенная (это только метафора, но удобная и, возможно, продуктивная) может быть представлена как развивающееся пространство-время, заполненное кластерами, состоящими из генов (то есть КОГ), или, точнее, эволюционирующими линиями ортологов, элементарными единицами эволюции. Ортология легче всего прослеживается между прокариотическими генами, так что здесь мы обсудим прокариотическую область геномной вселенной. Тенденции среди эукариотов в принципе похожи, но осложнены распространенной мультидоменной организацией белков и обширной паралогией. В нашем геномном пространстве заметно характерное распределение КОГ по геномам, хорошо аппроксимируемое тремя экспонентами с разными показателями, которые делят генную популяцию на три класса (см. рис. 3-13, а – в; Koonin and Wolf, 2008b).

1. (Почти) универсальные гены, те, что представлены в (почти) всех геномах клеточных форм жизни, составляют лишь малую часть генетической вселенной: это ядро клеточной жизнисостоит, самое большее, из приблизительно 70 генов. В каждом конкретном геноме доля этих «ядерных» генов составляет не более 10 процентов, если говорить о самых маленьких геномах клеточных форм жизни (паразитических бактерий, таких как M. genitalium), но обычно ближе к 1 проценту или менее от общего числа генов (см. рис. 3-14).

2. Умеренно консервативная генная оболочкасостоит из КОГ, представленных в самых разнообразных геномах, но не в подавляющем их большинстве. Недавний анализ имеющихся прокариотических геномов дает число КОГ оболочки около 5000. Гены оболочки составляют большую часть числа генов в любом геноме (см. рис. 3-14).

3. Малоконсервативное «облако»состоит из КОГ, встречающихся в узких группах организмов, и «генов-сирот» – генов в открытых рамках считывания (ОРС), обнаруженных пока что в одном-единственном геноме, но гомологи которых обычно обнаруживаются во вновь появляющихся геномных данных. Гены «облака» составляют переменную долю в каждом геноме, обычно в интервале 10–30 процентов от общего числа генов (см. рис. 3-14).

Примечательно, что эта структура является самоподобной, или фрактальной: те же три компонента – крошечное ядро, сравнительно большая оболочка и огромное «облако» – проявляются на любом уровне, где бы ни рассекалось генное пространство-время, от всего мира прокариот и до узких групп бактерий (см. рис. 3-14). Мы возвратимся к последствиям этой фрактальности геномного пространства-времени прокариот в главе 5. Заметим, однако, что эволюционная модель, которая объясняла бы наблюдаемую фрактальность, еще ожидает своей разработки [36]"
[User Picture]
From:duchifat
Date:December 14th, 2015 07:11 pm (UTC)
(Link)
Кунин приводит график "число кластеров генов" vs. "количество организмов". Точки на графике составляют три участка, которые он называет "ядро", "облако" и "оболочка". Фрактальность состоит в том, что тренд этого графика (три участка) будет примерно одинаковым то ли независимо от выборки организмов, то ли от чего-то еще (из текста трудно понять).

Сам график тоже трудно понять, он описывает, например, 338 организмов прокариот , и абсцисса меняется от 1 до 338. Если точки на графике являются организмами ("первый организм", "второй организм", "338-ой организм"), то непонятно, в каком порядке они пронумерованы.

Ось абсцисс подписана "число организмов". Если точки означают совокупности ("один организм", "два организма", "338 организмов"), то тоже непонятно.

При этом автор рассуждаeт о метафорах.
[User Picture]
From:duchifat
Date:December 14th, 2015 09:07 pm (UTC)
(Link)

Рис. 3-13 а. Глубокий уровень: 338 прокариот из базы данных EggNOG (Jensen et al., 2008)

Рис. 3-13 б. Средний уровень: 41 архей из базы данных arCOG (Makarova et al., 2007b)

Рис. 3-13 в. Мелкий уровень: 44 вида Escherichia, Shigella и Salmonella из базы данных COG (Tatusov et al., 2003). Регрессия данных экспоненциальными функциями на всех трех рисунках (Koonin and Wolf, 2008b) изображена пунктирными и непрерывными линиями.

Первая картинка восходит к статье
Koonin, E. V., and Y. I. Wolf. (2008b) Genomics of Bacteria and Archaea: The Emerging Dynamic View of the Prokaryotic World. Nucleic Acids Res 36: 6,688—6,719.
где она приводится вот в таком виде http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2588523/figure/F6/:
However, the distribution of the clusters by the number of included organisms immediately reveals the flip side of the coin: the great majority of the clusters include only a few organisms (Figure 6a). A more detailed examination of this distribution reveals distinct structure in the prokaryotic sequence space. The distribution is, essentially, an exponential decay curve, with a rise at the left end that corresponds to the universal or nearly universal clusters. Assuming that the distribution is described by an exponent(s), the best approximation is obtained with a sum of three exponential functions (Figure 6b). The first exponent represents the conserved (universal or nearly universal) gene core (∼70 clusters), the second exponent describes the ‘shell’ of moderately common genes (∼5700 clusters), and the third exponent corresponds to the ‘cloud’ (∼24 000 clusters) that consists of genes shared by a small number of organisms.

Насколько я могу понять, график этот означает примерно следующее. Это количество организмов, у которых встречаетстя данное количетсво кластеров. Скажем, первая (самая левая на верхнем графике) точка в районе (0, 24000) означает, что все 24000 кластеров не встречаются ни у одного, а (2, 8000) значит, что 8000 общих кластеров - только у двух организмoв. Множество точек, соответствующих, например, десяти кластерам, типа (80, 10), (150, 10), (200, 10) и др, означают, что по десять общих кластеров есть у 80 организмов, у 150 организмов, у 200 организмов (но это разные кластеры).

Авторы усматривают здесь три разные тенденции. "Ядро" генома это порядка 70 кластеров, которые встречаются почти у всех 338 организмов (точнее, где-то 330-338). Затем есть противоположный край - "Облако", порядка до 24 тыс кластеров, которые встречаются у пары организмов. И "Оболочка" - порядка 5700 кластеров, которые общие у 50-30 организмов.

А фрактальность состоит в том, что какое сообщество родственных организмов ни возьми (например, вместо всех 338 прокариот можно взять 44 вида Escherichia, Shigella и Salmonella) и в какой момент времени в течение эволюции их ни возьми, тенденция будет похожая: есть ядро, облако и оболочка.

Вроде бы про фракталы я более-менее понял. :)

Edited at 2015-12-14 10:16 pm (UTC)
[User Picture]
From:duchifat
Date:December 15th, 2015 02:02 pm (UTC)
(Link)
Степенной закон? Это наверное к тому, что фракталы характеризуются "размерностью", и эта размерность записывается как (дробная, это важно) степень.

Универсальные cтепенные зависимости могут возникать в разных ситуациях по разным причинам. Часто они связаны с "около-критическим" поведением между двумя режимами. Например, критические экспоненты рядом с критической точкой на фазовой диаграмме вещества (скажем, зависимость теплоемкости от температуры при пемпературе и давлении, при котором различие мехзду водой и паром пропадает). Или в ситуациях, когда система настраивает себя на околокритическое поведение, примером чего приводят кучу песка, когда при добавлении песчинки может ничего не произойти, а может произойти лавина непредсказуемой амплитуды. При этом амплитуды имеют степенное статистическое распределение, пример чего з-н распределение амплитуды землетрясений Гутенберга-Рихтера. К фрактальному поведению это тоже имеет отношение.


Похожа ли ситуация с эволюцией на добавление песчинки -- когда случайная мутация может не вызвать ничего, а может вызвать лавинообразный каскад изменений в геноме -- вопрос очень важный, но из книги Кунина не вполне ясный. Гипотеза Красной королевы (о которой Кунин пишет) вроде бы принадлежит к тому же классу динамических явлений.
[User Picture]
From:gineer
Date:December 15th, 2015 06:20 pm (UTC)
(Link)
Спасибо за цитаты
прорекламировал в http://caenogenesis.livejournal.com/90619.html#comments
моих знаний недостаточно чтобы прокоментировать
[User Picture]
From:overscience_mes
Date:December 16th, 2015 04:15 am (UTC)
(Link)
зря ты по-русски читаешь - писал-то он на английском, а что там напереводили...
[User Picture]
From:duchifat
Date:December 16th, 2015 04:34 am (UTC)
(Link)
Вроде там авторизированный перевод. Английского, небось, нет в сети.

> Go to Top
LiveJournal.com