?

Log in

No account? Create an account
Ivory Tower of a Hoopoe Bird

> Recent Entries
> Archive
> Friends
> Profile

December 16th, 2015


Previous Entry Share Flag Next Entry
10:24 am - еще немного почитал Кунина :)
Из главы про аналогию геномики / (и протеомики -?) с классической термодинамикой:

"Если гены или домены принять за атомарные единицы геномной эволюции, тогда геномы можно рассмотреть как статистические ансамбли таких единиц. Мы можем продолжить эту очень упрощенную, но очевидно не бессмысленную и потенциально продуктивную физическую аналогию и рассмотреть геномы как структуры, подобные газу или жидкости, в которых силы межмолекулярного взаимодействия хоть и являются важными параметрами, но слабы по сравнению с внутримолекулярными взаимодействиями (лежащими в основе стабильности молекул), в отличие от твердых тел, в которых межмолекулярные взаимодействия сильны и имеют определяющее значение. Из статистической физики известно, что поведение ансамбля слабовзаимодействующих частиц (молекул) следует простым и универсальным статистическим закономерностям, таким как распределение Больцмана для скоростей частиц. Аналогия между ансамблями генов (геномами) и ансамблями молекул (газами и жидкостями) наталкивает нас на поиск статистических закономерностей в функционировании и эволюции генома."


"Обобщение результатов показывает, что существуют два обширных класса переменных: 1. Интенсивные, эволюционные переменные– различные скорости геномных изменений, включая эволюцию последовательностей, потерю гена, перестройку генома и другие виды эволюционных процессов. 2. Экстенсивные, фенотипические переменные– скорость экспрессии, скорость трансляции, концентрация белка, частота взаимодействия с другими изучаемыми объектами.

Корреляции внутри каждого из двух классов обычно положительные, а корреляции между двумя классами – отрицательные (рис. 4–3). Эта закономерность предполагает модель «статуса генов», в которой высокостатусные гены эволюционируют медленно, имеют высокий уровень экспрессии и взаимодействуют со многими другими генами. Гены с низким статусом меняются быстро и имеют низкий уровень экспрессии и меньшее число партнеров...

Сильнейшая, универсальная связь между эволюционными и молекулярнофенотипическими переменными состоит в отрицательной корреляции скорости эволюции белок-кодирующих генов и уровня экспрессии: высокоэкспрессированные гены эволюционируют медленно...

Открытие универсальной связи между экспрессией генов и их эволюцией стимулировало смелую попытку новой интерпретации, согласно которой эволюция белков определяется в большей степени принципами структуры и укладки белка, общими для всех организмов, чем его уникальными биологическими функциями. Было выдвинуто предположение, впервые – в работе Алана Драмонда и Клауса Вилке, о том, что главным фактором отбора в эволюции белка является его устойчивость к неправильной укладке. Согласно этой гипотезе, влияние мутации, как геномной, так и фенотипической (вызванной ошибками трансляции), на приспособленность организма в первую очередь рассматривается как следствие отрицательного эффекта от неправильной укладки белка, которая, помимо вызываемых ею энергетических издержек, может быть еще и токсичной для клетки (Drummond et al., 2005; Drummond and Wilke, 2008). Не углубляясь в детали, заметим, что эта интуитивно привлекательная модель может естественным образом объяснить отрицательную корреляцию между экспрессией генов и эволюцией генных последовательностей: очевидно, что негативный эффект от неправильной укладки должен быть выше для высокоэкспрессированных белков, чем для белков, производимых в небольших количествах. Другими словами, уровень экспрессии – это линза, которая увеличивает любое негативное влияние на приспособленность, связанное с данной последовательностью белков, и важнейшее из таких влияний обусловлено неправильной укладкой белка. Таким образом, гены высокоэкспрессируемых белков подвергаются бо́льшим ограничениям, следствием чего является низкая скорость их эволюции. "


"К настоящему времени проведено сравнение фенотипических эффектов нокаута генов и скоростей эволюционирования генов для множества модельных организмов и получен недвусмысленный и как будто парадоксальный результат: связь между экспериментально измеренной биологической важностью гена и скоростью его эволюции очень слаба, если вообще существует(Hurst and Smith, 1999; Jordan et al., 2002; Krylov et al., 2003; Wang and Zhang, 2009). Еще более удивительным кажется отсутствие сильной корреляции между скоростью утраты гена в течение эволюции, представляющей в некотором смысле временную меру биологической важности или существенности гена, и экспериментально определенным эффектом на приспособленность: только те наборы генов, которые вообще не утрачиваются на продолжительных отрезках эволюции, таких как вся эволюция эукариот, обогащены «важными» генами (Krylov et al., 2003; Wang and Zhang, 2009). Первые работы, показавшие почти полное отсутствие связи между скоростью эволюции и биологической значимостью, были основаны на простом измерении эффекта (присутствует/отсутствует) нокаута гена (соответственно, существенный/несущественный ген). Можно предполагать, что такие измерения слишком грубы и не дают осмысленной оценки биологической важности. Однако, например, в последних работах лаборатории Джорджа Занга было продемонстрировано почти полное отсутствие корреляции между скоростью эволюции и весьма точно измеренным влиянием на приспособленность пекарских дрожжей ( S. cerevisiae) во множестве различных условий (Wang and Zhang, 2009), что уменьшает вероятность получения неадекватных результатов. Чем же тогда объяснить неожиданно слабую связь между эволюцией и функцией гена? По отношению к эволюции последовательностей можно предположить, что скорость эволюции более зависит от внутренних характеристик гена (в особенности от структуры кодируемого белка), чем от его биологической значимости. Однако это объяснение неприменимо к случаям утраты гена. Наиболее осмысленным – хотя опять-таки противоречащим здравому смыслу – кажется следующее объяснение: фенотипический эффект нокаута гена (и в целом – набора необходимых генов) не проявляется как консервативное свойство в эволюционном процессе и быстро меняется (в масштабах эволюционной шкалы), вероятно благодаря высокой скорости эволюции сетей взаимодействующих генов [39]. Ясно, что это предположение можно проверить опытным путем, пусть и с помощью трудоемких экспериментов."

"В целом скорость эволюции гена определяется размером его почти нейтральной сети, то есть множества последовательностей, получаемых друг из друга в результате одношаговых мутаций (пусть и необязательно с помощью одной замены) и имеющих приспособленность примерно такую же, как и у наиболее приспособленной последовательности (Wagner, 2008a; Wolf et al., 2010). Чем больше нейтральная сеть, тем слабее ограничения для конкретного гена, тем быстрее он может эволюционировать (рис. 4–5).

В эволюции белка приспособленность отдельной последовательности в основном зависит от ее устойчивости к ошибкам укладки и от уровня экспрессии, а размер почти нейтральной сети зависит от высоты и формы пика, занимаемого этой последовательностью и ее соседями на ландшафте устойчивости (рис. 4–6). В этой модели высокоэкспрессированные белки, чьи исходные последовательности высоко устойчивы к ошибкам укладки, занимают высокие и крутые пики с небольшой областью высокой приспособленности (малые почти нейтральные сети) и, следовательно, подвержены сильному стабилизирующему отбору и медленно эволюционируют. И наоборот, белки с более низким уровнем экспрессии и меньшей устойчивостью находятся на более низких, пологих пиках, имеют более широкую область высокой приспособленности и, соответственно, подвержены более слабому отбору и имеют высокую скорость эволюции (рис. 4–6; Wolf et al., 2010)."


"Распределение численности паралогичных семейств в любом геноме – еще одна универсальная статистическая закономерность, обнаруженная сравнительной геномикой (рис. 4–7). Распределения для всех геномов приблизительно описываются степенной функцией с отрицательным показателем степени: y = ах -y (где у– положительное число, а– коэффициент; Koonin et al., 2002; Luscombe et al., 2002). Эти распределения, имеющие в двойных логарифмических координатах вид прямых линий, показывают, что большинство семейств по численности малы (включая семейства геномов с преобладанием синглетонных сайтов), и только немногие семейства включают в себя большое число паралогов."


"Как показывается в серии доскональных исследований Эрика Ван Нимвегена [43], различные функциональные классы генов по-разному соотносятся с общим числом генов в геноме (Molina and van Nimwegen, 2009; van Nimwegen, 2003). Не учитывая некоторые отклонения, для прокариот можно указать три основных показателя степени, описывающие эти соотношения: 0, 1 и 2. Генам белков, участвующих в информационных процессах (трансляции, транскрипции и репликации), соответствует показатель степени 0 – число таких генов достигает некоторого константного значения уже в минимальных геномах и в принципе не зависит от сложности генома. Число метаболических ферментов и транспортных белков примерно прямо пропорционально общему числу генов (показатель степени 1). Регуляторные гены и компоненты систем передачи сигналов показывают квадратичную зависимость (показатель степени равен 2; рис. 4-10). Показатели степени этих трех обширных классов остаются неизменными, с очень небольшими отклонениями, для всех групп прокариот, и это позволяет предположить, что разница в эволюционной динамике генов с различными функциями отражает какие-то фундаментальные законы эволюции клеточных организмов, или, другими словами, строгие и четко выраженные ограничения в функциональном устройстве геномов. Для генов эукариот обнаружены похожие, хотя и не такие явные, степенные соотношения, показатель степени для регуляторных генов эукариот значительно больше 1 (хотя и меньше 2). Имея в виду все вышесказанное, можно заключить, что эти соотношения представляют еще один набор универсалий геномной эволюции, которые становятся еще интереснее при рассмотрении их связи с функциональным устройством клетки. "


"порождающие модели для общегеномных универсалий либо совсем не используют понятие отбора, либо используют только понятие очищающего (стабилизирующего) отбора. Эта форма отбора направлена на сохранение статуса-кво и наблюдается для укладки белковых молекул, для распределения численности генных семейств и для универсальной зависимости численности функциональных классов генов от общего числа генов (Koonin and Wolf, 2010b)."

"Аналогия между эволюционным процессом и статистической физикой не ограничена существованием универсальных зависимостей и распределений, некоторые из которых могут быть выведены в рамках простых моделей. Возможно также составить схему детального соответствия ключевых параметров этих двух областей(Barton and Coe, 2009; Sella and Hirsh, 2005). Такой параметр состояния (степень свободы), как положение частицы, в этой схеме является аналогом либо состояния сайта в нуклеотидной или белковой последовательности, либо состояния гена в геноме (в зависимости от уровня моделирования эволюции), и тогда параметрам скорости эволюции для сайта или гена будет соответствовать скорость частицы. Более того, значение эффективной численности популяции будет очевидно аналогичным значению температуры в статистической физике, а приспособленность будет соответствовать свободной энергии."


Там много интересных мыслей; я выделил жирным самое интересное: про важность ошибок укладки белка (как нам известно из наших наук, она управляется гидрофобными силами и SOC), про степенные зависимости (опять же, приходит в голову SOC) и про разные показатели степени для генов с разными функциями (ну, геном же это "операционная система" а не "программа", согласно известной метафоре).

Что до аналогий с термодинамикой, то степень их полезности я не совсем понял. Как известно из основ термодинамики, состояние физической системы в этой науке описывается функцией вида
dU = T dS - p dV + mu dN
Причем в произведение входят пары переменных, некоторые из которых экстенсивны (пропорциональны объему системы, как энтропия S или объем V или количество частиц N), а сопряженные им интенсивны, т.е. от объема не зависят (как температура T или давление P или химический потенциал mu). Эта сопряженность сама по себе интересна (там обычно одна переменная измерима, а другая определяется косвенно), в механике ей соответствует формула для силы и перемещения dE=-Fdx, с ней можно проделывать преобразования Лежандра и определять дополнительную энергию dE*=-xdF, применять теорему Kастильяно и все такое, но я не буду здесь пересказывать термодинамику и механику за второй курс. :)

Аналогия между геномом и термодинамикой основывается на этой статье http://www.pnas.org/content/102/27/9541.full
Опять же, глубина этой аналогии и ее последствия не вполне понятны; в указанной статье она мне кажется чисто формальной (наверно, для любого клеточного автомата можно определить такую, ну и что). Но надо почитать внимательнее и еще подумать.

(6 comments | Leave a comment)

Comments:


From:opegs
Date:December 17th, 2015 12:36 am (UTC)
(Link)
> связь между экспериментально измеренной биологической важностью гена и скоростью его эволюции очень слаба, если вообще существует(... ... ...)

Есть мутации затрагивающие сворачивание белка, есть портящие его функционально-важные реакционные центры, какие из них вреднее для клетки? Ну да, есть разные ограничения на скорости мутаций, и не только на уровне сворачивания белков, но и на уровне эмбриогенеза, и на всех уровнях. Все это рассматривается со ранних времен создания СТЭ. Чтобы разобраться в процитированных статьях, даже подготовленному читателю пришлось бы тратить пару недель на каждую. Кроме того, "скорость эволюции" в них мерялась очень косвенными методами. Так что, в каждой статье могут быть очень сильно разные результаты, по силе доказательности. И что, данные ограничения, следующие из физики сворачивания и есть основа телеологических взглядов?

Edited at 2015-12-17 12:47 am (UTC)
[User Picture]
From:duchifat
Date:December 17th, 2015 12:51 am (UTC)
(Link)
Стат.физика там так-себе, для красивости. Какое-какое там распределение для скоростей частиц в жидкости? Какие степени свободы будем считать свободно-частичными, а какие нет, например, в воде?

Так вы напишите авторам, я думаю, им ваши замечания будут полезны и интересны.
http://www.pnas.org/content/102/27/9541.full
Guy Sella † , ‡ and Aaron E. Hirsh §
†Center for the Study of Rationality, Hebrew University of Jerusalem, Givat Ram, Jerusalem 91904, Israel; and
§Department of Biological Sciences, Stanford University, Stanford, CA 94305
Edited by Simon A. Levin, Princeton University, Princeton, NJ
gsella@math.huji.ac.il

Или лучше напишите комментарий в PNAS. :)
From:opegs
Date:December 17th, 2015 04:54 am (UTC)
(Link)
Цитата в первом параграфе поста взята из популярной книги Кунина, а не из статьи?
[User Picture]
From:duchifat
Date:December 17th, 2015 05:29 am (UTC)
(Link)
Цитата из книги, но Кунин опирается на результаты этой статьи. Сарказм мой вызван тем, что обсудить это мне интересно, но с тем, кто хорошо понимает термодинамику и некоторые другие области (по-видимому - вычислительные клеточные автоматы, модель Айзинга, Поттса и т.п.). "Гамильтониан" в вычислительных моделях это не то же самое, что гамильтониан в Механике Ландау и Лифшица.

Аналогия между геномом и термодинамикой идеального газа в статье Сэлы и Хирша примерно такая (http://www.pnas.org/content/102/27/9541/T1.expansion.html):
Состояние нуклеотида (А, Т, Ц, Г) = микросостояние термодинамической системы (координата атома, импульс атома)
Логарифм приспособляемости = энергия (гамильтониан)
Размер популяции = температура

На первый взгляд (и на второй тоже) это аналогия надуманная, непродуктивная. Во-первых, если координата и импульс - одно и то же ("состояние"), то дальше уже не интересно. Поскольку это дополнительные друг другу переменные, их произведение дает действие и т.п. У них по отдельность аналога в геноме нет.
Во-вторых, логарифм выбран искусственно, чтобы сохранялась аддитивность (при умножении величин логарифмы складываются). Что толку от того, что какой-то искуственно введенный параметр якобы аналогичен энергии? Это слова и формальная аналогия на уровне определений.
В-третьих, аналогия размера популяции с температурой имеет только тот смысл, что и то и другое стоит под экспонентой при расчете вероятностей, exp (-kT) в термодинамике и exp(Population size) в геномике. Но последнее - результат некой выбранной игрушечной модели ("Moran birth–death process").

Короче, я тут глубины не увидел. Но я мог чего-то не понять, и обсудить это интересно бы с тем, кто понимает.

В то же время аналогия "геномные переменные - интенсивные, фенотипические [или протеомные?] - экстенсивные" звучит для меня многообещающе, что-то в этой идее есть. Это как текст и материальный носитель текста. Энтропия генома это энтропия текста, а белок - вполне термодинамическая материальная сущность. Материализация происходит при экспрессии и сворачивании белка. Но на уровне формул вроде dU = T dS как это работает - не просматривается. В частности потому, что размер популяции (аналог температуры, т.е. величины интенсивной) - разве же это "геномная" переменная?

Edited at 2015-12-17 06:06 am (UTC)
[User Picture]
From:duchifat
Date:December 17th, 2015 12:57 am (UTC)
(Link)
Ну какой уж у прокариот эмбриогенез...
[User Picture]
From:gineer
Date:December 17th, 2015 11:51 am (UTC)
(Link)
Спасибо. Интересно.

> Go to Top
LiveJournal.com