Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

«Промоторные островки» как структурно-функциональный компонент генетического окружения горизонтально перенесенных генов Глазунова Ольга Андреевна

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Глазунова Ольга Андреевна. «Промоторные островки» как структурно-функциональный компонент генетического окружения горизонтально перенесенных генов: диссертация ... кандидата Биологических наук: 03.01.03 / Глазунова Ольга Андреевна;[Место защиты: ФГБУН Институт биофизики клетки Российской академии наук], 2017.- 109 с.

Содержание к диссертации

Введение

Промоторы и промотор-подобные участки Escherichia coli, как сигналы для взаимодействия с РНК-полимеразой (обзор литературных данных)

1. Транскрипционный аппарат кишечной палочки

2. Струкутура и функциональные особенности «промоторных островков»

3. Горизонтальный перенос генов

Материалы и методы

1. Бактериальные геномы и геномные области

2. Бактериальные штаммы

3. Получение штаммов с заменой ранее перенеснных генов на их ортологи из геномов потенциальных доноров

4. Условия роста

5. Используемые праймеры

6. Фракционирование и очистка фрагментов ДНК

7. Выделение суммарной фракции клеточной РНК

8. Синтез кДНК

9. Количественная ПЦР в реальном времени

10. Регистрация коротких РНК, синтезируемых с «островковых промоторов»

11. Подготовка библиотек и секвенирование

12 Анализ данных секвенирования

13. Оценка внутривидового полиморфизма нуклеотидных последовательностей

14. Оценка частоты и характеристика спектра спонтанных мутаций в популяциях хронически растущих клеток (эксперимент Р. Ленского)

Результаты и их обсуждение

1. Сравнительный анализ «промоторных островков» с АТ-богатыми последовательностями в геноме E. coli

2. Белок H-NS как ингибитор транскрипции «промоторных островков»

3. Выбор генов для искусственного горизонтального переноса, рекомбинация, и анализ экспрессии интегрированных генов в условиях хронического роста

4. Анализ нуклеотидных последовательностей в области интеграции рекомбинантных генов sfmA и ydhZ

5. Сравнительный анализ внутривидового полиморфизма и вариабельности нуклеотидных последовательностей для «промоторных островков», обычных промоторов и контрольных фрагментов генома

Заключение

Выводы

Список публикаций по теме диссертации

Список литературы

Струкутура и функциональные особенности «промоторных островков»

В результате детального экспериментального анализа промоторов кишечной палочки было установлено, что длина участков ДНК, с которыми связывается РНКП, составляет 60 пар нуклеотидов (Ross et al., 2001). Большая часть этой последовательности может быть любой, однако промоторы содержат несколько консервативных элементов, непосредственно узнаваемых одной из 7 сменных -субъединиц бактериальной РНКП, а также е -субъединицами. Изучение характера этого взаимодействия было начато еще в 1975 году, когда в промоторах, распознаваемых основным сигма-фактором (70), на основе выравнивания всего лишь шести известных последовательностей Дэвид Прибнов выявил первый консервативный элемент (Pribnow, 1975). Его называют «Прибнов-бокс», или «элемент -10». Контекст предложенного им консенсуса был TATRATG (где R=A/G). Позднее, по мере накопления знаний о последовательностях большего числа промоторов, первичная структура области -10 была уточнена, а консенсусной последовательностью стала TATAAT. Обычно она расположена на расстоянии в 2-11 нуклеотидных пар (н.п.) от точки инициации транскрипции. Ещ один консервативный мотив, «элемент -35», был обнаружен на расстоянии 14-21 н.п. от элемента -10 (Gross et al., 1998). Консенсусная последовательность в этой области у промоторов, узнаваемых 70, – TTGACA.

Следующим шагом в понимании структурной организации бактериальных промоторов стало обнаружение неслучайного распределения нуклеотидов в участках, фланкирующих элемент -10. Первым был обнаружен динуклеотид TG, отстоящий от Прибнов-бокса на 1 н.п. с 5 -конца. Оказалось, что его присутствие снижает потребность транскрипционного комплекса в наличии консервативной последовательности в области -35 (Keilty, 1987; Kumar, 1993; Barne, 1997). Объединнный мотив TGATAAT, иногда TGTGATAAT, стали называть «удлиненной -10 областью» (extended -10 region). Однако динуклеотид TG встречается только в 15-20% известных промоторов (Burr, 2000; Mitchell, 2003), то есть обладает очень низким дискриминирующим потенциалом, по сравнению с основными консервативными модулями. Чуть позднее, в участке, расположенном между элементом -10 и стартовой точкой транскрипции, была обнаружена G/C-богатая последовательность, необходимая для своевременного выключения генов с зависящей от скорости роста экспрессией (Zacharias et al., 1990). Е назвали дискриминатором «строгого контроля», но и она присутствует в относительно небольшом числе промоторов.

Практически одновременно с обнаружением этих двух модулей, в нуклеотидных последовательностях, фланкирующих 5 -конец элемента -35 были найдены гомонуклеотидные Т- и А-треки. Установлено, что их присутствие активирует инициацию транскрипции, более того, они могут заменить элемент -35 при формировании транскрипционного комплекса (Galas, 1985; Ross, 1993; Blatter, 1994). Этот элемент промоторов был назван UP-элементом и оказалось, что он распознается С-концевыми доменами обеих -субъединиц РНК-полимеразы (Ross, 1993; Blatter, 1994). Классическим примером является промотор P1 рибосомного оперона rrnB, удаление из которого UP-элемента длиной 22 н.п. приводило к 30-кратному снижению транскрипционной активности. Консенсус UP-элемента был установлен в экспериментах SELEX (Estrem et al., 1998). Он имеет контекст AAAwwTwTTTT—AAAA, где w=A=T, который обнаруживается в 5-10% промоторов. В 3% промоторов E. coli UP-элемент отстоит от элемента -35 всего на несколько нуклеотидных пар ( 4), то есть имеет довольно чткую локализацию (Estrem, 1999).

Различные комбинации обнаруженных в промоторах элементов позволяют РНКП узнать промоторную область и инициировать транскрипцию, при этом совсем не обязательно, чтобы все они находились в е нуклеотидной последовательности. Некоторым исключением является только элемент -10, присутствие которого можно считать обязательным, хотя и недостаточным, для полноценной активации промоторов кишечной палочки (Feklistov et al., 2006). В двухцепочечной форме этот элемент распознатся модулями 2.3, 2.4 и 2.5 субъединицы. Взаимодействие с ними приводит к локальному плавлению двойной спирали ДНК (Fenton, 2000). Из 6 н.п. этого элемента только три являются высоко-консервативными: TAtaaT (Hook-Barnard, Hinton, 2007), а наиболее важным для взаимодействия с РНКП является первый динуклеотид ТА (Fenton, 2001; Murakami, 2002). В среднем только 7,9 из 12 консервативных пар гексамеров -10 и -35 обнаруживаются в последовательностях известных промоторов, причм 10% промоторов, эффективно начинающих транскрипцию, содержат меньше 5 консервативных пар (Lisser, 1993; Ozoline, 1997). Было показано, что мутации в областях -10 или -35, которые приближают промоторную последовательность к консенсусной, обычно способствуют увеличению транскрипционной активности промоторов, в то время как с уменьшением сходства промотора с консенсусом, его транскрипционная активность обычно снижается (Hawley, McClure, 1983). Тем не менее, из этого правила имеется несколько исключений, и в геноме E. coli есть только один промотор, имеющий 12 консервативных пар.

Он является умеренно активным и экспрессия соответствующего гена чаще начинается с дополнительного промотора, последовательность которого меньше похожа на консервативную. Это обусловлено тем, что связывание РНК-полимеразы с консервативными последовательностями настолько сильно, что фермент не способен покинуть область связывания и перейти к элонгации (Moyle, 1991; Gaal, 2001; Miroslavova, Busby, 2006).

Способность бактерий переживать стрессовые условия в первую очередь обусловлена способностью их транcкрипционного аппарата к адаптивным перестройкам. Наиболее масштабная регуляция опосредована функционированием различных -факторов. У E. coli, кроме основной 70/D (RpoD)-субъединицы, которая управляет экспрессией генов в условиях быстрого роста, имеется еще шесть альтернативных белков: 54/N (RpoN), 32/H (RpoH), 38/S (RpoS), 24/E (RpoE), 28/F (RpoF) и 19/FecI (FecI). Каждый из них отвечает за распознавание конкретного набора промоторов (Ishihama, 2000; Gruber, 2003). При этом промоторы некоторых генов способны взаимодействовать с разными холо-ферментами для обеспечения постоянной экспрессии нужных генов в различных условиях (Fang, 2005). Общее число молекул кор-фермента в растущей культуре клеток кишечной палочки составляет 2000, что меньше общего числа генов ( 4000). Это значит, что именно РНКП «выбирают» какие гены транскрибировать и с какой интенсивностью (Blattner, 1997; Ishihama, 1997). В то же время, молекул РНКП в бактериальной клетке больше, чем растущих цепей РНК (Grigorova, 2006). Это значит, что в клетках есть пул свободных полимераз, обеспечивающий необходимый резерв для своевременного переключения транскрипции на новые гены.

Все сигма-факторы, за исключением 54, принадлежат к одному белковому семейству, функционируют по схожему механизму и встречаются у большинства бактерий. Основной сигма-фактор кишечной палочки может активировать транскрипцию почти всех генов, особенно во время экспоненциального роста бактерий (Ishihama, 2000.). Семейство 70 подразделяют на четыре филогенетические группы (Lonetto, 1992; Helmann, 2002). Первая группа включает 70 и его ортологи в разных бактериях. Они чрезвычайно важны для жизненного цикла бактерий, поскольку управляют транскрипцией генов «домашнего хозяйства». Вторая группа содержит белки сходные с 70, присутствующие в некоторых видах, которые необязательны для роста, в силу того, что их функции может выполнить 70. Наиболее хорошо изученным членом этой группы является 38, один из главных регуляторов стрессовых реакций клетки (Huo et al., 2008). Холо-фермент E38 (ES) активирует экспрессию генов, необходимых для выживания клеток во время стационарной фазы роста. Активность генов, задействованных в ходе экспоненциального роста клетки, при этом быстро подавляется. Ряд физико-химических факторов, таких как повышенная концентрация соли или изменение уровня суперспирализации ДНК, способствуют транскрипции некоторых генов с участием ES, хотя в обычных условиях их экспрессия контролируется E70 (Gaal, 2001; Ishihama, 2000). Сигма-факторы третьей группы характеризуются меньшим сходством с 70 и обычно

активируют гены белков, выполняющих какие-то специализированные функции. Так, например, 32 распознает промоторы «генов теплового шока», продукты которых помогают выжить клетке при воздействии высоких температур (Nonaka et al., 2006). Основным сигналом, индуцирующим синтез короткоживущего белка 32, является накопление в цитоплазме клетки белков с нарушенным фолдингом (частично денатурированных в результате действия высоких температур или других факторов). К числу генов (регулону), транскрипция которых осуществляется с участием 32, относятся, в частности, гены шаперонов GroEL и DnaK, а также протеаз Lon и Clp, которые способствуют восстановлению правильной конформации умеренно денатурированных белков и деградации необратимо поврежденных белков (Gragerov et al., 1992). При этом, сами эти регуляторы контролируют клеточный уровень 32 по принципу негативной обратной связи (Gamer et al., 1996; Guisbert et al., 2006). Ещ одним членом третьей группы является 28, которая присутствует в бактериальных клетках в больших количествах и отвечает за экспрессию генов, вовлеченных в хемотаксис и формирование флагеллярных структур (Ishihama, 2000; Osterberg, 2011).

Получение штаммов с заменой ранее перенеснных генов на их ортологи из геномов потенциальных доноров

Использование современных высокоэффективных методов геномики, позволяющих проводить расшифровку полных последовательностей любых геномов, вне зависимости от их размеров, не только ведет к лавинообразному накоплению данных о новых генах и их продуктах, но и предоставляет уникальную возможность проследить их филогенетические связи, то есть понять, как формируется и закрепляется в популяции тот или иной признак? Бактерии лучше, чем все остальные типы живых организмов, подходят для такого филогенетического анализа, просто потому, что имеют самый короткий жизненный цикл. Чтобы обеспечить высокую изменчивость микроорганизмов, их большой приспособительный потенциал к внешним условиям, способность к конкуренции в сложных сообществах, у прокариот должен присутствовать механизм, обеспечивающий необходимые изменения и их «узаконивание» в ранее сложившихся регуляторных сетях хозяйской клетки.

У высших организмов разнообразие потомства обеспечивается особенностями полового размножения – происходит случайная перетасовка участков родительских хромосом, результатом которой является уникальный набор признаков – от морфологических (например, цвет глаз или волос) до биохимических (особенности структуры ферментов, влияющие на их субстратную специфичность и активность). Очевидно, что прокариоты, практически лишенные «полового» размножения, как такового, при делении должны передавать дочерним клеткам свой геном «вертикально» в условно неизменном виде. Конечно, при копировании хромосомной ДНК возникают точечные ошибки, которые, в отсутствие своевременной реакции системы репарации, могут с некоторой невысокой вероятностью передаться в геном дочерней клетки и даже закрепиться в последующем ее потомстве – при условии, если такая мутация дает преимущество, или хотя бы не снижает конкурентоспособность в популяции исходных клеток. Однако такой путь не может обеспечить разнообразие и быструю изменчивость, столь характерные для бактерий.

Анализ динамики накопления изменений в микробном геноме свидетельствует в пользу того, что в мире прокариот эволюция в основном происходит не путем классического дарвиновского процесса, который представляет собой постепенное накопление многочисленных мутации, а, скорее всего, за счет более быстрых и масштабных изменений, «скачкообразно» (Koonin, 2016).

Стремительное возникновение новых видов бактерий возможно благодаря уникальным особенностям их генетики, в частности, их способности легко обмениваться генетическим материалом (Ochman, Davalos, 2006; Cohan, Koeppel, 2008). Основной вклад при этом вносит горизонтальный обмен генетической информацией. Горизонтальный (или латеральный) перенос генов (ГПГ) является природным процессом передачи генетического материала от одной клетки другой, часто принадлежащей совсем другому виду. Многочисленные подтверждения его широкого распространения могут быть обнаружены в нуклеотидных последовательностях геномов практически всех живущих микробов (Ochman, Davalos, 2006). Функционально ГПГ часто опосредован вирусными частицами, плазмидами или другими векторами. При этом, объектом горизонтального переноса обычно бывает не конкретная полная кодирующая последовательность, а случайный фрагмент, захватывающий как некодирующие последовательности, так и гены, их части, или даже целые группы генов. Длина переносимых отрезков ДНК может варьировать от нескольких нуклеотидов до нескольких десятков тысяч, причем эффективность переноса мало зависит от этой длины.

Скорость, с которой генетическая информация приобретается и теряется, неодинакова для разных бактерий, и, отчасти, определяется особенностями среды их обитания (Ochman, 2005). При снижении биоразнообразия, например, многие гены, полученные за счет ГПГ, могут стать бесполезными и удаляются отбором, как это имело место у Salmonella enterica серовар Typhi и Paratyphi A (Parkhill et al., 2001; McClelland et al., 2004).

Обширные данные о последовательностях бактериальных хромосом позволили установить, что горизонтальный перенос происходит не в строго определенные места генома, а по всей его длине (Ochman, Jones, 2000). При этом переносимые участки ДНК часто содержат открытые рамки считывания (Nakamura et al., 2004; McDaniel et al., 2010), накопление которых может приводить к происхождению новых видов бактерий (Gogarten et al., 2002). Геном Salmonella enterica серовар Typhimurium штамм LT2, например, приобрел с помощью горизонтального переноса и ассимилировал не менее 200 дискретных областей, каждая длиной более 100 пар оснований, которые суммарно содержат около 1400 отрытых рамок считывания, что составляет более четверти общего числа его кодирующих последовательностей (Navarre et al., 2007). Следует отметить, однако, что обмен генетическим материалом может оказывать заметное влияние на эволюцию лишь в том случае, когда доноры и реципиенты используют одну и ту же систему для кодирования, хранения и обработки генетической информации (Johnsborg et al., 2007).

Одни из первых доказательств вклада горизонтального переноса в процесс бактериальной эволюции были получены при изучении распространения устойчивости к пенициллину у бактерий рода Enterobacteriaceae (Datta, Kontomichalou, 1965). В этом случае обмен генетической информацией опосредован плазмидами и не требует интеграции перенеснных генов в бактериальную хромосому. Много позднее, с помощью популяционного генетического моделирования, было показано, что эволюционный режим, при котором вклад горизонтального переноса ограничен, а основные мутации накапливаются в процессе конкуренции клональных популяций, в долгосрочной перспективе неустойчив (Takeuchi, Kaneko, 2014). Клональные популяции, как правило, погибают из-за действия эволюционного механизма, известного как храповик Мюллера, в результате постепенной потери приспособляемости и накопления незначительных вредных мутаций за счет генетического дрейфа (Muller, 1964; Charlesworth, Morgan, 1993). Гибель бактерий по этому пути является типичным механизмом отбора, который схож с последствиями внутриклеточного паразитизма (Allen, Light, 2009). Горизонтальный перенос позволяет нивелировать эффекта Мюллера, приводя к замене мутантного гена функциональной копией или в результате активации ранее приобретенных генов, которые способны компенсировать вредные эффекты накопившихся мутаций. Таким образом, у прокариот горизонтальный перенос играет ту же роль предотвращения «мутационного распада» (mutational meltdown), что и мейоз у эукариот (Ku, Nelson-Sathi, 2015).

Помимо ухода от действия храповика Мюллера, ГПГ также играет важную роль в появлении функционально значимых изменений в геномах прокариот (Lerat et al. 2005; Dagan et al. 2008; Treangen, Rocha, 2011). Многие факторы вирулентности бактериальных патогенов были привнесены из экзогенных источников, таких как фаги, плазмиды, транспозоны и интегративные конъюгативные элементы (Hacker, Kaper, 2000; Ochman et al., 2000). Например, факторы вирулентности, которые отличают бактерий рода Salmonella от E. coli были, в основном, приобретены за счет ГПГ (Groisman, Ochman, 1996; Gogarten et al., 2002), а белковые продукты, обеспечивающие устойчивость к антибиотикам и закодированные на плазмидах, отличаются даже у близкородственных организмов, что свидетельствует об их независимом приобретении.

Важно, что горизонтальный перенос не ограничивается только факторами патогенности. Он вносит весомый вклад в эволюцию различных функциональных систем и развитие специальных типов адаптации, связанных с метаболическими путями (Pl et al., 2005; Maslov et al., 2009), кислородным фотосинтезом (Mulkidjanian et al., 2006), устойчивостью к действию высоких температур (Aravind et al., 1998; Brochier-Armanet, Forterre, 2007) и антибиотиков (Blahna et al., 2006), патогенностью (Kelly et al., 2009) и т.д. Так, например, метанотрофы приобрели способность синтезировать некоторые из кофакторов для утилизации метана от метаногенных архей (Chistoserdova, 1998; Gogarten et al., 2002). Именно благодаря ГПГ дивергентные популяции могут передавать друг другу фрагменты ДНК, обусловливающие определенные свойства организма. Такое совместное использование генов, как правило, не делает две популяции более похожими с экологической точки зрения. При этом, реципиент может использовать новое свойство для освоения новой экологической ниши, или для повышения своей конкурентоспособности в пределах текущей среды обитания (Cohan, Koeppel, 2008). Исходя из этого, ГПГ может существенно влиять на развитие отдельно взятых микробных сообществ и экологического разнообразия в целом (Burke et al., 2011, Shapiro et al., 2012).

Количественная ПЦР в реальном времени

В оставшихся после извлечения картируемых прочтений последовательностях, с использованием программы MisMatcher, были идентифицированы такие, которые имеют одиночные замены. Из двенадцати возможных замен (AC/G/T, C A/G/T, GA/C/T и TA/C/G), восемь дают трансверсии (AC/T, CA/G, GC/T и TA/G), но регистрация AC/T или CA/G на одной из цепей обязательно подразумевает наличие мутаций T G/A или GT/С, на противоположной нити. Поэтому замены, найденные для обеих цепей и приводящие к образованию одной и той же пары оснований, считались одной спонтанной мутацией, тогда как разные мутации в одной позиции учитывались независимо. Всего это дат 4 комбинированных набора для трансверсий: A/TT/A, G/C T/A, G/CC/G, A/TC/G и два набора для транзиций: A/TG/C, G/CA/T, которые были использованы для сравнительного анализа.

Характер замен, зарегистрированных для исходного штамма (sfmA_control) и мутанта (sfmA_rec) по результатам этого раунда секвенирования, приведен на Рис. 26.

Число спонтанных замен по данным анализа ампликонов, полученных из штаммов E. coli-sfmA_rec и sfmA_control. Показаны результаты популяционного секвенирования контрольной и рекомбинантной областей на стадии 2000 генераций. Слева (А) приведены данные о количестве замен разного типа, нормированные на общее число уникальных «прочтений» с одной спонтанной мутацией в клетках исходного и мутантного штаммов, а справа (Б) те же данные, но нормированные на количество изменнных пар (для замен А/Т-пар на G/C-пары это число АТ-пар, для замен G/C-пар на АТ-пары – число G/C-пар)

Как и ожидалось, число транзиций, то есть замен типа пуринпурин и пиримидинпиримидин, было больше чем трансверсий (замен пуринпиримидин). Для контрольного образца, то есть участка генома, содержащего уже сформировавшийся «промоторный островок» больше всего оказалось замен A/TG/C (серые столбики на Рис. 26А). Это ожидаемо, так как доля А/Т-пар в этой последовательности гораздо больше (60%), чем в среднем по геному ( 50%) и в опытном образце (48.4%). Это значит, что число мутаций A/TG/C и A/TC/G в этой последовательности и должно быть больше, чем в рекомбинантной области, а замен G/CA/T и G/CT/А, наоборот, должно быть меньше. Соответствующая нормировка на A/T(G/C)-состав уменьшила разницу в характере замен между родительским и мутантным штаммами, но само по себе отличие сохранилось (Рис. 26Б). При обеих нормировках основными заменами в мутантном штамме оказались транзиции G/CA/T. Это соответствует нашему предположению, о том, что превращение цитидина и метилцитидина в дезоксиуридин и тимин с участием цитидиндезаминаз может быть важным фактором, способствующим накоплению А/Т-пар рядом с чужими генами.

Относительное число разных мутаций в прочтениях с одной заменой, полученных для мутанта E. coli-ydhZ_rec и соответствующей контрольной области (Рис. 27А), оказалось приблизительно таким же, как и в предыдущем случае (Рис. 26А). Однако нормировка на A/T(G/C)-состав нивелировала разницу между исходным и мутантным штаммом по транзициям G/CA/T (Рис. 27Б), что вызывает определнные сомнения в правильности нашего предположения. Частота возникновения спонтанных замен по данным анализа ампликонов, полученных из штаммов E. coli-ydhZ_rec и ydhZ_control. Показаны результаты популяционного секвенирования контрольной и рекомбинантной областей на стадии 4000 генераций. Слева (А) приведены данные о количестве замен разного типа, нормированные на общее число уникальных «прочтений» с одной спонтанной мутацией в клетках исходного и мутантного штаммов, а справа те же данные, но нормированные на количество изменнных пар (для замен А/Т-пар в G/C-пары это число АТ-пар, для замен G/C-пар в АТ-пары – число G/C-пар)

Следующее секвенирование было сделано по достижении популяциями клеток 5000 (культуры E. coli-sfmA_rec и E. coli-sfmA_control) и 7000 (культуры E. coli-ydhZ_rec и E. coli-ydhZ_control) генераций. При этом были скорректированы положения праймеров для амплификации целевых локусов. Размеры областей, таким образом, были увеличены, составив 3217 и 1704 н.п. для sfmA/fimA и 2405 и 1461 н.п. для ydhZ (Таблица 4). Количество зарегистрированных прочтений после фильтрации данных по уровню качества Q20, составило 344004 для объединенных мутантных популяций и 319079 для контрольных штаммов.

На Рис. 28Б показан профиль распределения «прочтений», идеально картируемых на исследуемую область. Видно, что обнаруженный ранее провал в области сайта связывания рекомбиназы Flp (Рис. 28А) увеличился, что свидетельствует о возможности скорой фиксации замены в этой области. Это будет большая удача. Так, исходя из результатов, полученных в лаборатории Р. Ленского, где в 12 непрерывно растущих культурах кишечной палочки за 40000 поколений накопилось всего 627 фиксированных мутаций, за время роста наших популяций – 5000 и 7000 поколений, можно ожидать возникновение в среднем всего одной фиксированной мутации на 709000 или 506000 н.п., соответственно, то есть в участке, более чем на два порядка превышающем анализируемые нами локусы. Любопытно также, что первичной мишенью для мутагенеза оказалась короткая последовательность flp-сайта, которая, безусловно, является фактором риска, так как создат основу для мобильности в геноме. Кроме этого провала, в гене канамициновой устойчивости явно намечается ещ несколько потенциально мутируемых позиций. В ближайшее время они могут закрепиться в популяции. В гене fimA/sfmA таких позиций пока нет.

При картировании прочтений, содержащих одну замену, было логично ожидать некоторую инверсию пиков, в сравнении с распределением идеально совпадающих последовательностей (Рис. 28В). Однако наше предположение не оправдалось, и даже очень малое покрытие flp сайтов не коррелировало с бльшим количеством прочтений с одиночными заменами.

Профиль распределения «прочтений» длиной 25 н., полностью соответствующих последовательностям встроенных генов (А и Б) и «прочтений» с одной заменой (В). Показаны результаты секвенирования на этапе 2000 (А) и 5000 генераций (Б и В). Зеленым овалом на панели (В) отмечена область 500-1400 н.п., в которой сравнивали относительную частоту возникновения различных типов замен. Для построения графиков использовано сглаживание в бегущем окошке 40 н.п.

На Рис. 29 приведены аналогичные профили для другой рекомбинантной области. Распределение прочтений в гене канамициновой устойчивости и flp-сайтов у них одинаковое с мутантом E. coli-sfmA_rec, так как зарегистрированные в этой области прочтения, в условиях совместного секвенирования ампликонов, равно эффективно картируются на одинаковые последовательности. Также как и в предыдущем случае, покрытие второй половины гена ydhZ и прилегающей к нему межгенной области идеально картирующимися «прочтениями» оказалось бльшим, чем покрытие соседних участков (Рис. 29Б). Более того, распределение идеально картирующихся прочтений (Рис. 29Б) в значительной степени повторялось профилем прочтений с единичными заменами (Рис. 29В). То есть, большее число прочтений с мутациями в этой области является простым следствием большего числа прочтений из этого участка в суммарной библиотеке полученных прочтений. Такая неравномерность в покрытии может быть обусловлена какой-то особенностью нуклеотидной последовательности этой области, которая воспроизводимо отражается на подготовке образца, например, на эффективности лигирования или амплификации (Head et al., 2014). Причиной неравномерного покрытия могут быть также различия в эффективности секвенирования разных областей. Не исключено также, что отсутствие прочтений с двумя и более заменами тоже отражается на общем профиле распределения дефектных прочтений (Рис. 29В), хотя их вклад не может быть большим.

Выбор генов для искусственного горизонтального переноса, рекомбинация, и анализ экспрессии интегрированных генов в условиях хронического роста

Внутривидовую изменчивость последовательностей в использованных ранее наборах геномных локусов (за исключением перекрывающегося с «промоторными островками» набора АТ-богатых последовательностей) анализировали с помощью алгоритма Microbial BLAST, для всех доступных в NCBI геномов Escherichia, как описано в разделе Материалы и Методы. В качестве запроса были использованы последовательности, взятые из генома E. coli K12 MG1655. Для каждой из них находили гомолог с максимальным числом точечных замен, которое после нормировки на длину анализируемой области использовали в качестве характеристики внутривидового полиморфизма по данной области. На Рис. 32А показаны результаты этого анализа. Стало ясно, что для контрольных последовательностей, взятых из кодирующих участков генома, характерен низкий уровень внутривидового полиморфизма. За исключением 4 выбросов, соответствующих вторым копиям анализируемых генов, которые могли превратиться в псевдогены и выйти из-под контроля селективного отбора, число отличий от последовательностей E. coli K12 MG1655 обычно варьирует в диапазоне 2-5. Промоторные последовательности, вне зависимости от количества стартовых точек, практически не отличаются от контрольных и друг от друга. Однако количество точечных замен в «промоторных островках» в среднем оказалось приблизительно в 6 раз больше, чем в других наборах. Аналогичные данные были получены С.С. Киселвым с использованием всех доступных в базе данных NCBI бактериальных геномов рода Escherichia (всего 216) при усреднении числа спонтанных замен по очищенному от дублей набору выровненных последовательностей (Рис. 32Б). Мутационный процесс, идущий в «промоторных островках», следовательно, отличается от других последовательностей генома.

Явно повышенный уровень внутривидового полиморфизма «островков» (Рис. 32) может быть прямым следствием более высокой частоты спонтанных мутаций в них, либо результатом селективного отбора, адаптирующего их транскрипционную активность к потребностям конкретного вида. Поэтому на следующем этапе была сопоставлена частота спонтанных мутаций во всех четырх типах геномных локусов, обнаруженных в геноме одного штамма, E. coli B REL606 в ходе длительного эволюционного эксперимента (Barrick et al., 2009; Barrick, Lenski, 2009). Бактериальные клетки в этом эксперименте растут без всякого эволюционного давления с февраля 1988 г. Их ежедневно пересевают на новую среду, а геномы периодически секвенируют, используя для этого хромосомы случайно выбранных клеток, либо геномы всей популяции (клональное и популяционное прочтение, соответственно). В процессе роста в генетическом материале бактерий приблизительно с одинаковой частотой (Таблица 2) возникают спонтанные мутации. Некоторые из них ассимилируются популяцией, но большая часть элиминируются. Прочтения, полученные в результате полногеномного секвенирования 7 популяций, предоставляющие спектр случайных замен, произошедших в разных клетках, были использованы на следующем этапе. После фильтрации по качеству, их количество варьировало от 20848 до 80898 в разных популяциях (Таблица 2). Картирование этих мутаций осуществляли с использованием программы MisMatcher, так же, как это делалось для картирования спонтанных мутаций, найденных в бактериальных культурах нашего эволюционного эксперимента.

Распределение однонуклеотидных замен в различных типах локусов в геномах бактериальных клеток штамма E. coli B REL606, обнаруженных в результате секвенирования 7 клеточных популяций (популяционное секвенирование) на разных этапах хронического эволюционного эксперимента, проводимого в лаборатории Р. Ленского. Число мутаций нормализовано на 300 н.п. для каждой последовательности в наборах и усреднено по 7 экспериментам полногеномного секвенирования. Указано число последовательностей, найденных в геноме E. coli B REL606, которые гомологичны последовательностям исходных наборов, взятых из генома E. coli K12 MG1655.

Оказалось, что количество спонтанных мутаций в «промоторных островках» минимально по сравнению с другими областями (Рис. 33), что коренным образом отличается от распределения фиксированных мутаций у разных штаммов Escherichia (Рис. 32). Медиана для «промоторных островков» лежит приблизительно на 15% ниже, чем для промоторов, а область вариаций уже. Эта принципиальная разница между частотой спонтанных мутаций в одном штамме (Рис. 33) и уровнем внутривидового полиморфизма (Рис. 32) является ещ одним свидетельством отличия мутационного процесса, идущего в «промоторных островках», от других последовательностей генома.

Так как при каждом секвенировании выявляется спектр текущего генетического разнообразия, можно предположить, что меньшее, по сравнению с другими участками, количество замен, обнаруженных на «островках», обусловлено большей степенью их экранированности от мутагенных факторов. Отдельные замены могут некоторое время персистировать в популяции, или сразу же элиминироваться. Поэтому узкий диапазон вариаций и пониженное число замен внутри «промоторных островков» (Рис. 33) может быть результатом стабилизирующего отбора, более эффективно элиминирующего клетки с заменами в «островках», чем в других областях. В таком случае частота мутаций в них может оказаться зависимой от гетерогенности исследуемых популяций.

Поэтому на следующем этапе мы провели аналогичный анализ числа спонтанных мутаций в отдельных клонах E. coli B REL 606 (Barrick et al., 2009). В этом случае регистрировались точечные замены, возникающие в культуре клеток, родоначальником которой является клонообразующая клетка. Число спонтанных замен в таких клетках после фильтрации по качеству варьировало от 16336 до 37281 (Таблица 2) и было приблизительно в два раза меньше, чем при популяционном секвенировании. Они включали спонтанные и фиксированные мутации, которые клонообразующая клетка накопила до посева и мутации, которые дочерние клетки получили в процессе роста. Их суммарное количество в ПО оказалось одинаковым с числом замен в двух других промоторных наборах (Рис. 34). Косвенно это свидетельствует в поддержку предположения о стабилизирующем отборе и элиминации клеток с мутациями в «островках», то есть о том, что их популяционный гомеостаз (Рис. 33) как-то поддерживается всем сообществом совместно растущих бактерий. Если это так, то и характер мутаций, зарегистрированных при клональном и популяционном секвенировании тоже может отличаться.

Распределение однонуклеотидных замен в четырх типах локусов в геномах бактериальных клеток штамма E. coli B REL606, обнаруженных в результате секвенирования 7 геномов клеточных культур, полученных из одиночных клонов (клональное секвенирование) на разных этапах хронического эволюционного эксперимента, проводимого в лаборатории Р. Ленского. Число мутаций нормализовано на 300 н.п. Указано число последовательностей, найденных в геноме E. coli B REL606, которые гомологичны последовательностям исходных наборов, взятых из генома E. coli K12 MG1655. На Рис. 35 показан характер распределения однонуклеотидных замен, полученный по результатам клонального секвенирования, то есть так же как для Рис. 34. Частота спонтанных мутаций для разных пар в этом масштабном эксперименте существенно различалась. Переход G/C в C/G оказался самым редким событием, в то время как транзиция G/CА/Т, наоборот, одной из самых частых, что согласуется с литературными (Lee et al., 2012) и нашими (Рис. 26, 27, 30, 31) данными. Для «промоторных островков» и множественных промоторов число таких замен было особенно большим (Рис. 35). Это соответствует нашему предположению, согласно которому образование остановленных транскрипционных комплексов на «островках» может способствовать дезаминированию цитидинов с последующим их превращением в тимины.