Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию Устюгова Светлана Викторовна

Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию
<
Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Устюгова Светлана Викторовна. Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию : диссертация ... кандидата биологических наук : 03.00.03.- Москва, 2007.- 104 с.: ил. РГБ ОД, 61 07-3/637

Содержание к диссертации

Введение

II. Обзор литературы. типы ретроэлементов и их взаимодействие с геномом человека . 6

I. Основные типы ретроэлементов генома человека. 6

1. Длинные диспергированные ядерные повторы (LINE). 7

1.1. Класс LINE 1. 7

1.1.1. Структура. 7

1.1.2. Классификация и номенклатура. 7

1.1.3. Размножение LINE 1 в геноме человека в процессе эволюции . 12

1.1.3.1 .Транскрипция

и посттранскрипционые модификации РНК LINE 1. 12

1.1.3.2.Трансляция ORF1 и ORF2 и функции ORF1 р и ORF2p. 15

1.1.3.3 .Обратная транскрипция и интеграция в геном. 19

1.1.3.4.0бразование инвертированных и 5' укороченных копий L1

элементов. 22

1.2. Классы LINE2, LINE3, HAL1. 23

2. Короткие диспергированные ядерные повторы (SINE). 24

2.1. Alu элементы. 24

2.1.1. Структура. 24

2.1.2. Номенклатура. 24

2.1.3. Размножение Alu в геноме человека в процессе эволюции . 25

2.2. MIR элементы. 25

3. Ретроэлементы, содержащие длинные концевые повторы . 26

3.1. LTR-ретротранспозоны - MaLR. 26

3.2. HERV - эндогенные ретровирусы человека. 26

3.2.1.1.Структура. 26

3.2.1.2.Номенклатура. 28

3.2.1.3.Размножение HERV в геноме человека в процессе эволюции. 30

4. Химерные элементы. 31

4.1. SINE-R. 31

4.2. SVA. 32 II. Взаимодействие ретроэлементов с геномом человека . 32

5. Белки, кодируемые ретроэлементами, участвуют в некоторых клеточных процессах. 32

6. Последовательности ретроэлемеитов входят в состав регуляторных областей различных генов человека 33

7. Фрагменты последовательности ретроэлемеитов могут входить в кодирующую последовательность генов человека. 37

8. Геномные перестройки, ассоциированные с транспозиционной активностью ретроэлемеитов. 38

8.1. Инсерционный мутагенез. 38

8.2. Размножение неавтономных ретроэлемеитов и образование процессированных псевдогенов. 43

8.3. L1-опосредованная трансдукция. 44

8.4. Гомологичная рекомбинация. 45

8.5. Генная конверсия 46

9. Инактивация X хромосомы. 46

10. Способы регуляции активности ретроэлемеитов в клетке. 47

Заключение. 49

III. Экспериментальная часть 50

Материалы 50

Методы 53

IV. Результаты и обсуждение 69

1. Поиск видоспецифических и полиморфных интеграции L1 элементов и определение их локализации относительно генов человека. 69

2. Биоинформатический поиск полиморфных интеграции L1 элементов, расположенных в интронных областях генов человека. 76

3. Генотипирование серии опухолевых клеточных линий человека различного тканевого происхождения. 78

4. Определение уровней транскрипции аллельных вариантов генов, отличающихся полиморфными инсерциями ретроэлемента L1. 81

5. Создание набора рекомбинантных конструктов для функционального анализа

интронных ретроэлемеитов в системе транзиентнои экпрессии репортерного гена. 89

V. Выводы 94

Список литературы 95

Введение к работе

Одной из фундаментальных задач молекулярной биологии является изучение регуляторных систем, определяющих транскрипционную активность различных генов. Как один из факторов, способных изменять регуляцию экспрессии генов, современная геномика рассматривает размножение в геноме мобильных элементов, в первую очередь ретропозонов. Внедрение мобильного элемента в последовательность гена может изменить его транскрипционную активность, в зависимости от структурных и функциональных особенностей элемента. Анализ данных, полученных в ходе работы по определению нуклеотидной последовательности генома человека, выявил тот факт, что около 42% генома человека представлено ретроэлементами и одной из наиболее широко представленных в геноме человека групп ретроэлементов являются длинные диспергированные ядерные повторы LINE, и самый многочисленный класс среди них LINE1 или L1 [1]. Среди L1 ретроэлементов есть несколько эволюционно молодых и, по-видимому, транскрипционно активных семейств, характеризующихся довольно высокой частотой ипсерциопного полиморфизма. Опубликованные данные о распространенности инсерционных полиморфизмов позволяют предполагать, что ретропозиция L1 ретроэлементов происходит и в наше время, внося существенный вклад в формирование вариабельности генома человека современного вида. Считается, что геном каждого 50-ого новорожденного имеет новую копию L1 элемента [2, 3]. Кроме того, известен ряд de novo инсерций L1, ассоциированных с отдельными генетическими заболеваниями человека[4].

Таким образом, изучение роли ретроэлементов, включая L1 повторы, в эволюции и функционировании генома приматов относится к числу наиболее важных проблем современной молекулярной биологии. Опубликованные данные о количестве, распределении в геноме видоспецифических и полиморфных инсерций L1 и их возможном взаимодействии с генами получены либо с использованием биоинформатических подходов и методов анализа, либо на модельных объектах. В связи с этим проведение полногеномного поиска видоспецифических и полиморфных инсерций L1 ретроэлемента и исследование их влияния на экспрессию генов человека является актуальной задачей функциональной геномики. 

Размножение LINE 1 в геноме человека в процессе эволюции

Промотор L1 находится в первых 100-150 нуклеотидах 5 UTR [18]; последовательности, расположенные в первых 670 нуклеотидах задействованы в активации транскрипции [19]. Транскрипция инициируется на внутреннем промоторе в положении -9 н. +4 н. [20]. Известно, что с внутренних промоторов осуществляется транскрипция коротких некодирующих РНК [21], причём в процессе участвует РНК полимераза III. В экспериментах in vitro было показано, что РНК полимераза III способна синтезировать короткие фрагменты L1 последовательности с L1 промотора [22]. Однако, полноразмерный L1 элемент составляет около 6 тыс.п.о. в длину, а РНК полимереза III обычно транскрибирует относительно короткие гены. Кроме того, терминации траснкрипции РНК полимеразой III способствуют полиТ последовательности, а в структуру L1 элемента входит несколько таких Т-богатых последовательностей. Учитывая эти факты, можно предположить, что транскрипция L1 элемента РНК полимеразой III in vivo маловероятна.

Несмотря на тот факт, что L1 элемент не содержит ТАТА-последователыюсть, входящую в промоторную область многих клеточных генов транскрибируемых РНК-полимеразой II, считается, что синтез РНК L1 в клетках осуществляет именно РНК-полимераза II. С другой стороны известно, что промоторы некоторых клеточных генов, транскрибируемых РНК полимеразой II, вместо ТАТА-последовательности содержат инициаторный элемент (Inr) [23]. Элементы, выполняющие аналогичную Inr функцию, были найдены и в составе neLTR-ретротранспозона jockey из генома дрозофилы Drosophila melanogaster. Транскрипцию этого элемента осуществляет РНК-полимераза II. В структуру ретротранспозона_/осеу входят консервативные промоторные элементы - DPE, которые позволяют инициировать транскрипцию ретроэлемента [24, 25]. Возможно, L1 человека, как и jockey дрозофилы, имеют инициаторные элементы, что позволяет РНК-полимеразе II осуществлять транскрипцию этих ретропозонов. Более того, в недавних экспериментах с помощью хроматин-иммунопреципитации бьио обнаружено связывание РНК полимеразы II с 5 UTR L1 [26]. В пользу гипотезы о транскрипции L1 элемента РНК полимеразой II, свидетельствуют данные о посттранскрипционных изменениях L1 РНК, характеризующих транскрипты, синтезированные РНК полимеразой П. Посттранскрипционные модификации РНК L1 будут рассмотрены немного ниже.

Помимо внутреннего промотра 5 UTR L1 содержит последовательность, расположенную между 400 и 600 н.п., способствующую транскрипции вышележащей последовательности геномной ДНК (так называемый антисмысловой промотор или ASP - AntiSense Promotor). При анализе библиотеки кДНК из клеток тератокарциномы человека были изолированы 15 кДНК, содержащих 5 нетранслируемые области LIHs сплайсированные с последовательностями известных генов или некодирующими последовательностями ДНК. Детальный анализ четырёх отобранных химер показал, что уровень их транскрипции в различных линиях клеток составляет от 1% до 500% по сравнению с транскрипцией известных генов, входящих в состав химер. Функции найденных транскриптов пока остаются неизвестными [27]. Автор предполагает, что многие копии L1 содержат антисмысловой промотор и, таким образом, способны влиять на экспрессию близлежащих генов.

В различных исследованиях, направленных на изучение транскрипционных факторов, связывающихся с промотором L1 элемента и изменяющих активность промотора, было идентифицировано несколько белков. Первый идентифицированный белок - вездесущий транскрипционный фактор YY1, связывающий L1 последовательность в участке 113-121 п.о по консенсусу L1 и увеличивающий активность промотора L1 [19, 22, 28-30]. Результаты последующего детального изучения связывания фактора YY1 с мутантным промотором и промотором дикого типа позволили сделать заключение о необходимости YY1 для правильной инициации транскрипции в положении +1 L1 элемента [31]. Ещё два сайта связывания (1472 -1477 и 1572 - 1577 по консенсусу L1) были найдены для транскрипционных факторов семейства SOX, вовлечённых в процесс определения пола эмбриона. В экспериментах по котрансфекции фактор Sox 11 увеличивал уровень экпрессии репортёрного гена, транскрибируемого с промотора L1, примерно на порядок [32]. Более того, для другого транскрипционного фактора RUNX3, также было обнаружено два сайта связывания в последовательности 5 UTR: 183 - 1101 н.п. и 1526 - 1508 н.п. В экспериментах по экспрессии RUNX3 было показано, что связывание транскрипционного фактора с первым сайтом приводит к активации транскрипции и ретротранспозиции L1; а мутации во втором сайте связывания изменяют активность обратного промотора L1 элемента [26,33].Считается, что после транскрипции РНК L1 подвергается модификациям, характерным для транскриптов, синтезированных РНК полимеразой П.

Посттранскрипционные модификации PHKL1.

Первая модификация - кэпирование 5 конца РНК. Преполагается, что часто встречающиеся на 5 конце инсерции L1 элемента несколько гуаниновых остатков являются следствием обратной транскрипции m7G кэпа. Кроме того, бимодальное распределение длин L1 инсерции может свидетельствовать о том, что 5 конец полноразмерных L1 элементов защищен «кэпом» [20, 34].

Вторая модификация - полиаденилирование. Структура области, включающей сигнал поли(А) L1 и полиА-последовательность, по сравнению с аналогичной областью клеточных генов имеет две особенности. Первая особенность заключается в том, что участок между сигналом поли А и полиА "хвостом" L1 содержит А-богатую последовательность, по-видимому, кодируемую самим элементом [35]. Вторая особенность структуры L1 заключается в том, что ретроэлемент не содержит GT-богатую консервативную последовательность в районе 40-60 н.п. после сигнала поли(А), ответственную за эффективное расщепление и полиаденилирование транскрипта [36].

Размножение Alu в геноме человека в процессе эволюции

Alu не содержат последовательностей, кодирующих какие-либо белки. Структура последовательностей, фланкирующих инсерцию Alu, и особенно наличие последовательности, близкой к консенсусу 5 -ТТАААА-3 , позволяет предположить, что интеграция Alu элемента происходит не случайным образом, и в этом процессе задействован фермент, обладающий эндонуклеазной активностью [73]. Считается, что обратную транскрипцию и интеграцию в геном Alu элемента осуществляет ORF2p L1, обладающий апуриновой/апиримидиновой эндонуклеазной активностью. Подтверждение этого предположения было получено в последующих экспериментах in vitro. Было показано, что белок ORF2p L1, хотя и с очень низкой частотой, способен связывать некодирующую его РНК (Alu, различные мРНК) [112], а РНК Alu может быть подвержена обратной транскрипции и интеграции в ДНК при помощи ORF2p [87]. Другая группа исследователей показала, что в культуре клеток при одновременной экспрессии белков L1 происходит ретротранспозиция конструкции, содержащей Alu элемент и репортёрный ген [113]. В тех же экспериментах, авторами была замечена слабая зависимость частоты ретропозиции Alu элемента от присутствия ORPlp L1, необходимого для ретропозиции самого L1. РНК Alu сохраняет способность формировать вторичную структуру, сходную с 7SL РНК, и поэтому РНК Alu способна взаимодействовать с SRP9/14 белками сигнал-распознающего комплекса (Signal Recognishon Particle - SRP). По-видимому, 7SL подобная структура привлекает SRP9/14 белки, и в составе SRP перемещается к месту синтеза белка. Возможно, таким образом происходит предпочтительное перемещение Alu РНК к рибосомам, что способствует концентрации Alu РНК в месте синтеза ORF2p L1 и увеличивает возможность ретропозиции повтора [113].

Большая группа SINE элементов, по-видимому, произошла от тРНК. К этой группе относятся MIR (Mammalian-Wide Interspersed Repeats) элементы, представленные в геноме человека 300 - 400 тыс. копий, что составляет около 2,5 % последовательности генома [1]. Длина этих элементов составляет приблизительно 190-280 п.н. В структуру MIR входит промотор для РНК-полимеразы III, представляющая собой участок промотора тРНК, и центральный домен, которые являются консервативной частью ретропозона. Следующая за ней вариабельная часть может быть представлена 3 концевым фрагментом LINE различных семейств [114]. MIR элементы были транспозиционно активны в геномах древних млекопитающих и размножались, по-видимому, используя транспозиционный аппарат LINE2 [115,116]. 3. Ретроэлементы, содержащие длинные концевые повторы.

Третья группа ретроэлементов - ретроэлементы, содержащие длинные концевые повторы (Long Terminal Repeat - LTR) или LTR элементы. Характерной чертой ретроэлементов этой группы является наличие длинных концевых повторов, фланкирующих ретроэлемент. Группа подразделяется на два класса: LTR -ретротранспозоны и эндогенные ретровирусы (Endogenious RetrVirus - ERV).

LTR ретротранспозоны в геноме человека представлены группой MaLR (Mammalian apparent LTR retrotransposons) в количестве 40000-100000 копий [117, 118]. Наиболее многочисленное семейство MaLR - Transposon-like Human Elements (THE-1) [117, 118]. Полноразмерный представитель этого семейства составляет в длину примерно 2,3 тыс.п.о., а его LTR - 350 п.о. Количество полноразмерных элементов оценивается как 1000 копий, кроме того в геноме присутствует около 30000 одиночных LTR. Большая часть MaLR элементов имеет одну открытую рамку считывания. Продукт ORF древних представителей MaLR сходен с gag белком ретровируса семейства ERV-L, что указывает на их возможное родство [6,104]. По всей видимости, MaLR элементы были транспозиционно активны 80-100 млн. лет назад, о чем свидетельствует их наличие в геномах млекопитающих различных отрядов (грызунов, парнокопытных, приматов и др.) [118].

Больше половины LTR элементов принадлежат к группе эндогенных ретровирусов (ERV). Эндогенные ретровирусы человека (Human Endogenous RetroViruse - HERV) составляют в длину 6-11 т.п.о. и сходны по строению с провирусами экзогенных ретровирусов. Типичный провирус класса HERV содержит длинные концевые повторы (LTR) на 5 и 3 концах, между которыми располагаются гомологи основных ретровирусных генов gag, рої, иногда prt и env; провирус обычно фланкирован 4-6 н.п. последовательностями, представляющими собой дупликацию последовательности сайта интеграции (Рис. 6). corf

Белыми прямоугольниками обозначены ORF, соответствующие ретровирусным генам: gag, prt, pol, env. Для MA, CA, NC, DU, PR, RT, RNH, IN, SU, TM пояснения даны в тексте. Чёрными прямоугольниками обозначен ген corf, кодирующий вспомогательный белок CORF. PBS -участок связывания тРНК затравки; LTR - длинный концевой повтор. Белые треугольники по краям обозначают дупликации сайта мишени (TSD).

«Тело» ретровируса содержит следующие гены: gag (group specific antigens), который кодирует полипептид, включающий белок основного капсида (СА), белок ядерного капсида (NC) и белок матрикса (МА); ген протеазы (PR) -prt; кодирующая последовательность pol детерминирует синтез обратной транскриптазы (RT), РНКазы Н и интегразы (IN); а ген env -белков оболочки ретровирусов - трансмембранных (ТМ) и поверхностных (SU) [119]. Относительно недавно, в составе гена gag провирусов семейства HERV-K была выявлена последовательность, кодирующая домен, обладающий активностью дУТФазы [120]. На 5 конце кодирующей части провируса находится домен, связывающий тРНК затравку в процессе обратной транскрипции (PBS - primer binding site) и сигнал упаковки в капсид - W. Помимо основных белков в геноме HERV-K закодирован регуляторный белок Corf, являющийся структурным и функциональным аналогом вспомогательных белков Rev (HIV-1) и Rex (HTLV), мРНК которого образуется путём двойного сплайсинга одного из типов транскриптов ретровируса [121]. Этот белок связывается с последовательностью RcRE (regulatory Corf responsive element) мРНК, соответствующей U3-R области LTR, и стабилизирует несплайсированные и частично сплайсированные РНК, а также способствует их экспорту из ядра. Гораздо чаще, чем полноразмерные HERV элементы в геноме человека встречаются одиночные LTR, образованные в результате гомологичной рекомбинации между идентичными LTR одного провируса [122].

Длина LTR разных представителей эндогенных ретровирусов варьирует от 300 до 1000 п.о., и его структура подразделяется на три части: U3 (3 уникальный район), R (повторяющийся участок) и U5 (5 уникальный район). В U3 области сосредоточены различные регуляторные элементы: промотор, энхансер и рецепторы разных транскрипционных факторов. В R области расположен сигнал полиаденилирования. В U5 области LTR HERV-K, по-видимому, присутствует последовательность негативного регуляторного элемента [123, 124] (Рис.7).

HERV - эндогенные ретровирусы человека.

Известно очень небольшое количество белков ретроэлементов, экспроприированных организмом «хозяина». Один из наиболее интересных примеров экспрессирующихся в клетках человека вирусных белков - синцитин или белок Env HERV-W. Он принимает участие в образовании синцитиотрофобласта в процессе развития плаценты [136, 137]. Кроме Env HERV-W, в плаценте найдены Env белки ERV-3, которые тоже имеют фыозогенные свойства и способны индуцировать слияние клеточных мембран [138].

Ещё один пример ретровирусного белка - "Corf. Этот белок, кодируемый эндогенным ретровирусом человека семейства HTDV/HERV-K, структурно сходный с вирусными регуляторными белками Rev (вируса HIV) и Rex (вируса HTLV), узнающими ДНК последовательность внутри 3 LTR и регулирующими импорт и экспорт вирусных РНК через ядерную мембрану. Транспорт зависит от типа сплайсирования РНК и опосредован клеточным фактором CRM1 [121]. Возможно, этот белок регулирует также транспорт некоторых клеточных РНК из ядра в цитоплазму. 6. Последовательностиретроэлементов входят в состав регуляториых областей различных генов человека.

Участие ретроэлементов в регуляции экспрессии генов эукариот постулировалось с момента их открытия. Фактически, обнаружение ретроэлементов основывалось на их способности изменять экспрессию генов организма, в котором они находятся. «Контролирующие элементы» кукурузы, отрытые Барбарой МакКлинток в 1946 году [139], были названы так именно в связи с их способностью контролировать активность генов, отвечающих за пигментацию зёрен этого растения. Вскоре после этого, ей удалось доказать, что контролирующие элементы способны перемещаться из одного места генома в другое, и, основываясь на полученных результатах, постулировать существование мобильных элементов генома [140].

За последние 15 лет накопилось много свидетельств об участии ретроэлементов (РЭ) в регуляции отдельных генов позвоночных [109]. Впервые участие РЭ в регуляции генов было показано при изучении Sip гена мыши [141]. Sip высоко гомологичен гену С4, кодирующему четвёртый компонент системы комплимента. После дупликации предковой последовательности этих генов, эндогенный ретровирус (ERV) внедрился в 5 фланкирующую область гена Sip, что привело к изменению функционирования и тканеспецифичности экспрессии этого гена. В противоположность С4, Sip экспрессируется только у самцов, так как его экспрессия зависит от андрогена, сайт связывания которого находится в составе LTR ERV [142,143].

Так как в структуру LTR - элементов и эндогенных ретровирусов входит LTR, содержащий различные регуляторные элементы, то взаимодействие транскрипционных факторов с LTR-элементом, внедрившимся в ген или поблизости от него, может приводить к изменению уровня экспрессии этого гена. Интеграция LINE или SINE элемента в ген, как считается, может приводить к предварительной терминации транскрипции гена или альтернативному сплайсингу соответствующей мРНК. В Таблице 5 приведены примеры генов человека, экспрессия которых регулируется с помощью сигналов ретроэлементов. Так, например, промоторная область гена амилазы человека представлена 3 LTR, входящим в состав целого ретровируса. Ген PLA2L человека представляет собой результат слияния последовательности гена фосфолипазы 2А и фрагмента длиной 251 нуклеотид, происходящего из 5 области эндогенного ретровируса семейства HERV-H. Ретровирусная последовательность находится перед стартом транскрипции и является промоторной областью для этого гена (Таблица 4).

Недавно было показано наличие антисмыслового промотора (ASP - AntiSense Promotor) внутри LIHs. Анализ базы данных экспрессирующихся последовательностей показал, что ASP обусловливает эффективную транскрипцию ряда генов, а также тканеспецифичность некоторых из них. Кроме того, в работе Matlik et al. в 2006 году показано, что ASP L1 служит альтернативным промотори для некоторых генов, например, для гена NOS1, кодирующего нейрональную изоформу синтазы окиси азота. Для этого гена известно 9 альтернативных промоторов, определяющих тканеспецифичность экспрессии изоформы мРНК и эффективность её трансляции. Кроме того, при использовании подхода, комбинирующего анализ баз данных транскрипционных стартов и картирование старта транскрипции методом 5 RACE (Rapid Amplification of 5 cDNA Ends), недавно показано, что ASP LI содержит 2 сайта инициации траскрипции [26,148]. Инициация транскрипции с обоих сайтов может повышать разнообразие и тканеспецифичность альтернативных транскриптов генов и эффективность их трансляции.

Считается, что видоспецифические РЭ в большой степени отличают геномы разных видов организмов. Например, в результате сравнительного анализа геномов

мыши и человека было показано, что РЭ, специфичные для генома мыши составляют 88 % от всех инсерций РЭ в мышином геноме (32,8% последовательности генома), а РЭ, специфичные для генома человека составляют 52,7 % (22,8% последовательности генома человека) [155]. С другой стороны, в результате того же сравнительного анализа было выяснено, что только для 1% белок-кодирующих генов мыши в геноме человека не было выявлено гомологичных генов и только 20% генов мыши не имеют прямого ортолога в геноме человека (то есть не произошли от того же предкового гена). Согласно этим результатам, инсерций РЭ могут представлять собой больше видоспецифических генетических отличий между двумя видами, чем белок-кодирующие гены. Более того, размножение РЭ может приводить к увеличению размеров генома за относительно короткий промежуток времени. Результаты сравнительного анализа геномных последовательностей нескольких видов приматов позволяют сделать вывод о широком варьировании частот ретропозиции РЭ в геномах разных видов. Особенно высокой на протяжении эволюции гоминид была частота ретропозиции РЭ в геноме человека [156]. Последствием относительно высокой скорости ретропозиции РЭ стало увеличение генома приматов на 500 млн.п.о. за последние 50 млн. лет, в частности на 30 млн.п.о. за 6 млн. лет с момента расхождения предковых линий человека и шимпанзе. Возможно, размножение видоспецифических РЭ обусловило какие-то изменения в регуляции некоторых генов, внеся, таким образом, вклад в эволюцию различных таксонов.

SVA. 32 II. Взаимодействие ретроэлементов с геномом человека

Несмотря на тот факт, что L1 ретропозиционный аппарат преимущественно связывает и транспозирует собственную L1 РНК [112], ретропозиционный аппарат LINE участвует в размножении SINE элементов. Участие L1 элементов в ретропозиции Alu было продемонстрировано в экспериментах на клеточных линиях котрансфецированных Alu-содержащим ретропозиционным конструктом и экспрессионным L1-содержащим вектором [113]. В других исследованиях был проведён анализ сайтов интеграции LINE и SINE элементов генома человека. В результате было выявлено структурное сходство сайтов интеграции LINE и SINE, что позволяет предположить, что ретропозиционный аппарат L1 участвовал в размножении SINE элементов (цитируется по [170]).

Процессированные псевдогены (ПП), называемые также ретропсевдогены, представляют собой кДНК копии клеточной РНК, интегрировавшие в геном, и составляют 0,5 % генома. Обычно ПП содержат полиА последовательность и не имеют промоторов и интронов. Источниками ПП могут быть мРНК, кодирующие белки, альтернативно сплайсированные формы РНК, антисмысловые транскрипты, РНК, не кодирующие белки, неполностью сплайсированные гяРНК или мРНК, происходящие от других РЭ [171-175]. ПП являются важным ресурсом возникновения новых генов, называемых ретрогенами, а ретропозиция ПП в интроны генов может привносить новые белок-кодирующие последовательности в уже существующие гены (перемещение экзонов) [109,176]. Предполагается, что, за редким исключением [177], в формировании ПП участвует ретропозиционный аппарат L1. В исследованиях на клеточных линиях, котрансфицированных вектором, содержащим L1 ретропозиционную кассету, и последовательность, кодирующую мРНК одного из клеточных генов, была показана ретропозиция мРНК [178].

Одним из следствий транспозиционной активности L1 является L1-опосредованная трансдукция. Эта особенность L1 заключается в их способности переносить 3 фланкирующие участки геномной ДНК [83, 179, 180]. Вопреки устоявшемуся мнению, что L1 обладает слабым сигналом полиаденилирования (полиА), недавно было показано, что эффективность полиаденилирования, при использовании сигнала полиаденилирования L1 достаточно высока [37]. Однако, известно, что пропуск сигнала полиА и использование дальнего сигнала полиаденилирования с очень низкой частотой происходит даже в случае некоторых генов, содержащих сильный сигнал полиаденилирования. Известно также, что существует некая конкуренция между сигналами полиаденилирования, расположенными на небольшом расстоянии друг за другом, и обладающими одинаковой эффективностью [181]. Возможно, при некоторых услових сигнал полиаденилирования L1 пропускается и для полиаденилирования транскрипта используется следующий сигнал полиА. Синтезированная РНК подвергается обратной транскрипции и встраивается в новое место генома в соответствии с механизмом ретропозиции LINE1. Исследование геномных интеграции LINE1 показали, что 15-20% элементов фланкированы трансдуцированными последовательностями. Анализ новых интеграции L1 в культуре клеток дал схожие результаты [92]. Экстраполяция полученных данных к размеру всего генома позволяет сделать вывод о том, что около 1% нуклеотидной последовательности генома возникло благодаря L1-опосредованной трансдукции.

Так как ретропозиционный аппарат L1 обеспечивает ретропозицию неавтономных РЭ, можно предположить, что 3 трансдукция может быть связана с ретропозицией и других неавтономных РЭ. Недавно был проведён анализ полноразмерных SVA элементов генома человека, в результате которого было подсчитано, что около 53 тыс.п.о. было трансдуцировано в процессе 143 независимых SVA интеграции. Примечательной находкой этого исследования стали 3 SVA-опосредованных дупликации гена семейства АМАС1, кодирующего ацил-малонил-конденсирующий энзим 1, и произошедшие до расхождения предковых линий человека и шимпазе. Авторами был предложен сценарий дупликации АМАС1. В промежутке между 7 и 14 млн. лет назад в 5 фланкирующую область гена АМАС1 (AMAC1L3 на 17 хромосоме) внедрился активный SVA элемент. Образовавшаяся в результате транскрипции ретроэлемента РНК содержала последовательность SVA элемента и 3 фланкирующую область, включающую ген АМАС1. В результате сплайсинга, короткий интрон АМАС1 L3 был выщеплен, а процессированная РНК подверглась обратной трансркипции, и кДНК копия встроилась в новое место генома. В результате, трансдуцироваиная копия гена не содержит интрон. По-видимому, так возникли три копии гена AMAC1L3: АМАС1 на 17 хромосоме, АМАС1Ы на 18 хромосоме и AMAC1L2 на 8 хромосоме, причём в тех же исследованиях было показано, что AMAC1L3, АМАС1, AMAC1L2 транскрибируются в некоторых тканях человека. В процессе эволюции исходный аллель, содержащий ген AMAC1L3 и SVA элемент, исчез из популяции, и сохранился аллель, не содержащий SVA элемент [182]. И

Ретроэлементы, в особенности L1 и Alu, представляют собой хороший субстрат для гомологичной рекомбинации, так как представлены в геноме большим числом близких по нуклеотидной последовательности копий. Гомологичная рекомбинация между двумя ретроэлементами может приводить к делеции, дупликации и даже транслокации участка ДНК. Известны делеции, опосредованные Alu и L1 инсерциями, приведшие к возникновению генетических заболеваний (см. Таблицу 6) [183-185]. Несмотря на то, что описано всего несколько случаев L1-ассоциированных делеций, протяжённые последовательности L1 являются прямой мишенью для гомологичной рекомбинации, и их распространение вредно для клетки. Об этом свидетельствуют результаты недавнего полногеномного анализа распространения протяжённых L1 инсерций, в зависимости от семейства и длины инсерции и скорости рекомбинации. Эти исследования показали, что полноразмерные и протяжённые L1 инсерции, относящиеся к высококопийным семействам L1, располагаются в нерекомбинирующих участках генома или участках с низкой частотой рекомбинации. Этот факт говорит о негативной селекции протяжённых L1 инсерций, как потенциально опасных мишеней для гомологичной рекомбинации [186].

Похожие диссертации на Исследование влияния LINE1 элементов в интронах генов человека на их транскрипцию