Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Расположение и возможная функциональная роль участков связывания транскрипционного фактора CTCF в локусе 19 хромосомы человека Ветчинова Анна Сергеевна

Расположение и возможная функциональная роль участков связывания транскрипционного фактора CTCF в локусе 19 хромосомы человека
<
Расположение и возможная функциональная роль участков связывания транскрипционного фактора CTCF в локусе 19 хромосомы человека Расположение и возможная функциональная роль участков связывания транскрипционного фактора CTCF в локусе 19 хромосомы человека Расположение и возможная функциональная роль участков связывания транскрипционного фактора CTCF в локусе 19 хромосомы человека Расположение и возможная функциональная роль участков связывания транскрипционного фактора CTCF в локусе 19 хромосомы человека Расположение и возможная функциональная роль участков связывания транскрипционного фактора CTCF в локусе 19 хромосомы человека Расположение и возможная функциональная роль участков связывания транскрипционного фактора CTCF в локусе 19 хромосомы человека Расположение и возможная функциональная роль участков связывания транскрипционного фактора CTCF в локусе 19 хромосомы человека Расположение и возможная функциональная роль участков связывания транскрипционного фактора CTCF в локусе 19 хромосомы человека Расположение и возможная функциональная роль участков связывания транскрипционного фактора CTCF в локусе 19 хромосомы человека
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Ветчинова Анна Сергеевна. Расположение и возможная функциональная роль участков связывания транскрипционного фактора CTCF в локусе 19 хромосомы человека : дис. ... канд. биол. наук : 03.00.03 Москва, 2007 105 с. РГБ ОД, 61:07-3/687

Содержание к диссертации

Введение

2. Обзор литературы

2.1. Транскрипционные факторы, содержащие домен цинковых пальцев 9

2.2. CTCF - представитель многофункциональных белков, содержащих мотивы цинковых пальцев 14

2.3 Структурные особенности 14

2.4 Полифункциональность белка CTCF и регуляция его активности 20

2.5 Функции транскрипционного фактора CTCF

2.5.1 Регуляция транскрипции 22

2.5.2 Взаимодействие CTCF с последовательностями инсуляторов 26

2.5.3 Контроль импринтинга генетической информации 32

2.6 Boris 36

2.7 CTCF и развитие болезней 37 2.8 Методы исследования ДНК-белковых взаимодействий 39

2.9 Сдвиг электрофоретической подвижности в полиакриламидном геле 40

2.10 Метод иммунопреципитации хроматина 41

2.11 ДНК-белковые кросс-сшивки (DNA-protein crosslinking assay, DPC) 45

Заключение 46

3. Материалы и методы

3.1 Материалы 48

3.2 Методы 52

3.2.1 Получение белка CTCF в бесклеточной системе 53

3.2.2 Электрофорез белков в SDS-полиакриламидном геле 53

3.2.3 Вестерн блот анализ 53

3.2.4 Получение библиотеки фрагментов ДНК локуса FXYD5-COX7A 19 хромосомы человека 54

3.2.5 Радиоактивное мечение фрагментов ДНК при помощи ПЦР 55

3.2.6 Очистка меченой ДНК 55

3.2.7 Связывание меченых фрагментов ДНК с белками (Electrophoretic mobility shift assay, EMSA) 56

3.2.8 Сдвиг электрофоретической подвижности в полиакриламидном геле 56

3.2.9 Связывание библиотеки коротких фрагментов ДНК с транскрипционным фактором CTCF. Разделение фрагментов в первом направлении 57

3.2.10 Разделение фрагментов во втором направлении 57

3.2.11 Клонирование библиотеки и трансформация клеток Е. coli 58

3.2.12 Приготовление компетентных клеток Е.coli и их трансформация 58 3.2. 13 Ранжирование и анализ библиотеки 58

3.2.14 Выделение плазмид из клонов, содержащих фрагменты, связывающиеся с CTCF 59

3.2.15 Культивирование клеток 59

3.2.16 Иммунопреципитация хроматина 59

3.2.17 ПЦР-амплификация 61

3.2.18 Секвенирование и картирование последовательностей 63

4. Результаты и обсуждение 64

4.1 Получение белка CTCF и его функциональный анализ 64

4.2 Отбор фрагментов, связывающихся с CTCF 67

4.3 Клонирование фрагментов в вектор и трансформация клеток Е. coli 69

4.4 Ранжирование полученных клонов и проверка на наличие вставки 69

4.5 Анализ отобранных фрагментов методом EMSA 70

4.6 Картирование участков связывания CTCF в локусе FXYD5-COX7A1 71

4.7 Проверка способности обнаруженных фрагментов ДНК связываться с белком CTCF методом иммунопреципитации хроматина (ChlP-Chromatin Immunoprecipitation) 71

4.8 Картирование и анализ расположения фрагментов, связывающихся с CTCF, в локусе FXYD5-COX7A1 19 хромосомы человека 73

4.9 Функциональный анализ последовательностей, обладающих инсуляторной активностью.75

Выводы 85

Введение к работе

Стремительный прогресс в молекулярной биологии позволил расшифровать полные последовательности геномов многих организмов позвоночных (Lander et.al., 2001). В частности, была установлена полная первичная структура человеческого генома и определено положение в геноме человека большей части генов. Однако, установить функции генов на основании их первичной структуры возможно далеко не всегда. Для решения этой задачи требуется привлечение знаний из разных областей науки: биоинформатики, генетики, биологии развития, молекулярной биологии, биохимии и т. д. Достижения в определении первичной структуры и картировании геномов привели к появлению нового направления исследований - функциональной геномики, которая включает в себя главным образом идентификацию, локализацию в геноме и функциональный анализ новых генов.

В то же время геном содержит множество нетранскрибируемых
функционально активных элементов, обладающих важнейшими регуляторными
свойствами и имеющими решающее значение для его нормальной работы.
Примерами таких элементов могут служить энхансеры, терминаторы
транскрипции, участки связывания ДНК с регуляторными белками, участки
начала репликации, места интеграции ретроэлементов и т.д. В большинстве
случаев подобные структуры невозможно идентифицировать, имея данные только
о нуклеотидной последовательности участков ДНК, которые их содержат. Одним
из способов их корректной идентификации является соответствующий
экспериментальный, функциональный подход. Картирование

последовательностей с известной функциональной ролью значительно облегчает понимание общей организации и основных принципов регуляции работы генома как целого.

Известно, что многие белки способны специфически связываться с теми или иными участками ДНК. Связывание ядерных белков с регуляторными последовательностями ДНК является главным механизмом регуляции экспрессии у эукариот. Среди белков, вовлечённых в экспрессию эукариотических генов, существуют многофункциональные белки, действующие на разных этапах экспрессии генов: при инициации и элонгации транскрипции, трансляции.

Цели и задачи работы

Целью диссертационной работы является идентификация сайтов связывания транскрипционного фактора CTCF в локусе 19 хромосомы человека, длиной около 1 млн.п.н., находящегося между маркерами FXYD5 и Сох7А1. Этот локус содержит значительное число известных генов и его нуклеотидная последовательность полностью установлена, что позволит, как картировать все отобранные элементы с большой точностью, так и сделать выводы о взаимном расположении белок-связывающих элементов и генов и их возможной функциональной взаимосвязи.

Были поставлены следующие экспериментальные задачи:

выявить с помощью метода сдвига электрофоретической подвижности (EMSA) участки связывания белка CTCF в локусе 19 хромосомы человека между маркёрами FXYD5 и Сох7А1;

клонировать и секвенировать участки ДНК, связывающиеся с белком CTCF;

выявить фрагменты ДНК, связывающиеся с белком CTCF in vivo с использованием метода иммунопреципитации хроматина (ChlP-assay), и сравнить их с выделенными в системе in vitro;

построить карту распределения сайтов связывания CTCF в локусе 19 хромосомы человека между маркёрами FXYD5 и Сох7А1.

2.0бзор литературы. 2.1. Транскрипционные факторы, содержащие домен цинковых

пальцев.

Большинство транскрипционных процессов обусловлено присутствием многофункциональных белков, связывающихся с нуклеиновыми кислотами (Kadonaga and Tjian, 1986). Белок, который после его перемещения в ядро клетки регулирует транскрипцию, специфически взаимодействуя с ДНК, либо стехиометрически взаимодействует с другим белком, который может образовывать со специфичной последовательностью ДНК комплекс "белок-ДНК" называется транскрипционным фактором (Johnson and McKnight, 1989). Специфичность взаимодействия транскрипционных факторов с распознаваемыми ими регуляторными последовательностями генов определяется преимущественно особенностями их ДНК-связывающих доменов. Многие факторы связываются с ДНК в виде димеров (мультимеров), и состав этих комплексов также может влиять на специфичность связывания с ДНК (Kornberg 1999, Kadonaga 2004).

Предлагаемая классификация транскрипционных факторов опирается на совокупность свойств их ДНК-связывающих доменов (Semenza 1994, Патрушев, 2000). В некоторых случаях учитываются и особенности димеризационных доменов транскрипционных факторов. Таким образом, основные подразделы классификации определяются исходя из функциональных и структурных критериев. Предложенная классификация позволяет приписать отдельному транскрипционному фактору десятичный классификационный код, соответствующий его принадлежности к определенной группе транскрипционных факторов. Два белка различных биологических видов при наличии выраженной функциональной или структурной гомологии рассматриваются в рамках предложенной классификации как один и тот же фактор. Однако часто бывает трудно или даже невозможно установить отношения сходства между транскрипционными факторами, происхождение которых сильно различается, например, белками позвоночных и насекомых. Поэтому в большинстве случаев транскрипционные факторы позвоночных, насекомых, высших растений и грибов приписываются в этой классификации к различным группам.

В соответствии с предложенной схемой все транскрипционные факторы по ключевым особенностям ДНК-связывающих доменов разделены на четыре следующих суперкласса:

Суперкласс 1. Факторы, ДНК-связывающий домен которых обогащен положительно заряженными аминокислотными остатками. Суперкласс 2 . Факторы, у которых ДНК-связывающий домен формируется с участием координированных ионов цинка.

Суперкласс 3. Факторы, имеющие ДНК-связывающий мотив типа спираль-поворот-спираль.

Суперкласс 4. Факторы, у которых поверхность, контактирующая с ДНК, представлена в виде сложным образом организованного скэффолда из 0-цепей. Контакты с ДНК в этом случае осуществляются по малой бороздке. Существует также большая группа транскрипционных факторов с неизвестной в настоящее время структурной организацией ДНК-связывающих доменов, которые относятся к условному суперклассу 0.

Эти классы являются общепринятыми в литературных источниках. Они использованы в базе данных TRANSFAC (Wingender et al., 1996). Общее число регуляторных белков составляет несколько тысяч. В настоящем разделе суммирована информация о 996 известных факторах транскрипции, представленная в базе данных TRANSFAC к концу 1999 г. Классификация основана на гомологии первичных и вторичных структур факторов транскрипции.

Цинк-координирующие белки являются наиболее распространенными ДНК-связывающими транскрипционными факторами эукариот (Ladomery and Dellaire, 2002). Множество белков, содержащих цинковые пальцы, взаимодействуют с молекулой ДНК и участвуют в белок-белковых взаимодействиях, которые играют важную роль в развитии организма. К таким белкам относятся: WT1, ZNF74, TFIIIA, YY1, GL1, CTCF и многие другие. Наибольший интерес представляет семейство многофункциональных белков, содержащих цинковые пальцы С2Н2-типа. Один из примеров таких белков, является транскрипционный фактор TFIIIA, выделенный впервые из ооцитов Xenopus laevis, который может связываться и с ДНК и с РНК и участвует в регуляции транскрипции генов 5S-pPHK (Ladomery and Dellaire, 2002). Каждый

ооцит содержит примерно 20000 молекул TFIIIA, которые ассоциированы с 5S рРНК, формируя 7S РНП частицу рибосомы в оогенезе. TFIIIA содержит 9 различающихся по аминокислотной последовательности цинковых пальцев С2Н2-типа и необходим для экспрессии генов 5S рРНК (Theunissen et.al., 1992).

Многофункциональный белок WT1 играет ключевую роль в развитии почек, экспрессируется в гонадах плода и мезотелии (Pritchard-Jones et.al., 1990, Semenza 1994). Белок содержит четыре С-концевых цинковых пальцев С2Н2 типа (рис. 1); цинковые пальцы под номерами 2, 3, 4 близки к трём цинковым пальцам широкоизученного транскрипционного фактора EGR1/Zif268. Подобно EGR1, WT1 узнаёт с помощью цинковых пальцев GC-богатые последовательности (Nardelli et.al., 1991, Hamilton et.al., 1998). На N-конце расположен пролин/глутамин-богатый транс-регуляторный домен и домен, участвующий в димеризации. Известно, что для гена WT1 характерен альтернативный сплайсинг. В результате альтернативного сплайсинга возможна вставка трёх аминокислот (лизина, треонина и серина), следующих непосредственно за а-спиралью третьего цинкового пальца (Ladomery and Dellaire, 2002).

Рисунок 1. Изоформы белка WT1, образующиеся в результате альтернативного сплайсинга гена WT1. В одной из изоформ присутствуют 3 дополнительные аминокислоты, которые отсутствуют в другой изоформе белка WT1 (обозначены чёрным прямоугольником)

У пациентов, страдающих синдромом Фразера (Frasier syndrome), который сопровождается нарушениями развития гонад вплоть до реверсии пола при генотипе XY, изменено соотношение двух изоформ белка WT1 (т. е. имеющих вставку трёх аминокислот KTS и лишённых её). Эти данные были подтверждены в опытах на мышах (Hammes et.al., 2001).

WT1 является многофункциональным белком и может выступать в роли активатора, коактиватора и репрессора транскрипции (Loeb et ah, 2002).

Изоформа, в которой присутствует вставка (WT1(+KTS)), не связывается с последовательностями ДНК (Laity et.al., 2000) и колокализуется с факторами сплайсинга. Например, WT1(+KTS) взаимодействует с фактором сплайсинга U2AF65 (Davies et al, 1998), в то время как, изоформа WTl(-KTS) связывается с ДНК и выступает в качестве транскрипционного фактора.

Ген ZNF74 картирован в непосредственной близости к полиморфному маркеру, делеции которого, ассоциированы с генетической предрасположенностью к шизофрении (Grondin et. al., 1996). Многофункциональный белок ZNF74 состоит из домена, включающего 12 цинковых пальцев, а также из N-концевых участков, названных KRAB А и KRAB В. KRAB - Kruppel associated box - является репрессорным мотивом, который, вероятно, функционирует через взаимодействие с корепрессором КАР-1 (Friedman et.al., 1996). КАР-1 способен связываться с НР1 (который является компонентом комплекса деацетилазы NCoRl) и вызывать транскрипционный сайленсинг, модифицируя гистоны при помощи метилтрансфераз и гистондеацетилаз (Schultz et al, 2001). Следовательно, белки, имеющие в своём составе боксы KRAB, вовлечены в регуляцию транскрипции. Помимо участия ZNF74 в регуляции транскрипции, ZNF74 участвует в процессинге РНК. ZNF74 ассоциирован с ядерным матриксом и может связываться с РНК с последовательностями poly(U) и poly(G) при помощи цинковых пальцев (Grondin et. al., 1996). Показано, что ZNF74 специфично связывается с гиперфосфорилированной формой РНК-полимеразы II и фактором сплайсинга SC35. Гиперфосфорилированная РНК-полимераза II участвует в инициации и элонгации транскрипции, а также в процессинге пре-мРНК за счёт связывания с факторами сплайсинга и факторами отщепления ро1у(А)-хвоста. Таким образом, ZNF74 играет роль не только в репрессии транскрипции, но и, возможно, в процессинге и созревании РНК (Grondin et al, 1997). С гена ZNF74 синтезируютя разные формы мРНК белка ZNF74; это достигается за счёт использования дополнительного промотора и альтернативного сплайсинга. Разные формы ZNF74 различаются по способности репрессировать транскрипцию генов. Например, ZNF74-I, лишённый N-концевого бокса KRAB А, обладает слабой способностью репрессировать транскрипцию

генов. Напротив, ZNF74-II, который содержит целые боксы KRAB А и KRAB В, обладает сильной репрессорной активностью (Ladomery and Dellaire, 2002).

Белки, содержащие мотив (DW)C4, найдены у дрожжей, растений и позвоночных. Выделяют два семейства (DW)C4 белков: «ZIS» и «ТЕТ».

Белок C4SR впервые был найден у Xenopus и отнесен к новым РНК-связывающимся белкам (Ladomery et al., 2000). N-конец C4SR содержит два очень похожих по последовательности цинковых пальца С2-С2 типа (DW)C4, за которыми следуют протяжённая последовательность из кислых аминокислотных остатков и домен, богатый серин-аргининовыми повторами. Аналогом C4SR у человека является белок "ZIS" (Zinc finger protein Involved in Splicing) (Nakano et al., 1998), у мыши - "Zfp265"(Adams et. al., 2000). Между собой они имеют большую степень гомологии. Подобные белки также присутствуют у D. melanogaster и С. elegans (Ladomery and Dellaire, 2002). Недавние исследования показали, что "ZIS" белки вовлечены в сплайсинг. Так, Zfp265 взаимодействует с важными факторами сплайсинга U170K и U2AF35, и иммунопреципитирует с пре-мРНК (пока ещё не выяснено какой продукт она кодирует).

Существуют многофункциональные белки, несущие также (DW)C4, но имеющие другую доменную архитектуру. Белок D. melanogaster Cabeza, экспрессирующийся в большом количестве в мозге во время эмбриогенеза, EWS, транслокация которого ассоциирована с саркомой Эвинга, TLS, принимающий участие в развитии липосаркомы, TAFII68 - белок, ассоциированный с ТВР (TATA-binding protein) входят в состав семейства белков ТЕТ (TLS/FUS, EWS, TAFII68). Как функционируют белки, содержащие мотив (DW)C4, пока не известно. Однако, на примере белков C4SR (Xenopus), TLS и Zfp265 (мышь) было показано, что для связывания с мРНК они используется (DW)C4 мотив (Ladomery et.al., 2000).

YY1 (YY1 - Yin Yang i) многофункциональный белок, содержащий домен цинковых пальцев С2-Н2 типа, может активировать и репрессировать транскрипцию некоторых клеточных и вирусных генов (Park and Atchinson, 1991). Цинковые пальцы YY1 участвуют в связывании с ДНК. YY1 ассоциирован с мРНП-частицами в цитоплазме ооцитах Xenopus. В данном случае YY1 не выступает в роли регулятора транскрипции. Не существует однозначного

объяснения данного феномена; предполагается, что таким образом YY1 участвует в метаболизме транскриптов или хранится для возможного участия в процессах, происходящих в цитоплазме (или в ядре) (Ladomery and Dellaire, 2002).

Транскрипционный фактор TRA-1 С. elegans является представителем семейства белков GLI, в состав которых входят домены, состоящие из 5 цинковых пальцев С2Н2, аминокислотная последовательность которых является высококонсервативной (Ruppert et.al., 1988). У человека обнаружено 4 гена, относящихся к данному семейству белков, которые были обозначены как GUI-4. Впервые GLI1 идентифицирован при злокачественной глиоме, при которой происходит множественная амплификация данного гена. TRA-1 принимает участие в нормальном развитии особей женского пола С. elegans. В дополнении к способности репрессировать транскрипцию, TRA-1 связывается с 3'-нетранслируемой областью мРНК tra-2, принимая участие в транспорте tra-2 из ядра; при этом TRA-1 коэкспортируется вместе с мРНК tra-2. Tra-2 кодирует мембранный белок и также необходим для развития женских особей. Показано, что TRA-1 взаимодействует с цитоплазматическим доменом TRA-2 (Ladomery and Dellaire, 2002).

Таким образом, многие ядерные процессы, включающие компартментализацию ядра, альтернативный сплайсинг, регуляцию транскрипции, определяются набором факторов, в том числе содержащих цинковые пальцы, специфически связывающиеся с регуляторными последовательностями ДНК.

2.2. CTCF - представитель многофункциональных белков, содержащих

мотивы цинковых пальцев. Структурные особенности

Транскрипционный фактор CTCF - высоко консервативный и полифункциональный белок в клетках высших эукариот (Klenova et al, 1997). Впервые этот транскрипционный фактор был обнаружен по способности взаимодействовать с протяжёнными GC-богатыми последовательностями, содержащими многократно повторяющиеся мотивы СССТС, внутри промотора гена с-тус курицы (Klenova et.al., 1993). Ген, кодирующий CTCF человека,

располагается на 16 хромосоме в локусе 16q21-q22.3. Перестройки в этом гене и мутантные формы белка обнаруживаются в различных неопластических образованиях человека, что может свидетельствовать о возможной роли CTCF в качестве онкогенного супрессора.

Транскрипционный фактор CTCF состоит из центрального ДНК-связывающего домена, включающего 11 цинковых пальцев, который фланкирован 267 аминокислотными остатками на N-конце и 150 аминокислотными остатками на С-конце. Общее количество аминокислотных остатков - 727. Молекулярная масса составляет 82 кДа, однако, определение молекулярной массы по результатам SDS-электрофореза приводит к значению молекулярной массы 130 кДа, что обусловлено большим количеством отрицательно заряженных аминокислот в N-концевом и С-концевом доменах. Множественные формы белка CTCF, имеющие молекулярные массы 55, 70, 73, 80 и 91 кДа, обнаружены у кур (Klenovaetal., 1993).

Гомология по аминокислотной последовательности белков CTCF человека, кролика, курицы и лягушки составляет 83-84%, при этом домен, включающий 11 цинковых пальцев, полностью идентичен. Ген CTCF человека по сравнению с геном CTCF курицы содержит дополнительно 5 эволюционно-приобретённых интронов, богатых Alu и LINE повторами; при этом открытая рамка считывания (ORF) не изменяется (Ohlsson et al., 2001). Экзоны Е2-Е9 CTCF млекопитающих кодируют домен, содержащий 11 цинковых пальцев (ZF1-ZF11) и относительно небольшой мотив - KKRRGRP - связывающийся с АТ-богатыми участками ДНК (АТ-крюк). Экзон ЕЮ содержит стоп-кодон (STOP-codon) и З'-UTR. З'-UTR мРНК CTCF относится к редкой группе нетранслируемых последовательностей (). Возможно З'-UTR мРНК играет важную роль в трансляции.

Наиболее протяжённые экзоны Е1 и ЕЮ содержат транс-репрессорные домены. Данные домены представляют собой отдельные белковые модули, которые участвуют в репрессии транскрипции. В ингибировании транскрипции участвует домен, состоящий из цинковых пальцев, а также N- и С-концевые домены (Ohlsson et al., 2001).

Первые 10 цинковых пальцев (ZF1-ZF10) состоят из 30 аминокислотных остатков и относятся к С2Н2-типу. а-спирали цинковых пальцев специфично узнают азотистые основания нуклеотидов в большой бороздке ДНК. Одиннадцатый цинковый палец (ZF11) относится к С2НС-типу, который структурно сходен с цинковыми пальцами белков FOG (Friend of GATA-1), которые взаимодействуют с GATA белками при помощи мотивов цинковых пальцев С2НС-типа (Fox et al., 1999). Кроме домена цинковых пальцев, фактор CTCF содержит три важные последовательности, которые играют значительную роль в функционировании белка: АТ-крюк - участвует в связывании с АТ-богатыми последовательностями ДНК, последовательность, богатая остатками серина, которые подвергаются фосфорилированию, и два повтора пролин-богатых последовательностей - РХХР, характерные для белков, содержащих 8НЗ-домены (обычно присутствуют у белков, которые участвуют в передаче сигналов внутри клетки) (Sparks et al., 1996).

Рисунок 2. Строение транскрипционного фактора CTCF. Показаны полная аминокислотная последовательность CTCF и аминокислотные замены в цинковых пальцах, приводящие к возникновению неопластических образований (Ohlsson et al., 2001).

Вопрос о точной субклеточной локализации CTCF был решён с помощью метода иммунофлуоресцентного окрашивания. Выяснилось, что локализация CTCF зависит от стадии клеточного цикла: в интерфазе CTCF локализуется в

к,

ядрышках, на стадии митоза CTCF ассоциирован с центросомой (особенно на стадиях метафазы и анафазы), при вхождении в телофазу CTCF диссоциирует от центросомы и оказывается локализованным во вновь формирующемся ядре клетки (Zhang et al., 2004). Показано, что CTCF на разных фазах клеточного цикла имеет разные пост-трансляционные модификации, что предполагает разные функции на различных стадиях клеточного цикла. Белок CTCF имеет несколько сайтов в С-концевом домене, по которым он фосфорилируется казеин киназой II (СК2) in vivo (Klenova et al, 2001). Транскрипционный фактор CTCF взаимодействует с поли(АДФрибозил)полимеразой и сам подвергается пост-трансляционно поли(АДФ)-рибозилированик>, что важно для придания белку свойств инсулятора (Yu et al., 2004).

Помимо взаимодействий с определенными сайтами связывания ДНК, CTCF участвует в белок-белковых взаимодействиях с белками YY1, RNP-K и корепрессором SIN3A, взаимодействующим с гистон-деацетилазой (Ohlsson et al, 2001, Ladomery et al, 2002). Одним из первых белков, который был обнаружен по способности связываться с CTCF как in vitro, так и in vivo, является многофункциональный белок YB1, связывающийся с последовательностью под названием Y-box (Chernukhin et al., 2000). Предполагается, что YB1 принимает участие в регуляции транскрипции, репликации и «круговороте» РНК (Ladomery М. and Sommerville J. 1995). Возможно, что YB-1 опосредует эффекты, вызванные облучением УФ, воздействием интерлейкина-2, а также играет роль в репарации генетических повреждений (Izumi et.al., 2001). YB1 способен расплетать ДНК в строго определённых сайтах, а также может взаимодействовать с РНК. Известно также, что YB-1 взаимодействует с рядом транскрипционных факторов. Например, YB-1 может формировать гетеродимеры с Pur-a (Chen and Khalili, 1995), 65 P2 (Mertens et.al, 1998), YY-1 (Li et.al., 1997), PCNA (Ise et.al, 1999), CARP (Zou et.al., 1997), Rel A (Raj et.al., 1996), Т-антигеном (Safak et.al., 1998) и Tat (Ansari et.al., 1999). Комплекс CTCF/YB-1 присутствует в различных тканях. Предполагается, что связывание CTCF с YB-1 модулирует функции транскрипционного фактора (Chernukhin et al., 2000).

2.3. Связывание транскрипционного фактора CTCF с различными последовательностями ДНК.

Своё название транскрипционный фактор CTCF получил благодаря способности связываться с тремя прямыми повторами СССТС, расположенными в районе промотора гена туе курицы (Lobanenkov et al., 1990). Однако, несмотря на явное предпочтение связывания белка с последовательностями богатыми GC-повторами, на сегодняшний день не обнаружен консенсус общий для всех CTCF-связывающих сайтов. Например, сайт связывания CTCF во втором модуле сайленсера гена лизоцима курицы вместо СССТС -мотива содержит АТ-мотив.

Связывание CTCF с различными промоторами, сайленсерами и инсуляторами возможно благодаря использованию различных комбинаций цинковых пальцев (Burcin et al., 1997, Bell et al., 1999b, Fillipova et. al., 1996, Vostrov et al., 1997, Vostrov et.al., 2002). Например, при взаимодействии с промотором гена туе человека задействованы 4-11 цинковые пальцы CTCF, в то время как с F1 элементом сайленсера гена лизоцима кур CTCF связывается при помощи 1-8 пальцев (Burcin et al., 1997).

Исследования экспресии «литических» генов (ICPO, UL54, ICP4 и ДНК-полимеразы) вируса простого герпеса первого типа и структуры гсг участка позволили предположить, что геном вируса имеет гиперацетилированные транскрипционно активные и гипоацетилированые транскрипционно неактивные домены, организация которых, как и в случае геномов эукариот, обусловлена пограничными элементами (Kubat et al., 2004). Анализ первичной нуклеотидной последовательности генома вируса, исследования с помощью метода иммунопреципитации хроматина и репортерной системы люциферазы позволили идентифицировать уникальный короткий повтор, содержащий кластер СССТС-сайтов. Этот участок консервативен для всех альфагерпесвирусов и клеточный белок CTCF связывается с этим участком, расположенным в LAT области генома вируса, in vivo (Amelio et al., 2006). С помощью метода EMSA, иммунопреципитации хроматина, и футпринт-анализа с применением ДНКазы I было показано, что CTCF также связывается in vivo с последовательностью, расположенной между участком начала репликации OriP промотором гена С, генома вируса Эпштейн Барра (Chau et. al., 2006).

На сегодняшний день обнаружено и охарактеризовано множество участков связывания данного белка в геноме эукариот. Многие из обнаруженных сайтов ассоциированы с генами, вовлеченными в процессы метаболизма, нейрогенеза, апоптоза и внутриклеточной сигнализации, что говорит о потенциальной способности фактора CTCF участвовать в регуляции этих процессов. Исследование расположения сайтов связывания CTCF в геноме мыши указывает на существование в геноме около 4000 участков, связывающихся с CTCF и расположенных в интронных и экзонных областях различных генов, в межгенных участках, а так же на границе интронов с экзонами. В пересчете на геном мыши это означает, что в среднем сайты связывания CTCF располагаются на расстоянии 400 т.п.н. один от другого (Mukhopadhyay et al., 2004). Согласно результатам, полученным в нашей лаборатории расстояние между сайтами CTCF в геноме человека на порядок ниже, около 30 т.п.н. Помимо упомянутых выше промоторных областей, сайты CTCF найдены и в других регуляторных элементах генома - сайленсерах и инсуляторах (Arnold et al., 1996; Burcin et al., 1997; Bell et al., 1999b; Saitoh et al., 2000, Klochkov et al., 2006). Кроме того, имеются данные о расположении участков связывания CTCF в повторяющихся элементах генома, таких как длинные концевые повторы LTR (long terminal repeat), а также повторы семейств LINE (long interspersed elements) и SINE (short interspersed elements) (Mukhopadhyay et al., 2004). Интересно, что первым обнаруженным примером микросателлитной ДНК, участвующей в регуляции специфической активности генов, является повтор (gt)22(ga)i5, расположенный в экзоне 2 гена HLA-DRB1. Повтор консервативен как по положению в гене, так и по структуре, при этом имеет высокую гомологию с элементом F1 сайленсера гена лизоцима, способного взаимодействовать с CTCF (Arnold et al., 1996). Повтор способен связываться с CTCF, и за счет этого, так же, как и элемент F1 сайленсера гена лизоцима, подавлять транскрипцию репортерного гена в зависимости от уровня экспрессии CTCF в клетке (Arnold et al., 2000). Таким образом, CTCF взаимодействует с различными регуляторными элементами генома, отличными по нуклеотидному составу, по выполняемым функциям, и по происхождению.

Сайты связывания CTCF Цинковые пальцы

ODDOOOOOO.» h

MYC-FpV с.тсс.атакасавааксаасасвс.сЯсс.іі(1Я!т&Шссс,А

chicken олоосАСТСОсссстсссссосвасастсссссоссоотс

Fl sllen. gacatBtaaataccatagctatccaEtaBaSStctcaatt J

Chicken ^TiiTACATTTATffiTATCGATAGGrcATCTCCAGAGTTAA |_JLjl_J|| Щ111 |_ЛЛ_Г

Fll insul. ATTACaTCCCTCCCCCeCTASffiEECAGCACCOAGCCGCC

chicken TAATOCAOeGAOGOGOCGATCCCCCBTcfflTcBcTcSfcHO

MYC A GTAiSrtATTCgAGCCAGAiiBICAHA!aaaifilfgABdaili!rGR f

human catcattaaggtcgctctccgtctccctcoctcgcccgcc ТПпГ

MYC В OGGCCCEei^eccffltSAgCAOCACAGCTCGGGGO J

human CCCGGGCC^CACCgCCGGCgjCTC^TCjrGTCGAGCCCCC

АЕфіЩЕСААААСТТТОТаССТ

ТССАС^^ЭгтТТвАААСАСООА [J|nj|jLjLU_rUljUl_r

люнит

АЛтсЯіддсЩсоТАОАаАССАТТ J

тщсАІрАСсассосАтсістоотАА TJ[J|J|J]Jlj|j|jljLnr

mmmm тиинт

GOAACOGAGCTACCgcgcEiracAGCATACTCCTATATA j CCTTGCCTCGATOGCGCGCCACc3rC@rA'lSAGGATATAT |ПП_][^ииШ1ПППГ

SfcffllSEeABrA'.'AATAC Г І11ППП

qjjcACCACCgrCATGTTATC |

ССТСАаіЯСАТТТСССТСАТСАТССАААіДДІЯЯЯААТААР I OGACTCACaTAAASEGAGTACTAGGTTTTCTCCCTIATTG ~ Ц П П Я

MYC N CGCGATGATCTCTGCTGCCAGTAgA^fcACACTTACT

MYC w стсассттстсстта

human GAOCaaAAGAOOAAGTCCAC

PLK agagqaagatttaagtaaaagcttcciQSaSSMQc&caa

h'm tctccttctaaattcattttcgaaggacctcctccgcgtt

human OCGCTACTAGAaACGACGGTCATCTCCcterGAATATGA

9 P1M-1 CTTTTCCTTCCCGCCA'

human gaaaagoaaoogcog' '

  1. PIM-1 aGGQAGAGGGG'UgrbBlcda-nAljBBBiacpgAGCGQAQGG mouse CCCCTCTCCCCACAICGGCGCTCCCCCGCCTCGCCICCC

  2. P19ARF QCAGGGCCcficBgBcBcCTCCCCCTGGGCgCCTCTIGCGA

mouse CGTCTCGGGCCCCCGCjEWSSsE^'CCffiCGGAGAACCCT

12 DMD4
mouse

13. DMD7 CTAAATGOACAGACCATGCCJ mouse GATTTACCTOTCTGCTA

"144" sllen. сстоастИсатттссстсатоатссаааа! aaaJEgaotactaggtttt

15. APP TTCCCCGGCGOCfflCcfflCTA^^TGTCTCTCOOGTGCCGA J

human AAOGGCCCGCGCGSBCGATCCCCAgABABAGCCCACGGCT LJLJIjLjIjIJLjLJLJLJIJ

Рисунок 3. Фрагменты ДНК, связывающиеся с CTCF и цинковые пальцы, участвующие в связывании соответствующих им фрагментов в левой панели. Цветом обозначены цинковые пальцы, участвующие в связывании.

2.4 Полифункциональность белка CTCF и регуляция его активности. 2.4.1 Пост-трансляционные модификации.

Значительное разнообразие выполняемых белком CTCF функций предполагает существование сложного многоуровневого процесса регуляции самого фактора CTCF. Регуляция эффектов, опосредуемых белком CTCF, может осуществляться несколькими основными путями: регуляцией экспрессии самого белка, модификацией сайтов связывания CTCF в геноме, например метилирование, что исключает посадку белка в сайтах-мишенях, и посттрансляционными модификациями белка. CTCF - широко экспрессирующийся белок. Нозерн-блот анализ различных клеточных линий и тканей человека выявил присутствие во всех исследованных образцах мРНК CTCF длинной около 4 т.п.н. В клетках почек, печени и легких уровень мРНК CTCF заметно ниже, чем в клетках поджелудочной железы, скелетных мышц и сердца (Filippova et al., 1998). Наиболее хорошо изучена регуляция транскрипции гена CTCF кур. Исследование промоторного участка с 5'-конца кодирующей области гена CTCF и

компьютерный анализ этой последовательности позволили обнаружить несколько десятков известных сайтов связывания транскрипционных факторов и получить первичные данные о возможной регуляции гена (Klenova et al., 1998). Минимальный промотор chCTCF (chiken CTCF), относящийся к промоторам, не содержащим ТАТА-боксы, характеризуется сильной базальной активностью. С 3'-стороны от промотора на расстоянии 60 п.н. расположен инициатор (Inr-элемент) - GCCATTTT-мотив, являющийся высокоаффинным сайтом связывания фактора YY1. Эта часть промотора высококонсервативна среди промоторов гена CTCF курицы, мыши и человека. Мутации коровых нуклеотидов Inr-элемента в экспериментах с транзиентными трансфекциями исключают связывание YY1 с этим участком и значительно снижают транскрипционную активность минимального промотора chCTCF, поэтому консервативный YY1-содержащий Inr-элемент важен для регуляции транскрипции генов CTCF позвоночных (Klenova et al., 1998). Еще один участок промотора гена chCTCF интересен тем, что гомологичен CDE/CHR элементам, встречающимся в промоторах генов PLK, cdc25, cdc2, гена циклина А, активность которых меняется в ходе клеточного цикла. CDE/CHR элементы необходимы для активации промоторов в S и G2 фазе клеточного цикла. Измерение относительной концентрации мРНК chCTCF в клеточных популяциях на стадии логарифмического роста показало возрастание уровня мРНК CTCF в S и G2 фазе клеточного цикла. В процессе дифференцировки в исследованных клеточных линиях транскрипция CTCF подавлена. Так, при дифференцировке исследуемых клеточных линий лейкемии в эритроидные, мегакариоцитарные, гранулоцитарные и моноцитоподобные клетки, уровень, как самого белка, так и мРНК CTCF снижается. Снижение в каждом случае имеет разную кинетику, зависящую от клеточной линии и пути дифференцировки. При этом белок CTCF обнаруживается в разных фосфорилированных формах. Как выяснилось, уровень фосфорилирования белка специфичен для каждой клеточной линии и зависит от пути дифференцировки клеток (Delgado et al., 1999).

Пост-трансляционная модификация белка влияет на его ДНК-связывающую способность. Пост-трансляционное поли(АДФ)-рибозилирование CTCF важно для придания CTCF свойств инсуляторного белка. Обнаружено, что существует связь

между поли(АДФ)-рибозилированием CTCF и способностью выступать в качестве инсуляторного белка. Это было продемонстрировано при использовании 3-аминобензамида - ингибитора поли(АДФ-рибулозо)полимеразной активности. Например, с областью ICR (imprinting control region) генов Igf2/H19 взаимодействует CTCF, подвергнутый поли(АДФ)-рибозилированию (Yu et. al., 2004). Белок CTCF имеет несколько сайтов в С-концевом домене, по которым он фосфорилируется казеин киназой II (СК2) in vivo (Klenova et al, 2001). Коэкспрессия CK2 и CTCF переключает функции CTCF с репрессии транскрипции на активацию транскрипции. Мутантный белок, который не фосфорилируется, имеет преобладающую репрессорную, нежели активаторную, активность. Мутация по 612 серину является критичной для ремеханизма переключения репрессорной/активаторной функций (преобладает активаторная функция) (Klenova et.al., 2001).

2.5 Функции транскрипционного фактора CTCF 2.5.1 Регуляция транскрипции

Многофункциональность транскрипционного фактора CTCF определяется различными комбинациями цинковых пальцев (Fillipova et.al., 1996), ответственных за связывание с сильно различающимися по последовательности участков ДНК. Длина сайтов, с которыми связывается CTCF, составляет примерно 50 п. о (Rasko et.al., 2001). Этот белок вовлекается во многие аспекты регуляции генов: активацию, репрессию транскрипции (Vostrov et al., 2002, Fillipova et al., 1996, Awad et al., 1999), импринтинг генетической информации (Hark et al., 2000, Kanduri et al., 2000), взаимодействие с последовательностями, обладающими инсуляторной активностью (Kuhn and Geyer 2003, Valadez-Graham et al., 2004), инактивацию Х-хромосомы млекопитающих (Chao et al.,) участвует в качестве опухолевого супрессора (Fillipova et al., 1998).

CTCF активирует транскрипцию гена, кодирующего предшественника р-амилоида (АРР - amyloid p-p_rotein precursors). Проксимальная часть промотора гена АРР лишена TATA и ССААТ боксов, но содержит обязательный инициаторный элемент, содержащий точку начала транскрипции. Большое значение в активации транскрипции имеет сайт под названием АРВр, с которым

связывается CTCF для достижения оптимального уровня транскрипционной активности. Для активации транскрипции гена АРР важную роль играет N-концевой домен транскрипционного фактора. Например, при делециях данного домена уровень транскрипции гена сильно уменьшается (Vostrov et.al., 1997, Vostrov et. al., 2002). Высокий уровень экспрессии АРР наблюдается в почках и головном мозге. Амилоидный (3-белок формируется путём протеолитического расщепления АРР. Обнаружено, что при таких заболеваниях как болезнь Альцгеймера и синдром Дауна существует повышенный уровень транскриптов гена АРР. При трисомии 16 хромосомы (уровень экспрессии CTCF повышается, т. к. CTCF кодируется 16 хромосомой) также происходит запасание АРР, что вызывает аналогичные патологии (Litz et.al., 2003)

Помимо активации транскрипции CTCF способен выступать и в качестве репрессора, промотора гена туе и гена лизоцима кур (Baniahmad et.al., 1990а, Kohne et.al., 1993, Fillipova et al, 1996, Lobanenkov et. al., 1990). Однако, механизмы подавления транскрипции фактором CTCF различны. В некоторых случаях сайты связывания CTCF перекрываются с участками связывания активаторов транскрипции, поэтому CTCF снижает активность промотора за счет конкуренции с активаторами за места связывания. Например, в участке Р2 промотора гена с-тус участок связывания CTCF перекрывается с местами посадки активатора транскрипции SP1 (Klenova et al., 1993). Другой механизм связан с активностью репрессорных участков самого белка CTCF, что показано в опытах с применением составных белков, содержащих ДНК-связывающий домен белка Gal4 и разные домены CTCF (Filippova et al., 1996; Lutz et al., 2000; Drueppel et al., 2004). Репрессорные участки, как уже упоминалось, обнаружены в С-концевом домене и домене цинковых пальцев белка. Поиск белков, ответственных за транс-репрессорную активность CTCF, привел к обнаружению двух факторов, образующих комплекс с CTCF. Обнаруженный ко-репрессор SIN3A взаимодействует с репрессорным участком в домене цинковых пальцев CTCF. SIN3A входит в состав большого ко-репрессорного комплекса, содержащего деацетилазы гистонов HDAC1 и HDAC2 (Fleischer et al., 2003), и, возможно, что подавление транскрипции под действием CTCF происходит за счет деацетилирования гистоновых белков. Однако исследования, проводимые на

клетках молочной железы линии MCF-7 человека, не обнаружили ассоциации белка CTCF с HDAC1 и HDAC2 (Dunn et al., 2003). Другим фактором, взаимодействующим с CTCF и участвующим совместно с ним в подавлении транскрипции, является многофункциональный YB-1 (Y-box binding protein 1). Фактор YB-1 так же, как и SIN3A, взаимодействует с ДНК-связывающим доменом CTCF. Ко-экспрессия YB-1 и CTCF значительно усиливает CTCF-зависимую репрессию с-тус (Chernukhin et al., 2000).

Ацетилорование

Рисунок 4. Участие CTCF в репрессии транскрипции (Ohlsson et al., 2001).

(А) В отсутствии тиреоидных и/или ретиноидных гормонов к одному из автономных доменов сайленсинга (расположен в домене содержащем мотивы цинковых пальцев) CTCF присоединяется корепрессор SIN3A, который привлекает гистондеацетилазу - HDAC, тем самым происходит репрессия транскрипции. (Б) При присоединении тиреоидных и/или ретиноидного гормонов происходит активация транскрипции, за счёт привлечения гистонацетилазы.

В некоторых случаях сайты связывания фактора CTCF обнаруживаются в непосредственной близости от сайтов рецепторов тиреоидных гормонов TREs (thyroid hormone response elements). Сайленсер гена лизоцима курицы расположен на расстоянии 2,4 т.п.н. с 5'-области от точки начала транскрипции. Он состоит из двух элементов (F1 и F2), которые совместно репрессируют транскрипцию гена лизоцима. Модуль F2 содержит инвертированные повторы, с которыми связывается либо гомодимер рецепторов тиреоидных гормонов, либо гетеродимер рецепторов тиреоидного и ретиноидного гормонов. Модуль F1 связывает транскрипционный фактор CTCF, который взаимодействует с АТ-богатой последовательностью.

Было показано, что рецептор тиреоидного гормона T3R гена лизоцима кур функционирует совместно с CTCF. Оба фактора обладают общим свойством привлекать гистондеацетилазу (HDAC), приводящую к конденсированию хроматина. Репрессия, обусловленная T3R, представляет результат взаимодействия рецепторов ретиноевой кислоты (RXR) и тиреоидного гормона (TR) с корепрессором (SMRT, N-CoR или Alien). Выяснилось, что корепрессор обладает деацетилазной активностью, видимо, привлекая гистондеацетилазу (HDAC 1,2 и 7). Этим свойством обладает и фактор SIN3A, связывающий CTCF с корепрессором тиреоидного рецептора (Рис.4). Репрессия транскрипции гена лизоцима осуществляется белками, взаимодействующими с данными двумя модулями, при отсутствии лиганда тиреоидного и ретиноидного рецепторов, то есть при отсутствии тиреоидного и/или ретиноидного гормонов. При взаимодействии с лигандом происходит активация транскрипции.

В некоторых случаях сайты связывания тиреоидных ядерных рецепторов и сайтов CTCF (CTS) располагаются рядом. Однако каких-то строгих, консенсусных характеристик для таких участков ни в структуре, ни в положении внутри регулируемых генов не найдено (рис. 5).

CTCF

им +210+245 +260 Участок ДНК гена с-тус

" Сайленсер F1 /F2 гена лизоцима

Г*"

-1—//-СШ 1 CTCF h

231 249 388 427 ЗЛЄМЄНТ 144

Ч::.--'-. CTCF~~~~1 1 1 I

-116 -78 +80 +96 Промотор гена APP

Рисунок 5. Примеры расположения участков связывания рецепторов тиреоидных рецепторов (TR) вблизи сайтов связывания белка CTCF. Цифры обозначают положение относительно первого нуклеотида транскрибируемой последовательности генов.

Каждое деление клетки ассоциировано с уменьшением длины теломер

(Feng et.al., 1995). Теломераза представляет собой рибонуклеопротеидный

комплекс, поддерживающий длину теломер путем добавления гексамерных

повторов TTAGGG на концах хромосом, компенсируя, таким образом, длину

теломер при очередном клеточном делении. (Morin G., 1989). Теломеразная

активность детектируется в период эмбриогенеза, а также в стволовых клетках, в то время как в соматических клетках взрослых млекопитающих ее активность детерминирована. Активация теломеразы наблюдается в 85 % неопластических образований (Kim et.al., 1994). Активность теломеразы регулируется на уровне экспрессии гена теломеразной обратной транскриптазы (hTERT), кодирующего каталитическую субъединицу теломеразы (Pool et al., 2001). Регуляторные элементы, ответственные за регуляцию гена, были обнаружены в коровом промоторе на расстоянии 283 п.н. от точки начала трансляции и 5' участке, фланкирующем промотор (Li et.al., 1999). С помощью методов EMS А и иммунопреципитации хроматина были выявлены два участка связывания транскрипционного фактора CTCF в районе первого и второго экзонов гена hTERT. С помощью РНК интерференции в клеточной линии HeLa было показано, что уменьшение уровня экспрессии CTCF приводило к увеличению транскрипционной активности репортерного гена, содержащего первый экзон гена hTERT. Эти результаты позволяют предположить, что транскрипционный фактор CTCF вовлекается в транскрипционную репрессию гена hTERT. Транскрипция этого гена регулируется также такими транскрипционными факторами, как р53, WT-1, Madl, MZF-2 и другими (Horikawa. and Barrett, 2003). Однако только CTCF может подавлять транскрипцию гена теломеразной обратной транскриптазы независимо от типа клеток (Renaud et.al., 2005).

2.5.2 Взаимодействие CTCF с последовательностями инсуляторов.

Инсуляторы были идентифицированы в различных видах эукариотических организмов, включая позвоночных, Drosophila, Schizosaccharomyces pombe и Saccharomyces cerevisiae (Chung et.al., 1993, Zhong and Krangel, 1997, Bi and Broach, 2001, Nagaya et al, 2001, Defossez and Gilson, 2002). Инсуляторы представляют собой элементы ДНК, предотвращающие активацию промоторов сигналами с неспецифических энхансеров и/или останавливают распространение конденсированного хроматина, то есть выполняют барьерную функцию (Kellum and Scedl, 1992, Kuhn and Geyer, 2003, West et.al., 2002). Есть данные об инсуляторах, у которых обе активности могут быть разъединены (Recillas-Targa et al., 2002). Среди исследованных инсуляторов не обнаруживается четкой

гомологии в последовательностях ДНК. Однако для ряда инсуляторов характерным является то, что большая часть их активности сосредоточена в коротком фрагменте, названном коровым элементом. Как правило, коровый элемент содержит один или несколько HS-сайтов (сайты, гиперчувствительные к действию ДНКазы I) и служит участком связывания специфического белка или группы белков, которые определяют особенности функционирования инсулятора (Cook, 2003). Полученные экспериментальные данные указывают на консервативность действия некоторых инсуляторов: 1) scs, gypsy, Fab-элементы блокируют активацию разных генов под действием разных энхансеров (Bell et д/.,2001); 2) scs-элементы плодовой мушки Drosophila функционально активны в клетках лягушки Xenopus, Р-глобиновый инсулятор курицы - в клетках Drosophila и человека (Dunaway et al, 1997, Walters et al, 1999); 3) инсулятор из гена арилсульфатазы морского ежа Hemicentrotus pulcherrimus функционирует в растительных клетках (Nagaya et al., 2001). Эти данные позволяют предположить, что функциональный консерватизм этих cis-регуляторных элементов широко распространен в эукариотических клетках. Белки, которые взаимодействуют с этими элементами, также высоко консервативны. Например, белок CTCF играет ключевую роль для инсуляторов Р-глобинового локуса цыпленка, мыши, человека (Chung et.al., 1993, Valadez-Graham et.al., 2004), Т-клеточного рецепторного а/б локуса (Farrell et al., 2001, Zhong and Krangel, 1997), локуса инсулинового ростового фактора (Bell and Felsenfeld, 2000, Hark et.al., 2000). Метилирование последовательности ДНК, обладающей инсуляторной активностью, препятствует связыванию белков, ответственных за функционирование инсулятора. В результате инсулятор оказывается инактивированным. Эта стратегия используется в локусе Igf2/H19 (Bell and Felsenfeld, 2000). Большинство инсуляторов лишены внутренней полярности, и они эффективно блокируют дистальные энхансеры в случае, если они располагаются в обратной ориентации по отношению к транскрибируемому гену.

Интересным представляется то, что в отличие от других организмов, у которых с разными инсуляторами взаимодействуют разные инсуляторные белки, CTCF является единственным инсуляторным белком позвоночных (Bell et al., 1999). Это не означает, что CTCF связывается со всеми инсуляторами

позвоночных. По всей видимости, инсуляторы позвоночных делятся на две группы: CTCF-зависимые и CTCF-независимые (Magdinier et al., 2004). В работе Магдинера обнаружены участки ДНК, которые не содержат сайтов связывания с белком CTCF, но характеризуются при этом сильной энхансер-блокирующей активностью. Связывание CTCF с последовательностью инсуляторов обеспечивает функцию блокирования действия энхансера на промотор, а также барьерную функцию (Wei et.al., 2005).

Группой ученых был найден ортолог (dCTCF) транскрипционного фактора позвоночных CTCF у Drosophila, обладающий сходной доменной организацией, сходной активностью репрессировать транскрипцию и взаимодействующий со сходными последовательностями генома Drosophila (Moon et al., 2005). Инсулятор Drosophila Fab-8 (Drosophila Abdominal-B locus) связывает dCTCF (обозначение dCTCF расшифровывается как белок CTCF у Drosophila). Таким образом, было развеяно давно существовавшее мнение, что CTCF экспрессируется в клетках позвоночных животных и не встречается в других группах организмов.

С открытием первых инсуляторов для объяснения их свойств было предложено множество различных, порой даже противоречивых моделей (West et al., 2002, West and Fraser, 2005). Несмотря на разнообразие предложенных моделей, их все можно разбить на две группы - структурные модели и модели локальных взаимодействий (Bell et al., 2000, Zhan et al., 2001, Gaszner and Felsenfeld, 2006). Модели локальных взаимодействий предполагают непосредственное взаимодействие белковых комплексов инсулятора и энхансера (или других регуляторных элементов) (Blackwood and Kadonaga, 1998, Carder et.al, 2005). Согласно данной модели комплекс активаторных белков, собранный на энхансере, движется вдоль ДНК, как бы сканируя ее, до тех пор, пока не достигнет целевого промотора. В данном случае инсулятор выступает в роли физического барьера, препятствующего передвижению этого комплекса (Zhan et. al, 2001, Melnikova et. al., 2002). Используя стабильно реплицируемые минихромосомы, содержащие cHS4 инсуляторы, было показано, что связывание CTCF с последовательностью инсулятора препятствует продвижению РНК полимеразы II (Zhao et. al., 2004). В случае, если энхансер и промотор удалены друг от друга на большом расстоянии, то, по-видимому, белковые комплексы энхансера и

промотора связываются между собой цепью вспомогательных транскрипционных факторов. В ядрах клеток Drosophila были обнаружены вспомогательные факторы активации транскрипции Chip и Nipped-B (Rollins et al, 1999). Эти белковые факторы (HD-факторы), содержащие гомеодомены, способны связываться с нуклеотидными последовательностями в области энхансера. За счет взаимодействия с Chip-белком облегчается связывание других HD-факторов с сайтами, расположенными ближе к промотору. Взаимодействия между HD-белками, опосредованные Chip-белком, приводят к компактизации хроматина, в результате чего энхансер и промотор оказываются сближенными. Белок Chip несет домен, ответственный за связывание с белком Su(Hw) gy/wy-инсулятора. Формирование этого комплекса препятствует взаимодействию между Chip-белком и транскрипционными факторами, содержащими гомеодомены, что в итоге приводит к нарушению взаимодействия энхансера и промотора (West et al., 2002). Структурные модели связывают функционирование инсулятора с изменениями в структуре хроматина (Gerasimova et.al., 2001, Ghosh et al., 2001). Инсуляторные элементы могут влиять на достаточно протяженные участки хроматина. Например, инсуляторы могут определять стартовые точки активности, такие как метилирование ДНК или ацетилирование гистонов, чувствительность к эндонуклеазам, которые в свою очередь влияют на структуру доменов и регуляцию транскрипции в этих доменах (Chen et. al., 2001, Li et. al., 2002). В соответствии с этой моделью критичность положения инсулятора по отношению к энхансеру и промотору можно объяснить тем, что данная асимметрия создается для того, чтобы отделить зону одного домена от другого (Dunaway et. al., 1997). Инсуляторам отводится роль в образовании хроматиновых доменов с независимой генной активностью за счет взаимодействия белков инсуляторов между собой или со специфическими структурами ядра. В результате регуляторные области одного домена не могут взаимодействовать с промоторами другого. Формирование независимых хроматиновых доменов возможно благодаря взаимодействию белков, связывающихся с последовательностями инсуляторов и белками ядерного матрикса (Gaszner and Felsenfeld, 2006). В клетках опухоли легкого человека CTCF был идентифицирован в составе белкового комплекса, взаимодействующего с MAR-элементом (Dunn et. al., 2003). Исследования, проводимые в лаборатории

Фельзенфельда (Felsenfeld), свидетельствуют о формировании комплекса CTCF с нуклеофосмином (B23/numatrin), архитектурным белком ядра. Нуклеофосмин представляет собой молекулярный шаперон, который вовлечён в транспорт рибосомных субчастиц и/или гистонов из цитоплазмы в ядро и ядрышко. С помощью метода иммунопреципитации выявлено, что нуклеофосмин совместно с CTCF взаимодействует с инсуляторами р-глобиновых генов кур (HS4 и 3'HS); предположительно нуклеофосмин играет вспомогательную роль в инсуляторной активности CTCF. Возможно, что благодаря образованию комплекса CTCF с нуклеофосмином, CTCF способен принимать участие в формировании отдельных петлевых доменов хроматина, нарушающих связи энхансеров с промоторами (Yusufzai et ah, 2004).

Инсуляторы и участки связывания с ядерным матриксом играют большую роль в организации генетической информации в пределах клеточного ядра. При сравнении профиля модификации гистонов в аллелях гена с-тус человека и мыши, были идентифицированы эволюционно консервативные пограничные элементы, которые ограничивают ген с-тус от метилированного гетерохроматина. Внутри этого транскрипционного домена обнаружен инсуляторный элемент MINE (c-myc insulator element), который обладает двумя функциональными активностями: блокирует действие энхансера на промотор и защищает трансген от эффекта положения. CTCF обеспечивает энхансер-блокирующую активность MINE элемента. С помощью метода иммунопреципитации хроматина было показано, что CTCF связывается с участком в 40 п.н. внутри элемента MINE и внутри Р2 участка промотора с-тус независимо от уровня транскрипции гена. По-видимому, CTCF функционирует в качестве фактора, обеспечивающего функции инсуляторного элемента, и/или служит белковым кофактором, привлекающим дополнительные факторы, обеспечивающие репрессию гена с-тус (Gombert et al., 2003).

Известно, что CTCF связывается со многими элементами, такими как BEAD (Zhong and Krangel, 1997), RO Xenopus (Robinett et.al., 1997), 3'HS и 5'HS элементами глобинового локуса, что говорит о консерватизме механизмов действия перечисленных инсуляторов. Выделенные 3'HS и 5'HS элементы, пограничные участки (3-глобинового локуса, обладают энхансер-блокирующей

активностью. CTCF обеспечивает индивидуальную регуляторную программу глобиновых генов, распознавая эти инсуляторные элементы (Saitoh et ah, 2000).

У млекопитающих компенсация дозы генов, обусловленная наличием двух Х-хромосом у самок в отличие от одной Х-хромосомы у самцов, осуществляется путём инактивации дополнительной Х-хромосомы самок (Percec et. al., 2002). Изучение данного феномена привело к открытию участка Х-хромосомы, обозначенного Xic (X-inactivation center). На неактивной Х-хромосоме с гена Xist (inactive X-specific transcript), расположенного внутри участка Xic, транскрибируется некодирующая РНК, которая определяет сайленсинг X-хромосомы.

Транскрипция гена Tsix с обеих Х-хромосом приводит к полному подавлению сайленсинга Х-хромосомы путём подавления транскрипции гена Xist. Участок DXPas34, расположенный с З'-конца промотора гена Tsix, гиперметилирован в случае «сильной» аллели. Компьютерный анализ района, расположенного между промотором гена Tsix и DXPasS4, выявил кластер сайтов связывания транскрипционного фактора CTCF. Взаимодействие CTCF с одной из двух Х-хромосом предотвращает транскрипцию гена Xist; различие в метилировании дифференциально метилированного участка (DMR - differentially methylated region) - DXPasS4 - определяет с какой из двух Х-хромосом будет связываться CTCF. Метилирование предотвращает связывание CTCF с DMR.

На основании результатов компьютерного анализа и последующего исследования CTCF на способность связываться с данным кластером in vitro и in vivo построены две модели, определяющие участие CTCF и Tsix в компенсации дозы генов. Первая модель предполагает взаимодействие CTCF со «слабой» аллелью (содержит неметилированный участок), в результате чего транскрибируется ген Tsix, продукт которого является прямым репрессором транскрипции Xist, что приводит к предотвращению сайленсинга Х-хромосомы (рис. 7 А). Вторая модель предполагает, что существует блокирующий комплекс, который связывается с последовательностью, находящейся перед промотором гена Tsix. Связывание блокирующего комплекса становится возможным только в случае, когда DMR метилирован; в случае неметилированного DMR - с ним возможно связывание CTCF, который мешает посадке блокирующего комплекса.

Блокирующий комплекс активирует распространение гетерохроматина на ген Xist так, что его транскрипция прекращается; напротив, ген Tsix транскрибируется (рис. 7 Б).

2.5.3 Контроль импринтинга генетической информации

Геномный импринтинг означает дифференциальную модификацию материнского и отцовского генетического материала, которая опосредует дифференциальную экспрессию родительских аллелей в процессе развития и у взрослых особей (Tilghman, 1999).

Изучение расположенной между генами Н19 и Igf2 области ICR/DMR (imprinting control region/differentially methylated region), обладающей инсуляторной активностью, выявило чувствительность фактора CTCF к метилированию сайтов связывания с ДНК. Метилирование ДНК инсулятора препятствует связыванию белков, ответственных за него, в результате этого инсулятор оказывается инактивированным (Bell and Felsenfeld, 2000, Holmgren et.al., 2001, Engel et.al., 2005). Igf2/H19 локус мыши и человека содержит сайты связывания для белка CTCF (4 и 7 сайтов, соответственно). С материнской хромосомы, включающей неметилированный ICR, транскрибируется ген Н19; с отцовской хромосомы, содержащей метилированный ICR, транскрибируется ген Ig/2 (рис. 7). С помощью РНК-интерференции (Cui et.al., 2001, Fedoriw et.al., 2004) гена CTCF было доказано участие CTCF в поддержании неметилированного состояния (по аналогии с транскрипционным фактором SP1, который связывается с промоторами генов «домашнего хозяйства», находящихся в неметилированном состоянии), - возможно, что при посадке CTCF на ICR происходит блокирование доступа к ICR ДНК-метилтрансфераз (Szabo et.al., 2004). Двумя независимыми группами ученых было показано, что связывание транскрипционного фактора CTCF с последовательностью ДНК зависит от статуса метилирования, но в свою очередь метилирование тоже зависит от связывания с транскрипционным фактором (Pant et.al., 2003, Rand et.al., 2004).

В некоторых случаях может произойти потеря состояния импринтинга за счёт метилирования ICR генов Ig/2/H19, т. е. с материнских и отцовских хромосом будет транскрибироваться один и тот же ген. Такое явление получило название потери импринтинга - loss of imprinting (LOI). Потеря импринтинга генов

Igf2/H19 приводит к возникновению опухоли Вилмса, поражающей клетки почек - наиболее распространённому злокачественному образованию почек, развивающемуся в эмбриональный период. При этом происходит повышенная экспрессия гена инсулинподобного ростового фактора 2 (Ig/2) за счёт транскрипции гена Ig/2 с материнской хромосомы, который в нормальных клетках транскрибируется только с отцовской хромосомы (Kanduri et ah, 2000).

Причиной возникновения опухолей Вилмса могут стать мутации в гене CTCF. Такое состояние называется потерей гетерозиготности - loss of heterozygosity (LOH). Недавние исследования выявили мутации, при которых происходит замена некоторых аминокислот в 3-ем и 7-ом цинковых пальцах, что ведёт к тому, что CTCF не может связаться с ICR генов Igf2/H19, но при этом может взаимодействовать с инсулятором р-глобиновых генов (Cui et al., 2001).

Потеря гетерозиготности, затрагивающая локус 16q22.1, который кодирует CTCF, выявлена в 15% случаев опухолей Вилмса. Такие эпигенетические центры как Kcql ICR, участок гена Dlkl/Gtl2 также содержат сайты связывания транскрпционного фактора CTCF (Paulsen et.al., 2001, Kanduri et.al., 2002).

c-myc

Рисунок 6. Схема распределения MINE и MAR-элементов, определяющих независимые функциональные и структурные границы домена гена с-тус. Инсулятор MINE включает участок, связывающийся с CTCF, и элемент, выполняющий функции барьера (BE).

Хі Ха

Xist

Xist

CTCF

Tsix

> локирую тни

комплекс

Tsix

Рисунок 7. Предложенные механизмы инактивации Х-хромосомы у млекопитающих (объяснение в тексте). Хі - инактивированная Х-хромосома, Ха - активная X-хоомосома. EN - поелполагаемый энхансео (на данный момент не найдені.

A ЛокусІ&2Н19

Ш

Igf2 Инсулятор H19 Энхансер

Б Материнский (неметилированный ) аллель

ш

Ж

Igf2

Инсулятор

HI 9

Энхансер

В Отцовский (метилированный) аллель

W

/

"bfF^

тг

Инсулятор

Энхансер

Рисунок 8. Регуляция инсуляторной активности в локусе Igf2-Y\\9.

а) Расположение генов Igf2 и Н19 относительно инсулятора и энхансера в локусе /g/2-H19;

б) CTCF связывается с неметилированным инсулятором в материнском локусе и предотвращает
действие энхансера на промотор гена Igf2;

в) CTCF не способен связаться с метилированным инсулятором отцовского локуса, в результате чего
энхансер активирует промотор гена Igf2.

2.6. BORIS

При исследовании белков ядерного экстракта клеток семенников мышей на способность к связыванию с сайтами с CTCF, был обнаружен белок, содержащий домен, включающий 11 цинковых пальцев (Loukinov et.al., 2002). По аминокислотной последовательности данный домен полностью идентичен домену из 11 цинковых пальцев транскрипционного фактора CTCF млекопитающих. N- и С- концевые домены в значительной степени различаются. Так как одной из функций CTCF является "прочитывание" аллель-специфических метилированных участков ДНК, то открытый белок был назван BORIS (Brother of the Regulator of Imprinted Sites) (Klenova et.al., 2002).

Показано, что участки ДНК, кодирующие домены цинковых пальцев CTCF млекопитающих и BORIS, сходны (следовательно, взаимодействуют со сходными последовательностями), в то же время N- и С-концевые домены значительно различаются; последовательность, кодирующая домен цинковых пальцев CTCF птиц, отличается количеством экзонов. Возникло предположение, что в определённый момент эволюции млекопитающих произошла дупликация всех экзонов гена CTCF вместе с прилежащим к нему участком. Образовавшиеся после дупликации последовательности переместились в разные хромосомы. Таким образом, CTCF и BORIS являются паралогами. Антагонистические характеристики двух «братьев-близнецов» - CTCF и BORIS - иллюстрируют тот факт, что при гиперэкспрессии CTCF наблюдается блокировка клеточного деления, в то время как гиперэкспрессия BORIS приводит к клеточному росту и в конечном итоге к злокачественной трансформации клетки (Klenova et.al, 2002). Известно также, что при некоторых неопластических заболеваниях CTCF и BORIS экспрессируются совместно.

С помощью FISH метода показано, что ген, кодирующий BORIS, расположен в сегменте 20ql3.2. Интересно, что в гене BORIS отсутствуют последовательности, которые кодирует АТ-крюк, а также главные сайты фосфорилирования по серинам СКII.

BORIS экспрессируется в сперматоцитах семенников, где не экспрессируется CTCF. Поэтому в данных клетках отсутствует конкуренция

между CTCF и BORIS за сайты связывания. При созревании сперматозоидов происходит переключение (при помощи метилирования) на экспрессию CTCF. Возможно, что экспрессия BORIS в сперматоцитах необходима, так как CTCF и BORIS выполняют разные функции.

2.7 CTCF и развитие болезней.

Ген белка CTCF расположен в локусе 16q22. Этот участок 16 хромосомы человека часто оказывается поврежденным в раковых клетках молочной железы, простаты, а также в клетках опухоли Вилмса (Wilms* tumor). Эти наблюдения позволили предположить, что CTCF относится к опухолевым супрессорам (Filippova et al., 1998). Было обнаружено четыре мутации в домене цинковых пальцев CTCF, каждая из которых приводит к избирательной потере ДНК-связывающей способности мутантного белка. Для данных мутаций было показано изменение ДНК-связывающей способности белка по отношению к сайтам-мишеням внутри промоторных/инсуляторных элементов, вовлеченных в клеточную пролиферацию (MYC, PLK, онкоген PIM-1, pl9ARF и Igf2/H19) (Ohlsson et al., 2001). Однако никаких изменений в связывании этими же белками АРР промотора, Р-глобинового инсулятора и сайленсера лизоцима кур не наблюдается. Чаще всего мутации генов белков супрессоров опухолей приводят к полной утрате их функциональной активности, но исследованные мутации CTCF приводят к изменению функции, а не к ее потере. Кроме того обнаружено, что избирательная потеря ДНК-связывающей способности мутантного белка определяется двумя механизмами: генетическими (как обнаруженные мутации цинковых пальцев) и эпигенетическими (как известно CTCF не взаимодействует с метилированными формами ДНК). Таким образом, предполагается, что такие генетически и эпигенетически обусловленные изменения во всем наборе сайтов узнавания CTCF представляют новый механизм изменения функции транскрипционного фактора, приводящий к онкогенности данного фактора (Filippova et al, 2002).

Как было отмечено выше, CTCF способен взаимодействовать с гистонмодифицирующими ферментами (HDAC, HATs), определяющими структуру хроматина. Взаимодействие белка с такими ферментами необходимо

для обеспечения нормального состояния хроматина, и нарушение этих взаимодействий приводит к изменению уровня экспрессии некоторых генов и развитию злокачественных заболеваний (DePinho etal., 1998; Yang etal, 1996).

Рассматривая CTCF в качестве кандидата супрессора опухолевого роста, следует отметить, что CTCF способен репрессировать клеточный рост (Rasko et.al.,2001); локус 16q22 хромосомы человека часто оказывается поврежденным в раковых клетках молочной железы, а так же простаты; функционально значимые и специфические мутации в гене CTCF обнаруживаются при различных неопластических образованиях, включая опухоли легкого (Fillipova et.al., 2002). Процесс формирования неопластических образований включает каскадную поэтапную активацию экспрессии онкогенов на фоне инактивации экспрессии генов клеточных опухолевых супрессоров. Уровень экспрессии CTCF в клетках опухолей легкого достаточно высокий и показано, что снижение уровня эндогенного CTCF в этих клетках приводит к апоптозу раковых клеток (Docquier et.al., 2005). Однако, в клетках незрелых В-лимфоцитов высокая экспрессия этого белка, наоборот, приводит к апоптозу (Qi et.al., 2003). Следует заметить, что клеточное окружение, тканеспецифичность, профиль экспрессии генов в разных клеточных линиях по-разному реализуют генетическую информацию. Так, например, pRB, р21 и WT-1 могут быть как антиапоптозными, так и проапоптозными факторами в зависимости от типа клеточной линии (Tsao et.al., 1999). В клетках рака легкого CTCF специфически связывается с промотором белка Вах. Увеличение уровня экспрессии CTCF приводит к уменьшению уровня Вах в клетке и ингибированию апоптоза, уровень же экспрессии антиапоптозного белка Вс1-2 при этом велик. В репортерной системе было показано, что CTCF способен регулировать экспрессию как с промотора Вах, так и с промотора Вс1-2. Механизм, по которому CTCF в клетках опухоли отменяет апоптоз путем уменьшения экспрессии Вах, не изучен. Вероятно, регуляция апоптоза транскрипционным фактором CTCF осуществляется за счет участия дополнительных транскрипционных факторов (в частности антиапоптозные белки (Bcl-2, Bcl-XL, Mcl-l), и апоптозные белки (Вах, Bak, Bad, Вік, Bid, Вок)) и на посттрансляционном уровне. Изменение уровня эндогенного белка CTCF в опухолевых клетках может служить терапевтической мишенью для лечения рака

легких: уменьшение уровня CTCF в клетке будет приводить к апоптозу раковых клеток, без губительного эффекта на нормальные клетки легкого (Docquier et.al., 2005).

Помимо повреждений самого белка или его гена, к развитию злокачественного заболевания может привести нарушение статуса метилирования некоторых участков, связывающихся с фактором CTCF. Известно, что модуляция активности хроматин-модифицирующих ферментов, способных изменить структуру хроматина, играет одну из основных ролей в развитии рака. Как было показано, аномальное метилирование сайтов CTCF в ICR-участке локуса Igf2/H19 обнаруживается при некоторых видах неопластических заболеваний, включая колоректальный рак, опухоль Вилмса и рак крови (Nakagava et al., 2001; Cui et al., 2001; Takai et al., 2001). Аномальное метилирование нескольких других сайтов-мишеней CTCF обнаружено и при врожденном синдроме миотонической дистрофии (Filippova et al., 2001). По всей видимости, в норме CTCF и BORIS, взаимодействуя с хроматин-модифицирующими ферментами, поддерживают необходимую конформацию хроматина. Любые нарушения, приводящие к повреждению такой структуры, способны стать причиной злокачественной трансформации (Dunn and Davie, 2003).

Методы исследования ДНК-белковых взаимодействий

Постгеномная эра дает в руки ученых мощные средства для проведения полногеномных исследований индивидуальных особенностей транскрипционной регуляции. Широкомасштабные биоинформационные подходы сильны своей обобщающей способностью. Однако прямой поиск сайтов связывания транскрипционных факторов в виде усредненных консенсусных последовательностей приводит к большому количеству ложнопозитивных результатов. В настоящее время самыми распространёнными методами исследования регуляции транскрипции являются методы ДНК-белковых сшивок, сдвиг электрофоретической подвижности в геле (Electrophoretic Mobility Shift Assay, EMSA), иммунопреципитации хроматина (ChIP, Chromatin Immunoprecipitation) и методы футпринтинга in vivo и in vitro.

Сдвиг электрофоретической подвижности в полиакриламидном геле (Electrophoretic mobility shift assay, EMSA)

Метод EMSA (gel retardation, gel shift) является самым простым и распространённым методом исследования ДНК-белковых взаимодействий in vitro. В его основе лежит изменение скорости миграции комплекса ДНК-белок в неденатурирующем ПААГ или агарозе, по сравнению со свободной молекулой ДНК. Практически одновременно эта методика была предложена двумя группами исследователей из США (Fried М. and Crothers D.M. (1981), Garner M. and Revzin A. (1981)). Так как положение в геле полосы, соответствующей ДНК-белковому комплексу, «смещено» (shifted или retarded) относительно положения полосы свободной ДНК, можно визуально детектировать сдвиг подвижности в геле. Для визуализации ДНК-белковых комплексов использовали как окрашивание ДНК бромидом этидия, так и радиоактивно меченую ДНК.

Методом EMSA, могут быть идентифицированы не только сильные ДНК-белковые взаимодействия (константа ассоциации ~10 М'), но и относительно слабые с константой ассоциации менее 109 М'1. Этот нетривиальный факт (время жизни "слабых" комплексов не превышает долей секунды при нескольких часах длительности электрофореза) был объяснен в теоретических работах (Сапп 1998) стабилизирующим влиянием ячеек полиакриламидного геля (cage effect).

Метод EMSA применим не только для исследования комплексов ДНК с очищенным белком, но и для идентификации ДНК-связывающих белков в сложных смесях, состоящих из тысяч белков, таких как солевые экстракты клеточных ядер (Dignam et. ah, 1983) или целых клеток (Manley., et. ah 1983). Специфичность связывания ДНК с белком можно проверить методом конкурентного EMSA, добавляя в реакцию связывания избыток немеченого фрагмента ДНК, содержащего участок связывания белка, либо не содержащий такового. Если связывание ДНК с белком специфично для данной последовательности, то в первом случае полоса меченой ДНК, соответствующая ДНК-белковому комплексу, будет ослабляться или исчезнет за счет конкуренции; во втором случае изменений происходить не будет (Chodosh et.ah, 1986).

РОССИЙСКАЯ

ГОСУДАРСТВЕННАЯ

БИБЛИОТЕКА

При использовании для EMSA белковых экстрактов конкретный белок, образующий комплекс с ДНК, в общем случае неизвестен. Если же имеются основания предполагать участие в этом комплексе какого-либо белка, это предположение можно проверить при помощи дополнительного сдвига электрофоретической подвижности (supershift assay) (Kristie and Roizman, 1986). Для этого при образовании комплекса в реакционную смесь добавляют антитела к соответствующему белку, которые, связываясь с ДНК-белковым комплексом, дополнительно уменьшают его подвижность в геле (supershift) (Papavassiliou and Silverstein, 1990). Метод дополнительного сдвига электрофоретической подвижности может быть также использован для выявления субъединицы сложного белка, которая предположительно отвечает за взаимодействие белка с ДНК. Но иногда при добавлении антител исходный ДНК-белковый комплекс не образуется, из чего делается вывод, что антитело к определённой субъединице мешает взаимодействию белка с ДНК, а данная субъединица отвечает за образование комплекса ДНК-белок.

Достоинствами метода EMSA являются, в первую очередь, его простота, высокая чувствительность и избирательность - с его помощью легко выявляется присутствие белка, связывающегося с определенной последовательностью ДНК, даже если он присутствует в количестве нескольких пикограмм в смеси из сотен белков. Основной недостаток этого метода - несоответствие условий связывания ДНК и белков таковым in vivo. Действительно, в ядре клетки ДНК находится в составе хроматина, что может значительно изменить ее доступность для ДНК-связывающих белков, в частности для факторов транскрипции (Morse 2003). Метод иммунопреципитации хроматина- СЫР

Метод иммунопреципитации хроматина (chromatin immuniprecipitation, СЫР) является эффективным экспериментальным подходом, позволяющим идентифицировать участки генома, ассоциированные со специфическими белками. Метод основан на фиксации ДНК-белковых комплексов в составе хроматина и последующей иммунопреципитации комплексов, содержащих сайты связывания искомого белка, антителами к этому белку (Orlando 2000, Weinmann et.al., 2001) (рис. 9). На сегодняшний день различают два основных способа выполнения ChlP. Одна методика предполагает использование хроматина,

фиксированного с помощью формальдегида или ультрафиолетового облучения ядер или целых клеток, и его последующую фрагментацию с помощью ультразвуковой обработки (Orlando 2000). Этот вариант получил название ХСЫР. Другой подход, NChIP, основывается на использовании хроматина, полученного в результате нуклеазной обработки клеточных ядер (O'Neil et.al., 2003). XChIP в основном используется при изучении негистоновых белков, a NChIP - белков, с высокой аффинностью взаимодействующих с ДНК, подобно гистонам. В дальнейшем полученный одним из вышеописанных способов материал подвергается очистке с помощью иммунопреципитации антителами к исследуемому белку (Kuo and Allis, 1999, Das et.al., 2004). В случае использования формальдегидных сшивок, их далее разрушают, и преципитированная ДНК анализируется на присутствие специфических геномных последовательностей (van Steensel and Henikoff, 2003).

При использовании УФ сшивок их последующее устранение невозможно без повреждения ДНК. Тем не менее, именно с использованием таких сшивок, как правило, изучается кинетика ДНК-белковых взаимодействий, т.к. использование УФ гарантирует очень быструю сшивку белков, непосредственно взаимодействующих с ДНК (Celis et.al., 1986). С помощью формальдегидного сшивания можно исследовать и белки, связывающиеся с ДНК опосредованно. Однако его использование не дает гарантии того, что сшивание исследуемого белка происходит именно с ДНК, а не с нуклеосомой.

Метод иммунопреципитации хроматина применяется также при изучении регуляторных элементов генома, располагающихся на протяженных расстояниях друг от друга, таких как энхансеры, которые связываются с промотором с образованием так называемой «петли». Связывание происходит через ряд регуляторных белков, связанных с этими участками ДНК, которые в свою очередь контактируют между собой. Группой ученых из Нидерландов с помощью метода СЫР было доказано существование такой петли в ходе транскрипции in vivo, на примере взаимодействия промотора гена Р-глобина с удаленной от него регуляторной областью (Tolhuis et.al., 2002). К качеству антител в методе иммунопреципитации предъявляются высокие требования, так как от этого напрямую зависит качество выделения ДНК-белковых комплексов (Das et.al.,

2004). Из возможных вариантов иммунопреципитации хроматина ChIP-on-chip метод, основанный на использовании микрочипов, обеспечивает возможность проведения полногеномного анализа (Buck and Lieb, 2004).

СЫР представляет собой достаточно мощное средство изучения структуры и функционирования генома. Благодаря его применению для анализа взаимодействия ядерных белков с ДНК был отмечен существенный прогресс в понимании регуляции генов. Важный прорыв был сделан в определении последовательности событий, происходящих по завершении митоза и приводящих к восстановлению транскрипционной компетентности хроматина в результате действия комплексов хроматинового ремоделинга. Существенные результаты были достигнуты в изучении механизмов клеточной репликации и установлении иерархии событий с участием различных регуляторных факторов при гормон-индуцированной транскрипционной активации. С помощью СЫР была описана динамика привлечения ТАТА-связывающего фактора ТВР и других базальных факторов инициации транскрипции к различным промоторам .

Клетки HeLa

Образование кросс-сшивок

I

Фрагментация хроматина

Белки хроматина сшиты с ДНК

I

'*<*»«*>'

Добавление антител

Фрагменты геномной ДНК сшитые с белками

Связывание и иммунопреципитация

Осаждение комплексов ДНК-белок

Input chromatin

Удаление кросс-сшивок

Удаление кросс-сшивок

Выделение ДНК

Выделение ДНК

ПЦР анализ со специфическими праймерами

Рисунок 9.Схема метода иммунопреципитации хроматина

ДНК-белковые кросс-сшивки (DNA-protein crosslinking assay, DPC).

Дополнительную по сравнению с EMSA информацию о связанном с ДНК белке (белках) и структуре ДНК-белковых комплексов позволяет получить метод ДНК-белковых сшивок под действием ультрафиолетового облучения. Облучение ультрафиолетовыми лучами создает ковалентные связи между активными группами ДНК и аминокислотами белка, такими как тимин, цистеин, серии, метионин, лизин, аргинин, гистидин, триптофан, фенилаланин и тирозин. Метод DPC основан на том, что образовавшиеся комплексы устойчивы в денатурирующих условиях и могут быть разделены в денатурирующем геле.

Метод был разработан независимо друг от друга двумя группами ученых из Москвы (Nikolaev et al., 1987) и Кембриджа (Chodosh et.al., 1986) на примере белка, специфически связывающегося с основным поздним промотором аденовируса 2 (Nikolaev et.al., 1988).

Метод ультрафиолетовой пришивки позволяет прямо исследовать структуру ДНК-белкового комплекса в том случае, если он состоит из нескольких белков, связанных с одним и тем же фрагментом ДНК. Для этого ДНК-белковые комплексы разделяют в первом направлении в неденатурирующем геле в условиях EMSA. Гель облучают ультафиолетом для образования ДНК-белковых сшивок, обрабатывают ДНК-азой для удаления большей части ДНК, и разделяют во втором направлении в SDS-содержащем геле. При этом меченые за счет остаточной ДНК белки выявляются в виде пятен. При данном подходе в ковалентно связанном комплексе находится одна молекула белка, связанная с одной молекулой ДНК, так как малая эффективность пришивки УФ-излучением делает крайне маловероятной возможность сшивания с одним и тем же фрагментом ДНК двух и более белков. Таким образом, число пятен на геле соответствует числу белков, связавшихся с фрагментом ДНК, а их подвижность в геле соответствует их молекулярным массам (Nikolaev et.al., 1988).

На сегодняшний день нельзя не подчеркнуть особый вклад биоинформатики в изучение геномов млекопитающих. Если простые по своему строению организмы позволяют использовать чисто эмпирические подходы для получения достаточно достоверной информации о регуляторных участках геномов, то для таких сложных геномов, как, например, геном человека, такие

исследования являются чересчур трудоемкими и дорогостоящими. Главной проблемой идентификации сайтов связывания транскрипционных факторов на уровне целого генома эукариотического организма с помощью различных компьютерных алгоритмов является довольно большое количество ложноположительных результатов. Такие обнаруживаемые "ложные" сайты, способные связываться с регуляторными факторами, in vivo оказываются изолированными и не участвуют в регуляции. Методики полногеномного исследования сайтов связывания транскрипционных факторов in vivo, ChIP-on-chip с применением микрочипов, очень дорогостоящи и трудоемки. Поэтому на данный момент все еще не представляется возможным выявить полный набор регуляторных взаимодействий для эукариотических организмов. Разработка новых методов, способных решить эти проблемы, безусловно, должна продолжаться.

Заключение

Фактор CTCF активно изучается на протяжении последних пятнадцати лет, и уже удалось достаточно глубоко продвинуться в изучении его свойств и функций. Транскрипционный фактор CTCF выполняет важные функции и вовлечен во множество клеточных процессов. В последние годы стало много известно о роли CTCF в качестве инсуляторного белка позвоночных. Очевидно, что белок необходим для проявления энхансер-блокирующей активности этих элементов генома. Большое внимание уделяется значению фактора в контроле импринтинга генетической информации. Тем не менее, по-прежнему остаются неизученными вопросы, касающиеся белков, взаимодействующих с CTCF, регуляции активности самого белка, роли белка в онкогенезе, расположении участков связывания CTCF в геноме и их влиянии на экспрессию окружающих генов. Участки связывания транскрипционного фактора CTCF составляют всего 50 п.н., по своему нуклеотидному составу очень разнобразны, такая множественная специфичность сайтов связывания обусловлена участием разных комбинаций 11 цинковых «пальцев» белка, а так же N- и С-концевыми доменами. Все изученные на сегодняшний день инсуляторы млекопитающих взаимодействуют с консервативным транскрипционным фактором CTCF. Роль

инсуляторов состоит в разграничении доменов активно транскрибирующихся генов и областей конденсированного хроматина. В последние годы было обнаружено множество инсуляторов в тех участках, где они могли бы блокировать влияние регуляторных элементов одного домена на экспрессию генов другого. Однако идентифицировать сайты связывания CTCF с последовательностями, обладающими инсуляторной активностью, на уровне целого генома представляет собой очень масштабную задачу. С помощью метода ДНК-microarray из клонов клеток печени мыши, полученных при гибридизации отобранных с помощью метода иммунопреципитации хроматина (ChIP-on-chip) было идентифицировано более 200 сайтов связывания CTCF в геноме мыши, включая экзоны, интроны и межгенные участки. Все эти последовательности неметилированы, что свидетельствует о роли исследуемого белка в поддержании определенного эпигенетического статуса. Среди идентифицированных сайтов связывания обнаружены потенциальные инсуляторы, но, несмотря на такой объем работы и полученные результаты, авторы считают, что ими открыто только порядка 5-7 % всех потенциальных участков связывания (Mukhopadhyay et.al., 2004).

Для того чтобы понять, каким образом функционирует геном, как регулируется активность генов, какую роль в этом принимают некодирующие, регуляторные последовательности и как они связаны друг с другом, необходимо иметь информацию о расположении этих элементов в геноме. Для достижения этой цели представляется удобным исследовать достаточно протяженные участки генома, содержащие различного рода регуляторные элементы, такие как энхансеры, сайленсеры, S/MAR (scaffold/matrix attachment геоіпз)-злементьі, инсуляторы, в том числе, участки связывания CTCF. В связи с тем, что фактор CTCF выполняет множество описанных выше функций, изучение мест посадки белка в геноме представляет несомненный интерес и требует особого внимания. В нашей работе мы ставим себе задачу идентифицировать все участки связывания транскрипционного фактора CTCF в локусе 19 хромосомы человека длиной 1 млн.п.н., и, исходя из данных об исследованных в данном локусе cis-регуляторных элементах и идентифицированных генах, построить функциональную карту локуса.

3 МАТЕРИАЛЫ И МЕТОДЫ 3.1 МАТЕРИАЛЫ Реактивы

Агароза (LE, Molecular Biology Grade) - Promega (США).

Дезоксинуклеозидтрифосфаты (2,5 мМ) - Boehringher Mannheim (ФРГ).

Глицерин - Sigma (США).

Бромистый этидий (10 мг/мл) - GibcoBRL (США).

Ксиленцианол, бромфеноловый синий, ЭДТА - Pharmacia (Швеция).

Изопропанол, этанол, ацетат аммония, ацетат натрия, хлорид натрия, едкий натр,

цитрат натрия, поливинилпирролидон, борная кислота, хлорид калия фенол,

хлороформ - Реахим (Россия).

Акриламид, М,>Г-метилен-бисакриламид, персульфат аммония, хлорид магния,

хлорид кальция, 2-меркаптоэтанол, тритон Х-100, ЭДТА, глицерин, бычий

сывороточный альбумин, трис-оксиметиламинометан, додецилсульфат натрия -

фирмы "Merck" (Германия).

Дезоксирибонуклеозид-5'-трифосфаты- фирмы "Pharmacia" (Швеция).

MgCl2 (25 mM) - Promega (США).

Протеин А сефароза - Santa Cruz Biotechnology, Inc (США).

ДНК спермы лосося (Salmon Sperm DNA) - Research Genetics (США).

Pellet Paint Co-Precipitant - Novagen (Великобритания).

Nonidet P-40 Helicon (США)

Tween 20 Serva (США)

Ампициллина натриевая соль - Биосинтез (Россия).

Ферменты

Taq ДНК полимераза (5 ед/мкл) - Promega (США).

Т4 ДНК лигаза (5 ед/мкл) - Promega (США).

- MBI Fermentas (Литва).

- Serva (США).

Фрагмент Кленова ДНК-полимеразы I Escherichia coli

Лизоцим марки В - Реахим (Россия).

РНКаза А из поджелудочной железы быка (10 мг/мл) -

Протеиназа К - Promega (США).

Трипсин - Calbiochem (США).

Буферные растворы

10х буферы для эндонуклеаз рестрикции - Boehringher Mannheim (ФРГ).

10х буфер для Т4 ДНК лигазы, с ЮтМ АТФ - Promega (США).

10х буфер для ПЦР (без MgCl2>) - Gibco-BRL (США).

Буфер для нанесения проб для гель-электрофореза: 0,025% бромфеноловый синий,

0,025% ксиленцианол, 30% глицерин на буфере ТАЕ.

Буфер для нанесения проб для электрофореза по Лэммли: Трис-HCl рН 6,8, 5 % р -

меркаптоэтанола, 10 % глицерина, 2 % SDS, 0.5 % бромфенолового синего.

Буфер ТЕ: Трис-HCl рН 8,5, 1 мМ ЭДТА рН 8.0.

Буфер ТАЕ: 40мМ Трис-ацетат, рН 8,2, 20 мМ уксусная кислота, 1 мМ ЭДТА, рН

8,0).

Буфер ТВЕ 0,5х: 45 мМ трис-борат, 1 мМ ЭДТА, рН 8,0.

Буфер В (12 мМ HEPES-KOH, рН 7,9, 12% глицерин, 60 мМ КС1, 0,3 мМ EDTA,

0,6 мМ дитиотрейтол).

Буфер для элюции фрагментов ДНК из полиакриламидного геля: 0,5 М ацетат

аммония, 1% SDS, 1 мМ ЭДТА.

Трис-глициновый буфер: 25 гаМ Tris, 192 mM glycine, 0,1% SDS рН=8,3.

Lysis buffer (для выделения геномной ДНК): ЮтМ Tris НС1 рН 8.5, 5тМ EDTA,

0,2% SDS, 0,2М NaCl, 0,1 mg/ml Proteinase К).

PBS - фосфатный солевой буфер, ICN (США).

Лизирующий буфер: 50 мМ Трис-HCl рН 8,0,1% SDS, 10 мМ ЭДТА.

IP буфер: 16,7 мМ Трис-HCl, рН 8,0, 16,7 мМ NaCl, 1,2 мМ ЭДТА, 1% Тритон X-

100,0,01% SDS.

Буфер элюции: 1% SDS, 0,1 М NaHC03.

Растворы, используемые в иммунопреципитации хроматина:

  1. 0,1% SDS; 1% Тритон Х-100; 2мМ ЭДТА; 20 мМ Трис-HCl, рН 8,1; 150 MMNaCl.

  2. 0,1% SDS; 1% Тритон Х-100; 2мМ ЭДТА; 20 мМ Трис-HCl, рН 8,1; 500

мМ NaCl.

  1. 0,25 M LiCl; 1% NP-40; 1% дезоксихолат натрия; 1 мМ ЭДТА; 10 мМ Трис-НС1,рН8Д.

  2. Буфер ТЕ, (ЮмМ Трис-HCl рН 8,0, 1мМ ЭДТА) Фирменные наборы

WizardPlus Minipreps DNA Purification System - Promega (США). WizardPlus Midipreps DNA Purification System - Promega (США). TNT Quick coupled transcription/translation systems-Promega (США). pGEM -T and pGEM-T Easy Vector Systems-Promega (США). Qiaex II Gel Extraction Kit - QIAGEN (ФРГ). QIAquick PCR purification kit - QIAGEN (ФРГ). Diatom TM DNA Elution - Isogene Ltd (Россия).

Маркеры молекулярных весов ДНК

100 п.н.: GeneRuler ЮОЬр DNA Ladder Plus - Fermentas (США).

1 т.п.н.: 1Kb DNA Ladder - GibcoBRL (США).

Белковый маркер

4 - 250 кДа SeeBlue Pre-Stained Standard - Invitrogen (США)

Антитела

Rabbit anti-human CTCF - Usbiological (США).

Rabbit policlonal to CTCF - ChIP grade (at>10571) - Abeam, (США).

CTCF (N-17):sc-5916 - Santa Cruz Biotechnology (США).

Donkey Anti-goat IgG, HPR - Promega (США)

Питательные среды Среда LB: Юг Bacto-Tryptone, 5 г Bacto-yeast extract, 5r NaCl на 1 литр стерильной дистиллированной воды.

Среда LB с ампициллином: к среде LB добавляли раствор ампициллина до конечной концентрации 100 мкг/мл.

Агаризованная среда LB с ампициллином: к 1 л среды LB добавляли 15 г агара и автоклавировали, после остывания до 50С добавляли раствор ампициллина до конечной концентрации 100 мкг/мл.

Сухие смеси для приготовления культуральных сред (DMEM, DMEM:F12 НАМ, RPMI-1640) - GibcoBRL (США).

Эмбриональная сыворотка теленка - FCS, GibcoBRL (США).

Оборудование

Автоматические микропипетки - Gilson (Франция).

Автоматический С02 инкубатор IR 1500 - Flow Laboratories (США).

Источники питания Power Supply Model 500, Power Рас- BioRad Laboratories

(США).

Электрофорезный прибор Mini Protein III Bio-Rad Laboratories (США)

Прибор для - Trans-BlotR SD Semi-Dry Transfer Gel Bio-Rad Laboratories (США)

Ламинар - Laminar Flow, Babcock-BSH (ФРГ).

Ламинар Gelaire - Flow Laboratories (США).

Люминометр биологический ЛБ-4АИ - Климби (Россия).

Микроцентрифуга 5415, MiniSpin Plus -Eppendorf (ФРГ).

Одноразовая стерильная пластиковая посуда - Corning (США)

Приборы (камеры) для горизонтального электрофореза - Pharmacia Biotech

(Швеция).

ПЦР-амплификатор РТС-150 - MJ Research, Inc. (США).

Термостатируемый шейкер CertomatH, - B.Braun (США).

Горизонтальный шейкер - Red Rocker, San Francisco (США)

Термостатируемый шейкер для микропробирок "Thermomixer comfort" -

Eppendorf (ФРГ)

УФ-спектрофотометр GeneQuant - Amersham Pharmacia Biotech (Швеция).

Ультрафиолетовый трансиллюминатор ТС-312 A Transilluminator (312 нм) с

программой для обработки изображений Grabit 2,59 - UVP Inc. (США).

Центрифуга - GPR Centrifuge, Beckman J2-21 (США).

Ультразвуковой дезинтигратор - Ultra Sonic Processor, Cole Parmer Instrument

Company (США)

Цифровая фотокамера и ультрафиолетовый трансиллюминатор White/Ultraviolet

Электронные весы - Sartorius Е 5500 S, Sartorius GMBH Gottingen (ФРГ).

EIA Reader 2550 - BioRad Laboratories (США).

Рентгеновская пленка PM-B (Россия)

Иммобилон - Millipore (США)

Штаммы бактерий и бактериофаги.

В работе использовали следующие штаммы Е. coin XL-l-F'proABlacfIacZJMJ5 TnlO(Tef)/recAl endAl gyrA96(Naf) thi-1 hsdR17(rK-,mK+) supE44 relAl lac

DH-5a- F'/endAl hsdR17(rK-,mK+) supE44 thi-1 recAl gyrA(Naf) relAl A(lacZYA-argF)ui69 (

3.2 Методы

Приготовление компетентных клеток E.coli, трансформацию, рестрикцию, лигирование, гель-электрофорез и другие стандартные манипуляции проводили по описанным методикам (Maniatis, Fritsch, and Sambrook, 1982). Выделение плазмидной ДНК проводили из 5 мл ночной культуры Е.соН с использованием набора Wizard Plus Minipreps DNA Purification System фирмы Promega в соответствии с прилагаемой инструкцией.

EcoR\ (8222) #/«dIII(819lj\

hCTCF

His Tag кодирующая последовательность

Промотор

Начало транскрипции

pBR322 ОГІ

Рисунок 10. Строение плазмиды рЕТ 7.1, содержащей ген человеческого транскрипционного фактора CTCF

3.2.1 Получение белка CTCF в бесклеточной системе

Синтез белка осуществляли с использованием набора "TNT Quick coupled transcription/translation systems"(Promega) согласно прилагаемой инструкции. В качестве векторной конструкции использовали, любезно предоставленную коллегами (З.Абдуллаев и В.Лобаненков, National Institutes of Health, USA), плазмиду pET 7.1, содержащую полноразмерный ген CTCF человека (рис. 10).

Система состоит из лизата ретикулоцитов кролика, реакционного буфера, РНК-полимеразы фага Т7, смеси аминокислот (исключая метионин) и ингибитора РНКазы. К 40 мкл TNT Quick Coupled Trascription/Translation System добавляли З мкл ІмМ метионина, 1 мкг плазмиды, кодирующей CTCF, и воду, не содержавшую нуклеазы, до 50 мкл. Далее смесь инкубировали при 30С в течение 90 мин.

Синтезированный в системе in vitro CTCF функционально анализировали с помощью Вестерн блот анализа и методом EMSA, используя в качестве зонда меченый фрагмент туе гена.

3.2.2 Электрофорез белков в SDS-полиакриламидном геле.

Белковый электрофорез проводили по методике, описанной ранее (Laemmli and Favre М., 1973). К белковому образцу (20 мкг суммарного белка ядерного экстракта клеточной линии HeLa или 7 мкл CTCF и люциферазы, синтезированных в системе "TNT Quick coupled transcription/translation systems") добавляли 1/5 буфера для нанесения и кипятили пробы в течение 5 минут при температуре 100С. Электрофорез проводили при силе тока 10 мА.

3.2.3 Вестерн блот анализ

Электроблоттинг белковых зон, полученных в результате электрофореза, проводили на аппаратуре фирмы Bio-Rad (США) с переносом на иммобилон (Immobilon-P, Millipore) в буфере для переноса (30 мМ Tris, 0.2 М глицина, 20% метанола) в течение 30 минут при силе тока 1 А. Для забивки неспецифической сорбции мембрану инкубировали в 5% растворе молока (not fat milk). Мембрану отмывали три раза по 5 минут в растворе для отмывки (0.1 % Tween-20, PBS) перед добавлением первичных и вторичных антител и непосредственно перед окрашиванием мембраны. Инкубацию с первичными антителами (CTCF (N-17),

Santa Cruz Biotechnology) с разведением 1:500 и вторичными антителами с разведением 1:10000 (Donkey Anti-goat IgG, HPR, Promega) проводили в течение часа на горизонтальном шейкере (Red Rocker, San Francisco). Окрашивали мембрану с помощью 3,3',5,5'-тетраметилбензидина (Promega).

3.2.4 Получение библиотеки фрагментов ДНК локуса FXYD5-COX7A 19

хромосомы человека.

По 1 мкг смеси равных количеств космидных ДНК из 30 индивидуальных космид исчерпывающе расщепляли 20 ед. рестриктазы Sau3A или Csp6-I в буфере, рекомендованном производителями. Полноту расщепления контролировали электрофорезом в 1% агарозном геле. ДНК экстрагировали смесью фенола и хлороформа (1:1), осаждали этанолом и растворяли в 30 мкл буфера ТЕ (10 мМ Трис-HCl рН 8,0, 1 мМ ЭДТА).

Фрагменты космидной ДНК, полученные после расщепления каждой из рестриктаз, смешивали и лигировали с праймером и соответствующим адаптором в следующей смеси: 10 мкл смеси фрагментов ДНК, 2 мкл 10х буфера для лигирования (200 мМ Трис-HCl рН 7,6, 100 мМ MgCl2, 50 мМ 2-меркаптоэтанола, 100 мкг/мл бычьего сывороточного альбумина (БСА), 10 мМ АТР), по 2 мкл (1 нмоль) соответствующего адаптера и праймера (см. ниже), 8 ед. ДНК-лигазы фага Т4, в конечном объеме 20 мкл. Реакцию проводили в течение ночи при 13С для Sau3A и 4С для Csp6-I гидролизатов.

Структуры праймера и адапторов приведены ниже:

5'GATCTGTTCATGG3' адаптер для Sau3А

ИяиЯА

5 'GTACTGTTCATGG3' адаптор для Csp6.1

Csp6-1

5' ACTGAGCTCGAGTATCCATGAACA3' универсальный библиотечный праймер

Xhol

Библиотечный праймер одинаков для обоих адапторов и содержит участок узнавания рестриктазы Xhol.

3.2.5 Радиоактивное мечение фрагментов ДНК при помощи ПЦР

Фрагменты ДНК амплифицировали с соответствующей плазмидной матрицы, или фрагментов библиотеки с пришитыми к ним адаптерами при помощи ПЦР с использованием универсального библиотечного праймера. Для получения туе фрагмента (участок промотора гена туе) в качестве матрицы использовали геномную ДНК человека. Использовали праймеры:

myc L (5'-GGGATCGCGCTGAGTATAAA-3')

и туе R (5'-GGATCTCCCTTCCCAGGAC-3').

Для ПЦР-мечения смешивали:

1 мкл фрагмента ДНК длиной 200-600 п.н. (0,5-1,0 нг/мкл) или библиотеку фрагментов в том же количестве (1,0 нг/мкл), 1 мкл библиотечного праймера (10 пмоль/мкл) или 2 мкл соответствующих пар праймеров, 1,5 мкл реакционного буфера (100 мМ Tris-HCI рН 8,3, 500 мМ КС1), 1,2 мкл 25 мМ MgCl2j 0,6 мкл смеси dCTP, dGTP, dTTP (5 мМ каждого), 0,6 мкл 0,5 мМ dATP, 5 мкл alpha-32P-dATP (3000 Ки/ммоль), 1 ед. Taq-полимеразы и Н20 до 15 мкл. Амплификацию (15 циклов) проводили по следующей программе: 94С - 30с, 60С - 30с, 72С - 1 мин 30 с.

3.2.6 Очистка меченой ДНК

Полученную ДНК отдельных фрагментов очищали в 10% полиакриламидном геле с 0,17% И^-метилен-бис-акриламидом (сшивка 30:1) в буфере: 45 мМ трис-борат, 45 мМ борная кислота, 1 мМ ЭДТА, рН 8,0 (0,5хТВЕ). После проведения электрофореза и радиоавтографии меченой ДНК часть геля, соответствующую искомому фрагменту ДНК, вырезали из геля, измельчали и элюировали ДНК в 150 мкл буфера для элюции (0,5 М ацетат аммония, 1% SDS, 1 мМ ЭДТА) при 37С в течение ночи. Затем отфильтровывали частицы геля через стекловату, добавляли к раствору 2 объема 96% этанола и выдерживали 1 час при -70С. После центрифугирования (14500 об/мин, 10 мин), удаляли супернатант, осадок промывали 250 мкл 75% этанола, высушивали и растворяли в 10 мкл Н20.

Библиотеку меченых фрагментов ДНК очищали с помощью колонок QIAguick (QIAGEN) согласно рекомендациям производителя.

3.2.7 Связывание меченых фрагментов ДНК с белками (EMSA)

Реакционная смесь содержала 2 мкл ~ 5нг (30000-50000 имп/мин) меченого фрагмента ДНК, 1 мкл (1 мкг) альтернирующего двунитевого гетерополимера poly(dl-dC), 2 мкл (3 мкг суммарного белка) ядерного экстракта HeLa или 5 мкл белка CTCF, синтезированного in vitro, 12 мМ HEPES-KOH, рН 7,9, 12 % глицерин, 60 мМ КС1, 0,3 мМ EDTA, 0,6 мМ дитиотрейтол (буфер В). Белковый образец добавляли в последнюю очередь. После добавления всех реагентов, смесь инкубировали в течение 20 минут при комнатной температуре. Буфер для нанесения в образцы не добавляли.

Реакционную смесь для дополнительного сдвига электрофоретической подвижности в присутствии антител к CTCF готовили аналогично, за исключением того, что в смесь вносили 0,3 мкг антител, специфичных к N-концевой области CTCF (Usbiological, США). 3.2.8. Сдвиг электрофоретической подвижности в полиакриламидном геле (Electrophoretic mobility shift assay, EMSA). Эксперименты по сдвигу электрофоретической подвижности проводили по ранее описанной методике (Fried and Crothers, 1981). По окончании инкубации (см. выше), смесь наносили на 10% или 5% полиакриламидный гель (сшивка 30:1) приготовленный на буфере ТВЕхОД В свободные дорожки геля наносили красители бромфеноловый синий и ксиленцианол для контроля миграции во время прохождения электрофореза. Электрофорез проводили при силе тока в 12-15 мА. По прохождении ксиленцианол ом 2/3 (10-12 см) геля электрофорез останавливали, гель закрывали лавсановой пленкой и радиоавтографировали в течение 16-40 часов при +4С.

3.2.9 Селекция фрагментов, содержащих участки, способные связываться с транскрипционным фактором CTCF (метод двумерного EMSA).

Полученную библиотеку фрагментов ДНК (пункт 3.2.4) амплифицировали, радиоактивно метили (п.З. 2.7) и очищали с помощью колонок QIAquick (QIAGEN).

Связывание библиотеки коротких фрагментов ДНК с транскрипционным фактором CTCF. Разделение фрагментов в первом направлении

2,5 мкл (~20 нг) смеси радиоактивно меченых фрагментов ДНК (300000-500000 имп/мин) инкубировали с 5 мкл белка CTCF, синтезированного in vitro с помощью «TNT Quick Coupled Trascription/Translation System» или 12 мкл люциферазы, также синтезированной в системе in vitro, в присутствии 1 мкл (1мкг) poly(dl-dC) в течение 20 минут при комнатной температуре и разделяли в 5% полиакриламидном геле (сшивка 30:1, гель размером 15x15 см, толщина 0,7 мм), приготовленном в 0,5хТВЕ-буфере. Как и при EMSA, в свободные дорожки геля наносили красители бромфеноловый синий и ксиленцианол для контроля миграции во время прохождения электрофореза. Электрофорез проводили при силе тока в 12-15 мА. По прохождении ксиленцианолом 2/3 (10-12 см) геля электрофорез останавливали, гель закрывали лавсановой пленкой и проводили радиоавтографию в течение 1 часа при температуре +4 С.

Полифункциональность белка CTCF и регуляция его активности

Значительное разнообразие выполняемых белком CTCF функций предполагает существование сложного многоуровневого процесса регуляции самого фактора CTCF. Регуляция эффектов, опосредуемых белком CTCF, может осуществляться несколькими основными путями: регуляцией экспрессии самого белка, модификацией сайтов связывания CTCF в геноме, например метилирование, что исключает посадку белка в сайтах-мишенях, и посттрансляционными модификациями белка. CTCF - широко экспрессирующийся белок. Нозерн-блот анализ различных клеточных линий и тканей человека выявил присутствие во всех исследованных образцах мРНК CTCF длинной около 4 т.п.н. В клетках почек, печени и легких уровень мРНК CTCF заметно ниже, чем в клетках поджелудочной железы, скелетных мышц и сердца (Filippova et al., 1998). Наиболее хорошо изучена регуляция транскрипции гена CTCF кур. Исследование промоторного участка с 5 -конца кодирующей области гена CTCF и компьютерный анализ этой последовательности позволили обнаружить несколько десятков известных сайтов связывания транскрипционных факторов и получить первичные данные о возможной регуляции гена (Klenova et al., 1998). Минимальный промотор chCTCF (chiken CTCF), относящийся к промоторам, не содержащим ТАТА-боксы, характеризуется сильной базальной активностью. С 3 -стороны от промотора на расстоянии 60 п.н. расположен инициатор (Inr-элемент) - GCCATTTT-мотив, являющийся высокоаффинным сайтом связывания фактора YY1. Эта часть промотора высококонсервативна среди промоторов гена CTCF курицы, мыши и человека. Мутации коровых нуклеотидов Inr-элемента в экспериментах с транзиентными трансфекциями исключают связывание YY1 с этим участком и значительно снижают транскрипционную активность минимального промотора chCTCF, поэтому консервативный YY1-содержащий Inr-элемент важен для регуляции транскрипции генов CTCF позвоночных (Klenova et al., 1998). Еще один участок промотора гена chCTCF интересен тем, что гомологичен CDE/CHR элементам, встречающимся в промоторах генов PLK, cdc25, cdc2, гена циклина А, активность которых меняется в ходе клеточного цикла. CDE/CHR элементы необходимы для активации промоторов в S и G2 фазе клеточного цикла. Измерение относительной концентрации мРНК chCTCF в клеточных популяциях на стадии логарифмического роста показало возрастание уровня мРНК CTCF в S и G2 фазе клеточного цикла. В процессе дифференцировки в исследованных клеточных линиях транскрипция CTCF подавлена. Так, при дифференцировке исследуемых клеточных линий лейкемии в эритроидные, мегакариоцитарные, гранулоцитарные и моноцитоподобные клетки, уровень, как самого белка, так и мРНК CTCF снижается. Снижение в каждом случае имеет разную кинетику, зависящую от клеточной линии и пути дифференцировки. При этом белок CTCF обнаруживается в разных фосфорилированных формах. Как выяснилось, уровень фосфорилирования белка специфичен для каждой клеточной линии и зависит от пути дифференцировки клеток (Delgado et al., 1999).

Пост-трансляционная модификация белка влияет на его ДНК-связывающую способность. Пост-трансляционное поли(АДФ)-рибозилирование CTCF важно для придания CTCF свойств инсуляторного белка. Обнаружено, что существует связь между поли(АДФ)-рибозилированием CTCF и способностью выступать в качестве инсуляторного белка. Это было продемонстрировано при использовании 3-аминобензамида - ингибитора поли(АДФ-рибулозо)полимеразной активности. Например, с областью ICR (imprinting control region) генов Igf2/H19 взаимодействует CTCF, подвергнутый поли(АДФ)-рибозилированию (Yu et. al., 2004). Белок CTCF имеет несколько сайтов в С-концевом домене, по которым он фосфорилируется казеин киназой II (СК2) in vivo (Klenova et al, 2001). Коэкспрессия CK2 и CTCF переключает функции CTCF с репрессии транскрипции на активацию транскрипции. Мутантный белок, который не фосфорилируется, имеет преобладающую репрессорную, нежели активаторную, активность. Мутация по 612 серину является критичной для ремеханизма переключения репрессорной/активаторной функций (преобладает активаторная функция) (Klenova et.al., 2001).

Многофункциональность транскрипционного фактора CTCF определяется различными комбинациями цинковых пальцев (Fillipova et.al., 1996), ответственных за связывание с сильно различающимися по последовательности участков ДНК. Длина сайтов, с которыми связывается CTCF, составляет примерно 50 п. о (Rasko et.al., 2001). Этот белок вовлекается во многие аспекты регуляции генов: активацию, репрессию транскрипции (Vostrov et al., 2002, Fillipova et al., 1996, Awad et al., 1999), импринтинг генетической информации (Hark et al., 2000, Kanduri et al., 2000), взаимодействие с последовательностями, обладающими инсуляторной активностью (Kuhn and Geyer 2003, Valadez-Graham et al., 2004), инактивацию Х-хромосомы млекопитающих (Chao et al.,) участвует в качестве опухолевого супрессора (Fillipova et al., 1998).

CTCF активирует транскрипцию гена, кодирующего предшественника р-амилоида (АРР - amyloid p-p_rotein precursors). Проксимальная часть промотора гена АРР лишена TATA и ССААТ боксов, но содержит обязательный инициаторный элемент, содержащий точку начала транскрипции. Большое значение в активации транскрипции имеет сайт под названием АРВр, с которым связывается CTCF для достижения оптимального уровня транскрипционной активности. Для активации транскрипции гена АРР важную роль играет N-концевой домен транскрипционного фактора. Например, при делециях данного домена уровень транскрипции гена сильно уменьшается (Vostrov et.al., 1997, Vostrov et. al., 2002). Высокий уровень экспрессии АРР наблюдается в почках и головном мозге. Амилоидный (3-белок формируется путём протеолитического расщепления АРР. Обнаружено, что при таких заболеваниях как болезнь Альцгеймера и синдром Дауна существует повышенный уровень транскриптов гена АРР. При трисомии 16 хромосомы (уровень экспрессии CTCF повышается, т. к. CTCF кодируется 16 хромосомой) также происходит запасание АРР, что вызывает аналогичные патологии (Litz et.al., 2003)

Электрофорез белков в SDS-полиакриламидном геле

Белковый электрофорез проводили по методике, описанной ранее (Laemmli and Favre М., 1973). К белковому образцу (20 мкг суммарного белка ядерного экстракта клеточной линии HeLa или 7 мкл CTCF и люциферазы, синтезированных в системе "TNT Quick coupled transcription/translation systems") добавляли 1/5 буфера для нанесения и кипятили пробы в течение 5 минут при температуре 100С. Электрофорез проводили при силе тока 10 мА.

Электроблоттинг белковых зон, полученных в результате электрофореза, проводили на аппаратуре фирмы Bio-Rad (США) с переносом на иммобилон (Immobilon-P, Millipore) в буфере для переноса (30 мМ Tris, 0.2 М глицина, 20% метанола) в течение 30 минут при силе тока 1 А. Для забивки неспецифической сорбции мембрану инкубировали в 5% растворе молока (not fat milk). Мембрану отмывали три раза по 5 минут в растворе для отмывки (0.1 % Tween-20, PBS) перед добавлением первичных и вторичных антител и непосредственно перед окрашиванием мембраны. Инкубацию с первичными антителами (CTCF (N-17),

Santa Cruz Biotechnology) с разведением 1:500 и вторичными антителами с разведением 1:10000 (Donkey Anti-goat IgG, HPR, Promega) проводили в течение часа на горизонтальном шейкере (Red Rocker, San Francisco). Окрашивали мембрану с помощью 3,3 ,5,5 -тетраметилбензидина (Promega).

По 1 мкг смеси равных количеств космидных ДНК из 30 индивидуальных космид исчерпывающе расщепляли 20 ед. рестриктазы Sau3A или Csp6-I в буфере, рекомендованном производителями. Полноту расщепления контролировали электрофорезом в 1% агарозном геле. ДНК экстрагировали смесью фенола и хлороформа (1:1), осаждали этанолом и растворяли в 30 мкл буфера ТЕ (10 мМ Трис-HCl рН 8,0, 1 мМ ЭДТА).

Фрагменты космидной ДНК, полученные после расщепления каждой из рестриктаз, смешивали и лигировали с праймером и соответствующим адаптором в следующей смеси: 10 мкл смеси фрагментов ДНК, 2 мкл 10х буфера для лигирования (200 мМ Трис-HCl рН 7,6, 100 мМ MgCl2, 50 мМ 2-меркаптоэтанола, 100 мкг/мл бычьего сывороточного альбумина (БСА), 10 мМ АТР), по 2 мкл (1 нмоль) соответствующего адаптера и праймера (см. ниже), 8 ед. ДНК-лигазы фага Т4, в конечном объеме 20 мкл. Реакцию проводили в течение ночи при 13С для Sau3A и 4С для Csp6-I гидролизатов.

Структуры праймера и адапторов приведены ниже: 5 GATCTGTTCATGG3 адаптер для Sau3А ИяиЯА 5 GTACTGTTCATGG3 адаптор для Csp6.1 Csp6-1 5 ACTGAGCTCGAGTATCCATGAACA3 универсальный библиотечный праймер Xhol Библиотечный праймер одинаков для обоих адапторов и содержит участок узнавания рестриктазы Xhol.

Фрагменты ДНК амплифицировали с соответствующей плазмидной матрицы, или фрагментов библиотеки с пришитыми к ним адаптерами при помощи ПЦР с использованием универсального библиотечного праймера. Для получения туе фрагмента (участок промотора гена туе) в качестве матрицы использовали геномную ДНК человека. Использовали праймеры: myc L (5 -GGGATCGCGCTGAGTATAAA-3 ) и туе R (5 -GGATCTCCCTTCCCAGGAC-3 ). Для ПЦР-мечения смешивали: 1 мкл фрагмента ДНК длиной 200-600 п.н. (0,5-1,0 нг/мкл) или библиотеку фрагментов в том же количестве (1,0 нг/мкл), 1 мкл библиотечного праймера (10 пмоль/мкл) или 2 мкл соответствующих пар праймеров, 1,5 мкл реакционного буфера (100 мМ Tris-HCI рН 8,3, 500 мМ КС1), 1,2 мкл 25 мМ MgCl2j 0,6 мкл смеси dCTP, dGTP, dTTP (5 мМ каждого), 0,6 мкл 0,5 мМ dATP, 5 мкл alpha-32P-dATP (3000 Ки/ммоль), 1 ед. Taq-полимеразы и Н20 до 15 мкл. Амплификацию (15 циклов) проводили по следующей программе: 94С - 30с, 60С - 30с, 72С - 1 мин 30 с.

Полученную ДНК отдельных фрагментов очищали в 10% полиакриламидном геле с 0,17% И -метилен-бис-акриламидом (сшивка 30:1) в буфере: 45 мМ трис-борат, 45 мМ борная кислота, 1 мМ ЭДТА, рН 8,0 (0,5хТВЕ). После проведения электрофореза и радиоавтографии меченой ДНК часть геля, соответствующую искомому фрагменту ДНК, вырезали из геля, измельчали и элюировали ДНК в 150 мкл буфера для элюции (0,5 М ацетат аммония, 1% SDS, 1 мМ ЭДТА) при 37С в течение ночи. Затем отфильтровывали частицы геля через стекловату, добавляли к раствору 2 объема 96% этанола и выдерживали 1 час при -70С. После центрифугирования (14500 об/мин, 10 мин), удаляли супернатант, осадок промывали 250 мкл 75% этанола, высушивали и растворяли в 10 мкл Н20.

Библиотеку меченых фрагментов ДНК очищали с помощью колонок QIAguick (QIAGEN) согласно рекомендациям производителя.

Реакционная смесь содержала 2 мкл 5нг (30000-50000 имп/мин) меченого фрагмента ДНК, 1 мкл (1 мкг) альтернирующего двунитевого гетерополимера poly(dl-dC), 2 мкл (3 мкг суммарного белка) ядерного экстракта HeLa или 5 мкл белка CTCF, синтезированного in vitro, 12 мМ HEPES-KOH, рН 7,9, 12 % глицерин, 60 мМ КС1, 0,3 мМ EDTA, 0,6 мМ дитиотрейтол (буфер В). Белковый образец добавляли в последнюю очередь. После добавления всех реагентов, смесь инкубировали в течение 20 минут при комнатной температуре. Буфер для нанесения в образцы не добавляли.

Приготовление компетентных клеток Е.coli и их трансформация 58 3.2. 13 Ранжирование и анализ библиотеки

Синтез белка проводили in vitro в системе транскрипции/трансляции с использованием набора "TNT Quick coupled transcription/translation systems" фирмы "Promega". В качестве векторной конструкции, несущей полноразмерный ген CTCF человека, использовали плазмиду рЕТ 7.1, любезно предоставленную 3. Абдуллаевым и В. Лобаненковым.

Функциональный анализ полученного белка проводили методом EMSA с использованием в качестве зонда фрагмент гена туе и с помощью Вестерн блот анализа. Предварительно с геномной ДНК с помощью ПЦР был наработан в препаративных количествах и амплифицирован с радиоактивной меткой фрагмент гена туе длиной 150 п.н., связывающийся с CTCF (Fillippova et.al., 1996). Далее проводили очистку меченого зонда в 10% ПААГ геле, вырезали и элюировали фрагмент геля, содержащий соответствующий продукт. Для связывания зонда использовали наработанный in vitro CTCF в количествах 2 мкл и 8 мкл, чтобы определить количество белка, необходимое для оптимального связывания. В качестве отрицательного и положительного контроля использовали люциферазу (12 мкл) и ядерный экстракт клеточной линии HeLa (3 мкг) соответственно. После инкубации смесь разделяли в неденатурирующем полиакриламидном геле. Как видно на рисунке 11, после электрофореза и экспонирования геля с рентгеновской пленкой наблюдаются полосы торможения комплексов ДНК-белок. В отрицательном контроле связывание люциферазы с зондом не наблюдается. При использовании в качестве положительного контроля ядерного экстракта клеточной линии HeLa, мы наблюдали полосу торможения в геле. Как видно, уже с 2 мкл белка наблюдается четкое связывание меченого зонда с белком, а 8 мкл является уже избыточным, поэтому решено для рационального использования синтезированного белка брать 5,5 мкл на связывание (рис. 11).

Вестерн блот анализ проводили с помощью поликлональных антител к транскрипционному фактору CTCF. Полноразмерный белок имеет молекулярный вес 82 кДа, однако, в SDS-полиакриламидном геле белок мигрирует как полоса 130 кДа, вследствие большого количества отрицательно заряженных аминокислотных остатков на N- и С-конце молекулы (Klenova et al., 1997). Для обеспечения многочисленных функций в клетке белок CTCF подвергается посттрансляционным модификациям: фосфорилированию казеин киназой II по остаткам серинов и треонинов на С-конце (Klenova et al., 2001) и поли(АДФ)-рибозилированию, что обеспечивает участие в связывании с последовательностями инсуляторов млекопитающих (Yu et al., 2004). Как видно на рисунке, синтезированный в системе in vitro CTCF, имеет молекулярную массу приблизительно 130 кДа, a CTCF in vivo в составе белков ядерного экстракта клеточной линии HeLa - молекулярную массу 160 кДа. Синтезированную in vitro люциферазу использовали в качестве отрицательного контроля (рис. 12).

В качестве источника ДНК для выявления участков связывания транскрипционного фактора CTCF в локусе 19 хромомсомы человека использовали имеющуюся в лаборатории космидную библиотеку, содержащую перекрывающиеся фрагменты участка FXYD5-C0X7A1B длиной 1 млн. п.н. Она была обработана ферментами рестрикции Sau3A и Csp6.1. Исходя из данных о последовательности ДНК, ферменты были подобраны таким образом, чтобы в результате расщепления получались продукты со средней длиной 500 п.н. Два фермента было использовано для того, чтобы исключить потери фрагментов из-за присутствия сайта расщепления внутри функциональной области фрагмента. К полученным фрагментам через специальные олигонуклеотидные адапторы был присоединен праймер Рг27 (см. Материалы и методы). Для получения меченых фрагментов ДНК исследуемого локуса была проведена ПЦР-амплификация с этим праймером. Матрицей для нее служили фрагменты с лигированным праймером Рг27, любезно предоставленные И.П.Черновым (Chernov et ai, 2002).

Селекцию фрагментов, связывающихся с CTCF, проводили в два раунда с применением двумерного электрофореза. В первом направлении селекцию проводили по ранее описанной методике EMSA-анализа. Для этого связывали ПЦР-меченые фрагменты анализируемой библиотеки с синтезированным в системе in vitro CTCF и разделяли электрофорезом в не денатурирующих условиях. В качестве отрицательного контроля использовали меченые фрагменты той же самой библиотеки. Полосу геля первого направления, содержащую комплексы ДНК-CTCF, инкубировали в SDS-содержащем буфере для высвобождения ДНК из состава комплексов, а затем проводили электрофорез во втором направлении в денатурирующих условиях. Гель экспонировали с рентгеновской пленкой в течение двух суток, по истечении которых проводили анализ полученных радиоавтографов. На рисунке изображен радиоавтограф геля второго направления, содержащего связываемые с CTCF фрагменты. Участок, выделенный на рисунке точками, отсутствовал на геле с фрагментами библиотеки, не связываемыми с белком (рис. 13). Кроме того, вторая диагональ внутри отмеченого участка, указывает на одинаковый коэффициент торможения данных фрагментов в первом направлении. Так как угол смещения этих последовательностей отличается от угла смещения основной массы меченых фрагментов библиотеки, можно говорить о связывании CTCF с обнаруженными фрагментами. Участок геля, соответствующий фрагментам ДНК, связывающимся с белком, вырезали, элюировали, вновь метили и проводили второй раунд селекции по схеме первого раунда. После двух раундов связывания фрагментов с транскрипционным фактором были получены участки 19 хромосомы человека.

Клонирование фрагментов в вектор и трансформация клеток Е. coli

Ранее в нашей лаборатории был разработан метод позитивно-негативной селекции, с помощью которого были идентифицированы восемь последовательностей инсуляторов. Обнаруженные последовательности инсуляторов были секвенированы и картированы в исследуемом локусе хромосомы между генами FXYD5 и CoxlAl (Akopov et.al., 2006). Они представлены в таблице 3.

CTCF является единственным инсуляторным белком позвоночных (Bell et al., 1999). Тем не менее, существуют инсуляторы, для функционирования которых связывание с CTCF не является обязательным условием. По всей видимости, инсуляторы позвоночных можно разделить на CTCF-зависимые и CTCF-независимые (Magdinier et al., 2004). Обнаружены участки ДНК, которые не содержат сайтов связывания с белком CTCF, но характеризуются при этом сильной энхансер-блокирующей активностью.

С помощью метода EMSA мы проверили способность выявленных ранее инсуляторных последовательностей связываться с транскрипционным фактором CTCF in vitro. Для этого 8 фрагментов были наработаны и помечены с помощью ПЦР. Далее их инкубировали с ядерным экстрактом клеточной линии HeLa, после чего образовавшиеся комплексы были разделены в полиакриламидном геле в неденатурирующих условиях. Было показано, что все восемь последовательностей инсуляторов способны связываться с разной эффективностью с белками ядерного экстракта, образуя одну или несколько полос торможения комплекса ДНК-белок на радиоавтографе (рис.15).

С помощью метода иммунопреципитации хроматина мы исследовали способность 8 последовательностей инсуляторов связываться с белком CTCF in vivo. Для всех последовательностей были подобраны специфические пары праймеров за исключением последовательности № 8, вследствие того что, внутри этой последовательности располагается протяженный повторяющийся Alu-элемент. Иммунопреципитацию и анализ ДНК с помощью ПЦР проводили в условиях, подобранных для связывания с CTCF in vivo десяти CTCF-связывающих сайтов (смотри выше). Все 7 последовательностей амплифицировались с помощью специфических пар праймеров на матрице, полученной в результате обработки ультразвуком ДНК клеточной линии HeLa, сшитой с ядерными белками и селектированной антителами к белку CTCF (рис. 17). При добавлении неспецифических антител к растительному белку тауматину, как и ожидалось, амплификации со специфическими праймерами не наблюдалось. В качестве положительного контроля с ДНК, выделенной при использовании антител к

CTCF, амплифицировали фрагмент промотора гена с-тус длинной 150 п.н., связывающийся с CTCF (Filippova et al., 1996). Как видно на рис. 17 Б образуется продукт нужной длины, в то же время, амплификации фрагмента, кодирующей части гена Р-актина (отрицательный контроль) не наблюдается (рис. 17 Б). Согласно полученным результатам, можно сделать заключение, что все 7 выявленные в локусе длиной 1 млн. п.н. инсуляторы связываются с транскрипционным фактором CTCF с различной эффективность in vivo в клетках линии HeLa.

Известно, что белок CTCF - основной белок-инсулятор позвоночных (Bell et al, 1999) - взаимодействует с различными повторяющимися элементами генома: с LTR HERV, LINE и SINE элементами. Например, в геноме человека описан Alu-элемент, находящийся в 5 некодирующей области гена кератина 18, способный защищать трансген в геноме мыши от влияния геномного окружения (Recillasarga et al, 2004).

Выявленные нами десять сайтов связывания транскрипционного фактора CTCF и обнаруженные ранее последовательности инсуляторов не совпадают по координатам. Близко расположены участки связывания белка CTCF и последовательности инсуляторов между генами GPR42 и GPR43, а так же на границах функционального домена гена АТР4А.

Следует отметить, что выявленные ранее последовательности инсуляторов, способные связывать транскрипционный фактор CTCF in vivo, не были обнаружены среди тех фрагментов, которые были выявлены с помощью метода EMSA. Все исследованные последовательности (ранее выявленные инсуляторы и участки связывания CTCF) связываются с транскрипционным фактором CTCF с разной эффективностью. Мы проводили два раунда селекции для отбора фрагментов 19 хромосомы, связывающихся с транскрипционным фактором. Вероятно, в первом раунде были элиминированы последовательности, к которым сродство CTCF in vitro невелико.

В дальнейшем при создании библиотеки, обогащенной фрагментами, связывающимися с белком CTCF, нами было получено 64 клона, содержащих вставки, соответствующие участкам 19 хромосомы. При анализе нуклеотидной последовательности этих клонов большая часть содержала повторяющиеся элементы, принадлежащие 19 хромосоме, однако, при картировании возникали некоторые трудности, и не все последовательности удалось расположить на карте.

В данной работе нами проведен поиск и анализ последовательностей 19 хромосомы человека, способных связываться с транскрипционным фактором CTCF, а также впервые построена карта расположения этих участков в исследуемом локусе.

Информация о расположении сайтов CTCF может помочь выявить инсуляторные элементы, обладающие энхансер-блокирующей функцией, а так же определить возможные границы функциональных доменов хроматина внутри локуса. Кроме того, создание полной функциональной карты генома, содержащей участки связывания фактора CTCF, позволит приблизиться к пониманию роли взаимодействия белка с той или иной последовательностью. Решение этого вопроса и создание базы данных с информацией о сайтах связывания CTCF позволит применить эти последовательности в различных векторных конструкциях для модуляции активностей различных генов и их регуляторных элементов, используемых в генной терапии.

Похожие диссертации на Расположение и возможная функциональная роль участков связывания транскрипционного фактора CTCF в локусе 19 хромосомы человека