Найти промоутера: Доступ с вашего IP-адреса временно ограничен — Авито

Содержание

Найти промоутера и нанять его для раздачи листовок можно в РА Вэлвит

Полиграфическая реклама – традиционный метод продвижения товаров и услуг. Его результативность заключается в том, что человек подсознательно склонен верить тому, что написано на бумаге. Плюс ко всему листовка сама по себе является небольшим «презентом», т.к. ее не просто показывают, а дают в руки.
Нанять промоутера – выгодное мероприятие, которое только на первых порах требует затрат. В будущем оно принесет выгоду. Отлично, если человек возьмет вашу рекламу в руки, прочитает, положит в карман или сумку. Информация, которая на ней размещена, еще раз попадется на глаза и отложится в памяти. Призыв к покупке сработает в нужный момент – когда потенциальный покупатель увидит товар в живую или появится необходимость в покупке.

Профессиональный промоутер и агентская раздача: преимущества


После того, как в выборе рекламы выигрывает листовка, встает следующий вопрос – нанять раздатчика или заняться самостоятельным распространением? Обратиться к «частнику» или в специализированное агентство?
    Для того, чтобы проще было сравнить, стоит познакомиться с преимуществами последнего метода:
  • Профессиональная раздача займет минимум времени. Это объясняется тем, что в агентстве уже готовы самые ходовые места, где скопление людей максимально. Большой листовочный тираж разойдется в считанные часы.
  • Выбор наиболее выгодного тарифа – агентство берет в работу тиражи разных размеров, предоставляются услуги одного промоутера, двух-трех или целой команды по всему городу, области.
  • Широкий охват, который гарантирует акция – можно выбрать как отдельную точку в городе, район, населенный пункт, Подмосковье.
  • Грамотная подача информации потенциальному покупателю. Профессиональный распространитель не просто вручает листовку в руки, а добивается того, чтобы она остались у человека и заинтересовала его. В этом состоит принципиальное отличие от обычных «частников», цель которых – просто реализовать тираж.
    Промоутеры из агентства специально подготовлены, представительно выглядят.
  • Подробный отчет о проделанной работе. Гарантия уверенности в том, что заказ выполнен на все сто процентов.
  • Контроль раздатчиков. Агентство, которое держит марку, тщательно контролирует выполнение заданий распространителями. Это повышает результативность их работы.

Где найти промоутера дешево для раздачи?


Рекламное агентство «Вэлвит» предлагает услуги раздатчиков – выгодно, качественно, оперативно.
    Преимущества:
  • доступные цены;
  • сотрудничество с физическими и юридическими лицами;
  • большой выбор рекламных программ.

Помогаем продвинуть продукт – профессионально и недорого.

Ищет полиция и не может найти промоутера Емельяненко Олега Раевского… Так вот же он — Происшествия — Новости Санкт-Петербурга

С глаз публики организатор турниров MMA Олег Раевский исчез после истории с продажей наркотиков. В последние дни человек, удивительно похожий на промоутера, активно участвует в конфликте мастериц парикмахерского искусства — на стороне той, которая подписывается фамилией Раевского. Статус заочно арестованного ему не помеха.

Фото: скриншот видео / «Фонтанка.ру»Поделиться

Раевского задержали со спецназом в июле 2017 года при сбыте крупной партии. Он пробыл в СИЗО несколько месяцев и вышел под подписку о невыезде. До задержания владелец промоутерской компании «Колизей» активно продвигал бойца Александра Емельяненко, открывал новые имена в мире MMA и слыл одним из самых медийных менеджеров в петербургском спорте.

Приморский районный суд начал слушать дело Раевского в сентябре 2018 года. Санкция статьи 228.1 УК предусматривает до 20 лет колонии. Судя по картотеке, из 24 заседаний подсудимый посетил меньше половины. Он очень часто болел.

В августе 2019 года процесс совсем замер. Как сообщили «Фонтанке» в объединенной пресс-службе судов Петербурга, производство по делу приостановили в связи с объявлением Раевского в розыск. Его заочно заключили под стражу на 2 месяца с момента будущего задержания. Организацию розыска поручили прокурору Приморского района.

Статус беглеца не погнал Олега Раевского из города. Меры конспирации он если и принимал, то символические. Пересел на лизинговый «Мерседес» и сменил деловой костюм на спортивный.

По данным «Фонтанки», с конца февраля 2020 года имя промоутера все чаще стали слышать в подразделениях МВД Центрального района, которые разбираются в энергичном конфликте парикмахеров.

На пятом этаже 41-го дома по Литейному проспекту несколько лет работала «Первая студия колористики» (ПСК). Среди прочих, работала в студии мастер по окрашиванию волос Наталья Вишнякова. В некоторых соцсетях она использует фамилию Раевская.

В мае прошлого года с Вишняковой расторгли трудовой договор. Работодатель уличил ее в переманивании клиентов и использовании корпоративного контента (рекламные фото и текст) в личных целях. Наталья пообещала зачистить свои аккаунты. Но осадок, вероятно, остался.

Пару недель назад сотрудники ПСК не смогли попасть в свою студию на Литейном. Кто-то сменил замки. За дверью остались оборудование, компьютеры с клиентской базой, товары для ухода за волосами и окрашивания.

Примерно в то же время в Instagram-аккаунте Perfettapro, рекламирующем услуги колористов, появилась запись о новом адресе салона — Литейный, 41.

Под брендом Perfettapro действует интернет-магазин, оформленный на ООО «Град» с регистрацией в Подпорожье. Собственником этой компании СПАРК называет Наталью Вишнякову.

Как стало известно «Фонтанке», полиция Центрального района в течение марта 2020 года зарегистрировала серию заявлений об имущественном споре между ПСК и Perfettapro. Как минимум в одном из них, с текстом которого редакции удалось ознакомиться, упоминается полный тезка промоутера:

«Раевским Олегом Сергеевичем произведен захват помещения с находящейся там техникой и мебелью, а также личными вещами сотрудников… Раевский угрожает мне расправой, обещает сжечь автомобиль и навредить моему маленькому сыну… Вынуждена забрать документы ребенка из детского сада и вывезти его из города, так как реально опасаюсь за свою жизнь и здоровье… Раевский представляется сотрудником ФСБ, ходит с оружием.

С его слов, писать заявление в полицию и другие инстанции бесполезно, так как у него большие связи…»

Оружейные пристрастия Олег Раевский не скрывает. Говорят, он не расстается с травматическим пистолетом.

Это заявление в 78-м отделе полиции оставила директор по маркетингу «Первой студии колористики». С тем же самым мужчиной, от которого якобы поступали угрозы, она виделась вечером 12 марта в присутствии сотрудников полиции. Этот человек удивительно похож на беглого промоутера.

«Фонтанка.ру»

По словам заявительницы, мужчина, названный ею Олегом Сергеевичем Раевским, пользуется черным автомобилем «Мерседес». Его тоже сфотографировали 12 марта на Литейном, 41.

На этом автомобиле Раевский передвигается по городу«Фонтанка.ру»Поделиться

«Фонтанка» пыталась связаться с Раевским через Наталью Вишнякову. Женщина сообщила, что такой человек ей знаком, но они давно не общаются. Объяснить, почему находящийся в розыске Раевский ставит «лайки» под ее свежими снимками в социальных сетях и занимает ее сторону в конфликте парикмахеров, собеседница отказалась.

Олег РаевскийсоцсетиПоделиться

«Фонтанка» отправила 16 марта запросы в прокуратуру Петербурга и ГУ МВД об организации розыска Раевского. Ответы пока не получены.

Александр Ермаков,

«Фонтанка.ру»

Фото: скриншот видео / «Фонтанка.ру»На этом автомобиле Раевский передвигается по городу«Фонтанка.ру»Олег Раевскийсоцсети

Как найти толковых промоутеров? Насторону.ру

Бытует мнение, что промоутеров лучше всего подбирать через кадровое агентство или же воспользоваться услугами компании, которая подготавливает и проводит промо-акции. Однако в большинстве случаев такой подход невыгоден. Ведь кадровые и рекламные агентства за свои услуги берут 15% от суммы за выполненную работу, а солидные фирмы и того больше, как минимум тысячу или две тысячи долларов. И если компании на несколько часов нужны два–три промоутера, оплата работы которых обойдется в 40 долларов, то стоит ли платить агентству большую сумму? В таком случае проще обратиться к специальным сайтам Интернета, где резюме промоутеров регулярно выставляются.

Выбирать промоутеров лучше с опытом работы, иначе придется потратить время на их обучение, а результат может не оправдать ожиданий. Девушкам обычно отдается предпочтение, так как они относятся к работе более ответственно.  

Можно пойти по другому пути. На тех же сайтах найти супервайзеров, а они приведут свою команду промоутеров. У каждого супервайзера, как правило, пять–шесть промоутеров. Час работы промоутера стоит четыре – пять долларов, супервайзеру за то же время платят пять–шесть долларов. В промоутеры идут студенты, старшеклассники и люди, которые ищут постоянную работу и пока ничем определенным не заняты. Поиск следует начинать за неделю до начала акции. На кастинг приглашают в полтора раза больше людей, чем нужно для участия в акции. На первом этапе кастинга претендентов отбирают по внешним данным. Большинство фирм и компаний отбирают девушек с модельной внешностью. Им платят по 10 долларов в час.  

На втором этапе кастинга претендентов знакомят с текстом, который они во время акции должны произносить. Запомнив «речевку», кандидаты читают ее перед собравшимися. На этом этапе также отсеивается какой-то процент претендентов. Кто-то от волнения начинает заикаться, у кого-то натянутая улыбка, а кто-то держится сковано. Остаются те, кто с приятной улыбкой расковано и с удовольствием читает текст. На последнем этапе ролевых игр выявляются лучшие из лучших. Претендентов разбивают на пары. Один  играет роль покупателя, другой – промоутера. «Покупатель» должен задавать каверзные вопросы о продукте, который рекламирует промоутер. Задача «промоутера» – правильно и содержательно ответить на них. Затем претенденты меняются ролями.  

После окончания кастинга, прошедшие отбор заполняют анкеты, в которых помимо ф.и.о., паспортных данных, номера контактного телефона и места жительства, указывают свой вес, рост, размер одежды и обуви. Эти данные нужны для пошива униформы и подбора обуви.  В анкете также должно быть  указано время, удобное сотруднику для работы. И еще одна очень важная деталь: промоутеры не должны менять свою внешность до проведения акции.  

С промоутерами заключаются трудовые договора, в которых оговорены обязанности сотрудников и время их работы. К сожалению, оформление договора не дает никаких гарантий в том, что человек прибудет на место в назначенный час. Поэтому не будет лишним иметь несколько человек в резерве. Само собой разумеется, что «запасных игроков» надо мотивировать, иначе они либо устоятся на другую работу, либо просто напросто отключат свои мобильные телефоны.    

В некоторых компаниях нашли неплохой выход из положения. Промоутеры, находящиеся в резерве, получают деньги даже в том случае, если им ничего не приходится делать. Для этого им необходимо постоянно быть на связи и в ситуации форс-мажора в течение получаса прибыть на место.

Промоутер должен работать не более четырех часов, а если предполагается, что акция продлиться дольше, то лучше, если сотрудники будут работать в две смены. Даже самый ответственный промоутер после пяти – шести часов непрерывного труда устает, и внимание его рассеивается.

Промоутеры работают под контролем супервайзеров. Планомерно объезжая все точки, где проводится акция, супервайзеры подвозят нужные промо-материалы, и наблюдают за работой промоутеров. Первое, на что обращают внимание супервайзеры, – это наличие сотрудников на рабочем месте. За четыре рабочих часа промоутер может сделать два перерыва по пять минут, и если перерыв продлиться дольше, то это – нарушение. Супервайзер также определяет активность работы промоутера, его общение с людьми и насколько точно он придерживается текста речевки.  

В трудовом договоре, как правило, имеются пункты, в которых оговариваются размеры штрафов: за курение на месте работы, утерянную униформу и тому подобное. Если проводимая акция краткосрочная, то штраф изымается в размере часового или дневного заработка промоутера. Если же акция длится несколько недель, то штраф повышается, и сотрудник может потерять недельный заработок.    

При проведении длительных или частых краткосрочных акций, когда требуется 50-60 промоутеров, своими силами обойтись трудно.  Поэтому лучше обратиться в кадровое агентство, которое не только подыщет необходимый персонал, но и подстрахует от возможных проблем. В случае невыхода на работу какого-либо сотрудника, агентство за свой счет заменит его. Выбирая агентство, следует посмотреть его послужной список, а менеджеру устроить небольшую проверку. В начале разговора скажите, что вам нужно, например, сто промоутеров, а в конце спросите, сколько претендентов предоставит агентство на кастинг. И если менеджер вам ответит, что кандидатов будет сто, то это говорит о его непрофессионализме. Ведь во время кастинга отсеивается как минимум тридцать процентов претендентов.                  

Промоутеры для раздачи листовок в Москве, заказать промо-персонал на мероприятие, найти распространителей, промоутеров на выставку, дегустацию – Легион Сервис

Для чего нужен промо-персонал?

Вы можете сделать все на высшем уровне, оформить стенды, напечатать красочные и информативные материалы для раздачи, найти и пригласить известных исполнителей, подготовить лучшие решения для дегустации, но приглашенные не получат того, за чем они пришли. Просто потому что все ваши усилия сведут на «нет» непрофессионалы среди промо-персонала на мероприятии или полное их отсутствие.

Маркетологи давно доказали, что эффективнее работает та реклама, которая попадает клиентам прямо в руки, например, на улице или в торговом центре. А если нанятый вами промоутер для раздачи листовок – уставший и раздраженный, ведь только что его обругал прохожий без настроения, то возьмет ли флаер ваш потенциальный клиент?

Люди любят дегустации. Где еще можно бесплатно попробовать новые сорта сыра, колбасы или конфет? И они с удовольствием подходят к еде, если промоутер на дегустации – молодой человек или улыбчивая девушка опрятной внешности. А если неулыбчивая и неопрятная?

Грамотный подход к рекламе предполагает присутствие возле каждого образца продукции консультанта, который сможет ответить на основные вопросы по характеристикам и преимуществам. Но захочет ли посетитель стать клиентом, если промо-персонала на выставке не будет на месте или, например, в ответе он будет руководствоваться только банальными неинформативными фразами?

Все эти примеры показывают, насколько важно заказать в качестве промоутера человека подготовленного, имеющего образование, владеющего собой и грамотной речью.

Компания Легион Сервис занимается подбором временного персонала, который качественно выполняет свою работу. При этом вам не придется самостоятельно вести поиск промоутеров в Москве и подбирать подходящих исполнителей для мероприятия. Все наши сотрудники, в том числе и распространители листовок, прошли специальный инструктаж и справятся с поставленной задачей.

Какими качествами должны обладать промоутеры

Результаты рекламной кампании напрямую зависят от работы промо-персонала. Временные сотрудники для раздачи листовок (распространители) или выполнения других задач от нашего агентства в Москве обладают всеми необходимыми качествами. Они:

  • Активны и коммуникабельны
  • Умеют правильно подавать информацию о товаре или услуге
  • Красиво, уверенно и грамотно разговаривают
  • Знают особенности рекламируемого товара или услуги
  • Умеют вызывать доверие и располагать к себе собеседника
  • Ответственны и пунктуальны

Сферы деятельности специалистов

Найти и нанять промоутеров для раздачи листовок в Москве теперь не проблема! Временный персонал от Легион Сервис выполнит качественную работу по следующим направлениям:

  • Раздача листовок, визиток, буклетов и других рекламных материалов на улицах и в помещениях
  • Работа на дегустациях
  • Раздача пробников рекламируемого продукта, каталогов
  • Консультирование по продукции
  • Презентации товаров и услуг
  • Работа на выставках и VIP-мероприятиях
  • Аниматорские программы с участием ростовых кукол
  • Проведение рекламных конкурсов
  • Работа хостес – встреча гостей на выставках и конференциях

Доверьте ваши заботы по поиску промо-персонала на мероприятие компании Легион Сервис. Мы не подведем!

Три причины обратиться к нам

  1. Промоутеры от Легион Сервис качественно выполняют свои функции. Вам не придется думать о том, где нанять промоутеров для дегустации, выставки, раздачи листовок или других рекламных акций.
  2. Вам не придется думать о том, где нанять промоутеров для раздачи листовок или других рекламных акций.
  3. Мы предоставляем детальный отчет о цене работы распространителей листовок.
  4. Мы работаем на вашу репутацию, индивидуально подыскивая сотрудников для решения ваших задач.

Вакансия требуется промоутер — объявления в Москве. Ищу работу промоутер по объявлению на BestRu.Ru

Учебный центр армо предлагает курсы повышения квалификации в строительстве по авторским программам
Раздел справочника:   Работа и образование
Дата: 30.07.2017

Московский Учебный центр АРМО начал обучение специалистов по программам повышения квалификации в сфере строительства по нескольким направлениям. В программы дополнительного образования включены специальные курсы на базе методических рекомендаций НОСТРОЙ (Национального объединения строителей), базовые курсы по проектированию, монтажу и пуско-наладке инженерных систем различных объектов капитального строительства, а также фирменные семинары от официальных дилеров инженерного оборудования Schneider Electric, Johnson Controls, курсы по CoDeSys и др. Дополнительным преимуществом курсов Учебного центра АРМО является индивидуальный подход к каждому слушателю, благодаря чему повышение квалификации в строительстве специалистов осуществляется в  короткие сроки.   Курсы повышения квалификации Учебного центра АРМО в области строительства рассчитаны на руководителей и специалистов организаций, занимающихся проектированием, монтажом, пуско-наладкой и эксплуатацией внутренних и наружных инженерных систем зданий и сооружений, в том числе систем электроснабжения, связи, автоматики, диспетчеризации и слаботочных систем. При этом центр АРМО осуществляет повышение квалификации в строительстве на своей материально-технической базе или на площадке заказчика, с выездом преподавателей центра. Разработанные курсы рассчитаны на…

13 советов как написать курсовую работу на «отлично»
Раздел справочника:   Работа и образование
Дата: 19.07.2017

Выполнение курсовой работы хоть и неприятная, но неотъемлемая часть любого учебного семестра. На ее выполнение обычно отводится весь семестр, однако большинство спохватывается лишь в последние дни перед ее сдачей. Здесь приводятся советы для лодырей как в короткий срок написать качественную курсовую и получить хорошую оценку. 1.Прежде всего следует определиться с темой работы. Обычно темы даются преподавателем, ведущим предмет (несколько штук, на выбор). Во время беседы о теме курсовой старайтесь записать все его советы по ее выполнению и задавайте как можно больше вопросов, чтобы узнать его точку зрения на исследуемую проблему. Даже если вы не согласны с ней, лучше выполнить работу по его предписаниям, это гарантия положительной оценки. 2.После выбора темы приступайте к подбору материала. Его нужно собрать как можно больше. Сейчас не надо тратить время на штудирование массы бумажной литературы, в интернете можно найти все, что вам необходимо. 3.Следует собирать всю информацию, даже если она касается вашей темы отдаленно. Это избавит вас от мучений…

Требования к содержанию и оформлению курсовой работы
Раздел справочника:   Работа и образование
Дата: 19.07.2017

Абсолютно любая курсовая работа или проект имеет стандартно следующие элементы: — Титульный лист — Содержание — Введение — Несколько глав с параграфами (или без них) — Заключение — Список используемой литературы Титульный лист создается по требованиям конкретного ВУЗа или методический рекомендация, его состав включает полное название учебного заведения, название предмета и темы курсовой работы, ФИО студента, преподавателя, год исполнения работы. Содержание оформляется на отдельной страничке, на ней указывается введения, название каждой главы, параграфа, заключение, список литературы, приложений с указанием номеров страниц. Как в любой книге или учебнике. Введение, каждую главу, заключение, список литературы начитают с новой страницы. Во введении дается краткое обоснование выбора и актуальности темы, раскрывается практическая значимость. Актуальность заключается в анализе современной ситуации, социальных противоречий. Кроме того во введение описывается объект и субъект курсовой работы, цели и задачи, источники информации. Стандартный объем введения 2-3 страницы. Первая глава работы обычно носит теоретический характер и представляет собой обзор источников. Пишущий демонстрирует свое понимание выбранной темы, выделяет основное. Возможно применение цитат.  Вторая…

Возможности работы в интернете
Раздел справочника:   Работа и образование
Дата: 19.06.2017

Многие люди на периферии, не владеют информацией, как заработать там, где они живут, по-другому, чем на проблемном местном заводике, где им платят 5-6 тысяч деревянных. Они не видят вариантов кроме как работа в саду, огороде, чтобы прокормиться. Даже в крупных городах трудоустройство в Интернете не так уж распространено. Можно привести пример, работа в интернете в мурманске среди людей зрелого и пожилого возраста по распространенности очень мала. И так обстоит дело не только с работой в интернете в мурманске, но и в Краснодаре, на Дальнем востоке, в сибирских крупных городах. Очень редко кто-то забросить свое резюме на тот или иной работный сайт. А вместе с тем в базах данных крупных работных ресурсов находится несколько миллионов резюме, которые со временем находят свои вакансии, чтобы их заполнить. Не использовать такую широкую возможность поиска работы в интернете в мурманске, Брянске, Калуге просто глупо. Вы с помощью рекрутинговых сайтов можете найти работу в санкт петербурге, Москве, уровень зарплаты может отличаться. ..

Работа промоутером. Вакансии промоутера в Москве с ежедневной оплатой.

Оплата работы промоутера зависит от количества часов и от того, что именно Вам нужно делать. Например, работа в ростовой кукле или с громкоговорителем оплачивается по более высокой ставке, чем раздача листовок – ставку мы указываем сразу в публикации вакансии. Оплачиваем работу ежедневно – сразу после завершения смены.

Ежедневно в течение рабочего дня мы публикуем объявления со свежими вакансиями – можно следить за публикациями или подписаться на вакансии и тогда Вам будут приходить уведомления о новых объявлениях.

Чаще всего мы публикуем вакансии заранее, но бывает так, что заказчику срочно нужны промоутеры – тогда мы ищем ребят, которые смогут выйти на точку уже через пару часов – тут важно быстро откликнуться на объявление и получить заказ.  

Работа для промоутера в Москве от 14, 15, 16 лет без опыта работы

Еще одно преимущество этой вакансии – это возможность получить подработку и собственные деньги подростку 14-16 лет.

Огромный плюс работы промоутером в том, что можно выйти на промоакцию, не имея никакого опыта – достаточно просто прибыть вовремя, запомнить и четко выполнять рекомендации координатора проекта – и у Вас все получится!

Ищете подработку в Москве промоутером, анкетером, супервайзером, консультантом?

Наше агентство предлагает вакансии промоутера, промоутера-консультанта, анкетера, супервайзера, модели, стендиста и другие вакансии на разовую подработку, не требующие опыта и специальных знаний.

Стандартные обязанности промоутера

В стандартные обязанности промоутера может входить раздача листовок, расклейка объявлений или раскладка под дворники авто, по почтовым ящикам, работа в ростовой кукле или с громкоговорителем, консультирование клиентов по товарам или услугам, раздача образцов продукции и т.д.  

Отзывы о работе промоутером

Вы можете познакомиться с отзывами о работе с нашим агентством в группе в ВК, перейдя по ссылке на сайте.

зачем промоутерам оцифровывать свою работу

На основе исследований рынка ритейла, компания Arkell IT-Solution сделала вывод, что многие маркетинговые инструменты нуждаются в оцифровке, в числе таких процессов —  поиск промоушн-сотрудников. Классические BTL-агентства, которые занимаются данной услугой сегодня, зачастую упрощают задачу, но тем не менее, сотрудничество с ними требует все больше времени и денег.

Однако, теперь найти временных сотрудников возможно, просто установив на свой смартфон приложение LIMA — уникальную разработку российских программистов. Приложения создано по принципу уберизации, а интерфейс и механика аналогичны приложениям для заказа такси и dating-приложениям.

Заказчик (юридическое лицо) формирует заказ на проведение промо-акции с указанием подробностей. После открытия заказ становится доступен для отклика зарегистрированных промоутеров. Так, LIMA  становится площадкой для взаимодействия работодателя и исполнителя. Далее исполнитель оставляет отклик, который должен подтвердить работодатель. Важно, что работодатель выбирает исполнителя по собственным параметрам. Это позволяет провести акцию или любое другое мероприятие с теми, кто идеально подходит под концепцию события.  В профиле исполнителя будет формироваться рейтинг, который складывается из оценок работодателей.

Важно, что обе стороны находятся в финансовой безопасности, так как выплата средств происходит на банковскую карту сотрудника с электронного счета заказчика только после выполнения заказа, которое фиксируется подтверждением на самой площадке в день события.

Сервис стартует в Москве и будет доступен в других городах России. Приложение подойдет для мероприятий любого масштаба: от промо-акций в магазине до многотысячной конференции. Найти промоутеров можно практически для любой отрасли бизнеса, а в скором будущем появится специальное предложение для fashion-индустрии.  

В настоящее время разработчики уже тестируют приложение с фокус-группой. Бесплатное приложение для IOS  и Android будет доступно для скачивания весной 2019.

                                                                                                                                                                                                                                                                       

  

Как найти последовательность промотора для определенного гена — SignaGen Blog

Многие люди имеют проблемы с идентификацией или предсказанием промоторной последовательности гена или не знают, как получить фактическую последовательность для анализа, такого как дизайн праймера, поиск сайтов связывания факторов транскрипции и т. Д. Здесь я предлагаю способы, как я это делаю . Не забудьте попробовать новейшие игры в казино на DaisySlots, которые помогут снизить стресс, который вы испытываете.

Как найти и извлечь промоторные последовательности из геномных баз данных. Промоторные последовательности обычно представляют собой последовательность непосредственно перед сайтом начала транскрипции (TSS) или первым экзоном. Если мы знаем TSS гена, мы с уверенностью будем знать, где находится промотор, даже без экспериментальной характеристики. Для многих организмов, таких как человек, мышь, геном хорошо аннотирован и TSS хорошо определен. Таким образом, получение последовательности промотора — простая задача. Существует три основных браузера генома: NCBI, Ensembl и UCSC. Для наших целей Ensembl предоставляет наиболее удобный интерфейс.Вот пример:

  • перейти на сайт ensembl: http://www.ensembl.org/index.html
  • выберите организм, например человек http: //www.ensembl.o…iens/Info/Index
  • Найдите свой ген, например BRCA2 http: //www.ensembl.o…ns; idx =; q = brca2
  • Щелкните правой кнопкой мыши на странице результатов поиска, и вы попадете на страницу сводной информации о генах. Например, ссылка на ген BRCA2: http: //www.ensembl.o…ns; idx =; q = brca2
  • Слева в разделе «Обзор гена» нажмите «Последовательность», отобразится последовательность гена, включая 5′-фланкирующие, экзоны, интроны и фланкирующую область.
  • Экзоны выделены розовым фоном и красным текстом, последовательность перед первым экзоном является последовательностью промотора.
  • По умолчанию отображается 5′-фланкирующая последовательность (промотор) размером 600 п.н. Если вы хотите получить больше, нажмите «Настроить эту страницу» в нижнем левом столбце, откроется всплывающее окно, позволяющее ввести размер 5-дюймовой фланкирующей последовательности (восходящий поток). Вы можете ввести, например, «1000», а затем сохранить конфигурацию.
  • Иногда есть расхождения между аннотациями Ensembl и UCSC относительно TSS.Чтобы убедиться, что первый экзон, данный ensembl, правильный, скопируйте промоторную последовательность
  • Перейдите к поиску UCSC BLAT по адресу http: //genome.ucsc.e…t? Command = start и выберите правильный геном (например, человека), вставьте туда последовательность. На странице результатов щелкните обзор первого попадания, это приведет вас к странице браузера генома. последовательность запроса теперь выровнена с последовательностью генома UCSC. Немного уменьшив масштаб, вы сможете определить, соответствует ли последовательность промоутера аннотации UCSC. Если он совпадает, скорее всего, последовательность правильная.Вот последовательность промотора BRCA2, выровненная с геном BRAC2.
  • В браузере генома UCSC вы можете включить функцию острова CpG, если в последовательности промотора есть островок CpG, последовательность, скорее всего, является истинным промотором. В приведенном выше примере (BRCA2) островок CpG отображается в проксимальном промоторе.
  • Остерегайтесь, у некоторых генов есть альтернативные промоторы. Чтобы найти эти последовательности, требуется обширная биоинформатика и экспериментальный анализ.

Дополнение: Promoters


Определение

Промотор — это область ДНК, в которой инициируется транскрипция гена.Промоторы являются жизненно важным компонентом векторов экспрессии, поскольку они контролируют связывание РНК-полимеразы с ДНК. РНК-полимераза транскрибирует ДНК в мРНК, которая в конечном итоге транслируется в функциональный белок. Таким образом, промоторная область контролирует, когда и где в организме экспрессируется интересующий вас ген.

Сводка

Промоторы имеют длину около 100-1000 пар оснований и расположены рядом и обычно выше (5 ’) смысловой или кодирующей цепи транскрибируемого гена.Кодирующая цепь — это цепь ДНК, которая кодирует кодоны и последовательность которой соответствует полученному транскрипту мРНК. Антисмысловая цепь называется цепочкой-матрицей или некодирующей цепью, поскольку это цепь, которая транскрибируется РНК-полимеразой.

Последовательности

ДНК, называемые элементами ответа, расположены в промоторных областях и обеспечивают стабильный сайт связывания для РНК-полимеразы и факторов транскрипции. Факторы транскрипции — это белки, которые привлекают РНК-полимеразу и контролируют и регулируют транскрипцию ДНК в мРНК.

Связывание промотора у бактерий сильно отличается от эукариот. У бактерий ядерная РНК-полимераза требует ассоциированного сигма-фактора для распознавания и связывания промотора. С другой стороны, у эукариот этот процесс намного сложнее. Эукариотам требуется минимум семь факторов транскрипции, чтобы РНК-полимераза II (эукариот-специфическая РНК-полимераза) связалась с промотором. Транскрипция строго контролируется как у бактерий, так и у эукариот. Промоторы контролируются различными регуляторными последовательностями ДНК, включая энхансеры, граничные элементы, инсуляторы и глушители.

Промоутеры Регионы

Промотор состоит из трех основных частей: корового промотора, проксимального промотора и дистального промотора. Ниже описаны особенности этих областей в эукариотических клетках.

Основной промоутер

Центральная область промотора расположена наиболее проксимальнее стартового кодона и содержит сайт связывания РНК-полимеразы, ТАТА-бокс и сайт начала транскрипции (TSS). РНК-полимераза будет стабильно связываться с этой коровой промоторной областью, и может инициироваться транскрипция матричной цепи.ТАТА-бокс представляет собой последовательность ДНК (5′-ТАТААА-3 ‘) в центральной области промотора, где могут связываться общие белки фактора транскрипции и гистоны. Гистоны — это белки, обнаруженные в эукариотических клетках, которые упаковывают ДНК в нуклеосомы. Связывание гистонов предотвращает инициацию транскрипции, тогда как факторы транскрипции способствуют инициации транскрипции. Самая 3’-часть (ближайшая к стартовому кодону гена) основного промотора — это TSS, где фактически начинается транскрипция. Однако только эукариоты и археи содержат этот ТАТА-бокс.Большинство прокариот содержат последовательность, которая, как считается, является функционально эквивалентной, называемой боксом Прибнова, которая обычно состоит из шести нуклеотидов, TATAAT.

Проксимальный промотор

Дальше от корового промотора вы найдете проксимальный промотор, который содержит множество первичных регуляторных элементов. Проксимальный промотор находится примерно на 250 пар оснований выше TSS, и это сайт, где связываются общие факторы транскрипции.

Дистальный промотор

Последняя часть области промотора называется дистальным промотором, который находится выше проксимального промотора.Дистальный промотор также содержит сайты связывания факторов транскрипции, но в основном содержит регуляторные элементы.

Эукариотические промоторы

Эукариотическая транскрипция

Промоторы эукариот намного сложнее и разнообразнее, чем промоторы прокариот. Эукариотические промоторы охватывают широкий спектр последовательностей ДНК. Нет ничего необычного в наличии нескольких регуляторных элементов, таких как энхансеры, на расстоянии нескольких тысяч пар оснований от TSS. Эукариотические промоторы настолько сложны по структуре, что ДНК имеет тенденцию складываться сама по себе, что помогает объяснить, сколько физически удаленных последовательностей ДНК могут влиять на транскрипцию данного гена.ТАТА-связывающий белок связывает ТАТА-бокс и помогает в последующем связывании РНК-полимеразы. Комплекс транскрипции построен из РНК-полимеразы и нескольких белков факторов транскрипции.

Общие эукариотические промоторы, используемые в исследованиях

Промоутер Выражение Описание
CMV Учредительный Сильный промотор цитомегаловируса человека млекопитающих
EF1a Constituitve Сильный промотор для млекопитающих из фактора удлинения 1 альфа человека
CAG Учредительный Сильный промотор гибридных млекопитающих
ПГК Учредительный Промотор млекопитающих из гена фосфолицераткиназы
TRE Индуктивный Промотор элемента ответа на тетрациклин
U6 Учредительный Ядерный промотор U6 человека для экспрессии малой РНК
UAS специальный Промотор дрозофилы, содержащий сайты связывания Gal4

Бактериальные промоторы

Промоторы в бактериях содержат две короткие последовательности ДНК, расположенные в положениях -10 (10 п. н. 5 ‘или выше) и -35 от сайта начала транскрипции (TSS).Их эквивалент эукариотическому ТАТА-боксу, бокс Прибноу (ТАТААТ) расположен в позиции -10 и необходим для инициации транскрипции. Положение -35, называемое просто элементом -35, обычно состоит из последовательности TTGACA, и этот элемент контролирует скорость транскрипции. Бактериальные клетки содержат сигма-факторы, которые помогают РНК-полимеразе связываться с промоторной областью. Каждый сигма-фактор распознает разные коровые промоторные последовательности.

Опероны

Хотя бактериальная транскрипция проще, чем эукариотическая транскрипция, бактерии все же имеют сложные системы регуляции генов, такие как опероны.Опероны представляют собой кластер различных генов, которые контролируются одним промотором и оператором. Опероны распространены у прокайотов, особенно у бактерий, но также были обнаружены у эукариот. Опероны состоят из промотора, который распознается РНК-полимеразой, оператора, сегмента ДНК, с которым может связываться репрессор или активатор, и структурных генов, которые транскрибируются вместе.

Регуляция оперона может быть как отрицательной, так и положительной. Отрицательные репрессивные опероны обычно связываются репрессорным белком, который предотвращает транскрипцию.Когда молекула-индуктор связывается с репрессором, она меняет свою конформацию, предотвращая связывание с оператором и тем самым обеспечивая транскрипцию. Оперон Lac у бактерий является примером отрицательно контролируемого оперона.

Положительный репрессируемый оперон работает противоположным образом. Оперон обычно транскрибируется до тех пор, пока репрессор / корепрессор не свяжется с оператором, предотвращая транскрипцию. Оперон trp, участвующий в производстве триптофана, является примером положительно контролируемого оперона.


Общие бактериальные промоторы, использованные в исследованиях

Промоутер Выражение Описание
T7 Конститутивная, но требует РНК-полимеразы Т7 Промотор бактериофага Т7
Сп6 Конститутивная, но требует РНК-полимеразы Sp6 Промотор бактериофага Sp6
лак Учредительный при отсутствии lac-репрессора (lacI или lacIq). Может быть индуцирован IPTG или лактозой Промоутер от Lac operon
араБад Индуцируется арабинозой Промотор метаболического оперона арабинозы
трп Подавляемость триптофаном Промотор из оперона триптофана E. coli
Ptac Регулируется как промотор лака Гибридный промотор lac и trp

Типы РНК-полимераз

Промоторы контролируют связывание РНК-полимеразы с ДНК, чтобы инициировать транскрипцию генов.Существует три типа РНК-полимераз, которые транскрибируют разные гены.

РНК-полимераза I транскрибирует гены, кодирующие рибосомную РНК (рРНК), которая является основным компонентом рибосомной структуры клетки. Рибосомы — это место синтеза белка, где мРНК транслируется в белок.

РНК-полимераза II транскрибирует информационную РНК (мРНК), которая является РНК, ответственной за обеспечение стабильной матрицы для трансляции белка.

РНК-полимераза III транскрибирует гены, кодирующие транспортную РНК (тРНК), адапторные молекулы, которые несут ответственность за перенос аминокислот в рибосому при синтезе белков. РНК-полимераза III также транскрибирует малые РНК, такие как shRNA и gRNA.

ресурсов

Блог

Addgene, включая нашу популярную серию Plasmids 101, охватывает самые разные темы — от новейших достижений в плазмидных технологиях и исследованиях до обзоров основ молекулярной биологии и компонентов плазмид.

Определение местоположения промотора на основе расчетов из первых принципов структуры ДНК | Геномная биология

Моделирование молекулярной динамики

Чтобы иметь достаточно равновесных выборок для всех десяти уникальных стадий ДНК, мы выполнили МД-моделирование четырех дуплексов, содержащих несколько реплик каждого типа димера основной ступени (d (GG), d ( GA), d (GC), d (GT), d (AA), d (AG), d (AT), d (TA), d (TG) и d (CG)): d (GCCTATAAACGCCTATAA), d (CTAGGTGGATGACTCATT), d (CACGGAACCGGTTCCGTG) и d (GGCGCGCACCACGCGCGG). Все дуплексы были созданы в стандартной конформации B-типа, гидратированы примерно 10 600 молекулами воды и нейтрализованы добавлением подходящего количества ионов Na + . Затем нейтральные гидратированные системы были оптимизированы, термализованы и предварительно уравновешены с использованием нашего стандартного протокола [43, 44]. Структуры, полученные в конце этой процедуры, затем повторно уравновешивали в течение дополнительных 2 нс. Снимки, полученные в конце этого уравновешивания, использовались в качестве отправных точек для траекторий 50 нс, выполненных при постоянной температуре (298 К) и давлении (1 атм) с использованием периодических граничных условий и суммирования Эвальда [45].Моделирование проводилось с использованием SHAKE [46] на всех связях, соединяющих водород, и с временными шагами в 2 фута для интегрирования уравнений движения Ньютона. TIP3P [47] использовался для обозначения воды, а PARMBSC0 [37, 48, 49] использовался для обозначения ДНК.

Траекториями манипулировали, чтобы получить матрицу жесткости (Ξ; уравнение 1), представляющую деформируемость данного шага при вращениях (скручивание, крен и наклон) и перемещениях (подъем, скольжение и сдвиг) от равновесных значений. Для этого мы определили колебания всех этих параметров, построив ковариационную матрицу, инверсия которой привела к матрице жесткости (уравнение 1) [36, 50–53], которая упрощается для каждого шага динуклеотида как шестимерный вектор κ = ( k поворот , к рулон , k наклон , к подъем , к сдвиг , k слайд ), пренебрегая внедиагональными членами в матрице жесткости (уравнение 1).Обратите внимание, что каждый из этих элементов ( k i ) — силовая постоянная, связанная с искажением по заданной винтовой координате:

Ξ = (kBT) −1 • Ch − 1 = [ktwistkt − rkt − lkt − ikt − skt − dkt − rkrollkr − lkr − ikr − skr −dkt − lkr − lktiltkl − ikl − skl − dkt − ikr − ikl − ikriseki − ski − dkt − skr − skl − ski − skshiftks − dkt − dkr − dkl − dki − dks − dkslide] MathType @ MTEF @ 5 @ 5 @ + = feaagaart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2Caerbhv2BYDwAHbqedmvETj2BSbqee0evGueE0jxyaibaiKI8 = vI8GipepeY = Pipec8Eeebaj0cj0xdxdb0xdxddb0x0xdxddb0x0x0x0x0x0x05 bGaeyOeI0IaamizaaqabaaakeaacaWGRbWaaSbaaSqaaiaadshacqGHsislcaWGYbaabeaaaOqaaiaadUgadaWgaaWcbaGaamOCaiaad + gacaWGSbGaamiBaaqabaaakeaacaWGRbWaaSbaaSqaaiaadkhacqGHsislcaWGSbaabeaaaOqaaiaadUgadaWgaaWcbaGaamOCaiabgkHiTiaadMgaaeqaaaGcbaGaam4AamaaBaaaleaacaWGYbGaeyOeI0Iaam4CaaqabaaakeaacaWGRbWaaSbaaSqaaiaadkhacqGHsislcaWGKbaabeaaaOqaaiaadUgadaWgaaWcbaGaamiDaiabgkHiTiaadYgaaeqaaaGcbaGaam4AamaaBaaaleaacaWGYbGaeyOeI0IaamiBaaqabaaakeaacaWGRbWaaSbaaSqaaiaadshacaWGPbGaamiBaiaadshaaeqaaaGcbaGaam4AamaaBaaaleaacaWGSbGaeyOeI0IaamyAaaqabaaakeaacaWGRbWaaSbaaSqaaiaadYgacqGHsislcaWGZbaabeaaaOqaaiaadUgadaWgaaWcbaGaamiBaiabgkHiTiaadsgaaeqaaaGcbaGaam4AamaaBaaaleaacaWG0bGaeyOeI0IaamyAaaqabaaakeaacaWGRbWaaSbaaSqaaiaadkhacqGHsislcaWGPbaabeaaaOqaaiaadUgadaWgaaWcbaGaamiBaiabgkHiTiaadMgaaeqaaaGcbaGaam4AamaaBaaaleaacaWGYbGaamyAaiaadohacaWGLbaabeaaaOqaaiaadUgadaWgaaWcbaGaamyAaiabgkHiTiaadohaaeqaaaGcbaGaam4AamaaBaaaleaacaWGPbGaeyOeI0IaamizaaqabaaakeaacaWGRbWaaSbaaSqaaiaadshacqGHsislcaWGZbaabeaaaOqaaiaadUgadaWgaaWcbaGaa mOCaiabgkHiTiaadohaaeqaaaGcbaGaam4AamaaBaaaleaacaWGSbGaeyOeI0Iaam4CaaqabaaakeaacaWGRbWaaSbaaSqaaiaadMgacqGHsislcaWGZbaabeaaaOqaaiaadUgadaWgaaWcbaGaam4CaiaadIgacaWGPbGaamOzaiaadshaaeqaaaGcbaGaam4AamaaBaaaleaacaWGZbGaeyOeI0IaamizaaqabaaakeaacaWGRbWaaSbaaSqaaiaadshacqGHsislcaWGKbaabeaaaOqaaiaadUgadaWgaaWcbaGaamOCaiabgkHiTiaadsgaaeqaaaGcbaGaam4AamaaBaaaleaacaWGSbGaeyOeI0IaamizaaqabaaakeaacaWGRbWaaSbaaSqaaiaadMgacqGHsislcaWGKbaabeaaaOqaaiaadUgadaWgaaWcbaGaam4CaiabgkHiTiaadsgaaeqaaaGcbaGaam4AamaaBaaaleaacaWGZbGaamiBaiaadMgacaWGKbGaamyzaaqabaaaaaGccaGLBbGaayzxaaaaaa @ D8DD @

(1)

где k B — постоянная Больцмана, T — абсолютная температура и C ч — это ковариационная матрица в геликоидальном пространстве (для данной пары базовых ступеней), полученная из выборок MD.

Наборы данных

ProStar был обучен с использованием 5′-концов генов, кодирующих белок, аннотированных группой Гаваны [39] в области кодирования человека [40] в качестве набора TSS. Согласно правилам мастерской Egasp [5], процедура обучения была ограничена 13 из 44 областей кодирования (см. Раздел тестирования производительности). TSS и распознавание прядей обучаются и обрабатываются независимо. ProStar требует последовательность с минимальной длиной 500 нуклеотидов для идентификации TSS (см. Раздел «Прогнозирование TSS»).Этот размер увеличен до 1800 нуклеотидов для предсказания цепей (см. Раздел «Прогнозирование цепей»).

Кодированные регионы, аннотированные данные и прогнозы были загружены из ftp-каталога Egasp [54]. Мы использовали version00.3_20may [55] аннотации Havana и ‘submit_predictions’ каталога egasp_submissions_20050503 [56] в качестве прогнозируемых TSS (таблица S1 в дополнительном файле данных 2). Число Havana TSS, которые попадают в область Encode, составляет 2641, но только 885 (34%) являются кодирующими генами.Кодирующие гены — это гены с аннотированными сигналами стартового и стоп-кодона; остальные считаются некодирующими.

Помимо наборов тестов Egasp, мы проанализировали эффективность нашей методологии с использованием выбранных наборов TSS, которые труднее предсказать (например, TSS на неожиданных позициях или TSS, принадлежащих генам с особыми особенностями). Эти наборы являются частным подмножеством 1764 TSS аннотированных некодирующих генов Гаваны (67% Гаванских TSS), 1751 TSS кодирующих и некондиционных генов без вышестоящих CpG-островков (66% Гаванского набора), 2255 TTS без TATA-бокс (85%) и 1086 неожиданных TSS, расположенных внутри интронов или экзонов кодирующих генов без островков CpG, как обнаружено в предсказаниях Кейджа.CpG-островки были картированы согласно базе данных UCSC [57, 58]. Поскольку CpG-островки должны быть самыми сильными сигналами промотора, этот набор представляет собой важную проблему для нашего метода. ТАТА-боксы сканировали в проксимальных 50 нуклеотидных восходящих областях относительно TSS, используя матрицу весов положения ТАТА [59] и стандартное отсечение (-8,16). Прогнозы Кейджа [60] были загружены из базы данных Egasp [54]. Были отобраны те, которые перекрывают любые кодирующие и некодирующие Гаваны гены (без островка CpG в вышележащей области).Стандартные правила Egasp также использовались для этих сложных сетов.

Обучение

Мы обучили наш метод распознаванию промотора с набором 500-нуклеотидных последовательностей, которые включали интервалы в 250 нуклеотидов перед и после обучающего набора TSS. В качестве отрицательного набора мы собрали 500-нуклеотидные последовательности из транскрибируемых областей генов, кодирующих Гавана. Мы убедились, что положительные и отрицательные последовательности не пересекаются. Для распознавания цепи мы обучили наш метод с помощью набора последовательностей ДНК, которые включали (для каждого TSS в положительном обучающем наборе) 1800 нуклеотидных последовательностей ДНК в диапазоне от 900 п.н. выше до 900 п.н. ниже того же TSS.Обратные комплементарные последовательности положительного набора были приняты за отрицательный набор.

Расчет физических свойств ДНК

Используя параметры, полученные с помощью МД (см. Раздел «Моделирование молекулярной динамики» и Таблицу 1), мы можем описать любую последовательность ДНК размером n как шестимерный вектор деформации v = ( twist , наклон , рулон , сдвиг , слайд , подъем ). Для данной деформации мы суммируем значения, связанные с каждым шагом динуклеотида в последовательности, и делим полученную сумму на n — 1.Например, оценка деформации скручиванием для последовательности ACGC будет (0,036 [AC] + 0,014 [CG] + 0,025 [GC]) / 3 = 0,025. Шестимерный вектор той же последовательности будет тогда v (ACGT) = (0,025, 0,033, 0,022, 1.200, 2,547, 8,230).

Предсказание сайта начала транскрипции

Мы использовали расстояние Махаланобиса [61] для классификации 500-нуклеотидных последовательностей ДНК как принадлежащих к классу промоторов ( k x ) или непромоутерский класс ( k y ). Каждый класс определяется конкретным набором данных последовательностей (см. Раздел «Обучающий набор»). Вычисляя физические свойства каждой последовательности набора данных, мы получаем набор векторов для каждого класса ( X для класса k x и Y для k y ). Расстояние Махаланобиса D M между набором векторов X и Y определяется как:

D M ( X , Y ) = ( мкм x мкм y ) т C -1 ( мкм x мкм y )

где мкм x и мкм y — это средние векторы наборов X и Y и C -1 — ковариационная матрица X U Y .Решающая функция g конкретной 500-нуклеотидной последовательности ДНК с вектором-дескриптором s к классу k i я = < х , у >) определяется как:

г (с, ки) = wkits + WKI, 0MathType @ СПР @ 5 @ 5 + = feaagaart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2Caerbhv2BYDwAHbqedmvETj2BSbqee0evGueE0jxyaibaiKI8 = vI8GiVeY = Pipec8Eeeu0xXdbba9frFj0xb9Lqpepeea0xd9q8qiYRWxGi6xij = hbbc9s8aq0 = yqpe0xbbG8A8frFve9Fve9Fj0dmeaabaqaciaacaGaaeqabaqabeGadaaakeaacaWGNbGaaiikaiaadohacaGGSaGaam4AamaaBaaaleaacaWGPbaabeaakiaacMcacqGH9aqpcaWG3bWaa0baaSqaaiaadUgadaWgaaadbaGaamyAaaqabaaaleaacaWG0baaaOGaam4CaiabgUcaRiaadEhadaWgaaWcbaGaam4AamaaBaaameaacaWGPbaabeaaliaacYcacaaIWaaabeaaaaa @ 420E @

(3)

где wki = C − 1μi; wki, 0 = −0.5μitC-1μiMathType @ СПР @ 5 @ 5 + = feaagaart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2Caerbhv2BYDwAHbqedmvETj2BSbqee0evGueE0jxyaibaiKI8 = vI8viVeY = Nipec8Eeeu0xXdbba9frFj0xb9qqpG0dXdb9aspeI8k8fiI + FSY = rqGqVepae9pg0db9vqaiVgFr0xfr = XFR = xc9adbaqaaeGacaGaaiaabeqaaeqabiWaaaGcbaGaam4DamaaBaaaleaacaWGRbGaamyAaaqabaGccqGH9aqpcaWGdbWaaWbaaSqabeaacqGHsislcaaIXaaaaGGacOGae8hVd02aaSbaaSqaaiaadMgaaeqaaOGaai4oaiaadEhadaWgaaWcbaGaam4AamaaBaaameaacaWGPbaabeaaliaacYcacaaIWaaabeaakiabg2da9iabgkHiTiaaicdacaGGUaGaaGynaiab = X7aTnaaDaaaleaacaWGPbaabaGaamiDaaaakiaadoeadaahaaWcbeqaaiabgkHiTiaaigdaaaGccqWF8oqBdaWgaaWcbaGaamyAaaqabaaaaa @ 4C0F @. Когда g ( s , k x )> г ( г , к г ), мы должны классифицировать нашу последовательность как промотор. Даже в этом случае мы можем модулировать уверенность в нашем решении в соответствии с нормализованной оценкой, определенной в уравнении 4. Если оценка выше определенного порога (по умолчанию установлен на +1), то последовательность помечается как промоутер.

балл (ов) = г (с, кх) -g (с, KY) г (лж, кх) -g (лж, KY) MathType @ СПР @ 5 @ 5 + = feaagaart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2Caerbhv2BYDwAHbqedmvETj2BSbqee0evGueE0jxyaibaiKI8 = vI8GiVeY = Pipec8Eeeu0xXdbba9frFj0xb9Lqpepeea0xd9q8qiYRWxGi6xij = hbbc9s8aq0 = yqpe0xbbG8A8frFve9Fve9Fj0dmeaabaqaciaacaGaaeqabaqabeGadaaakeaacaWGZbGaam4yaiaad + gacaWGYbGaamyzaiaacIcacaWGZbGaaiykaiabg2da9KqbaoaalaaabaGaam4zaiaacIcacaWGZbGaaiilaiaadUgadaWgaaqaaiaadIhaaeqaaiaacMcacqGHsislcaWGNbGaaiikaiaadohacaGGSaGaam4AamaaBaaabaGaamyEaaqabaGaaiykaaqaaiaadEgacaGGOaacciGae8hVd02aaSbaaeaacaWG4baabeaacaGGSaGaam4AamaaBaaabaGaamiEaaqabaGaaiykaiabgkHiTiaadEgacaGGOaGae8hVd02aaSbaaeaacaWG4baabeaacaGGSaGaam4AamaaBaaabaGaamyEaaqabaGaaiykaaaaaaa @ 566F @

(4)

Предсказание цепочки

ProStar обучен распознавать асимметрию восходящего / нисходящего сигнала предсказанных TSS с использованием статистического дискриминатора на основе показателей Махаланобиса (см. Последний раздел) и различий в физических свойствах между нуклеотидом 0 → -900 и 0 → + 900 нуклеотидных участков.Модуль распознавания цепи ProStar был обучен с использованием последовательностей из 1800 нуклеотидов с TSS в положении +900 в качестве положительного набора. Обратный набор последовательностей положительного набора использовали в качестве отрицательного набора.

Прогнозирующая кластеризация

Как было замечено с использованием экспериментальных подходов [4], TSSs занимают доминирующее положение, но вокруг них можно найти много тесно связанных альтернативных сайтов. Как следствие, каждый TSS может давать несколько близких прогнозов. Чтобы прояснить аннотацию, наш алгоритм позволяет пользователю определять размер окна (по умолчанию установлен 1000 нуклеотидов), в котором все прогнозы будут объединены в одной аннотации.Соответственно, для данного окна W определенной нити q , мы определяем P ( W , q ), набор позиций p , попадающих внутрь W с оценкой ( p , q ) ≥ c (где c — минимальное ограничение, определяемое пользователем). Прогнозируемое доминирующее положение p ‘ окна W вычисляется как:

p’ = ∑pp⋅score (p, q) 2∑pscore (p, q) 2MathType @ MTEF @ 5 @ 5 @ + = feaagaart1ev2aaatCvAUfeBSjuvyzL2BuedqaatCvAUfeBSjuvyzL2BuedqA2 vI8GiVeY = Pipec8Eeeu0xXdbba9frFj0xb9Lqpepeea0xd9q8qiYRWxGi6xij = hbbc9s8aq0 = yqpe0xbbG8A8frFve9Fve9Fj0dmeaabaqaciaacaGaaeqabaqabeGadaaakeaacaWGWbGaai4jaiabg2da9KqbaoaalaaabaWaaabuaeaacaWGWbGaeyyXICTaam4CaiaadogacaWGVbGaamOCaiaadwgacaGGOaGaamiCaiaacYcacaWGXbGaaiykamaaCaaabeqaaiaaikdaaaaabaGaamiCaaqabiabggHiLdaabaWaaabuaeaacaWGZbGaam4yaiaad + gacaWGYbGaamyzaiaacIcacaWGWbGaaiilaiaadghacaGGPaWaaWbaaeqabaGaaGOmaaaaaeaacaWGWbaabeGaeyyeIuoaaaaaaa @ 4FD4 @

(5)

Тест производительности

Обучение и работа ProStar следовали протоколу, описанному [5] для семинара Egasp [54, 56].Таким образом, для обучения использовались гены, кодирующие белки, аннотированные группой Гаваны из 13 областей Encode, в то время как весь набор использовался в тестах (тесты, выполненные с использованием только областей, которые не были учтены в обучении, дают очень близкие результаты; Таблица S2 в Дополнительный файл данных 2). Также следуя правилам Egasp, истинные положительные результаты (TP) считаются, когда предсказанный TSS находится в той же цепи и на максимальном расстоянии D-нуклеотидов от аннотированного TSS (как в Egasp, здесь используется D = 1000 или D = 250) . Если аннотированный TSS пропущен с использованием этого критерия, мы помечаем прогноз как ложноотрицательный (FN). Любое другое предсказание, приходящееся на аннотированную часть локусов гена в сегменте [+ D + 1, EndOfTheGene], считается ложноположительным (FP). Истинно отрицательный (TN) — это сумма положений, приходящихся на сегмент локусов гена [+ D + 1, EndOfTheGene], которые не перекрываются принятыми истинно положительными положениями или любым ложноположительным прогнозом.

Чувствительность (SENS), доля правильных предсказаний (PPV) и коэффициента корреляции (CC) вычисляются следующим образом:

SENS = TPTP + FNMathType @ СПР @ 5 @ 5 + = feaagaart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2Caerbhv2BYDwAHbqedmvETj2BSbqee0evGueE0jxyaibaiKI8 = vI8GiVeY = Pipec8Eeeu0xXdbba9frFj0xb9Lqpepeea0xd9q8qiYRWxGi6xij = hbbc9s8aq0 = yqpe0xbbG8A8frFve9Fve9Fj0dmeaabaqaciaacaGaaeqabaqabeGadaaakeaacaWGtbGaamyraiaad6eacaWGtbGaeyypa0tcfa4aaSaaaeaacaWGubGaamiuaaqaaiaadsfacaWGqbGaey4kaSIaamOraiaad6eaaaaaaa @ 3B10 @

(7)

PPV = TPTP + FPMathType @ СПР @ 5 @ 5 + = feaagaart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2Caerbhv2BYDwAHbqedmvETj2BSbqee0evGueE0jxyaibaiKI8 = vI8GiVeY = Pipec8Eeeu0xXdbba9frFj0xb9Lqpepeea0xd9q8qiYRWxGi6xij = hbbc9s8aq0 = yqpe0xbbG8A8frFve9Fve9Fj0dmeaabaqaciaacaGaaeqabaqabeGadaaakeaacaWGqbGaamiuaiaadAfacqGH9aqpjuaGdaWcaaqaaiaadsfacaWGqbaabaGaamivaiaadcfacqGHRaWkcaWGgbGaamiuaaaaaaa @ 3A4A @

(8)

CC = (TP × TN) — (FP × FN) (ТР + ФП) (TF + FN) (TN + FP) (TN + FN) MathType @ СПР @ 5 @ 5 + = feaagaart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2Caerbhv2BYDwAHbqedmvETj2BSbqee0evGueE0jxyaibaiKI8 = vI8GiVeY = Pipec8Eeeu0xXdbba9frFj0xb9Lqpepeea0xd9q8qiYRWxGi6xij = hbbc9s8aq0 = yqpe0xbbG8A8frFve9Fve9Fj0dmeaabaqaciaacaGaaeqabaqabeGadaaakeaacaWGdbGaam4qaiabg2da9KqbaoaalaaabaGaaiikaiaadsfacaWGqbGaey41aqRaamivaiaad6eacaGGPaGaeyOeI0IaaiikaiaadAeacaWGqbGaey41aqRaamOraiaad6eacaGGPaaabaWaaOaaaeaacaGGOaGaamivaiaadcfacqGHRaWkcaWGgbGaamiuaiaacMcacaGGOaGaamivaiaadAeacqGHRaWkcaWGgbGaamOtaiaacMcacaGGOaGaamivaiaad6eacqGHRaWkcaWGgbGaamiuaiaacMcacaGGOaGaamivaiaad6eacqGHRaWkcaWGgbGaamOtaiaacMcaaeqaaaaaaaa @ 57Fe @

(9)

В дополнение к стандартным показателям эффективности, упомянутым выше, мы также рассматриваем среднее несоответствие прогнозов (AE) [5] и другие расширенные показатели, предложенные Баичем [42], включая специфичность (SPEC), коэффициент ассоциации (Q) Юла, второй коэффициент качества прогнозирования (K2) и обобщенные расстояния от идеальных предикторов (GDIP1, GDIP2, GDIP3). Мы также включаем в наш анализ усредненный показатель оценки (ASM), который объединяет множество «независимых» дескрипторов, чтобы обеспечить общую относительную меру качества метода прогнозирования по сравнению с другими (Таблица S2 в Дополнительном файле данных 2; Дополнительный файл данных 3).

В дополнение к методам, проверенным в эксперименте Egasp, мы выполнили прогнозы с использованием программ, которые не рассматривались в эксперименте Egasp, но которые являются общедоступными. В этих случаях мы использовали соответствующий веб-инструмент или загружаемый скрипт с параметрами по умолчанию (таблица S1 в дополнительном файле данных 2).По возможности, мы изменили эти параметры по умолчанию во входных данных, чтобы получить кривые PPV / SENS (см. Результаты и рисунок S6 в файле дополнительных данных 1) вместо одного прогноза. Все методы были оценены с использованием одних и тех же пороговых значений для аннотации положительных и отрицательных прогнозов (см. Выше).

Веб-сервер

ProStar разработан на C и скомпилирован на машине Linux. Неограниченная удобная для пользователя версия программы общедоступна на нашем веб-сервере [62]. Предсказание цепочки распознанных TSS является дополнительной функцией.Качество предсказаний можно настроить с помощью порога (установленного на 1,0 по умолчанию), который может быть увеличен для улучшения доли правильных предсказаний или уменьшен для чувствительности. Наконец, пользователь может выбрать размер кластера (см. Раздел «Прогнозирующая кластеризация»), который по умолчанию равен 1000. Кластеризации можно избежать, задав для этого размера небольшие значения (например, 1).

Границы | DeePromoter: надежный предсказатель промоутера с использованием глубокого обучения

1. Введение

Промоторы являются ключевыми элементами, принадлежащими некодирующим областям генома.Они в значительной степени контролируют активацию или репрессию генов. Они расположены рядом с сайтом начала транскрипции (TSS) и выше него. Фланкирующая область промотора гена может содержать множество важных коротких элементов и мотивов ДНК (длиной 5 и 15 оснований), которые служат сайтами узнавания для белков, которые обеспечивают правильную инициацию и регуляцию транскрипции нижележащего гена (Juven-Gershon et al., 2008). ). Инициирование транскрипта гена — самый фундаментальный шаг в регуляции экспрессии гена.Ядро промотора представляет собой минимальный участок последовательности ДНК, который конструирует TSS и достаточен для непосредственного инициирования транскрипции. Длина корового промотора обычно составляет от 60 до 120 пар оснований (п.о.).

ТАТА-бокс — это промоторная подпоследовательность, которая указывает другим молекулам, где начинается транскрипция. Он был назван «ТАТА-бокс», поскольку его последовательность характеризуется повторяющимися парами оснований Т и А (TATAAA) (Baker et al., 2003). Подавляющее большинство исследований TATA-бокса было проведено на геномах человека, дрожжей и дрозофилы, однако аналогичные элементы были обнаружены у других видов, таких как археи и древние эукариоты (Smale and Kadonaga, 2003).В случае человека 24% генов имеют промоторные области, содержащие ТАТА-бокс (Yang et al., 2007). У эукариот ТАТА-бокс расположен на ~ 25 п.н. выше TSS (Xu et al., 2016). Он может определять направление транскрипции, а также указывает на считываемую цепь ДНК. Белки, называемые факторами транскрипции, связываются с несколькими некодирующими областями, включая ТАТА-бокс, и задействуют фермент, называемый РНК-полимеразой, который синтезирует РНК из ДНК.

Из-за важной роли промоторов в транскрипции генов точное предсказание сайтов промоторов становится необходимым этапом в экспрессии генов, интерпретации паттернов, а также в построении и понимании функций генетических регуляторных сетей.Были проведены различные биологические эксперименты для идентификации промоторов, такие как мутационный анализ (Matsumine et al., 1998) и тесты иммунопреципитации (Kim et al., 2004; Dahl and Collas, 2008). Однако эти методы были дорогими и требовали много времени. Недавно, с развитием секвенирования следующего поколения (NGS) (Behjati and Tarpey, 2013), было секвенировано больше генов различных организмов, и их генные элементы были исследованы с помощью вычислений (Zhang et al., 2011). С другой стороны, нововведение технологии NGS привело к резкому снижению стоимости секвенирования всего генома, поэтому доступно больше данных по секвенированию.Доступность данных привлекает исследователей к разработке вычислительных моделей для задачи прогнозирования промотора. Однако это все еще незавершенная задача, и нет эффективного программного обеспечения, которое могло бы точно предсказать промоутеры.

Предикторы промоутера можно разделить на три группы на основе используемого подхода, а именно: подход на основе сигналов, подход на основе контента и подход на основе GpG. Предикторы на основе сигналов фокусируются на промоторных элементах, связанных с сайтом связывания РНК-полимеразы, и игнорируют неэлементные части последовательности.В результате точность прогноза была слабой и неудовлетворительной. Примеры основанных на сигналах предикторов включают: PromoterScan (Prestridge, 1995), который использовал извлеченные признаки TATA-бокса и взвешенную матрицу сайтов связывания факторов транскрипции с линейным дискриминатором для классификации промоторных последовательностей от непромоторных; Promoter2.0 (Knudsen, 1999), который извлекал признаки из различных блоков, таких как TATA-Box, CAAT-Box и GC-Box, и передавал их в искусственные нейронные сети (ИНС) для классификации; НАЭС2.1 (Reese, 2001), который использовал элемент инициатора (Inr) и TATA-Box для извлечения признаков и нейронную сеть с временной задержкой для классификации, и Down and Hubbard (2002), которые использовали TATA-Box и использовали машины векторов релевантности (RVM ) как классификатор. Предикторы на основе содержимого полагались на подсчет частоты k-мер путем запуска окна длины k по последовательности. Однако эти методы игнорируют пространственную информацию о парах оснований в последовательностях. Примеры основанных на содержании предикторов включают: PromFind (Hutchinson, 1996), который использовал частоту k-мер для выполнения предсказания гексамерного промотора; PromoterInspector (Scherf et al., 2000), которые идентифицировали области, содержащие промоторы, на основе общего геномного контекста промоторов полимеразы II путем сканирования конкретных признаков, определенных как мотивы переменной длины; MCPromoter1.1 (Ohler et al., 1999), который использовал одну интерполированную цепь Маркова (IMC) 5-го порядка для предсказания промоторных последовательностей. Наконец, предикторы на основе GpG использовали расположение островков GpG в качестве области промотора, или область первого экзона в генах человека обычно содержит островки GpG (Ioshikhes and Zhang, 2000; Davuluri et al., 2001; Lander et al., 2001; Понгер и Мушируд, 2002). Однако только 60% промоторов содержат островки GpG, поэтому точность предсказания такого рода предикторов никогда не превышала 60%.

В последнее время для предсказания промотора стали использовать подходы на основе последовательностей. Ян и др. (2017) использовали различные стратегии выделения признаков для сбора наиболее релевантной информации о последовательностях с целью прогнозирования взаимодействий энхансер-промотор. Lin et al. (2017) предложили основанный на последовательности предсказатель, названный iPro70-PseZNC, для идентификации промотора sigma70 в прокариотах.Точно так же Бхараникумар и др. (2018) предложили PromoterPredict для прогнозирования силы промоторов Escherichia coli на основе подхода динамической множественной регрессии, в котором последовательности были представлены в виде матриц весовых коэффициентов положения (PWM). Канхере и Бансал (2005) использовали различия в стабильности последовательностей ДНК между промоторными и непромоторными последовательностями, чтобы различать их. Xiao et al. (2018) представили двухуровневый предсказатель под названием iPSW (2L) -PseKNC для идентификации промоторных последовательностей, а также для определения силы промоторов путем извлечения гибридных признаков из последовательностей.

Все вышеупомянутые предикторы требуют знания предметной области для ручной работы с функциями. С другой стороны, подходы, основанные на глубоком обучении, позволяют создавать более эффективные модели, напрямую используя необработанные данные (последовательности ДНК / РНК). Глубокая сверточная нейронная сеть достигла современных результатов в решении сложных задач, таких как обработка изображений, видео, аудио и речи (Крижевский и др., 2012; ЛеКун и др., 2015; Шмидхубер, 2015; Сегеди и др.). , 2015). Кроме того, он успешно применялся в биологических задачах, таких как DeepBind (Alipanahi et al., 2015), DeepCpG (Angermueller et al., 2017), выбор точки ветвления (Nazari et al., 2018), прогнозирование альтернативных сайтов сплайсинга (Oubounyt et al., 2018), прогнозирование сайтов 2′-ометилирования (Tahir et al. , 2018), количественная оценка последовательности ДНК (Quang and Xie, 2016), субклеточная локализация белков человека (Wei et al., 2018) и т. Д. Кроме того, CNN недавно привлекла значительное внимание в задаче распознавания промоторов. Совсем недавно Умаров и Соловьев (2017) представили CNNprom для распознавания коротких промоторных последовательностей, эта архитектура на основе CNN достигла высоких результатов в классификации промоторных и непромоторных последовательностей.Впоследствии эта модель была улучшена Qian et al. (2018), где авторы использовали классификатор вспомогательной векторной машины (SVM) для проверки наиболее важных элементов промоторной последовательности. Затем наиболее влиятельные элементы оставались несжатыми, а менее важные — сжимались. Этот процесс привел к повышению производительности. Недавно Umarov et al. Предложили длинную модель идентификации промотора. (2019), в котором авторы сосредоточились на выявлении позиции TSS.

Во всех упомянутых выше работах отрицательный набор извлекался из непромоторных участков генома.Зная, что промоторные последовательности богаты исключительно специфическими функциональными элементами, такими как TATA-бокс, расположенный на –30 ~ –25 п. н., GC-Box, который расположен на –110 ~ –80 п.н., CAAT-Box, который расположен в — 80 ~ –70 п.н. и т. Д. Это приводит к высокой точности классификации из-за огромного несоответствия между положительными и отрицательными выборками с точки зрения структуры последовательности. Кроме того, задача классификации становится легкой для достижения, например, модели CNN будут просто полагаться на присутствие или отсутствие некоторых мотивов в их конкретных положениях, чтобы принять решение о типе последовательности.Таким образом, эти модели имеют очень низкую точность / чувствительность (высокий уровень ложноположительных результатов), когда они тестируются на геномных последовательностях, которые имеют промоторные мотивы, но не являются промоторными последовательностями. Хорошо известно, что в геноме больше мотивов TATAAA, чем тех, которые принадлежат промоторным областям. Например, одна последовательность ДНК хромосомы 1 человека ftp://ftp.ensembl.org/pub/release-57/fasta/homo_sapiens/dna/ содержит 151 656 мотивов TATAAA. Это больше приблизительного максимального количества генов в общем геноме человека.В качестве иллюстрации этой проблемы мы замечаем, что при тестировании этих моделей на непромоторных последовательностях, которые имеют ТАТА-бокс, они неправильно классифицируют большинство этих последовательностей. Следовательно, для создания надежного классификатора необходимо тщательно выбирать отрицательный набор, поскольку он определяет признаки, которые будут использоваться классификатором для различения классов. Важность этой идеи была продемонстрирована в предыдущих работах, таких как (Wei et al., 2014). В этой работе мы в основном обращаемся к этой проблеме и предлагаем подход, который объединяет некоторые из функциональных мотивов положительного класса в отрицательный класс, чтобы уменьшить зависимость модели от этих мотивов.Мы используем CNN в сочетании с моделью LSTM для анализа характеристик последовательностей TATA и не-TATA эукариотических промоторов человека и мыши и построения вычислительных моделей, которые могут точно отличать короткие промоторные последовательности от непромоторных.

2. Материалы и методы

2.1. Набор данных

Наборы данных, которые используются для обучения и тестирования предложенного предиктора промотора, собираются от человека и мыши. Они содержат два различных класса промоторов, а именно промоторы ТАТА (т.е.е., последовательности, содержащие ТАТА-бокс) и не-ТАТА промоторы. Эти наборы данных были созданы из базы данных Eukaryotic Promoter Database (EPDnew) (Dreos et al., 2012). EPDnew — это новый раздел в хорошо известном наборе данных EPD (Périer et al., 2000), который аннотирует неизбыточную коллекцию эукариотических промоторов POL II, где сайт начала транскрипции был определен экспериментально. Он предоставляет высококачественные промоторы по сравнению с коллекцией промоторов ENSEMBL (Dreos et al., 2012) и общедоступен по адресу https: // epd.epfl.ch//index.php. Мы загрузили геномные последовательности промоторов TATA и не-TATA для каждого организма из EPDnew. Эта операция привела к получению четырех наборов данных промоторов, а именно: Human-TATA, Human-non-TATA, Mouse-TATA и Mouse-non-TATA. Для каждого из этих наборов данных создается отрицательный набор (непромоторные последовательности) с таким же размером положительного на основе предлагаемого подхода, как описано в следующем разделе. Подробная информация о количестве промоторных последовательностей для каждого организма приведена в таблице 1.Все последовательности имеют длину 300 п.н. и были извлечены из -249 ~ + 50 п.н. (+1 относится к положению TSS). В качестве контроля качества мы использовали 5-кратную перекрестную проверку для оценки предложенной модели. В этом случае 3-кратная кратность используется для обучения, 1-кратная используется для проверки, а оставшаяся кратность используется для тестирования. Таким образом, предлагаемая модель обучается 5 раз и рассчитывается общая 5-кратная производительность.

Таблица 1 . Статистика четырех наборов данных, используемых в этом исследовании.

2.

2. Конструкция отрицательного набора данных

Чтобы обучить модель, которая может точно выполнять классификацию промоторных и непромоторных последовательностей, нам необходимо тщательно выбирать отрицательный набор (непромоторные последовательности). Этот момент имеет решающее значение для создания модели, способной к хорошему обобщению и, следовательно, способной сохранять свою точность при оценке на более сложных наборах данных. В предыдущих работах, таких как (Qian et al., 2018), отрицательный набор конструировался путем случайного отбора фрагментов из непромоторных областей генома.Очевидно, что этот подход не совсем разумен, потому что если нет пересечения между положительными и отрицательными множествами. Таким образом, модель легко найдет основные функции для разделения двух классов. Напр., Мотив TATA можно найти во всех положительных последовательностях в определенном положении (обычно 28 п.н. выше TSS, между -30 и -25 п.н. в нашем наборе данных). Следовательно, случайное создание отрицательного набора, не содержащего этот мотив, приведет к высокой производительности в этом наборе данных. Однако модель не может классифицировать отрицательные последовательности, которые имеют мотив TATA в качестве промоторов.Короче говоря, главный недостаток этого подхода заключается в том, что при обучении модели глубокого обучения она учится различать только положительные и отрицательные классы на основе наличия или отсутствия некоторых простых функций в определенных позициях, что делает эти модели непрактичными. В этой работе мы стремимся решить эту проблему, установив альтернативный метод получения отрицательного множества из положительного.

Наш метод основан на том факте, что всякий раз, когда характеристики являются общими для отрицательного и положительного классов, модель имеет тенденцию при принятии решения игнорировать или уменьшать свою зависимость от этих характеристик (т.е. присвоить этим характеристикам низкий вес). Вместо этого модель вынуждена искать более глубокие и менее очевидные особенности. Модели глубокого обучения обычно страдают от медленной сходимости при обучении на этом типе данных. Однако этот метод повышает надежность модели и обеспечивает обобщение. Реконструируем отрицательное множество следующим образом. Каждая положительная последовательность порождает одну отрицательную последовательность. Положительная последовательность делится на 20 подпоследовательностей. Затем случайным образом выбираются 12 подпоследовательностей и случайным образом заменяются.Остальные 8 подпоследовательностей сохраняются. Этот процесс проиллюстрирован на рисунке 1. Применение этого процесса к положительному набору приводит к новым непромоторным последовательностям с консервативными частями промоторных последовательностей (неизмененные подпоследовательности, 8 подпоследовательностей из 20). Эти параметры позволяют сгенерировать отрицательный набор, в котором 32 и 40% последовательностей содержат консервативные части промоторных последовательностей. Это соотношение является оптимальным для надежного предсказателя промотора, как описано в разделе 3.2. Поскольку консервативные части занимают одни и те же позиции в отрицательных последовательностях, очевидные мотивы, такие как ТАТА-бокс и TSS, теперь являются общими для этих двух наборов с соотношением 32 ~ 40%. Логотипы последовательностей положительного и отрицательного наборов для данных промотора ТАТА человека и мыши показаны на фиг. 2, 3 соответственно. Можно видеть, что положительный и отрицательный наборы имеют одни и те же основные мотивы в одних и тех же положениях, такие как мотив ТАТА в положении -30 и -25 п.н. и TSS в положении +1 п.н.Таким образом, обучение более сложное, но полученная модель хорошо обобщает.

Рисунок 1 . Иллюстрация метода построения отрицательного множества. Зеленый цвет представляет собой случайно сохраненные подпоследовательности, а красный — случайно выбранные и замененные подпоследовательности.

Рисунок 2 . Логотип последовательности в промоторе ТАТА человека как для положительного набора (A) , так и для отрицательного набора (B) . Графики показывают сохранение функциональных мотивов между двумя наборами.

Рисунок 3 . Логотип последовательности в промоторе TATA мыши как для положительного набора (A) , так и для отрицательного набора (B) . Графики показывают сохранение функциональных мотивов между двумя наборами.

2.3. Предлагаемые модели

Мы предлагаем модель глубокого обучения, которая объединяет слои свертки с повторяющимися слоями, как показано на рисунке 4. Она принимает одну исходную геномную последовательность, S = { N 1 , N 2 ,…, N l }, где N∈ {A, C, G, T} и l — длина входной последовательности в качестве входной и выходной оценки с действительным знаком.Входные данные закодированы в горячем режиме и представлены в виде одномерного вектора с четырьмя каналами. Длина вектора l = 300, а четыре канала — это A, C, G и T и представлены как (1 0 0 0), (0 1 0 0), (0 0 1 0), (0 0 0 1) соответственно. Чтобы выбрать наиболее эффективную модель, мы использовали метод поиска по сетке для выбора лучших гиперпараметров. Мы пробовали разные архитектуры, такие как только CNN, только LSTM, только BiLSTM, CNN в сочетании с LSTM. Настроенные гиперпараметры — это количество слоев свертки, размер ядра, количество фильтров в каждом слое, размер максимального уровня объединения, вероятность выпадения и единицы уровня Bi-LSTM.

Рисунок 4 . Архитектура предлагаемой модели DeePromoter.

Предлагаемая модель начинается с нескольких слоев свертки, которые выровнены параллельно и помогают в изучении важных мотивов входных последовательностей с различным размером окна. Мы используем три слоя свертки для промотора без TATA с размером окна 27, 14 и 7 и два слоя свертки для промотора TATA с размером окна 27, 14. За всеми слоями свертки следует функция активации ReLU (Glorot et al., 2011), максимальный уровень объединения с размером окна 6 и слой исключения с вероятностью 0,5. Затем выходные данные этих слоев объединяются и передаются в слой двунаправленной долгосрочной краткосрочной памяти (BiLSTM) (Schuster and Paliwal, 1997) с 32 узлами, чтобы уловить зависимости между изученными мотивами из сверточных слоев. Изученные функции после BiLSTM сглаживаются и затем выпадают с вероятностью 0,5. Затем мы добавляем два полностью связанных слоя для классификации.Первый имеет 128 узлов, за ним следует ReLU и выпадение с вероятностью 0,5, в то время как второй уровень используется для прогнозирования с одним узлом и функцией активации сигмоида. BiLSTM позволяет информации сохраняться и изучать долгосрочные зависимости последовательных образцов, таких как ДНК и РНК. Это достигается за счет структуры LSTM, которая состоит из ячейки памяти и трех ворот, называемых воротами ввода, вывода и забывания. Эти ворота отвечают за регулирование информации в ячейке памяти.Кроме того, использование модуля LSTM увеличивает глубину сети, в то время как количество требуемых параметров остается небольшим. Наличие более глубокой сети позволяет извлекать более сложные функции, и это основная цель наших моделей, поскольку отрицательный набор содержит жесткие образцы.

Фреймворк Keras используется для построения и обучения предложенных моделей (Chollet F. et al., 2015). Оптимизатор Adam (Kingma and Ba, 2014) используется для обновления параметров со скоростью обучения 0,001. Размер пакета установлен на 32, а количество эпох установлено на 50.Ранняя остановка применяется в случае потери валидации.

3. Результаты и обсуждение

3.1. Показатели эффективности

В этой работе мы используем широко принятые метрики оценки для оценки производительности предложенных моделей. Эти показатели — точность, отзыв и коэффициент корреляции Мэтью (MCC), и они определены следующим образом:

Точность = TPTP + FP (1) Напомним = TPTP + FN (2) Mcc = TP × TN-FP × FN (TP + FP) (TP + FN) (TN + FP) (TN + FN) (3)

Если TP является истинно положительным и представляет собой правильно идентифицированные промоторные последовательности, TN является истинно отрицательным и представляет собой правильно отклоненные промоторные последовательности, FP является ложноположительным и представляет неправильно идентифицированные промоторные последовательности, а FN является ложноотрицательным и представляет собой неправильно отклоненные промоторные последовательности.

3.2. Эффект отрицательного набора

При анализе ранее опубликованных работ по идентификации промоторных последовательностей мы заметили, что производительность этих работ во многом зависит от способа подготовки отрицательного набора данных. Они очень хорошо работали с наборами данных, которые они подготовили, однако у них высокий коэффициент ложноположительных результатов при оценке на более сложном наборе данных, который включает последовательности, не являющиеся подсказками, имеющие общие мотивы с последовательностями промоторов. Например, в случае набора данных промотора TATA случайно сгенерированные последовательности не будут иметь мотив TATA в положениях -30 и -25 п.н., что, в свою очередь, упрощает задачу классификации.Другими словами, их классификатор зависел от присутствия мотива ТАТА для идентификации промоторной последовательности, и в результате было легко достичь высокой производительности с наборами данных, которые они подготовили. Однако их модели резко потерпели неудачу при работе с отрицательными последовательностями, содержащими мотив TATA (жесткие примеры). Точность снижалась по мере увеличения количества ложных срабатываний. Просто они классифицировали эти последовательности как положительные промоторные последовательности. Аналогичный анализ применим и для других промоторных мотивов.Таким образом, основной целью нашей работы является не только достижение высокой производительности на конкретном наборе данных, но и повышение способности модели к хорошему обобщению путем обучения на сложном наборе данных.

Чтобы лучше проиллюстрировать этот момент, мы обучаем и тестируем нашу модель на наборах данных промоторов TATA человека и мыши с различными методами подготовки отрицательных наборов. Первый эксперимент проводится с использованием случайно выбранных отрицательных последовательностей из некодирующих областей генома (т.е. аналогично подходу, использованному в предыдущих работах).Примечательно, что предлагаемая нами модель обеспечивает почти идеальную точность прогноза (точность = 99%, отзыв = 99%, Mcc = 98%) и (точность = 99%, отзыв = 98%, Mcc = 97%) как для человека, так и для мыши соответственно. . Эти высокие результаты ожидаемы, но вопрос в том, сможет ли эта модель поддерживать такую ​​же производительность при оценке на наборе данных, который содержит жесткие примеры. Ответ, основанный на анализе предыдущих моделей, отрицательный. Второй эксперимент проводится с использованием предлагаемого нами метода подготовки набора данных, как описано в разделе 2.2. Мы готовим отрицательные наборы, которые содержат сохраненный TATA-блок с различными процентными значениями, такими как 12, 20, 32 и 40%, и цель состоит в том, чтобы уменьшить разрыв между точностью и отзывом. Это гарантирует, что наша модель изучает более сложные функции, а не только наличие или отсутствие TATA-бокса. Как показано на фиг. 5A, B, модель стабилизируется при соотношении 32 ~ 40% для наборов данных промоторов TATA человека и мыши.

Рисунок 5 . Влияние различных соотношений консервативности мотива ТАТА в отрицательном наборе на производительность в случае набора данных промотора ТАТА как для человека (A) , так и для мыши (B) .

3.3. Результаты и сравнение

За последние годы было предложено множество инструментов для предсказания промоторных областей (Hutchinson, 1996; Scherf et al., 2000; Reese, 2001; Умаров, Соловьев, 2017). Однако некоторые из этих инструментов публично недоступны для тестирования, а некоторые из них требуют дополнительной информации, помимо исходных геномных последовательностей. В этом исследовании мы сравниваем производительность предлагаемых нами моделей с современной работой CNNProm, предложенной Умаровым и Соловьевым (2017), как показано в таблице 2.Как правило, предлагаемые модели DeePromoter явно превосходят CNNProm во всех наборах данных со всеми оценочными метриками. В частности, DeePromoter улучшает точность, отзывчивость и MCC в случае набора данных TATA человека на 0,18, 0,04 и 0,26 соответственно. В случае набора данных человека, не относящегося к TATA, DeePromoter улучшает точность на 0,39, отзыв на 0,12 и MCC на 0,66. Точно так же DeePromoter повышает точность, а MCC в случае набора данных TATA мыши на 0,24 и 0,31 соответственно.В случае набора данных мыши без TATA, DeePromoter улучшает точность на 0,37, отзыв на 0,04 и MCC на 0,65. Эти результаты подтверждают, что CNNProm не может отвергать отрицательные последовательности с промотором TATA, поэтому он имеет высокий уровень ложноположительных результатов. С другой стороны, наши модели могут более успешно справляться с этими случаями, а количество ложных срабатываний ниже по сравнению с CNNProm.

Таблица 2 . Сравнение DeePromoter с современным методом.

Для дальнейшего анализа мы изучаем влияние чередования нуклеотидов в каждой позиции на итоговую оценку.Мы сосредотачиваемся на области –40 и 10 п.н., поскольку в ней находится наиболее важная часть промоторной последовательности. Для каждой промоторной последовательности в тестовом наборе мы выполняем компьютерное сканирование мутаций, чтобы оценить эффект мутации каждой основы входной подпоследовательности (150 замен на интервале -40 ~ 10 п.н. подпоследовательности). Это проиллюстрировано на рисунках 6, 7 для наборов данных TATA человека и мыши соответственно. Синий цвет представляет собой снижение итоговой оценки из-за мутации, а красный цвет представляет собой приращение оценки из-за мутации.Мы замечаем, что изменение нуклеотидов на C или G в области –30 и –25 п.н. значительно снижает результат на выходе. Эта область представляет собой ТАТА-бокс, который является очень важным функциональным мотивом в промоторной последовательности. Таким образом, наша модель успешно определяет важность этого региона. В остальных положениях нуклеотиды C и G предпочтительнее, чем A и T, особенно в случае мыши. Это можно объяснить тем, что промоторная область содержит больше нуклеотидов C и G, чем A и T (Shi and Zhou, 2006).

Рисунок 6 . Карта значимости области от –40 до 10 пар оснований, которая включает TATA-бокс, в случае последовательностей промотора TATA человека.

Рисунок 7 . Карта значимости области от –40 до 10 пар оснований, которая включает ТАТА-бокс, в случае последовательностей промотора ТАТА мыши.

4. Заключение

Точное предсказание промоторных последовательностей важно для понимания механизма, лежащего в основе процесса регуляции генов.В этой работе мы разработали DeePromoter — который основан на комбинации сверточной нейронной сети и двунаправленного LSTM — для прогнозирования коротких последовательностей промотора эукариот в случае человека и мыши как для промотора TATA, так и для промотора не-TATA. Существенным компонентом этой работы было преодоление проблемы низкой точности (высокая частота ложных срабатываний), отмеченной в ранее разработанных инструментах из-за зависимости от некоторых очевидных признаков / мотивов в последовательности при классификации промоторных и непромоторных последовательностей.В этой работе мы были особенно заинтересованы в построении жесткого отрицательного набора, который побуждает модели исследовать последовательность на предмет глубоких и релевантных признаков вместо того, чтобы различать только промоторные и непромоторные последовательности на основе существования некоторых функциональных мотивов. Основное преимущество использования DeePromoter заключается в том, что он значительно снижает количество ложноположительных прогнозов, обеспечивая при этом высокую точность для сложных наборов данных. DeePromoter превзошел предыдущий метод не только по производительности, но и по преодолению проблемы с большим количеством ложноположительных прогнозов.Предполагается, что эта структура может быть полезна в приложениях, связанных с лекарствами, и в научных кругах.

Авторские взносы

MO и ZL подготовили набор данных, разработали алгоритм и провели эксперимент и анализ. MO и HT подготовили веб-сервер и написали рукопись при поддержке ZL и KC. Все авторы обсудили результаты и внесли свой вклад в окончательную рукопись.

Финансирование

Это исследование было поддержано Программой исследования мозга Национального исследовательского фонда (NRF), финансируемой правительством Кореи (MSIT) (No.NRF-2017M3C7A1044815).

Заявление о конфликте интересов

Авторы заявляют, что исследование проводилось при отсутствии каких-либо коммерческих или финансовых отношений, которые могут быть истолкованы как потенциальный конфликт интересов.

Список литературы

Алипанахи Б., Делонг А., Вейраух М. Т. и Фрей Б. Дж. (2015). Предсказание специфичности последовательности ДНК- и РНК-связывающих белков с помощью глубокого обучения. Nat. Biotechnol. 33, 831–838. DOI: 10.1038 / номер 3300

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Ангермюллер, К., Ли, Х. Дж., Рейк, В., и Стегл, О. (2017). Deepcpg: точное предсказание состояний метилирования одноклеточной ДНК с использованием глубокого обучения. Genome Biol. 18:67. DOI: 10.1186 / s13059-017-1189-z

CrossRef Полный текст | Google Scholar

Бейкер, Т.А., Уотсон, Дж. Д., Белл, С. П., Ганн, А., Лосик, М., и Левин, Р. (2003). Молекулярная биология гена (Сан-Франциско, Калифорния :).Издательство Бенджамин-Каммингс.

Google Scholar

Бхараникумар Р., Премкумар К. А. Р. и Паланиаппан А. (2018). Прогноз промотора: моделирование силы промотора escherichia coli σ70 на основе последовательностей дает логарифмическую зависимость между силой промотора и последовательностью. PeerJ 6: e5862. DOI: 10.7717 / peerj.5862

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Ф. Шолле (2015). Керас: библиотека глубокого обучения Python.Библиотека исходного кода астрофизики . Доступно на сайте: https://keras.io

Даль, Дж. А. и Коллас, П. (2008). Быстрый анализ иммунопреципитации микрохроматина (чип). Nat. Prot. 3, 1032–1045. DOI: 10.1038 / nprot.2008.68

CrossRef Полный текст | Google Scholar

Дреос, Р., Амброзини, Г., Кэвин Перье, Р., и Бухер, П. (2012). Epd и epdnew, высококачественные промоторные ресурсы в эпоху секвенирования нового поколения. Nucleic Acids Res. 41, D157 – D164. DOI: 10.1093 / nar / gks1233

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Глорот, X., Бордес, A., и Bengio, Y. (2011). «Глубокие нейронные сети с разреженным выпрямителем», в Труды четырнадцатой Международной конференции по искусственному интеллекту и статистике , (Форт-Лодердейл, Флорида:) 315–323.

Google Scholar

Хатчинсон, Г. (1996). Предсказание промоторных областей позвоночных с использованием дифференциального частотного анализа гексамеров. Биоинформатика 12, 391–398.

PubMed Аннотация | Google Scholar

Ювен-Гершон, Т., Хсу, Дж. Й., Тайзен, Дж. У., и Кадонага, Дж. Т. (2008). Основной промотор РНК-полимеразы II — путь к транскрипции. Curr. Opin. Cell Biol. 20, 253–259. DOI: 10.1016 / j.ceb.2008.03.003

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Ким, Дж. У., Зеллер, К. И., Ван, Ю., Джегга, А. Г., Ароноу, Б. Дж., О’Доннелл, К. А., и др.(2004). Оценка филогенетических следов myc e-box в гликолитических генах с помощью тестов иммунопреципитации хроматина. Мол. Клетка. Биол. 24, 5923–5936. DOI: 10.1128 / MCB.24.13.5923-5936.2004

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Кингма, Д. П. и Ба, Дж. (2014). Адам: метод стохастической оптимизации. препринт arXiv arXiv: 1412.6980 .

Google Scholar

Кнудсен, С. (1999). Промоутер2. 0: для распознавания промоторных последовательностей polii. Биоинформатика 15, 356–361.

PubMed Аннотация | Google Scholar

Крижевский А., Суцкевер И., Хинтон Г. Э. (2012). «Классификация Imagenet с глубокими сверточными нейронными сетями», в Advances in Neural Information Processing Systems , eds F. Pereira, C. J. C. Burges, L. Bottou и K. Q. Weinberger (New York, NY: ACM), 1097–1105.

Google Scholar

Ландер, Э. С., Линтон, Л. М., Биррен, Б., Нусбаум, К., Зоди, М.С., Болдуин, Дж. И др. (2001). Начальная последовательность и анализ человеческого генома. Природа 409, 860–921. DOI: 10.1038 / 35057062

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Линь Х., Лян З.-Й., Тан Х. и Чен В. (2017). Идентификация промоторов сигма70 с новым псевдонуклеотидным составом. IEEE / ACM Trans. Comput. Биол. Биоинформа . DOI: 10.1109 / TCBB.2017.2666141

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Мацумине, Х., Ямамура, Ю., Хаттори, Н., Кобаяси, Т., Китада, Т., Йоритака, А. и др. (1998). Микроделеция d6s305 в семействе аутосомно-рецессивного ювенильного паркинсонизма (park2). Геномика 49, 143–146.

PubMed Аннотация | Google Scholar

Назари И., Тайара Х. и Чонг К. Т. (2018). Выбор точки ветвления при сварке РНК с использованием глубокого обучения. Доступ IEEE . 7, 1800–1807. DOI: 10.1109 / ACCESS.2018.2886569

CrossRef Полный текст | Google Scholar

Олер, У., Харбек, С., Ниманн, Х., Нёт, Э. и Риз, М.Г. (1999). Интерполированные марковские цепи для распознавания эукариотических промоторов. Биоинформатика 15, 362–369.

PubMed Аннотация | Google Scholar

Oubounyt, M., Louadi, Z., Tayara, H., and Chong, K. T. (2018). Модели глубокого обучения на основе распределенных представлений функций для альтернативного прогнозирования сращивания. IEEE Access 6, 58826–58834. DOI: 10.1109 / ACCESS.2018.2874208

CrossRef Полный текст | Google Scholar

Перье, Р.К., Праз, В., Джунье, Т., Боннар, К., и Бухер, П. (2000). База данных эукариотических промоторов (epd). Nucleic Acids Res. 28, 302–303 . Доступно в Интернете по адресу: https://doi.org/10.1093/nar/28.1.302

Понгер, Л. и Мучироуд, Д. (2002). Cpgprod: идентификация островков cpg, связанных с сайтами начала транскрипции в больших геномных последовательностях млекопитающих. Биоинформатика 18, 631–633. DOI: 10.1093 / биоинформатика / 18.4.631

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Престридж, Д.С. (1995). Прогнозирование промоторных последовательностей pol ii с использованием сайтов связывания факторов транскрипции. J. Mol. Биол. 249, 923–932.

PubMed Аннотация | Google Scholar

Цянь, Ю., Чжан, Ю., Го, Б., Е, С., Ву, Ю. и Чжан, Дж. (2018). «Улучшенная модель распознавания промотора с использованием сверточной нейронной сети», в COMPSAC (1) (IEEE Computer Society), (Tokyo 🙂 471–476. DOI: 10.1109 / COMPSAC.2018.00072

CrossRef Полный текст | Google Scholar

Куанг, Д.и Xie, X. (2016). Danq: гибридная сверточная и рекуррентная глубокая нейронная сеть для количественной оценки функции последовательностей ДНК. Nucleic Acids Res. 44, e107 – e107. DOI: 10.1093 / nar / gkw226

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Риз, М. Г. (2001). Применение нейронной сети с временной задержкой к аннотации промотора в геноме дрозофилы melanogaster. Comput. Chem. 26, 51–56. DOI: 10.1016 / S0097-8485 (01) 00099-7

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Шерф, М., Клингенхофф, А., Вернер, Т. (2000). Высокоспецифичная локализация промоторных областей в больших геномных последовательностях с помощью промотеринспектора: новый подход к контекстному анализу2. J. Mol. Биол. 297, 599–606. DOI: 10.1006 / jmbi.2000.3589

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Шустер М. и Паливал К. К. (1997). Двунаправленные рекуррентные нейронные сети. IEEE Trans. Сигнальный процесс. 45, 2673–2681.

Google Scholar

Сегеди, C., Лю В., Цзя Ю., Серманет П., Рид С., Ангелов Д. и др. (2015). «Углубляясь в свертки», в Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition , (Boston, MA 🙂 1–9.

Google Scholar

Тахир М., Тайара Х. и Чонг К. Т. (2018). irna-pseknc (2methyl): идентифицировать сайты 2′-o-метилирования РНК с помощью сверточной нейронной сети и псевдокомпонентов Чжоу. J. Theor. Биол . 465, 1–6. DOI: 10.1016 / j.jtbi.2018.12.034

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Умаров Р., Кувахара Х., Ли Ю., Гао X., Соловьев В. (2019). Анализ и прогноз промотора в геноме человека с использованием моделей глубокого обучения на основе последовательностей. Биоинформатика bty1068. DOI: 10.1093 / биоинформатика / bty1068

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Умаров Р.К., Соловьев В.В. (2017). Распознавание прокариотических и эукариотических промоторов с использованием сверточных нейронных сетей глубокого обучения. PLoS ONE 12: e0171410. DOI: 10.1371 / journal.pone.0171410

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Вэй, Л., Дин, Ю., Су, Р., Тан, Дж., И Цзоу, К. (2018). Прогнозирование субклеточной локализации человеческого белка с помощью глубокого обучения. J. Parall. Дистриб. Comput. 117, 212–217. DOI: 10.1016 / j.jpdc.2017.08.009

CrossRef Полный текст | Google Scholar

Вэй, Л., Ляо, М., Гао, Ю., Цзи, Р., Хэ, З., и Цзоу, К. (2014).Улучшенная и многообещающая идентификация человеческих микрорн за счет включения высококачественного негатива. IEEE / ACM Trans. Comput. Биол. Биоинформ. 11, 192–201. DOI: 10.1109 / TCBB.2013.146

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Сяо, X., Сюй, З. К., Цю, В. Р., Ван, П., Ге, Х. Т. и Чжоу, К. С. (2018). ipsw (2l) -pseknc: двухуровневый предсказатель для идентификации промоторов и их силы по гибридным признакам с помощью псевдо-кортежного нуклеотидного состава. Геномика . (в прессе). DOI: 10.1016 / j.ygeno.2018.12.001

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Сюй М., Гонсалес-Уртадо Э. и Мартинес Э. (2016). Регуляция гена, специфичного для основного промотора: селективность Тата-бокса и зависимая от инициатора двунаправленность транскрипции, активируемой фактором ответа сыворотки. Biochim. Биофиз. Acta. 1859, 553–563. DOI: 10.1016 / j.bbagrm.2016.01.005

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Ян, К., Болотин, Э., Цзян, Т., Сладек, Ф. М., и Мартинез, Э. (2007). Преобладание инициатора над тата-боксом в генах человека и дрожжей и идентификация мотивов ДНК, обогащенных коровыми промоторами без тата человека. Ген 389, 52–65. DOI: 10.1016 / j.gene.2006.09.029

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Янг Ю., Чжан Р., Сингх С. и Ма Дж. (2017). Использование основанных на последовательностях функций для прогнозирования взаимодействий энхансер-промотор. Биоинформатика 33, i252 – i260.DOI: 10.1093 / биоинформатика / btx257

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Дом | Кафедра молекулярной биологии

Отделение молекулярной биологии Массачусетской больницы общего профиля является частью исследовательского сообщества больницы и отдела медицинских наук Гарвардской высшей школы искусств и наук. Члены кафедры проводят фундаментальные генетические и молекулярно-биологические исследования по множеству тем, находящихся на переднем крае дисциплины.В настоящее время около 170 человек, в том числе 13 преподавателей и более 85 докторантов и аспирантов, составляют кафедру молекулярной биологии. Отделение является основным компонентом отделения генетики Гарвардской медицинской школы. Все преподаватели молекулярной биологии, аспиранты и аспиранты одновременно работают в Гарварде, в основном в HMS Genetics.

Массачусетская больница общего профиля имеет давние отношения с Гарвардской медицинской школой. MGH была первой клинической больницей, связанной с медицинской школой, и продолжает играть важную роль в клинической и исследовательской подготовке студентов-медиков, ординаторов и научных сотрудников.Расположение кафедры молекулярной биологии в MGH отражает уверенность в том, что фундаментальная биологическая наука и медицинские исследования выиграют от тесного взаимодействия.

Научные традиции

В 2011 году Массачусетская больница общего профиля отметила 200-летие своего основания и сотрудничества с Гарвардской медицинской школой в качестве первой дочерней учебно-исследовательской больницы. История Массачусетской больницы общего профиля и Гарвардской медицинской школы в течение последних двух столетий была историей непрерывного взаимодействия; без фундаментальных медицинских исследований не было бы новых знаний для улучшения лечения болезней и ухода за пациентами.MGH, первая больница, основанная в Новой Англии, обязана своим признанием в качестве одного из крупнейших медицинских центров мира во многом благодаря своей давней приверженности исследованиям в области фундаментальных наук.

История фундаментальных исследований в MGH началась 16 октября 1896 года с официального открытия лаборатории патологии, через 50 лет после первой публичной демонстрации анестезии в операционной MGH, ныне знаменитом Ether Dome. Время требовало нового типа ученых-врачей, тех, кто сочетал бы медицинскую практику с глубокими знаниями науки и чутьем к экспериментам.

РНК-полимераза

приближается к своему промотору без скольжения на большие расстояния по ДНК

Abstract

ДНК-связывающие белки, специфичные для последовательности, должны быстро связываться с последовательностями-мишенями, несмотря на чрезвычайно большое количество нецелевой ДНК, присутствующей в клетках. Предполагается, что РНК-полимеразы (или связанные с ними общие факторы транскрипции) достигают промоторных последовательностей за счет облегченной диффузии (FD). При FD белок сначала связывается с ДНК, не являющейся мишенью, а затем достигает цели с помощью скользящего поиска 1D.Мы проверили, достигает ли РНК-полимераза Escherichia coli σ 54 промотора с помощью FD, используя метод многоволновой флуоресцентной микроскопии колокализации (CoSMoS). Эксперименты напрямую сравнивали скорости первоначального связывания полимеразы с промоторной и непромоторной ДНК и диссоциации с промоторной и непромоторной ДНК, измеренные в одном и том же образце в идентичных условиях. Связывание с ДНК без промотора происходило намного медленнее, чем с ДНК такой же длины, содержащей промотор, что указывает на то, что обнаруженные события неспецифического связывания не находятся на пути к связыванию промотора.Усечение одного из сегментов ДНК, фланкирующих промотор, до длины всего 7 п.н. или его удлинение до ~ 3000 п.н. не изменяет скорость связывания, специфичную для промотора. Эти результаты исключают, что FD на расстояниях, соответствующих длине промотора или больше, не играет какой-либо существенной роли в ускорении поиска промотора. Вместо этого данные подтверждают механизм прямого связывания, в котором РНК-полимераза 54 достигает локальных окрестностей промоторов посредством трехмерной диффузии через раствор, и предполагают, что связывание может быть ускорено атипичными структурными или динамическими особенностями промоторной ДНК.Прямое связывание объясняет, как полимераза может быстро достигать промотора, несмотря на занятость фланкирующей промотор ДНК связанными белками, которые препятствуют FD.

Связывание мультисубъединичной РНК-полимеразы (РНКП) или общих факторов транскрипции со специализированной последовательностью ДНК промотора транскрипции является важным шагом в инициации транскрипции ДНК во всех организмах (1, 2). Контроль этой стадии связывания промотора является ключевым механизмом, с помощью которого регулируется экспрессия генов (3). Чтобы понять, как происходит эта регуляция, необходимо понять процесс, с помощью которого аппарат транскрипции эффективно находит и связывается с последовательностями-мишенями, встроенными в хромосомную ДНК, где количество мишеней на порядки превосходит избыточную ДНК, не являющуюся мишенью.

Бактериальная транскрипция представляет собой удобную модельную систему для изучения поиска промоторов, поскольку этот процесс можно эффективно реконструировать in vitro из очищенных компонентов, а бактериальные холоферменты РНКП распознают и связываются непосредственно со специфическими мотивами промоторной последовательности ДНК (4, 5). Для хорошо изученной РНКП Escherichia coli скорость, с которой фермент обнаруживает свои родственные промоторы, может приближаться или даже превышать пределы, рассчитанные для простой трехмерной диффузии белка до целевой последовательности с последующим прямым связыванием промотора (6⇓– 8).Хотя есть неопределенности в вычислении величины этого предела из-за неопределенного вклада ограничений ориентации и электростатического управления (9), давно существует мнение, что быстрое связывание ускользает от ограничения скорости чистой трехмерной диффузии / прямого связывания за счет облегченной диффузии. (FD) процесс (10, 11). В FD повторяющиеся случаи неспецифического связывания последовательности сопровождаются 1D скользящей диффузией вдоль ДНК в поисках специфического сайта связывания для белка (рис. 1 A ) (12).Участие 1D диффузии эффективно создает большую мишень для связывания, которая включает сегменты ДНК, фланкирующие последовательность промотора, и, таким образом, ускоряет скорость, с которой белок находит промотор.

Рис. 1.

Одномолекулярный тест гипотезы FD для связывания σ 54 РНКП с промотором. ( A ) Гипотеза облегченной диффузии для связывания холофермента RNAP (овал, сердцевина RNAP; кружок, субъединица σ 54 ) с ДНК, содержащей родственный промотор (изогнутая стрелка).( B ) Эксперимент с одной молекулой для сравнения скорости связывания σ 54 RNAP, меченного Cy3 (зеленая звезда), с промотором (P), содержащим ДНК 598 P 255 (меченный Alexa Fluor 488; синяя звезда) и непромоторная (N) ДНК 825 N (помечена Cy5; красная звездочка). ( C ) Пример области изображения (6 × 6 мкм), показывающий пятна флуоресценции RNAP (монохромное изображение) в местах расположения молекул 598 P 255 (синие квадраты) и 825 молекул N (красные квадраты).Общая σ 54 Концентрация РНКП составляет 0,1 нМ. ( D ) Примеры записей интенсивности флуоресценции σ 54 RNAP, записанные из квадратов размером 3 × 3 пикселя (как в C ) с центром в положениях трех молекул 598 P 255 (синий) и трех 825 N молекул (красный). ( E ) Фракция молекул ДНК, которые связывают RNAP по крайней мере один раз до указанного времени (синий и красный), и экспоненциальные совпадения (черный), дающие очевидные константы скорости первого порядка [синий: (3.7 ± 0,5) × 10 −3 с −1 , N D = 102 молекулы ДНК; красный: (0,4 ± 0,1) × 10 −3 с −1 , N D = 96]. Контрольный эксперимент (рис. S4) показал, что скорость связывания не зависела от красителя, который использовался для мечения ДНК.

Бактериальные холоферменты РНКП имеют несколько ДНК-связывающих доменов, которые взаимодействуют с разными частями промоторной последовательности, и некоторые из этих доменов гибко связаны (3, 5).Связки делают возможным относительное перемещение ДНК-связывающих доменов на расстояния, соответствующие нескольким десяткам пар оснований (3), масштаб расстояний аналогичен физическому размеру промотора. Следовательно, механизм и кинетика образования специфических контактов РНКП-ДНК после того, как РНКП близко (порядка 10 нм или меньше) приближается к промоторным последовательностям, являются сложными, и этот процесс, вероятно, не может быть адекватно понят в терминах FD или 3D диффузии / связывания. обе модели рассматривают RNAP как твердое тело, движущееся относительно ДНК.Напротив, ожидается, что эти модели будут полностью способны описывать приближение к промотору с расстояний, намного превышающих физический размер промотора.

Для E. coli σ 70 RNAP, есть некоторые экспериментальные доказательства механизма FD для поиска промотора на расстояниях от 250 пар оснований до тысяч пар оснований (ссылки 13⇓⇓⇓⇓⇓⇓⇓ – 21 и ссылку 22 и ссылки в ней). Однако доказательства в целом слабые ( Обсуждение ) (9, 22, 23).Эффективные экспериментальные тесты были осложнены () общей неспособностью массовых экспериментов напрямую измерить связывание промотора, не связанное с последующими конформационными изменениями (2, 24) и ( ii ), слабой специфичностью последовательности связывания ДНК (25, 26). ).

В предыдущем исследовании (7) мы использовали колокализационную спектроскопию одиночных молекул (CoSMoS) для непосредственного наблюдения и измерения начальной скорости связывания σ 54 РНКП с родственным промотором, не связанным с последующей конформационной изомеризацией полимераза-промотор. сложный.Мы также показали, что начальный комплекс RNAP-промотор, который мы наблюдаем, находится на пути к инициации транскрипции. σ 54 RNAP также имеет преимущество по сравнению с σ 70 RNAP в том, что распознавание промотора может быть более специфичным (27–29). Здесь мы расширяем предыдущий подход; мы измеряем кинетику связывания и диссоциации как с промоторами, так и с непромоторной ДНК, и используем эти измерения для непосредственной проверки предсказаний модели FD.

Результаты

Наблюдаемое неспецифическое связывание слишком медленно, чтобы объяснить скорость связывания промотора.

Мы сравнили скорости начального связывания холофермента σ 54 RNAP с двумя разными видами ДНК: ДНК длиной 853 п.н., содержащей промотор glnAp2 (называемой 598 P 255, потому что она содержит 598 п.н. вверху и 255 п.н.). ниже промотора;) и ДНК длиной 825 пар оснований (825 N ), которая по существу идентична, за исключением делеции 27 пар оснований, содержащей основной промотор (фиг. S1 и S2). Скорость стадии связывания измеряли с использованием модификации метода CoSMoS, описанного ранее (7).Два типа молекул ДНК, каждая из которых была помечена флуоресцентным красителем разного цвета, были редко привязаны к поверхности предметного стекла микроскопа, а расположение и идентичность каждой отдельной молекулы регистрировались с помощью флуоресцентной визуализации с полным внутренним отражением (рис. S3). Затем в камеру вводили меченый красителем холофермент, и связывание детектировали путем регистрации временного появления пятен флуоресценции RNAP в положениях молекул ДНК на поверхности (рис. 1 B ).Ни активатор NtrC, ни NTP не были добавлены, и, следовательно, не происходило образования открытого комплекса и последующих этапов пути инициации (7, 30). Эксперименты проводились в буфере, имитирующем физиологические ионные условия.

Связывание холофермента наблюдалось как с промоторной, так и с непромоторной ДНК (фиг. 1 C ). Связывание с непромоторной ДНК может представлять собой независимую от последовательности ассоциацию σ 54 RNAP, аналогично связыванию без промотора, наблюдаемому ранее для σ 70 RNAP (23, 31).Наш эксперимент не предназначен для различения молекул, связанных в фиксированном положении на непромоторной ДНК, и молекул, которые могут скользить по ДНК. Тем не менее, связывание RNAP с промоторной ДНК происходило намного чаще, чем связывание с непромоторной ДНК (Fig. 1 D ), указывая тем самым, что многие из событий связывания на первом были формированием специфических комплексов промотор-холофермент. Исходный замкнутый комплекс σ 54 RNAP и этого промотора, RP 1 , диссоциирует с постоянной времени 2.3 с (7), длительность, которая легко обнаруживается в этих экспериментах (50% порог обнаружения ∼ 0,2–0,5 с) и согласуется со временем жизни большинства наблюдаемых пятен.

Хотя эксперименты проводились при субнаномолярных концентрациях холофермента, что затрудняет воспроизводимый контроль концентрации свободного холофермента, одновременное измерение двух ДНК в одном и том же образце позволило точно сравнить скорости связывания в идентичных растворах и условиях визуализации.Мы рассчитали скорость связывания, измерив время до первого наблюдаемого события связывания на каждой молекуле ДНК (7). Подбор распределений этих времен показал, что связывание с промоторной ДНК было в 10 раз быстрее, чем связывание с непромоторной ДНК (фиг. 1 E ). Это открытие означает, что примерно 90% событий, наблюдаемых на промоторной ДНК, являются событиями связывания, специфичными для промотора.

Наблюдаемое связывание с непромоторной ДНК (фиг. 1 D и E , красные следы) может представлять собой неспецифическое связывание полимеразы с общей последовательностью вдоль ДНК.Альтернативно, это может быть результатом связывания с концами ДНК, красителем или непромоторным сайтом сильного связывания, случайно включенным в последовательность (26, 32, 33). Чтобы проверить эти возможности, мы построили вложенную серию последовательностей без промотора различной длины (рис. S1) и измерили скорость связывания RNAP с каждой из них относительно скорости связывания RNAP с конструкцией 825 N ( Рис.2 A ). В пределах экспериментальной неопределенности измеренная скорость связывания линейно увеличивалась с увеличением длины ДНК.Это наблюдение несовместимо с интерпретацией, согласно которой наблюдаемое связывание с непромоторными ДНК возникает из-за связывания с концами ДНК, красителем или редкой специальной последовательностью. Напротив, это согласуется с гипотезой о том, что наблюдаемые события представляют собой неспецифическое связывание последовательности вдоль ДНК.

Рис. 2.

Связывание σ 54 РНКП с непромоторными ДНК различной длины. ( A ) Сравнение (как на фиг. 1 E ) скорости связывания 0,3 нМ σ 54 РНКП с непромоторными ДНК длиной 3,564 и 825 пар оснований.Подборки (черные) дают очевидные константы скорости первого порядка [синий: (31 ± 4) × 10 −4 с −1 , N D = 81; красный: (10 ± 2) × 10 -4 с -1 , N D = 74], что дает соотношение скоростей связывания 3564 N : 825 N 3,2 ± 0,7 (SE). ( B ) Относительные константы скорости связывания σ 54 РНКП с непромоторными ДНК различной длины. Отношения скорости связывания 306 N : 825 N , 1735 N : 825 N и 3564 N : 825 N (кружки) были измерены в сравнительных экспериментах (например,г., А ). Взвешенная линейная аппроксимация (черный) ограничена таким образом, что отношение 825 N : 825 N равно единице (квадрат).

В модели FD почти все связывание с промотором происходит посредством начального связывания с непромоторным сегментом ДНК (рис. 1 A ). Таким образом, модель предсказывает, что скорости связывания двух ДНК на рис. 1 B – E должны быть почти идентичными. Данные на рис. 1 D и E кажутся несовместимыми с этим прогнозом.

Скорость связывания, специфичного для промотора, не зависит от длины фланкирующей ДНК.

Результаты на рис. 1 и 2 полностью соответствуют простой трехмерной диффузии РНКП через раствор и прямому связыванию с промотором. Как описано выше, эти данные кажутся несовместимыми с предсказаниями механизма подхода FD-опосредованного промотора. Однако этот аргумент не является решающим: возможно, что в эксперименте на рис.1 B – E , но эти многочисленные события относятся к дополнительному необнаруженному классу событий неспецифического связывания. В отличие от измеренных событий (среднее время жизни = 4,7 с), этот класс должен быть слишком короткоживущим (т.е. длительностью << ∼0,3 с) (7), чтобы его можно было эффективно обнаружить в наших экспериментах.

Чтобы решить эту проблему, мы обратились к альтернативному экспериментальному плану, который не требует обнаружения событий неспецифического связывания последовательности. В этой конструкции мы варьировали длину сегментов ДНК, фланкирующих промотор, тем самым изменяя размер мишени для неспецифического связывания последовательности.Если неспецифическое связывание с фланкирующими последовательностями играет роль в обнаружении промотора, укорочение или устранение фланкирующей ДНК должно снизить скорость связывания промотора. Аналогичный подход был использован для изучения роли FD в связывании факторов транскрипции и рестрикционных ферментов с их последовательностями-мишенями в предыдущих ансамблевых (34, 35) и одномолекулярных исследованиях (36).

σ 54 Контакты РНКП с ДНК ниже промотора не выходят за пределы пары оснований, кодирующей 5′-нуклеотид транскрипта (37, 38).Мы приготовили содержащую промотор ДНК 595 P 7, которая была усечена сразу после этой точки. Если связывание и проскальзывание на расстояния >> 7 п.н. является доминирующим путем поиска промотора, ожидается, что связывание с этой ДНК будет примерно в два раза медленнее, чем связывание с 597 P 255, потому что нижележащая фланкирующая ДНК отсутствует в первом. Это ожидание не оправдалось; Эксперимент, сравнивающий скорости связывания с двумя ДНК, показывает, что скорости неразличимы в пределах экспериментальной неопределенности (рис.3 А ). Этот результат несовместим с тем, что ДНК >> 7 п.н. ниже промотора значительно ускоряет связывание по любому механизму, включая FD.

Рис. 3.

Связывание и диссоциация 0,1 нМ σ 54 РНКП с промоторов с различной длиной фланкирующей ДНК. ( A ) Сравнение скоростей связывания (как на фиг. 1 E ) с ДНК с 7 и 255 п.н. ниже промотора. Соотношение скорости связывания 595 P 7: 597 P 255 0,95 ± 0.14 ( N D = 189 и 202, соответственно) указывает, что скорости одинаковы в пределах экспериментальной неопределенности. ( B ) Кинетическая схема образования замкнутого комплекса с помощью σ 54 RNAP на glnAp2 из исх. 7. ( C ) Частота наблюдений комплексов РНКП-ДНК со временем жизни, большим или равным указанному времени пребывания на ДНК с усеченной фланкирующей последовательностью ниже по течению (синий: 595 P 7, количество комплексов N C = 663) или элемент управления (красный: 597 P 255, N C = 735), взятый из того же набора данных, что и A .( Врезка ) Увеличенное изображение, построенное в линейном масштабе для режима короткого времени пребывания. ( D ) То же, что C , за исключением ДНК с расширенным нижележащим сегментом (синий: 598 P 2993, N D = 122, N C = 1000) и контроля ( красный: 597 P 255, N D = 147, N C = 885). Закрашенные символы на вставке взяты из отдельного эксперимента с ДНК аналогичной длины без промотора (синий: 3564 N , N D = 148, N C = 2,245; красный: 825 N , N D = 147, N C = 1,091) при 0.4 нМ σ 54 RNAP и нормализовано до 0,1 нМ. Точки при времени пребывания 0 дают общие различия частоты событий связывания между длинной и короткой ДНК (6,38 ± 1,32) × 10 −4 с −1 с промотором и (4,92 ± 0,35) × 10 −4 с. −1 без промотора.

В этом эксперименте наблюдались как события связывания, в которых РНКП взаимодействовала с промотором, так и события связывания, при которых связывание было неспецифическим. Мы также выполнили независимый анализ, в котором оценивалась только продукция конкретных комплексов промотор-РНКП.Ранее мы показали (7), что связывание σ 54 RNAP (R) с промотором (P) первоначально образует кинетически нестабильный закрытый комплекс (RP 1 ), который затем изомеризуется в гораздо более кинетически стабильный закрытый комплекс (RP 2 ) (рис.3 B ). RP 2 является предшественником образования открытого комплекса и последующего синтеза РНК. В описанных здесь экспериментах образование открытых комплексов блокируется, поскольку активатор и NTP отсутствуют. Таким образом, распределение времени пребывания σ 54 РНКП, связанного с ДНК, содержащей промотор glnAp2 , состоит из двух компонентов (рис.3 C ), короткий компонент (комбинация RP 1 и непромоторного связывания) и более чем в 10 раз более длинный промотор-специфический компонент (из комплексов, которые делают одно или несколько переходов в RP 2 ) (7) . По существу, никаких долгоживущих (> ~ 10 с) комплексов не наблюдается на непромоторной ДНК (фиг. 3 D , вставка ). Следовательно, частота образования долгоживущих комплексов пропорциональна скорости связывания промотора при условии, что эффективность образования RP 2 из RP 1 , k 2 / ( k 2 + к −1 ) (рис.3 B ), является константой. Частоты этих долгоживущих комплексов, наблюдаемые на исходной и укороченной ниже по ходу цепи ДНК, были по существу идентичны (фиг. 3 C ), что указывает на то, что нижележащий сегмент не увеличивает скорость связывания промотора. Таким образом, результаты на фиг.3 A и C исключают возможность того, что существуют неспецифические для последовательности комплексы, которые образуют более 7 п.н. от промотора, что значительно ускоряет обнаружение промотора с помощью σ 54 RNAP, даже если это постулируется. комплексы имеют слишком короткое время жизни, чтобы их можно было обнаружить в наших экспериментах.

Приведенные выше результаты убедительно доказывают, что FD на расстояниях, превышающих ~ 10 п.н., не участвует в связывании промотора или играет только необнаружимо небольшую роль в ДНК длиной <1 т.п.н., изученной на рис. 1 и 3 A и C . Затем мы исследовали, может ли FD играть роль по крайней мере в меньшем количестве событий связывания промотора, когда ДНК длиннее и, следовательно, неспецифическое связывание последовательности будет более частым (Fig. 2 B ). Когда к матрице добавляли ~ 3000 п.н. нижестоящей ДНК, наблюдалось значительное увеличение общего числа событий связывания.Однако по существу все увеличение было вызвано короткоживущими событиями связывания, и примерно такое же увеличение наблюдали независимо от того, содержала ли ДНК промотор (фиг. 3 D , вставка ). Таким образом, увеличение короткоживущих событий, вероятно, происходит только из-за увеличения неспецифического связывания. Несмотря на увеличение общего количества событий связывания, частота долгоживущих событий с последующим удлинением и без него (фиг. 3 D и фиг. S5) была идентична пределу экспериментальной неопределенности.Таким образом, добавление длинного удлинения не приводит к заметному увеличению связывания промотора; данные предполагают, что не более 8% событий связывания долгоживущих промоторов на длинной ДНК могут возникать в результате скольжения, происходящего в длинном нижележащем сегменте ( SI Materials and Methods ).

Предыдущее исследование показало, что усечение сегментов выше или ниже по течению имеет разные эффекты на занятость промотора с помощью σ 70 RNAP (20). В нашей более ранней работе (7) мы урезали ДНК перед промотором glnAp2 (а не ниже) и измерили влияние усечения на кинетику связывания и высвобождения РНКП? 54 , используя те же методы, что и на рис. .3 A и C . В усеченной выше конструкции мы сохранили 78 п.н. ДНК перед сайтом начала транскрипции, чтобы избежать удаления корового промотора и элементов вышележащего промотора, которые могут участвовать в связывании промотора RNAP (39). Эксперименты (рис. S4 a и b в ссылке 7) ясно показали, что усечение восходящей ДНК с 597 до 78 п.н. не оказывает заметного влияния на скорость ассоциации RNAP с ДНК; k 1 (рис.3 B ) без изменений.Интересно отметить, что усечение восходящего сегмента при -78 значительно увеличивает скорость диссоциации ( k -1 ) короткоживущего комплекса RP 1 , не нарушая при этом k 2 и k — 2 . Таким образом, усечение снижает эффективность k 2 / ( k 2 + k -1 ), уменьшая скорость образования долгоживущих комплексов, несмотря на неизменную ассоциацию РНКП-промотор. ставка.Эти наблюдения согласуются с гипотезой о том, что контакт с петлевой или обернутой ДНК дальше, чем -78, помогает предотвратить диссоциацию полимеразы после того, как она достигает промотора. Тем не менее, эксперименты по усечению как выше, так и ниже по течению показывают, что последовательности вне области промотора не ускоряют заметно связывание промотора с помощью σ 54 RNAP.

Неспецифические комплексы и исходный закрытый комплекс обладают сходной кинетической стабильностью.

Данные на рис.1 E показывают, что для содержащей промотор ДНК размером 853 п.н. связывание RNAP с промотором происходит намного быстрее, чем его связывание со всей фланкирующей ДНК, взятой вместе. Этот эффект еще более выражен для более коротких ДНК, потому что они представляют меньшую мишень для неспецифического связывания (рис. 2). Даже если мы рассматриваем только короткий компонент распределения времени пребывания, почти все (~ 93%) событий связывания с 78 P 255 происходят от связывания с промотором, а не с фланкирующей ДНК (рис.4, Врезка ). Существенно, что начальные наклоны распределений времени пребывания комплексов RNAP-промотор и комплексов на непромоторной ДНК сходны по величине (рис. 4). Взятые вместе, эти наблюдения подразумевают, что кинетическая стабильность начального комплекса, образованного последовательным специфическим связыванием с промотором, сравнима с кинетической стабильностью неспецифических комплексов ДНК-РНКП, которые мы наблюдаем.

Рис. 4.

Доля наблюдаемых комплексов RNAP со временем жизни, большим или равным указанному времени пребывания на коротких ДНК с (синий: 78P255, N D = 95, N C = 996) или без (красный: 306N, N D = 90, N C = 103) промотора.( Врезка ) Частотное распределение времен жизни в диапазоне 0–20 с из того же набора данных.

Обсуждение

Данные, представленные здесь, проверяют, играет ли FD значительную роль в связывании σ 54 RNAP с промотором, используя три независимых экспериментальных теста. Во-первых, частота, с которой молекулы РНКП связываются с непромоторной ДНК длиной до 3,5 т.п.н., слишком мала для того, чтобы эти события связывания были промежуточными звеньями на пути, по которому РНКП достигает промотора.Во-вторых, усечение ДНК, фланкирующей сайт промотора (до 78 п.н. на стороне выше или ниже до 7 п.н. на стороне ниже по течению), существенно не снижает общую скорость связывания RNAP, что подразумевает, что фланкирующие сегменты ДНК длиной более 7 п.н. важную роль в оказании помощи RNAP в достижении промоутера. В-третьих, на скорость образования долгоживущих промотор-специфических комплексов, которые, как известно, являются облигатными промежуточными продуктами на пути инициации, также не влияет изменение длины фланкирующей ДНК, подтверждая, что фланкирующая ДНК не ускоряет образование промотора. комплексы, относящиеся к инициации транскрипции.Взятые вместе, эти результаты исключают FD на расстояниях в диапазоне от ∼10 до 3 т.п.н. как важный путь для σ 54 RNAP для достижения промотора в ионных условиях, изученных здесь, которые предназначены для имитации условий в живых бактериях. . Они также исключают другие механизмы, которые используют фланкирующую ДНК в этом диапазоне длин (40).

Общая скорость неспецифического связывания с молекулой ДНК увеличивается по мере удлинения ДНК, и расчетная аффинность σ 54 RNAP для непромоторной ДНК аналогична непромоторной аффинности, ранее измеренной для σ 70 RNAP ( SI Materials и методы ).Для промотора, встроенного в бактериальный геном, где длина фланкирующей ДНК составляет >> 3 т.п.н., скорость неспецифического связывания может возрасти до точки, при которой FD предположительно может начать вносить, по крайней мере, некоторый значительный вклад в скорость, с которой RNAP достигает промотора. . Однако такое скольжение на большие расстояния маловероятно: исходя из известного размера σ 54 RNAP и геометрии замкнутого комплекса, мы оцениваем максимальный коэффициент одномерной диффузии 1 × 10 6 п.н. 2 / с ( С.И. Материалы и методы ).Это значение означает, что в течение среднего измеряемого нами времени пребывания в 4,7 с неспецифически связанная RNAP может быть эффективно захвачена только в том случае, если промотор расположен на расстоянии <2200 п.н. от своего начального положения. Однако FD на расстояниях до 3 kb исключается уже описанными данными. Таким образом, данные исключают неспецифическое связывание последовательности с последующим одномерным скольжением как механизм ускорения связывания промотора даже в очень длинных ДНК.

Наши данные не исключают возможность того, что FD играет некоторую роль в очень мелкомасштабных перемещениях RNAP, которые происходят после того, как RNAP уже частично перекрывает промотор ∼30 bp.Однако вполне вероятно, что эти самые последние движения РНКП в формировании комплекса промотора, специфичного для последовательности, не могут быть адекватно поняты с точки зрения моделей FD или 3D диффузии / связывания, которые рассматривают РНКП как твердое тело, движущееся относительно ДНК. (см. Введение). Напротив, наши данные не исключают скольжение, если эффективность захвата промотора скользящим RNAP очень низка, но в этом пределе скольжение не ускоряет связывание промотора.

Даже белки, которые способны к FD, могут переключаться выше пороговой концентрации белка на режим, в котором вместо этого поиск происходит в основном посредством трехмерной диффузии и прямого связывания (23).Наши эксперименты проводились намного ниже этого порогового значения концентрации (который, согласно нашим измерениям, составляет ≥10 нМ) ( SI Materials and Methods ). Таким образом, наши данные свидетельствуют о том, что σ 54 РНКП не достигает промотора с помощью FD даже в режиме низких концентраций. При более высоких концентрациях свободных σ 54 RNAP, которые, как предполагается, присутствуют в живых клетках ( SI Materials and Methods ), роль FD-опосредованного поиска промотора еще менее вероятна.

Таким образом, наши данные в значительной степени исключают механизм FD для ускорения связывания промотора, показанный на рис.1 А . Вместо этого они согласуются с простым, одноэтапным процессом связывания, в котором RNAP достигает промотора посредством трехмерной диффузии через раствор, заканчивающейся прямым, зависимым от последовательности связыванием. Следовательно, σ 54 RNAP достигает своей последовательности-мишени с помощью механизма, который отличается от механизма, используемого факторами транскрипции и ДНК-связывающими белками, которые, как наблюдали, достигают своих мишеней путем скольжения (41⇓-43). Многие предыдущие исследования E. coli RNAP были интерпретированы как поддерживающие модель FD для поиска промоторов со скользящими расстояниями от сотен до тысяч пар оснований (13⇓⇓⇓⇓⇓⇓⇓ – 21).В этих исследованиях использовался другой холофермент (σ 70 вместо σ 54 ), и многие из них проводились при нефизиологически низкой ионной силе; следовательно, возможно, что поиск промотора с помощью FD происходит в условиях этих экспериментов, но не наших экспериментов. Однако мы отмечаем, что ни одно из исследований не показывает прямым наблюдением, что скольжение по ДНК предшествует захвату промотором, и они не показывают напрямую, что скольжение увеличивает чистую скорость, с которой полимераза достигает промотора.В отличие от предыдущих исследований, представленная здесь работа напрямую проверяет обе эти гипотезы и не находит ни одной из них.

В недавнем исследовании Wang et al. (23) использовали вытянутые «занавески» ДНК, на которых можно было непосредственно визуализировать скольжение других белков (например, репрессора Lac) (23). Wang et al. (23) не смогли непосредственно наблюдать, может ли неспецифически связанная σ 70 RNAP (в отличие от σ 54 RNAP, используемая здесь) скользить по ДНК, потому что неспецифические комплексы σ 70 RNAP были слишком короткоживущими.Однако короткое время жизни несовместимо со скольжением по тысячам пар оснований и, таким образом, кажется несовместимым с некоторыми более ранними наблюдениями за скольжением на большие расстояния неспецифически связанной σ 70 РНКП (13). Вместо этого они сделали вывод из наблюдаемой нелинейности в зависимости скорости связывания от концентрации RNAP, что FD доминирует при поиске промотора σ 70 RNAP ниже ∼0,5 нМ RNAP, но размер ДНК-мишени, на которой происходит FD, невелик (6 п.н.). Вывод о размере цели основан на модели твердого тела для диффузии RNAP, которая, как обсуждалось выше, может быть неточной на малых расстояниях.Тем не менее, общая картина, согласно которой поиск промотора σ 70 RNAP не включает FD, за исключением, возможно, очень малых расстояний, соответствует нашим результатам σ 54 RNAP.

Константа скорости второго порядка для σ 54 связывания РНКП с промотором, k 1 = 2,1 × 10 7 M −1 с −1 (7), составляет всего ∼50 в раз медленнее, чем предполагаемый верхний предел скорости трехмерной диффузии с последующим прямым связыванием ( SI Materials and Methods ).Вместо FD экспериментальные результаты указывают на то, что пара RNAP-промотор сильно очищена, чтобы обеспечить быстрое прямое связывание. Это уточнение иллюстрируется выведенными энергетическими ландшафтами для последовательного и неспецифического связывания (Рис. 5). Наши данные показывают, что исходный промотор-специфический комплекс RP 1 и неспецифический комплекс имеют примерно одинаковые скорости диссоциации (рис. 4). Таким образом, свободные энергии активации процессов диссоциации (Δ G r, N и Δ G r, P на рис.5) сопоставимы. Напротив, данные показывают, что константы скорости связывания (соответствующие энергии активации Δ G f, N и Δ G f, P на рис. неспецифическое связывание с промотором. Действительно, экстраполяция данных на рис. 2 B показывает, что длина непромоторной ДНК должна составлять ~ 7,2 т.п.н., чтобы скорость детектируемого неспецифического связывания равнялась скорости связывания с одним промоторным сайтом ( SI Materials и Методы ).Это поразительное наблюдение согласуется с механизмом, в котором промоторная последовательность имеет необычные структурные или динамические особенности, так что конформация ДНК, благоприятствующая полимеразе, высокоразвита на промоторах, но лишь изредка заселяется в родовой ДНК. В этом контексте интересно отметить, что промоторы σ 54 имеют характерную область, богатую содержанием аденозина / тимидина (A / T) перед промотором (27), и этот конкретный промотор также на 100% A / T от От -11 до +1 относительно сайта начала транскрипции.Возможно, что эти сегменты необычного состава оснований придают нетипичные структурные или динамические свойства промоторной последовательности.

Рис. 5.

Схематические ландшафты свободной энергии для связывания РНКП с промотором (синий) или неспецифическим сайтом (красный) в условиях наших экспериментов. Обозначения такие же, как на рис. 1 A .

Для всех промоторов транскрипции предположение о том, что аппарат транскрипции находит промоторы с помощью FD, долгое время было проблематичным, поскольку ожидается, что присутствие других связанных белков на ДНК будет препятствовать скользящему поиску (шаг 2 на рис.1 А ). У бактерий ДНК занята множеством нуклеоидных белков, тогда как у эукариот нуклеосомы могут располагаться фланкируя, если не, то активные промоторы (44, 45). У всех организмов ДНК вблизи промоторов содержит сайты связывания для общих и / или специфических факторов транскрипции, многие из которых заселяются даже при активации промотора. Наши результаты быстрого прямого связывания RNAP с промоторной ДНК и неучастия фланкирующей ДНК в процессе поиска промотора могут отражать эволюционное уточнение пары RNAP – промотор, что позволяет RNAP быстро находить промоторы, не препятствуя занятию фланкирующей ДНК. другими связанными белками.

Материалы и методы

Материалы.

молекул ДНК получали с помощью ПЦР, как описано (7), с использованием указанных матриц и праймеров (фиг. S1 и S2 и таблицы S1 и S2). Непромоторные ДНК удаляют от -27 до -1 относительно сайта начала транскрипции, чтобы удалить последовательности консенсусного промотора -12 и -24.

Core RNAP был получен от Epicenter. Экспрессия, очистка и мечение красителем для одиночного мутанта Cys σ 54 и восстановление Cy3-σ 54 холофермента RNAP были описаны ранее (7).Активность холофермента проверяли с использованием анализов как одиночной, так и общей транскрипции, как описано ранее (7). Во время типичного эксперимента с одной молекулой скорость связывания РНКП с поверхностно-привязанными молекулами ДНК с незанятым промотором снизилась всего на ~ 7% за 1000 с, что указывает лишь на небольшое снижение концентрации активного свободного холофермента во время экспериментов. Это минимальное снижение ожидается на основе медленной диссоциации σ 54 РНКП (46) и слишком мало, чтобы существенно повлиять на измеренные скорости ассоциации с ДНК, особенно потому, что мы измеряем только относительные скорости связывания с двумя молекулами ДНК в тот же образец.В контрольном эксперименте скорость связывания ДНК только с помощью σ 54 (т.е. без коровой RNAP) составляла <0,1% от скорости связывания холоферментом.

Микроскопия.

Измерения проводились с использованием специально разработанного многоволнового микрозеркального флуоресцентного микроскопа полного внутреннего отражения, оснащенного возбуждающими лазерами на 633, 532 и 488 нм и 785-нм лазером для автофокусировки (7, 47).

Проточные кюветы были сконструированы с использованием плавленого кварца или предметных стекол, пассивированных смесью ПЭГ / биотин-ПЭГ, по существу, как описано (47).Реагентами, используемыми для этого покрытия, были mPEG-SG2000 и биотин-PEG-SVA5000 (Laysan Bio). Предметные стекла, покрытые ПЭГ, были приготовлены заранее и хранились в атмосфере азота при -80 ° C до 6 месяцев.

Все эксперименты по связыванию RNAP проводили с использованием буфера для транскрипции, содержащего 50 мМ Tris⋅OAc, pH 8,0, 100 мМ KOAc, 8 мМ MgOAc, 27 мМ NH 4 OAc, 2 мМ DTT, 35 мг / мл PEG 8000 (# 81268; Sigma-Aldrich), 0,1 мг / мл BSA (# 126615; EMD Chemicals) и систему поглощения кислорода глюкозой / глюкозооксидазой / каталазой для минимизации фотообесцвечивания (7).Этот буфер также использовали во время первоначального прикрепления ДНК к поверхности проточной кюветы, за исключением того, что ПЭГ не добавляли до тех пор, пока не была достигнута удовлетворительная поверхностная плотность молекул ДНК, поскольку было обнаружено, что он препятствует прикреплению ДНК к поверхности. Помехи могут быть вызваны тем, что раствор ПЭГ вызывает поливалентное присоединение стрептавидина к биотин-ПЭГ на поверхности предметного стекла.

Привязка к поверхности проточной кюветы двух типов молекул краситель-ДНК-биотин, один из которых мечен Cy5 (Cy5-ДНК), а другой — Alexa Fluor 488 (AF488-ДНК), выполняли последовательно.Проточную кювету сначала инкубировали в течение 45 с с 0,013 мг / мл стрептавидина (Pierce) в буфере для транскрипции, в котором отсутствуют как ПЭГ, так и поглотитель кислорода. Затем клетку дважды промывали пятикратным объемом клетки, используя тот же буфер, а затем раствор, содержащий 10–20 пМ AF488-ДНК в том же буфере. Накопление флуоресцентных пятен от поверхностного прикрепления молекул AF488-ДНК контролировали, чтобы предотвратить перенаселение поверхности, и останавливали, промывая дорожку буфером. Затем на дорожку в буфере для транскрипции, не содержащем PEG, но содержащем поглотитель кислорода, добавляли раствор, содержащий 10–20 пМ Cy5-ДНК, и, как правило, накопление останавливали в течение нескольких минут.Затем предметный столик микроскопа перемещали в новое поле зрения (не подвергавшееся предварительному лазерному возбуждению). Прибору давали возможность уравновеситься в течение нескольких минут, чтобы минимизировать последующий пространственный дрейф. Затем обратная связь от 785-нм ИК-лазера использовалась для фокусировки микроскопа в новом положении столика без фотообесцвечивания меток красителя ДНК, которое могло бы быть вызвано воздействием возбуждения с видимой длиной волны. После записи изображений ДНК в течение нескольких секунд каждое с использованием возбуждения 633 и 488 нм, мы начали измерение связывания, введя Cy3-σ 54 RNAP в указанной концентрации в буфере для транскрипции.Затем повторяли то же изображение ДНК с последующим непрерывным отображением RNAP с использованием возбуждения 532 нм с частотой кадров 1 с -1 , прерываясь на ~ 1 с каждые ~ 2 минуты для автоматической фокусировки.

Методы анализа данных микроскопии приведены в SI Materials and Methods .

Благодарности

Мы благодарим Джейн Кондев за полезные обсуждения и комментарии к рукописи. Эта работа была поддержана грантом R01 GM 81648 Национального института здравоохранения и грантом G.Фонд Гарольда и Лейлы Ю. Мазерс.

Сноски

  • Вклад авторов: L.J.F., J.P.M. и J.G. спланированное исследование; L.J.F. проведенное исследование; L.J.F. внесены новые реагенты / аналитические инструменты; L.J.F. проанализированные данные; и L.J.F., J.P.M. и J.G. написал газету.

  • Авторы заявляют об отсутствии конфликта интересов.

  • ↵ * Для этой статьи с прямым представлением был назначен редактор.

  • Эта статья содержит вспомогательную информацию на сайте www.pnas.org/lookup/suppl/doi:10.1073/pnas.1300221110/-/DCSupplemental.

Clubbable: Найдите промоутера

Если вы ходите в клуб, то уже знаете, что попасть в клуб иногда бывает непросто, а если вы новичок в ночной жизни, важно знать и помнить следующую информацию.

Начнем с ключевого слова «промоутер».

Что такое промоутер?

Клубный промоутер — это тот, кто работает на клубы.

Промоутеры очень увлечены развлекательным бизнесом, поэтому они помогают клубам поддерживать веселую и оптимистичную атмосферу, приглашая в клуб много гостей и развлекая их.Это также их работа — следить за тем, чтобы приходили только хорошие гости.

Есть два типа промоутеров:

Первый — это внутренний промоутер, что означает, что промоутер работает напрямую с клубом, что делает его / ее надежным человек у клуба и у гостей.

Внутренний промоутер может предложить специальные предложения за столиками и имеет свой собственный список гостей.

Второй тип промоутера — фрилансер. У них есть соглашения со всеми клубами, с которыми они работают, но они не нанимаются клубом напрямую и обычно не имеют такого же приоритета или полномочий, как внутренние промоутеры.

Этот промоутер все еще может предлагать список гостей, но в большинстве случаев это будет чужой список гостей.

Также есть суб-промоутеры, которые являются младшими промоутерами, работающими от имени старшего промоутера, имеющего дело с клубом.

Например, Адда — внештатный промоутер, и она будет предлагать гостям список гостей Джона. Джон, будучи внутренним промоутером, имеет свой собственный список гостей.

Но зачем вам вообще промоутер?

Это потому, что большинство заведений не принимают заказы напрямую, вместо этого они платят промоутерам, чтобы они позаботились о бронировании.

Если вы попытаетесь отправить сообщение в клуб, скорее всего, вы не получите ответа. Во многие ночные клубы просто невозможно попасть без промоутера.

Теперь, когда вы знаете, насколько важна роль промоутера, вы скоро обнаружите, что найти хорошего не так просто, как может показаться.

Мы заметили необходимость в пространстве, где тусовщики могут найти тех хороших промоутеров, которые предлагают выгодные предложения и могут добавить вас в свой список гостей, где всегда готовятся предстоящие вечеринки, недавно открывшиеся клубы и те, которые закрывают свои двери Дата.

Использование Clubbable для выхода на улицу делает весь процесс без стресса и легким.

Вы можете заказать столик по установленным ценам, подходящим для вашей группы, или связаться с нами, если у вас есть особые требования, и мы сделаем это.

Если вы хотите быть в списке гостей, вы можете подать заявку, создав группу с такими данными, как дата, предпочитаемый клуб, количество парней / девушек, возраст и фотографии для себя и своих друзей.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *