Медико-генетический научный центр имени академика Н.П. Бочкова
115522, Москва,
ул. Москворечье, д. 1
Пн-Пт: с 9:00 до 17:00
Eng Готовность анализов

Разработаны подходы для поиска и анализа патогенных вариантов нуклеотидной последовательности в некодирующих областях генов

Совместная статья сотрудников лаборатории функциональной геномики Медико-генетического научного центра имени академика Н. П. Бочкова, посвященная разработке алгоритма, позволяющего выявлять патогенные варианты нуклеотидной последовательности в 5`- нетранслируемых областях генов, вышла в журнале Nucleic Acids Research (Q1, IF 19.16)

На сегодняшний день при проведении ДНК-диагностики пациентов с наследственными заболеваниями основное внимание исследователи обращают на ту часть гена, с которой непосредственно происходит трансляция основного белка, кодируемого данным геном. Однако помимо описанной белок-кодирующей части, гены человека включают в себя последовательности, не участвующие в кодировании белка. Одной из таких последовательностей является 5`-нетранслируемая область, находящаяся перед белок-кодирующей частью гена. Эти области играют важную роль в регуляции экспрессии генов за счёт различных механизмов, в том числе за счёт наличия особых последовательностей, называемых малыми открытыми рамками считывания - upstream ORFs (uORFs).

По литературным оценкам более половины генов человека могут иметь такие рамки считывания, но патогенные варианты в них описаны лишь в единичных случаях. Это связано, с одной стороны, с отсутствием качественной аннотации uORFs в генах человека, а с другой, с отсутствием доступных инструментов для поиска и интерпретации вариантов в этих генах.

Работу, посвященную решению этих проблем, провели сотрудники лаборатории функциональной геномики МГНЦ совместно с коллегами из Дальневосточного Федерального Университета (ДВФУ), Института искусственного интеллекта AIRI, Института биоинформатики и Политехнической школы в Париже. Научные сотрудники детально проанализировали около 3600 генов, связанных с наследственными заболеваниями, которые упоминаются в базе данных OMIM. В результате было описано порядка 4,7 тыс. сайтов инициации трансляции малых открытых рамок считывания в 1782 генах, ассоциированных с развитием наследственных заболеваний.

«Одним из важнейших результатов работы стало подтверждение того, что у половины генов, связанных с наследственными заболеваниями, существуют малые открытые рамки считывания. До настоящего момента не было создано достаточно качественного списка с координатами uORF в генах человека, что затрудняло поиск патогенных вариантов в данных генах. Наше исследование важно для повышения качества ДНК-диагностики пациентов с наследственными заболеваниями. Мы создали собственный биоинформатический инструмент, позволяющий находить патогенные варианты в uORF. С его помощью мы проанализировали варианты, находящиеся в открытых базах данных HGMD и ClinVar и нашли такие варианты, которые приводят к развитию заболевания именно за счёт нарушения малых открытых рамок считывания. Некоторые найденные с помощью биоинформатического инструмента малые открытые рамки считывания и варианты в них мы проверили экспериментально, чтобы подтвердить нашу гипотезу. Кроме того, опираясь на наш детальный анализ uORF в небольшой части генов человека, ассоциированных с развитием наследственных заболеваний, в совместной работе нам удалось создать модель машинного обучения, которая предсказала малые открытые рамки считывания во всех остальных генах человека, что представляет интерес  для фундаментальной науки», - рассказала научный сотрудник лаборатории функциональной геномики МГНЦ, к.б.н. Александра Филатова.

Часть работы была выполнена по договору с Институтом искусственного интеллекта (AIRI). Другая часть в рамках выполнения государственного задания Министерства науки и высшего образования РФ. Данная работа имеет большое практическое значение. Созданная программа поиска патогенных вариантов нуклеотидной последовательности в малых открытых рамках считывания позволит повысить эффективность диагностики. В случаях, когда стандартные методы ДНК-диагностики не принесут результата, врачи смогу воспользоваться биоинформатическим инструментом для поиска патогенных вариантов в 5`- нетранслируемых областях генов. Программа будет применяться в научно-исследовательской практике МГНЦ, а также будет открыта специалистам других научных и медицинских организаций.  

Подробнее с материалами статьи можно ознакомиться по ссылке: Alexandra Filatova, Ivan Reveguk, Maria Piatkova, Daria Bessonova, Olga Kuziakova, Victoria Demakova, Alexander Romanishin, Veniamin Fishman, Yerzhan Imanmalik, Nikolay Chekanov, Rostislav Skitchenko, Yury Barbitoff, Olga Kardymon, Mikhail Skoblov. Annotation of uORFs in the OMIM genes allows to reveal pathogenic variants in 5′UTRs. Nucleic Acids Research, gkac1247 https://doi.org/10.1093/nar/gkac1247