Медико-генетический научный центр имени академика Н.П. Бочкова
115522, Москва,
ул. Москворечье, д. 1
Пн-Пт: с 9:00 до 17:00
Eng Готовность анализов

Геногеография в 2019 году отмечает свой столетний юбилей. Еще в годы первой мировой войны с удивлением было обнаружено, что, хотя группы крови у всех людей одни и те же, но у разных народов они встречаются с очень разной частотой. Первооткрыватели описали это так: «На македонском фронте было великое скопление народов и рас… И различия в частотах групп крови обнаруживались ярчайшим образом». И именно геногеография может помочь прогнозировать, в каких группах населения со сходной генетической историей спектр наследственной патологии будет похожим, а в каких – отличным. И с развитием полногеномных исследований, персонифицированной медицины, фармакогенетики, криминалистики практическая значимость фундаментальных исследований геногеографии резко возрастает.

И как всегда, фундаментальные исследования имеют многочисленные практические приложения, порой неожиданные. Например, именно наш коллектив в 2011 году, исследовав Y-хромосому исполнителя теракта в аэропорту Домодедово, определил его вероятное происхождение из коренного населения Ингушетии, что обеспечило возможность идентификации личности исполнителя в течение нескольких дней.

БИОБАНК СЕВЕРНОЙ ЕВРАЗИИ

Многолетними усилиями нашего коллектива, ряда сотрудников лаборатории геномной географии ИОГен РАН и многих научных коллективов России и сопредельных стран создан Биобанк коренного населения Северной Евразии, являющийся крупнейшим в мире собранием биологических образцов от представителей коренных популяций северной половины Евразии.

«Биобанк Северной Евразии» содержит более 30 тысяч биологических образцов 300 популяций 100 этносов (рис. 3) Восточной Европы, Кавказа, Волго-Уральского региона, Центральной Азии, Сибири и Дальнего Востока (в том числе республик Адыгея, Алтай, Башкортостан, Бурятия, Дагестан, Ингушетия, Кабардино-Балкария, Калмыкия, Карачаево-Черкессия, Карелия, Коми, Крым, Марий-Эл, Мордовия, Саха, Северная Осетия, Татарстан, Тыва, Удмуртия, Хакассия, ХМАО, Чечня, Чувашия) и 17 зарубежных стран – Абхазии, Азербайджана, Алании, Армении, Афганистана, Белоруссии, Грузии, Казахстана, Киргизии, Литвы, Македонии, Монголии, Узбекистана, Украины, Таджикистана, Турции, Шри-Ланки.


Карта популяций, биологические образцы из которых входят в «Биобанк Северной Евразии».

Для его пополнения ежегодно проводятся несколько экспедиций. Их особенность – единые высокие требования к экспедиционному обследованию, соответствующие лучшим международным стандартам: собираются образцы венозной крови (> 90% образцов); преимущественно от мужчин (> 90%) старше 18 лет, не состоящих в родстве на глубину не менее трех поколений; все предки обследованных до трех поколений относили себя к данному этносу и родились в данной популяции; объем популяционной выборки в среднем 75-100 человек; этнос, как правило, представлен несколькими популяциями из разных частей его ареала; обязательное письменное информированное согласие на обследование; работа ведется под контролем этического комитета.

БАЗЫ ДАННЫХ и ГЕНОГЕОГРАФИЧЕСКИЕ АТЛАСЫ

Базы данных являются не просто хранилищами информации, а системами обработки данных. Созданные нашим коллективом базы данных об изменчивости Y-хромосомы (Y-base) и митохондриальной ДНК («MURKA») в населении мира являются наиболее полными и получили признание у международной научной общественности. Созданы БД «Аутосомные STR маркеры России», «Русский генофонд», «Русские фамилии». Создаются БД о распространении в населении России и мира широкогеномных аутосомных панелей и данных секвенирования экзомов.

Важнейшее направление – картографический анализ генофондов и создание атласов. Он позволяет своими собственными глазами увидеть пространственную изменчивость генофонда. Разработанное нами программное обеспечение для геногеографического анализа генофондов «GeneGeo» соответствует лучшим стандартам картографии и использовалось международным проектом «GENOGRAPHIC» - самым масштабным в области популяционной генетики человека.

GenеGeo обеспечивает многовариантный анализ не только отдельного признака, но и более сложные виды популяционного анализа (анализ генетических расстояний и границ, межпопуляционной изменчивости, корреляций и т.д.). Поэтому карта служит не иллюстрацией, а инструментом исследования.

Созданы серии мировых и региональных атласов по изменчивости Y-хромосомы, митохондриальной ДНК, различных параметров аутосомного генофонда, анализируемого по широкогеномным данным и экзомам, атлас русских фамилий, атлас антропологии русского народа, атлас аутосомных STR маркеров России, используемых в криминалистике.

Приведем несколько примеров комплексного использования созданных биобанка, баз данных, биоинформационных и картографических технологий.

АНАЛИЗ ПРОИСХОЖДЕНИЯ ГЕНОМОВ НАРОДОВ МИРА

Анализ предковых прапопуляций на основе широкогеномных данных (ADMIXTURE) представляет собой моделирование вклада предполагаемых предковых прапопуляций для каждого индивида в загруженном массиве данных. Иными словами, программа ADMIXTURE получает на входе только таблицу генетических данных для множества образцов и только число предполагаемых предковых прапопуляций для всех них (от k=2 и выше), при этом принадлежность конкретных образцов к конкретным популяциям программа не учитывает. На выходе исследователь получает оценку вклада каждой из k прапопуляций для каждого индивида, и далее, сгруппировав индивиды по принадлежности к популяциям – структуру каждой из изученных популяций.

Анализ предковых компонент народов мира методом ADMIXTURE при 6 предполагаемых предковых прапопуляций (k=6) приведен на рис. 4а. Картографирование каждой предковой компоненты (рис. 4б - 4д) позволяет реконструировать центр происхождения предковой прапопуляции и современный ареал ее распространения.

Максимум предкового компонента k1 (рис. 4б) характерен для коренного населения Африки южнее Сахары, значительно меньше его доля в Северной Африке и на Ближнем Востоке, минимальна в Юго-Западной Азии и в Испании и практически отсутствует предковый компонент k1 в остальной части Евразии. Предковый компонент k3 (рис. 4в), напротив, преобладает в популяциях Европы и вклад этой гипотетической прапопуляции падает с северо-запада на юго-восток Евразии. Совершенно противоположный тренд прослеживается на карте распространения предкового компонента k5 (рис. 4г): его максимум находится в Центральной и Восточной Сибири, и затем наблюдается плавное уменьшение в направлении с северо-востока на юго-запад: он четко выражен в популяциях Западной Сибири и Зауралья, Центральной Азии, но практически отсутствует в Европе, на Ближнем Востоке и в Южной Азии. Максимум предкового компонента k6 (рис. 4д) приходится на Юго-Восточную Азию с заметной выраженностью в Южной Сибири и Центральной Азии и практическим отсутствием в приарктической полосе Евразии, Европе и на Ближнем Востоке.

Анализ предковых компонент народов мира ADMIXTURE при 6 предполагаемых предковых прапопуляций (k=6): картографирование каждой предковой компоненты позволяет реконструировать центр ее происхождения и ареал

ВЫЯВЛЕНИЕ АРЕАЛОВ НОВЫХ ГАПЛОГРУПП ДЛЯ ДЕТАЛЬНОГО АНАЛИЗА ГЕНЕТИЧЕСКОЙ ИСТОРИИ ПОПУЛЯЦИЙ

Технологии полногеномного анализа Y-хромосомы позволяют выявить среди «старых» гаплогрупп (толстых «стволов» Y-хромосомного дерева) множество молодых тонких ветвей, обычно приуроченных к ограниченной территории и поэтому высокоинформативных для определения происхождения.

Разработанный нами подход, основанный на комплексном использовании биобанка, баз данных, биоинформационных и картографических технологий включает четыре этапа:

(1)   секвенирование всей основной части Y-хромосомы для нескольких образцов изучаемой гаплогруппы;

(2)   построение по этим данным филогенетического дерева, определение возраста ветвей и выбор для каждой ветви определяющих ее SNP;

(3)   массовый скрининг: генотипирование этих SNP для многих представителей многих популяций коренного населения; для выполнения этого этапа необходим биобанк, содержащий образцы из всех ключевых популяций всего ареала страны и сопредельных стран;

(4)   построение карт распространения ветвей. Совокупность карт распространения всех ветвей разного иерархического уровня, анализируемая вместе с датировками ветвей (полученными на этапе 1) позволяет разработать целостную модель истории гаплогруппу, которая, в сою очередь, является одной из проекций демографической истории народонаселения.

Пример использования этого подхода показан на рисунке 5. Гаплогруппа N настолько широко распространена почти по всему ареалу Северной Евразии (рис. 5 а), что обнаружив ее в популяции, ничего нельзя сказать о генетической истории популяции: неизвестно, получена она от якутов, тувинцев или эстонцев. Однако выполнение первых двух этапов подхода позволило подразделить ее на субветви (рис. 5 б), а выполнение 3 и 4 этапов – массовый скрининг и картографирование распространения субветвей, позволило выявить их уникальные ареалы (рис. 5 в). Теперь можно детально анализировать генетическую историю тех популяций, где встречены те или иные субветви гаплогруппы N.


Выявление субветвей гаплогруппы N, приуроченных к ограниченной территории и поэтому высокоинформативных для определения происхождения (популяции или отдельного человека).

Такой анализ можно провести не только в пространстве, но и во времени.

На рис. 6 приведена реконструкция филогеографии гаплогруппы Q3 на основе полного секвенирования Y-хромосомы. В неолите гаплогруппа Q3 дала начало пяти ветвям (Q3a - Q3e), которые позднее распространились в Западной, Центральной и Южной Азии. В эпоху бронзы Q3a разделилась на семь ветвей. Одна из них - Q3a1 - была приобретена популяцией, предковой для евреев-ашкенази и увеличилась в процентном отношении в этой популяции в 1-м тысячелетии нашей эры, достигнув 5% в современном генофонде евреев-ашкенази.


Реконструкция филогеографии гаплогруппы Q3 в пространстве и времени

Аналогичный анализ проводится нашим коллективом для целого ряда других гаплогрупп (C, Q, G1, G2, R1b, R1a и др.).

РЕКОНСТРУКЦИЯ СОБЫТИЙ ГЕНЕТИЧЕСКОЙ ИСТОРИИ ОТДЕЛЬНЫХ ПОПУЛЯЦИЙ

Технологии картографического, фиогеографического и полногеномного анализа Y-хромосомы позволяют анализировать не только историю мирового генофонда, но и отдельные события генетической истории народов (рис. 7-9).

Карта суммарной частоты восточно-евразийских гаплогрупп Y-хромосомы позволяет увидеть в современном населении след мощной миграционной волны, прокатившейся из Монголии в Казахстан и Среднюю Азию, и остановившейся у Волги (рис. 7). Дальнейший анализ выявления субветвей восточно-евразийских гаплогрупп Y-хромосомы уточнил эту картину и позволил датировать события, оставившие этот след.


Карта суммарной частоты восточно-евразийских гаплогрупп Y-хромосомы

Филогенетический анализ родовой и территориальной структуры популяций (рис. 8) позволяет отделять генетическое родство от легендарного и датировать события генетической истории. А полногеномный анализ гаплогрупп Y-хромосомы позволил (рис. 9) сказать, что легендарная генеалогия казахских кланов (родов) имеет четкое генетическое подтверждение. Поскольку из исторических источников известно время жизни предка-основателя рода Аргын, это позволило рассчитать скорость мутирования Y-хромосомы. На основе этой скорости теперь можно рассчитывать датировки времени событий генетической истории других народов.


Филогенетический анализ родовой структуры