Molecular epidemiological analysis of SARS-CoV-2 genovariants in Moscow and Moscow region
- Authors: Ozhmegova E.N.1, Savochkina T.E.1, Prilipov A.G.1, Tikhomirov E...1, Larichev V.F.1, Sayfullin M.A.1,2, Grebennikova T.V.1
-
Affiliations:
- National Research Center for Epidemiology and Microbiology named after honorary academician N.F. Gamaleya, Ministry of Health of the Russian Federation
- Pirogov Russian National Research Medical University
- Issue: Vol 67, No 6 (2022)
- Pages: 496-505
- Section: ORIGINAL RESEARCH
- Submitted: 26.12.2022
- Published: 07.12.2022
- URL: https://virusjour.crie.ru/jour/article/view/668
- DOI: https://doi.org/10.36233/0507-4088-146
- ID: 668
Cite item
Full Text
Abstract
Introduction. SARS-CoV-2, a severe acute respiratory illness virus that emerged in China in late 2019, continues to spread rapidly around the world, accumulating mutations and thus causing serious concern. Five virus variants of concern are currently known: Alpha (lineage B.1.1.7), Beta (lineage B.1.351), Gamma (lineage P.1), Delta (lineage B.1.617.2), and Omicron (lineage B.1.1.529). In this study, we conducted a molecular epidemiological analysis of the most prevalent genovariants in Moscow and the region.
The aim of the study is to estimate the distribution of various variants of SARS-CoV-2 in Moscow city and the Moscow Region.
Materials and methods. 227 SARS-CoV-2 sequences were used for analysis. Isolation of the SARS-CoV-2 virus was performed on Vero E6 cell culture. Sequencing was performed by the Sanger method. Bioinformatic analysis was carried out using software packages: MAFFT, IQ-TREE v1.6.12, jModelTest 2.1.7, Nextstrain, Auspice v2.34.
Results. As a result of phylogenetic analysis, we have identified the main variants of the virus circulating in Russia that have been of concern throughout the existence of the pandemic, namely: variant B.1.1.7, which accounted for 30% (9/30), AY.122, which accounted for 16.7% (5/30), BA.1.1 with 20% (6/30) and B.1.1 with 33.3% (10/30). When examining Moscow samples for the presence of mutations in SARS-CoV-2 structural proteins of different genovariants, a significant percentage of the most common substitutions was recorded: S protein – D614G (86.7%), P681H/R (63.3%), E protein – T9I (20.0%); M protein – I82T (30.0%), D3G (20.0%), Q19E (20.0%) and finally N protein – R203K/M (90.0%), G204R/P (73.3 %).
Conclusion. The study of the frequency and impact of mutations, as well as the analysis of the predominant variants of the virus are important for the development and improvement of vaccines for the prevention of COVID-19. Therefore, ongoing molecular epidemiological studies are needed, as these data provide important information about changes in the genome of circulating SARS-CoV-2 variants.
Full Text
Введение
Благодаря беспрецедентным усилиям учёных, врачей и работников клинико-диагностических лабораторий по секвенированию генома SARS-CoV-2 появилась возможность наиболее полно отслеживать и анализировать появляющиеся новые варианты SARS-CoV-2 с отличающимся эпидемиологическим поведением. В настоящее время в общедоступной базе данных GISAID (Global Initiative on Sharing Avian Influenza Data) содержится более 12 млн полных геномов SARS-CoV-2, и данный факт является первым случаем такого масштабного секвенирования за всю историю циркулирования вирусов в мире [1]. В условиях продолжающейся пандемии и адаптивной эволюции вируса [2] данная информация является крайне важной и служит предиктором новых вариантов SARS-CoV-2, которые имеют более выраженные эпидемиологические, иммунологические или патогенные свойства [3].
Ввиду зависимости распространения вирусных вариантов от таких факторов, как случайность, свойства вируса и хозяина, а также социальных факторов и мер здравоохранения предсказать распределение генетических линий в том или ином географическом регионе практически невозможно. Тем более, как подчеркивают авторы некоторых исследований, зачастую это распределение не зависит от приспособленности отдельных геновариантов, а обусловлено эпидемиологическими факторами [4–6].
Анализ проявлений эпидемического процесса COVID-19 и циркуляции геновариантов SARS-CoV-2 на территории РФ за 2020–2022 гг. позволил выделить два этапа и пять подъёмов заболеваемости COVID-19, каждый из которых имел свои особенности. Первый этап (март – декабрь 2020 г.) был обусловлен появлением нового возбудителя в популяции человека, который под воздействием социальных и природных факторов дал начало дальнейшему развитию эпидемического процесса COVID-19. На втором этапе пандемии COVID-19 на территории РФ (с декабря 2020 г. по настоящее время) произошли изменения биологических свойств вируса SARS-CoV-2 с последующей сменой превалирующих геновариантов [7].
В начале 2020 г. разнообразие SARS-CoV-2 на территории России ограничивалось несколькими генетическими линиями, из которых доминировала линия B.1, появившаяся в Северной Италии и достигавшая своего пика в 62% в марте – мае 2020 г., и линия B.1.1, циркулировавшая вплоть до февраля 2021 г. и достигавшая своего пика в 82% в июле – августе 2020 г. [8]. По данным GISAID, скорость появления новых линий возросла во время второй волны пандемии, начавшейся в России в сентябре 2020 г. [9]. Так, согласно Всемирной организации здравоохранения, в мире появились варианты, вызывающие озабоченность (variant of concern – VOC), которые были названы альфа (линия B.1.1.7), бета (B.1.351), гамма (P.1), дельта (B.1.617.2) и омикрон (B.1.1.529) [10]. Все перечисленные линии обладали повышенной трансмиссивностью благодаря мутациям в RBD-связывающем домене спайкового белка, а также пониженной чувствительностью к нейтрализации моноклональными антителами, сывороткам выздоравливающих и иммунизированных людей, а также вакцинам [11].
Несмотря на постоянный мониторинг циркулирующих геновариантов в мире и огромный вклад всех стран по созданию новых терапевтических противовирусных средств, моноклональных антител и вакцин, SARS-CoV-2 продолжает эволюционировать и производить новые VOC, а в его геноме появляются всё новые значимые мутации. Соответственно, исследования по изучению распространения вируса в разных странах и регионах, в том числе для совершенствования и разработки новых препаратов для профилактики COVID-19, является актуальной задачей.
Целью данной работы было оценить распространение различных вариантов SARS-CoV-2 на территории Москвы и Московской области.
Материалы и методы
Составление набора данных последовательностей
В исследовании было использовано 227 последовательностей SARS-CoV-2, 31 из которых была получена при взятии назофарингеальных мазков у пациентов с симптомами новой коронавирусной инфекции из Инфекционной клинической больницы (ИКБ) № 1 г. Москвы в период с марта 2021 г. по апрель 2022 г., а 196 образцов были получены из общедоступной базы данных GISAID [1].
Исследование проводилось при добровольном информированном согласии пациентов. Протокол исследования одобрен Этическим комитетом ФГБУ «Национальный исследовательский центр эпидемиологии и микробиологии имени почетного академика Н.Ф. Гамалеи» Минздрава России (протокол № 32 от 01.12.2022).
Выделение вируса SARS-CoV-2 в культуре клеток Vero E6
В работе использовали перевиваемую линию клеток почки африканской зелёной мартышки (Chlorocebus aethiops) Vero Е6, предоставленную Всероссийской коллекцией клеточных культур ФГБУ «Национальный исследовательский центр эпидемиологии и микробиологии имени почётного академика Н.Ф. Гамалеи» Минздрава России.
Выращивание клеток осуществляли на среде DMEM (Dulbecco’s modified Eagles medium) с 5% эмбриональной телячьей сывороткой (ЭТС). В 96-луночные культуральные плоскодонные планшеты помещали клетки Vero E6 по 12 000 кл/лунка в объёме 100 мкл свежеприготовленной среды. Культивировали 24 ч при температуре 37 °C в атмосфере 5% CO2 до образования монослоя клеток.
Перед внесением проб из планшетов удаляли ростовую среду, промывали клетки 1–2 раза бессывороточной средой и вносили поддерживающую среду (DMEM с 1% ЭТС).
Пробы носоглоточных мазков от пациентов с клиническим диагнозом «новая коронавирусная инфекция» обследовали на наличие вируса методом выделения в культуре клеток Vero Е6. С палочки тампона делали смыв поддерживающей средой и вносили жидкость в лунки планшета с монослоем клеток. Планшеты инкубировали при температуре 37 °C в атмосфере 5% CO2 в течение 96 ч.
Для обнаружения изменения состояния клеточного монослоя (развитие цитопатического действия (ЦПД) вируса) просматривали лунки планшета в инвертированном микроскопе каждые 24 ч. При обнаружении ЦПД культуральную жидкость переносили в новую лунку с монослоем (пассировали). После выявления ЦПД в пассажных клетках культуральную жидкость отбирали и исследовали методом полимеразной цепной реакции (ПЦР) для обнаружения рибонуклеиновой кислоты (РНК) вируса SARS-CoV-2. Положительные образцы секвенировали и регистрировали в международной базе данных GISAID.
Выделение РНК SARS-CoV-2
Выделение РНК проводили путём экстракции из суспензии исследуемых образцов (культуральной жидкости) смесью гуанидина изотиоцианата, фенола и хлороформа [12].
Проведение обратной транскрипции и полимеразной цепной реакции
Для получения амплифицированных фрагментов использовали набор OneTube RT-PCR («Евроген», Россия) согласно рекомендациям производителя. Обратную транскрипцию (ОТ) и ПЦР проводили в тонкостенных пробирках объёмом 0,2 и 0,5 мл (QSP) на амплификаторах Mastercycler Gradient (Eppendorf, Германия) или «Терцик» («ДНК-технология», Россия). Общий объём реакционной смеси составлял 20 мкл. В реакционную смесь входили следующие компоненты: 10 мкл ОТ-ПЦР mix, по 5 пМ прямого и обратного праймера, 3 мкл раствора РНК и 1 мкл смеси ферментов. Амплификацию ОТ-ПЦР осуществляли с использованием следующих параметров: 42 °C 40 мин, 85 °C 2 мин (94 °C 15 с, 50 °C 15 с, 72 °C 90 с) 35 циклов; 72 °C 5 мин 1 цикл.
Секвенирование
Первичную нуклеотидную последовательность определяли по методу Сэнгера при помощи прямого секвенирования ПЦР-продукта с использованием BigDye Terminator v3.1 Cycle Sequencing Kit (Applied Biosystems, США) согласно рекомендациям изготовителя. Электрофорез ДНК осуществлялся на автоматическом ДНК-анализаторе ABI Prism 3130xl (Applied Biosystems, США).
Компьютерный анализ нуклеотидных последовательностей
Компьютерный анализ нуклеотидных последовательностей проводили с помощью пакетов программ DNASTAR (Lasergene v.6). Подбор праймеров для проведения реакций ОТ, ПЦР и секвенирования выполняли с помощью программы Primer Premier 5.00 (PREMIER Biosoft International, США). В работе были использованы синтетические олигонуклеотиды производства фирмы «Литех» (Россия).
Клинико-эпидемиологические данные
Эпидемиологические метаданные, такие как возраст, пол, район отбора проб, а также клиническая и вирусологическая информация были доступны для 31 последовательности и использовались в качестве данных о признаках. В силу плохого качества нуклеотидной последовательности одного образца было задепонировано в общедоступную базу GISAID 30 последовательностей. Номера доступа GISAID для последовательностей, используемых в этом исследовании: EPI_ISL_14995632, EPI_ISL_14988081, EPI_ISL_14988080, EPI_ISL_14988061, EPI_ISL_14988083, EPI_ISL_14988060, EPI_ISL_14988082, EPI_ISL_14988063, EPI_ISL_14988085, EPI_ISL_14988062, EPI_ISL_14988084, EPI_ISL_14988065, EPI_ISL_14988064, EPI_ISL_14988067, EPI_ISL_14988066, EPI_ISL_14988069, EPI_ISL_14988068, EPI_ISL_14988070, EPI_ISL_14988072, EPI_ISL_14988071, EPI_ISL_14988074, EPI_ISL_14988073, EPI_ISL_14988076, EPI_ISL_14988075, EPI_ISL_14988078, EPI_ISL_14988077, EPI_ISL_14988058, EPI_ISL_14988057, EPI_ISL_14988079, EPI_ISL_14988059.
Выравнивание последовательностей и филогенетический анализ
В результате выравнивания последовательностей один образец был удалён в силу плохого качества сиквенса. Нуклеотидные последовательности 30 московских образцов и 196 образцов из GISAID выравнивали с помощью MAFFT [13]. Исходное предковое дерево было создано с помощью филогенетического анализа с использованием метода максимального правдоподобия (ML) в IQ-TREE v1.6.12 [14] по модели нуклеотидных замен GTR, которая была выбрана как наиболее подходящая в jModelTest 2.1.7 [15]. Для проверки геноварианта методом ML к выравненным московским последовательностям из ИКБ № 1 были добавлены эталонные последовательности геновариантов и их сублиний, которые были взяты из базы данных последовательностей SARS-CoV-2 GISAID. Полученное филогенетическое дерево было подтверждено с использованием локального экземпляра рабочего процесса Nextstrain [16], который использует анализ ML, реализованный в Tree-Time [16, 17]. Общий набор данных для анализа Nextstrain ML содержал 226 последовательностей SARS-CoV-2: 30 последовательностей S-, E-, M-, N-белков вируса из Москвы, 196 полных геномов глобальных последовательностей SARS-CoV-2, которые использовались в качестве внешней группы. Визуализация дерева была проведена с помощью Auspice версии 2.34.1 [18]. Корнем дерева считался образец hCoV-19/Wuhan/WIV04/2019 (WIV04), который обозначается в базе GISAID как EPI_ISL_402124.
Статистический анализ
Анализ эпидемиологических характеристик, таких как пол, возраст, компьютерная томография (КТ) при постановке, мазок при постановке, исход заболевания, был проанализирован с помощью критерия χ2 Пирсона или двустороннего точного критерия Фишера (при необходимости). Различия считались достоверными при p менее 0,05. Все анализы выполнены в программе Statistica 10.0 (StatSoft, США).
Клинико-эпидемиологическая характеристика исследуемых образцов
Отобраны пробы от 31 пациента, госпитализированного в ИКБ № 1 в период с марта 2021 г. по апрель 2022 г. (табл. 1). Из них 30 пациентов проживали на территории 8 из 12 административных округов (АО) Москвы (Зеленоградский АО – 4, Южный – 2, Юго-Западный – 3, Центральный – 1, Северо-Западный – 9, Северо-Восточный – 4, Северный – 3, Западный – 3, Восточный – 1), один – в г. Химки (Московская область). Два пациента были госпитализированы из одного эпидемического очага (мать с дочерью). Бо́льшая часть госпитализированных из Северо-Западного АО, по нашему мнению, связана с расположением инфекционного стационара в данном округе. За последние 2 недели 29 пациентов не выезжали за пределы региона проживания, одна пациентка выезжала из Москвы в Московскую область. Указания на предшествующий контакт с больным COVID-19 были у 7 заболевших.
Таблица 1. Клинико-эпидемиологические данные исследуемых образцов
Table 1. Clinical and epidemiological data of the studied samples
Показатель/Indicator | Значение/ Value, n (%) | p value |
Средний возраст, лет / Average age, years, M ± m | 57,5 ± 3,6 | |
Пол/Gender Мужчины/Men Женщины/Women | 17 (54,8) 14 (45,2) | 0,27 |
КТ при постановке / CT at diagnosis 0 1 2 3 Не проведено / Not carried out | 4 (12,9) 20 (64,5) 4 (12,9) 1 (3,2) 2 (6,5) | 0,65 0,04 0,19 0,77 |
Мазок при постановке / Smear at diagnosis Положительный/Positive Отрицательный/Negative | 27 (87,1) 4 (12,9) | 0,018 |
Исход заболевания / Outcome of the disease Выписан/Discharged Умер/Died | 30 (96,8) 1 (3,2) | 8,32 |
Заключительный диагноз / Final diagnosis COVID-19, вирус идентифицирован / Virus identified COVID-19, вирус не идентифицирован / Virus not identified | 28 (90,3) 3 (9,7) | 0,007 |
Возраст пациентов составил от 24 до 99 лет, в среднем 57,5 ± 3,6 года. В группе было 14 женщин (45,2%). Хронические заболевания установлены у 19 (61,2%) пациентов, сочетанная коморбидная патология (более одного хронического заболевания) выявлена у 12 человек. Пациенты были госпитализированы на 3–8-й день от начала заболевания, медиана – 6-й [4; 8] день болезни. Противовирусную терапию до госпитализации получали 14 человек (умифенавир, фавипиравир, триазаверин).
Изменения в лёгких при мультиспиральной КТ (МСКТ) грудной клетки были установлены у 25 человек (до 25% поражения лёгких – 20, 25–50% – 4, 50–75% – 1). Двум пациентам МСКТ не была проведена.
Тридцать пациентов были выписаны с улучшением на амбулаторное лечение, один мужчина 50 лет скончался на 23-й день болезни (15-й день стационарного лечения) на фоне прогрессирующей дыхательной, сердечно-сосудистой недостаточности. Количество койко-дней составило от 2 до 26, медиана 8 [6; 12].
Филогенетический анализ исследуемых образцов
Филогенетическая дендрограмма с использованием метода ML была построена с использованием 196 полных геномов, взятых в открытой базе данных GISAID, включающих референс-штаммы Nextstrain для каждого варианта, а также 31 образец белков вируса S, E, M, N, полученных в лаборатории. Один образец был удалён в силу низкого качества сиквенса. Филогенетический анализ 30 образцов белков S (рецептор-связывающий белок), E (оболочечный белок), M (мембранный белок), N (нуклеокапсидный белок) SARS-CoV-2, полученных в лаборатории, позволил определить 4 клада московских образцов SARS-CoV-2 с высокой статистической поддержкой (PP ≈ 1,0 во всех случаях). В результате субтипирования московских образцов, полученных из ИКБ № 1, удалось выявить наиболее часто циркулирующие варианты и VOC в России и в мире, а именно: альфа (GRY; B.1.1.7 + Q.*), впервые выявленный на территории Великобритании дельта (GK; B.1.617.2 + AY.*), впервые детектированный в Индии, и омикрон (GRA; B.1.1.529 + BA.*), впервые обнаруженный в Ботсване, Гонконге и Южной Африке (рис. 1).
Рис. 1. Общая дендрограмма максимального правдоподобия 30 московских последовательностей, полученных из Инфекционной клинической больницы № 1, с 196 общедоступными последовательностями из открытой базы данных GISAID (использовались референс-варианты Nextstrain). Дерево укоренено с помощью референс-образца из Уханя (hCoV-19/Wuhan/WIV04/2019 (WIV04)). Цветом и подписями обозначены варианты, вызывающие озабоченность и интерес (VOC и VOI).
Fig. 1. Maximum likelihood dendrogram for 30 Moscow sequences obtained from Infectious Clinical Hospital No. 1 together with 196 available sequences from the GISAID database (Nextstrain reference variants were used). The tree is rooted using a reference sample from Wuhan (hCoV-19/Wuhan/WIV04/2019 (WIV04)). Variants of concern and interest (VOC and VOI) are marked with color and captions.
В то же время перечисленные VOC являются наиболее интересными вариантами с точки зрения создания вакцин. В результате филогенетического анализа методом ML 10 (33,3%) образцов из ИКБ № 1 были отнесены к линии B.1.1 вместе с референс-штаммами из Японии, США и России (рис. 2). В свою очередь, 8 из 9 образцов образовывали между собой высокоподдерживаемый кластер (PP = 1,0) (рис. 2). Высокая бутстрэп-поддержка (PP = 1) наблюдалась в кладе B.1.1.7 (альфа). В данной кладе группировались вместе 9 (30,0%) образцов из ИКБ № 1 и референс-штаммы из Германии, США и Швеции. Пять московских образцов (n = 31; 16,7%), полученные из ИКБ № 1, и референс-штаммы из Англии, Шотландии, США, Швейцарии, Германии и Сингапура вместе образовывали кладу и относились к варианту AY.122 (B.1.617.2, дельта) (PP = 1,0) (рис. 2). В то же время образец 252 объединялся в единый клайд с высокой статистической поддержкой (PP = 1,0) с референс-образцами из Англии, Шотландии и США. И, наконец, 6 (20,0%) московских образцов были отнесены к варианту BA.1.1 (B.1.1.529, омикрон) вместе с референс-штаммами из Люксембурга, США и Италии (рис. 2).
Рис. 2. Дендрограммы максимального правдоподобия московских образцов. Жирными точками указаны Московские образцы из ИКБ № 1. Цифрами у узлов деревья указаны высокоподдерживаемые ветви (бутстрэп поддержка > 0,9). Названия образцов указаны в соответствии с названиями из базы данных GISAID: а – линия B.1.1 вместе с референс-штаммами из Японии, США и России, б – линия B.1.1.7 (Alpha) с референс-штаммами из Германии, США и Швеции, в – линия BA.1.1 (B.1.1.529; Omicron) вместе с референс-штаммами из Люксембурга, США и Италии, г – линия AY.122 (B.1.617.2; Delta) с референс-штаммами из Англии, Шотландии, США, Швейцарии, Германии и Сингапура.
Fig. 2. Maximum likelihood dendrograms of Moscow samples. Illuminated dots indicate Moscow samples from IKH№1. The numbers at the tree nodes indicate highly supported branches (bootstrap support > 0.9). The names of the specimens are given according to the names from the GISAID database: a – line B.1.1 together with reference strains from Japan, USA and Russia, b – line B.1.1.7 (Alpha) with reference strains from Germany, USA and Sweden, c – line BA.1.1 (B.1.1.529; Omicron) together with reference strains from Luxembourg, USA and Italy, d – line AY.122 (B.1.617 .2; Delta) with reference strains from England, Scotland, USA, Switzerland, Germany and Singapore.
Анализ наиболее часто встречающихся мутаций в структурных белках SARS-CoV-2
При исследовании московских образцов (n = 30), полученных из ИКБ № 1, на наличие мутаций в структурных белках SARS-CoV-2 разных генетических вариантов зафиксирована значительная доля встречающихся вариантов замен, таких как S-белок – D614G (26/30; 86,7%), P681H/R (19/30; 63,3%), H69del + V70del (15/30; 50,0%), Y144del (14/30, 46,7%), N501Y (13/30, 43,3%), E156del + F157del + R158del/G (12/30, 40%), E484K (9/30, 30,0%); E-белок – T9I (6/30; 20,0%); M-белок – I82T (9/30; 30,0%), D3G (6/30; 20,0%), Q19E (6/30; 20,0%), A63T (6/30; 20,0%) и, наконец, N-белок – R203K/M (27/30; 90,0%), G204R/P (22/30; 73,3%), D3L (7/30; 23,3%), S235F (7/30; 23,3%) (табл. 2).
Таблица 2. Частота встречаемости мутаций в белках S, E, M, N SARS-CoV-2, n (%)
Table 2. Frequency of mutations in S, E, M, N SARS-CoV-2 proteins, n (%)
Тип мутации / Mutation type | Частота встречаемости мутации / Mutation frequency |
Мутации в белке S / Mutations in protein S | |
H69del + V70del | 15 (50,0) |
Y144del | 14 (46,7) |
E156del + F157del + R158del/G | 12 (40,0) |
E484K | 9 (30,0) |
N501Y | 13 (43,3) |
A570D | 9 (30,0) |
D614G | 26 (86,7) |
P681H/R | 19 (63,3) |
T716I | 8 (26,7) |
Мутации в белке E / Mutations in protein E | |
T9I | 6 (20,0) |
Мутации в белке M / Mutations in protein M | |
I82T | 9 (30,0) |
D3G | 6 (20,0) |
Q19E | 6 (20,0) |
A63T | 6 (20,0) |
Мутации в белке N / Mutations in protein N | |
D3L | 7 (23,3) |
R203K/M | 27 (90,0) |
G204R/P | 22 (73,3) |
S235F | 7 (23,3) |
На рис. 3 изображена частота мутаций в структурных белках, самым вариабельным участком является нуклеотидная последовательность гена S, именно в данном участке встречалось большее разнообразие мутаций. Мутации N501Y, E484K, D614G и P681H/R являются примерами общих мутаций между вариантами B.1.1.7, B.1.351, P.1, B.1.617.2 и B.1.1.529.
Рис. 3. Частота мутаций в структурных белках SARS-CoV-2 (S, E, M, N) московских образцов из Инфекционной клинической больницы № 1.
Fig. 3. Frequency of mutations in SARS-CoV-2 structural proteins (S, E, M, N) in Moscow samples from Infectious Clinical Hospital No. 1.
Согласно рис. 3 самым высококонсервативным структурным белком SARS-CoV-2 оказался белок оболочки вируса (E), на его участке была найдена только одна мутация – T9I, которая встретилась только у образцов, относящихся к варианту B.1.1.529 (омикрон), и, согласно исследованию [19], имела самую высокую распространённость среди всех мутаций в оболочечном белке.
Анализируя частоту встречаемости мутаций в гене мембраны (M), можно сказать, что в нашем исследовании данный белок оставался высококонсервативным, но в настоящее время имеются данные о быстром увеличении мутаций в данном белке за счёт замены I82T, которая была самой распространённой и в нашем исследовании [20].
Вторым по вариабельности геном после S-белка стал белок N, отвечающий за формирование новых вирусных частиц. Самыми распространёнными мутациями в данном белке оказались замены R203K/M и G204R/P, часто данные мутации были сопряжены друг с другом. Недавние исследования показали, что частота данных мутаций в белке нуклеокапсида (N) SARS-CoV-2 увеличивается среди новых вариантов, вызывающих озабоченность или интерес.
Результаты и обсуждение
В начале пандемии COVID-19 Россия оказалась несколько изолированной ввиду того, что были применены строгие эпидемиологические меры против распространения SARS-CoV-2, поэтому первые случаи COVID-19, а также случаи появления VOC произошли здесь позже, чем во многих других странах мира [21]. Тем не менее, несмотря на закрытие границ, импорт новых геновариантов продолжался, также происходили изменения биологических свойств вируса в виде накапливания ключевых мутаций, напрямую или косвенно влияющих на контагиозность, патогенность и реакцию на иммунизацию. Это привело к появлению тысячи российских линий, а также VOC [21, 22].
Так, во время второй волны пандемии (сентябрь 2020 г.) в России появилась линия B.1.1.7 (20I (альфа, V1)), которая уже в марте 2021 г. достигла частоты более 15% [22]. Вместе с вариантом B.1.1.7 в апреле 2021 г. в России были уже широко распространены российские линии B.1.1.524 и B.1.1.52. В середине весны 2021 г. ввиду одного случая завоза или нескольких в одно и то же время из одного плохо отобранного географического места в России появился вариант дельта (B.1.617.2; AY.122), частота которого увеличилась с 1% в апреле до более чем 90% в июне [23]. В конце 2021 г. был обнаружен новый VOC – B.1.1.529 (омикрон), который почти сразу вытеснил предыдущий доминирующий во всём мире вариант дельта (B.1.617.2), и в настоящее время он является преобладающим. Вакцины и терапевтические средства являются очень ценными инструментами в борьбе с SARS-CoV-2 и прогрессированием заболевания. Однако некоторые мутации вируса могут вызывать изменения ряда свойств, таких как инфекционная активность, патогенность, в том числе ускользание от современных терапевтических моноклональных антител и существующих вакцин [24, 25].
В настоящем исследовании мы провели молекулярно-эпидемиологический анализ геновариантов SARS-CoV-2, полученных в ИКБ № 1 (г. Москва). В результате филогенетического анализа мы выявили основные циркулирующие в России VOC на протяжении всего времени существования пандемии, а именно: вариант B.1.1.7 (альфа), который составил 30% (9/30) от общей выборки, исследуемых пациентов (n = 30), AY.122 (B.1.617.2, дельта), составивший 16,7% (5/30), BA.1.1 (BB.1.1.529, омикрон), составивший 20% (6/30) и B.1.1, составивший 33,3% (10/30). Следует отметить, что анализ проводился начиная с конца 2020 г., когда доминирующим вариантом в России был B.1.1, по весну 2022 г., когда доминирующим вариантом стал BA.1.1 (омикрон). Поэтому данное исследование отражает распространённость каждого варианта по генеральной совокупности последовательностей разных штаммов коронавируса.
Анализ мутаций в структурных белках S, E, M, N SARS-CoV-2 показал, что разнообразие мутаций в большей степени приходится на S-белок, а именно на часть RBD и других доменов. Данный факт очевиден с точки зрения того, что для эффективной адаптации коронавируса к новому хозяину необходимы мутации, влияющие на связывание с рецептором, поэтому данный белок играет важную роль в патогенезе вирусной инфекции и является критическим детерминантом вирусного тропизма и инфекционности [26].
Самой распространённой мутацией в S-белке различных генетических вариантов SARS-CoV-2 была замена D614G, которая отмечалась повышенной контагиозностью (в 4–9 раз), но не являлась мутацией, ускользающей от иммунного ответа [27]. Вторая по частоте встречаемости была замена P681H/R, которая потенциально могла бы влиять на усиление инфекции и трансмиссивность, однако исследования продолжаются [28, 29]. Следующей по распространённости и значимости была мутация E484K/A, которая вызывает особую озабоченность ввиду того, что она повышает аффинность к рецептору hACE2 (человеческий ангиотензинпревращающий фермент 2) и может ускользать от моноклональных антител, а также сывороток выздоравливающих/вакцинированных. Часто встречающаяся в данном исследовании замена N501Y, помимо влияния на аффинность к hACE2-рецептору, ускользание от моноклональных антител, а также сывороток выздоравливающих/вакцинированных, повышает трансмиссивность вируса и влияет на течение заболевания [30–33].
Самой распространённой в белке M была мутация I82T (9/30; 30%). Учитывая её быстрое появление в ряде стран и роль белка М во многих вирусных функциях, включая связывание вирусных клеток-хозяев, врождённый иммунный и Т-клеточный ответ при SARS и SARS-CoV-2 с возможным уклонением от иммунитета, данная мутация требует включения в текущий геномный надзор за SARS-CoV-2 и дальнейшую оценку потенциального увеличения географического распространения и патогенности.
Белок N был вторым по разнообразию и количеству присутствующих мутаций после белка S и представлен в основном мутациями R203K/M и G204R/P. В исследовании [34] было показано, что R203K/G204R связаны с появлением высококонтагиозной линии SARS-CoV-2 B.1.1.7. Конкурентные эксперименты предполагают, что варианты 203K/204R обладают преимуществом репликации по сравнению с предшествующими вариантами R203/G204, возможно, связанными со сборкой рибонуклеокапсида (RNP). Более того, вирус 203K/204R проявляет повышенную инфекционность в клетках лёгких человека и хомяков.
Наконец, наши результаты ограничены областью генов S, E, M, N SARS-CoV-2. Использование полных геномов может обеспечить более точный вывод результатов исследования, что следует учитывать при интерпретации результатов настоящего исследования.
Заключение
В настоящем исследовании мы выявили основные мутации и варианты вируса SARS-CoV-2, которые были получены из ИКБ № 1 и циркулировали на территории Москвы и Московской области в период с марта 2020 г. по апрель 2022 г. В свою очередь, изучение частоты и влияния мутаций, а также анализ наиболее часто циркулирующих вариантов вируса важны для разработки и совершенствования вакцин для профилактики COVID-19. Можно предположить, что оптимизация антигенного состава вакцин в соответствии с упомянутыми выше мутациями, которые соответствуют разным вариантам вируса, обеспечит синтез специфических антител. Тем не менее предстоящая задача остаётся огромной: уровни передачи высоки даже в районах с широко распространённой вакцинацией и предыдущими волнами инфекции, в геноме SARS-CoV-2 появляются новые мутации, и остаётся много открытых вопросов о будущем эпидемиологическом воздействии данного вируса. Следовательно, эпидемиологические исследования, особенно направленные на изучение генома SARS-CoV-2 молекулярными методами, должны продолжаться и составлять неотъемлемую часть в разработке вирусных вакцин для профилактики COVID-19.
Участие авторов: Ожмегова Е.Н. – написание статьи, выделение РНК вируса, амплификация и секвенирование, филогенетический анализ; Савочкина Т.E. – написание статьи, выделение РНК SARS-CoV-2, амплификация и секвенирование; Прилипов А.Г. – выделение РНК SARS-CoV-2, амплификация и секвенирование, анализ сиквенсов; Тихомиров Е.Е. – выделение РНК SARS-CoV-2, амплификация и секвенирование; Сайфуллин М.А. – написание статьи, отбор проб от пациентов; Ларичев В.Ф. – выделение SARS-CoV-2 в культуре клеток; Гребенникова Т.В. – организация исследования, анализ полученных результатов, редактирование текста.
Финансирование. Государственное задание Минздрава России «Разработка прототипа вакцины на основе VLP для профилактики COVID-19».
Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.
Этическое утверждение. Исследование проводилось при добровольном информированном согласии пациентов. Протокол исследования одобрен Этическим комитетом ФГБУ «Национальный исследовательский центр эпидемиологии и микробиологии имени почетного академика Н.Ф. Гамалеи» Минздрава России (протокол № 32 от 01.12.2022).
About the authors
Ekaterina N. Ozhmegova
National Research Center for Epidemiology and Microbiology named after honorary academician N.F. Gamaleya, Ministry of Health of the Russian Federation
Email: ozhmegova.eka@gmail.com
ORCID iD: 0000-0002-3110-0843
Researcher, Laboratory of leukemia viruses
Russian Federation, 123098, MoscowTatyana E. Savochkina
National Research Center for Epidemiology and Microbiology named after honorary academician N.F. Gamaleya, Ministry of Health of the Russian Federation
Email: tasavochkina@yandex.ru
ORCID iD: 0000-0003-4366-8476
Junior Researcher, Laboratory of Molecular Diagnostics
Russian Federation, 123098, MoscowAlexey G. Prilipov
National Research Center for Epidemiology and Microbiology named after honorary academician N.F. Gamaleya, Ministry of Health of the Russian Federation
Email: a_prilipov@mail.ru
ORCID iD: 0000-0001-8755-1419
Doctor of Biological Sciences, Head Laboratory of Molecular Genetics Center
Russian Federation, 123098, MoscowE. .E. Tikhomirov
National Research Center for Epidemiology and Microbiology named after honorary academician N.F. Gamaleya, Ministry of Health of the Russian Federation
Email: ozhmegova.eka@gmail.com
Russian Federation, 123098, Moscow
Victor F. Larichev
National Research Center for Epidemiology and Microbiology named after honorary academician N.F. Gamaleya, Ministry of Health of the Russian Federation
Email: vlaritchev@mail.ru
ORCID iD: 0000-0001-8262-5650
doctor of med. sci, Leading Researcher of laboratory of biology and indication of arbovirus infections
Russian Federation, 123098, MoscowMukhammad A. Sayfullin
National Research Center for Epidemiology and Microbiology named after honorary academician N.F. Gamaleya, Ministry of Health of the Russian Federation; Pirogov Russian National Research Medical University
Email: dr_saifullin@mail.ru
ORCID iD: 0000-0003-1058-3193
PhD, Associate Professor, Department of Infectious Diseases in Children, Faculty of Pediatrics, Sen. оf laboratory of biology and indication of arbovirus infections
Russian Federation, 123098, Moscow; 119997, MoscowTatyana V. Grebennikova
National Research Center for Epidemiology and Microbiology named after honorary academician N.F. Gamaleya, Ministry of Health of the Russian Federation
Author for correspondence.
Email: t_grebennikova@mail.ru
ORCID iD: 0000-0002-6141-9361
Doctor of Biological Sciences, Professor, Corresponding Member RAS, Head Laboratory of Molecular Diagnostics, Head of department
Russian Federation, 123098, MoscowReferences
- GISAID. Available at: https://gisaid.org/
- Kistler K.E., Huddleston J., Bedford T. Rapid and parallel adaptive mutations in spike S1 drive clade success in SARS-CoV-2. Cell Host Microbe. 2022; 30(4): 545–55е4. https://doi.org/10.1016/j.chom.2022.03.018
- (COVID-19 Genomics UK (COG-UK). An integrated national scale SARS-CoV-2 genomic surveillance network. Lancet Microbe. 2020; 1(3): e99–e100. https://doi.org/10.1016/S2666-5247(20)30054-9
- Endo A., Abbott S., Kucharski A.J., Funk S.; Group CftMMoIDC-W. Estimating the overdispersion in COVID-19 transmission using outbreak sizes outside China. Wellcome Open Res. 2020; 5: 67. https://doi.org/10.12688/wellcomeopenres.15842.3
- Lewis D. Superspreading drives the COVID pandemic – and could help to tame it. Nature. 2021; 590(7847): 544–6. https://doi.org/10.1038/d41586-021-00460-x
- Sun K., Wang W., Gao L., Wang Y., Luo K., Ren L., et al. Transmission heterogeneities, kinetics, and controllability of SARS-CoV-2. Science. 2021; 371(6526): eabe2424. https://doi.org/10.1126/science.abe2424
- Akimkin V.G., Popova A.Yu., Ploskireva A.A., Ugleva S.V., Semenenko T.A., Pshenichnaya N.Yu., et al. COVID-19: the evolution of the pandemic in Russia. Report I: manifestations of the COVID-19 epidemic process. Zhurnal mikrobiologii, èpidemiologii i immunobiologii. 2022; 99(3): 269–86. https://doi.org/10.36233/0372-9311-276
- Outbreak.info. Available at: https://outbreak.info/
- Akimkin V.G., Popova A.Yu., Khafizov K.F., Dubodelov D.V., Ugleva S.V., Semenenko T.A., et al. COVID-19: evolution of the pandemic in Russia. Report II: dynamics of the circulation of SARS-CoV-2 genetic variants. Zhurnal mikrobiologii, èpidemiologii i immunobiologii. 2022;99(4):381–396. DOI: https://doi.org/10.36233/0372-9311-2959311-295
- WHO. Coronavirus disease (COVID-19) pandemic. Available at: https://www.who.int/emergencies/diseases/novel-coronavirus-2019
- Planas D., Veyer D., Baidaliuk A., Staropoli I., Guivel-Benhassine F., Rajah M.M., et al. Reduced sensitivity of SARS-CoV-2 variant Delta to antibody neutralization. Nature. 2021; 596(7871): 276–80. https://doi.org/10.1038/s41586-021-03777-9
- Chomczynski P., Sacchi N. The single-step method of RNA isolation by acid guanidinium thiocyanate-phenol-chloroform extraction: twenty-something years on. Nat. Protoc. 2006; 1(2): 581–5. https://doi.org/10.1038/nprot.2006.83
- Katoh K., Rozewicki J., Yamada K.D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. 2019; 20(4): 1160–6. https://doi.org/10.1093/bib/bbx108
- Nguyen L.T., Schmidt H.A., von Haeseler A., Minh B.Q. IQ-TREE: a fast and effective stochastic algorithm for estimating maximum-likelihood phylogenies. Mol. Biol. Evol. 2015; 32(1): 268–74. https://doi.org/10.1093/molbev/msu300
- Darriba D., Taboada G.L., Doallo R., Posada D. jModelTest 2: more models, new heuristics and parallel computing. Nat. Methods. 2012; 9(8): 772. https://doi.org/10.1038/nmeth.2109
- Hadfield J., Megill C., Bell S.M., Huddleston J., Potter B., Callender C., et al. Nextstrain: real-time tracking of pathogen evolution. Bioinformatics. 2018; 34(23): 4121–3. https://doi.org/10.1093/bioinformatics/bty407
- Sagulenko P., Puller V., Neher R.A. TreeTime: Maximum-likelihood phylodynamic analysis. Virus Evol. 2018; 4(1): vex042. https://doi.org/10.1093/ve/vex042
- Auspice. Available at: https://auspice.us
- Mahmanzar M., Houseini S.T., Rahimian K., Namini A.M., Gholamzad A., Tokhanbigli S., et al. The first geographic identification by country of sustainable mutations of SARS-COV2 sequence samples: worldwide natural selection trends. bioRxiv. 2022. Preprint. https://doi.org/10.1101/2022.07.18.500565
- Shen L., Bard J.D., Triche T.J., Judkins A.R., Biegel J.A., Gai X. Emerging variants of concern in SARS-CoV-2 membrane protein: a highly conserved target with potential pathological and therapeutic implications. Emerg. Microbes Infect. 2021; 10(1): 885–93. https://doi.org/10.1080/22221751.2021.1922097
- Komissarov A.B., Safina K.R., Garushyants S.K., Fadeev A.V., Sergeeva M.V., Ivanova A.A., et al. Genomic epidemiology of the early stages of the SARS-CoV-2 outbreak in Russia. Nat. Commun. 2021; 12(1): 649. https://doi.org/10.1038/s41467-020-20880-z
- Klink G.V., Safina K.R., Garushyants S.K., Moldovan M., Nabieva E., Komissarov A.B., et al. Spread of endemic SARS-CoV-2 lineages in Russia before April 2021. PLoS One. 2022; 17(7): e0270717. https://doi.org/10.1371/journal.pone.0270717
- Borisova N.I., Kotov I.A., Kolesnikov A.A., Kaptelova V.V., Speranskaya A.S., Kondrasheva L.Yu., et al. Monitoring the spread of the SARS-CoV-2 (Coronaviridae: Coronavirinae: Betacoronavirus; Sarbecovirus) variants in the Moscow region using targeted high-throughput sequencing. Voprosy virusologii. 2021; 66(4): 269–78. https://doi.org/10.36233/0507-4088-72 (in Russian)
- Kannan S., Shaik Syed Ali P., Sheeza A. Omicron (B.1.1.529) – variant of concern – molecular profile and epidemiology: a mini review. Eur. Rev. Med. Pharmacol. Sci. 2021; 25(24): 8019–22. https://doi.org/10.26355/eurrev_202112_27653
- Karim S.S.A., Karim Q.A. Omicron SARS-CoV-2 variant: a new chapter in the COVID-19 pandemic. Lancet. 2021; 398(10317): 2126–8. https://doi.org/10.1016/S0140-6736(21)02758-6
- Unni S., Aouti S., Thiyagarajan S., Padmanabhan B. Identification of a repurposed drug as an inhibitor of Spike protein of human coronavirus SARS-CoV-2 by computational methods. J. Biosci. 2020; 45(1): 130. https://doi.org/10.1007/s12038-020-00102-w
- Daniloski Z., Jordan T.X., Ilmain J.K., Guo X., Bhabha G., tenOever B.R., et al. The Spike D614G mutation increases SARS-CoV-2 infection of multiple human cell types. Elife. 2021; 10: e65365. https://doi.org/10.7554/eLife.65365
- Zuckerman N.S., Fleishon S., Bucris E., Bar-Ilan D., Linial M., Bar-Or I., et al. A unique SARS-CoV-2 spike protein P681H variant detected in Israel. Vaccines (Basel). 2021; 9(6): 616. https://doi.org/10.3390/vaccines9060616
- Baden L.R., El Sahly H.M., Essink B., Kotloff K., Frey S., Novak R., et al. Efficacy and safety of the mRNA-1273 SARS-CoV-2 vaccine. N. Engl. J. Med. 2021; 384(5): 403–16. https://doi.org/10.1056/NEJMoa2035389
- Polack F.P., Thomas S.J., Kitchin N., Absalon J., Gurtman A., Lockhart S., et al. Safety and Efficacy of the BNT162b2 mRNA Covid-19 Vaccine. N. Engl. J. Med. 2020; 383(27): 2603–15. https://doi.org/10.1056/NEJMoa2034577
- Sadoff J., Gray G., Vandebosch A., Cárdenas V., Shukarev G., Grinsztejn B., et al. Safety and Efficacy of Single-Dose Ad26.COV2.S Vaccine against Covid-19. N. Engl. J. Med. 2021; 384(23): 2187–201. https://doi.org/10.1056/NEJMoa2101544
- Dong E., Du H., Gardner L. An interactive web-based dashboard to track COVID-19 in real time. Lancet Infect. Dis. 2020; 20(5): 533–4. https://doi.org/10.1016/S1473-3099(20)30120-1
- Wang R., Chen J., Gao K., Wei G.W. Vaccine-escape and fast-growing mutations in the United Kingdom, the United States, Singapore, Spain, India, and other COVID-19-devastated countries. Genomics. 2021; 113(4): 2158–70. https://doi.org/10.1016/j.ygeno.2021.05.006
- Wu H., Xing N., Meng K., Fu B., Xue W., Dong P., et al. Nucleocapsid mutations R203K/G204R increase the infectivity, fitness, and virulence of SARS-CoV-2. Cell Host Microbe. 2021; 29(12): 1788–801.e6. https://doi.org/10.1016/j.chom.2021.11.005