Structural Motifs and Spatial Structures of Helicase (NS3) and RNA-dependent RNA-polymerase (NS5) of a Flavi-like Kindia tick virus (unclassified Flaviviridae)
- Authors: Gladysheva A.A.1,2, Gladysheva A.V.1, Ternovoi V.A.1, Loktev V.B.1,2
-
Affiliations:
- State Scientific Center of Virology and Biotechnology «Vector»
- Novosibirsk National Research State University
- Issue: Vol 68, No 1 (2023)
- Pages: 7-17
- Section: ORIGINAL RESEARCH
- Submitted: 15.09.2022
- Published: 11.03.2023
- URL: https://virusjour.crie.ru/jour/article/view/637
- DOI: https://doi.org/10.36233/0507-4088-142
- ID: 637
Cite item
Full Text
Abstract
Introduction. Kindia tick virus (KITV) is a novel segmented unclassified flavi-like virus of the Flaviviridae family. This virus is associated with ixodes ticks and is potentially pathogenic to humans.
The main goal of this work was to search for structural motifs of viral polypeptides and to develop a 3D-structure for viral proteins of the flavi-like KITV.
Materials and methods. The complete genome sequences for KITV, Zika, dengue, Japanese encephalitis, West Nile and yellow fever viruses were retrieved from GenBank. Bioinformatics analysis was performed using the different software packages.
Results. Analysis of the KITV structural proteins showed that they have no analogues among currently known viral proteins. Spatial models of NS3 and NS5 KITV proteins have been obtained. These models had a high level of topological similarity to the tick-borne encephalitis and dengue viral proteins. The methyltransferase and RNA-dependent RNA-polymerase domains were found in the NS5 KITV. The latter was represented by fingers, palm and thumb subdomains, and motifs A-F. The helicase domain and its main structural motifs I–VI were identified in NS3 KITV. However, the protease domain typical of NS3 flaviviruses was not detected. The highly conserved amino acid motives were detected in the NS3 and NS5 KITV. Also, eight amino acid substitutions characteristic of KITV/2018/1 and KITV/2018/2 were detected, five of them being localized in alpha-helix and three in loops of nonstructural proteins.
Conclusion. Nonstructural proteins of KITV have structural and functional similarities with unsegmented flaviviruses. This confirms their possible evolutionary and taxonomic relationships.
Full Text
Введение
Kindia tick virus (KITV) – недавно обнаруженный сегментированный (многокомпонентный) флавиподобный неклассифицированный вирус, обнаруженный в 2017 г. на территории Гвинейской Республики в иксодовых клещах Rhipicephalus geigyi [1]. Схожий с KITV многокомпонентный флавиподобный вирус был ранее обнаружен в клещах вида Rhipicephalus microplus в регионе Jingmen (Цзиньмэнь) китайской провинции Хубей и был назван в соответствии с географическим местом открытия Jingmen tick virus (JMTV) [2]. Другой многокомпонентный Guaico Culex virus (GCXV) был несколько позднее обнаружен в комарах рода Culex в Перу, Панаме и на острове Тринидад в Карибском море [3].
Принципиальное отличие этих неклассифицированных вирусов от флавивирусов состоит в наличии сегментированного одноцепочечного РНК-генома (оцРНК) положительной полярности [4]. Геном вирусов группы JMTV состоит из четырёх сегментов, располагающихся в отдельных вирусных частицах [3]. Размер вирионов для вирусов JMTV варьирует от 30 до 100 нм [4]. Общая длина генома флавиподобных сегментированных вирусов составляет около 11 тыс. нуклеотидов [1], что также характерно и для флавивирусов [5]. Сегменты 1–3 несут по одной протяжённой открытой рамке считывания (ORF) и кодируют белки NS5, VP1 и NS3 соответственно. Сегмент 4 обладает двумя ORF и кодирует белки VP2, VP3 [1]. В то же время GCXV, переносимый комарами, может иметь геном из пяти сегментов. Для JMTV и вируса Alongshan было показано наличие последовательности polyA в 3’ UTR [5].
На сегодняшний день сегментированные флавиподобные вирусы обнаружены почти на всех континентах Земли [6]. Некоторые из них способны вызывать заболевание у человека [7]. Клинические проявления у пациентов, инфицированных JMТV, включают лихорадку, головную боль, миалгию, повышение температуры, тошноту, рвоту, зуд и лимфаденопатию. В биохимических показателях крови отмечаются повышение концентрации печёночной аминотрансферазы и незначительное снижение количества лимфоцитов. Продолжительность госпитализации обычно составляет от 14 до 28 дней [7]. Интересно, что геномная РНК многокомпонентных JMTV была обнаружена в крови пациентов с Крымской-Конго геморрагической лихорадкой в Косово и на юге России [8, 9]. Вероятно, JMTV циркулирует в популяции давно, приобрёл способность к адаптации к широкому спектру хозяев, включая клеща и человека, и способен вызывать вирусную микст-инфекцию у человека с клиническими проявлениями, характерными для Крымской-Конго геморрагической лихорадки, из-за чего долгое время оставался без внимания.
О пространственной структуре белков сегментированных флавиподобных вирусов известно крайне мало. Так, в базе PDB (Protein Data Bank) представлена информация только о структуре хеликазного домена белка NS3 вируса Alongshan [10]. Настоящая работа посвящена поиску и моделированию принципиально значимых районов вирусных белков KITV, обусловливающих их структурно-функциональные особенности. Эта информация является принципиально важной для создания вакцин и противовирусных препаратов, а также развития диагностики инфекций, ассоциированных с новыми сегментированными флавиподобными вирусами.
Цель работы – поиск структурных мотивов вирусных полипептидов и моделирование пространственной структуры вирусных белков NS3 и NS5 многокомпонентного флавиподобного KITV.
Материалы и методы
Вирусные геномные последовательности
Полногеномные последовательности, соответствующие сегментам 1–4 штаммов KITV: KITV/2017/1, KITV/2018/1, KITV/2018/2, были взяты из базы данных GenBank (MK673133–MK673136, MW341206–MW341209, MW341210–MW341213). Для проведения анализа были также дополнительно использованы геномные последовательности вирусов Зика (KX262887), жёлтой лихорадки (МN958078), Западного Нила (KX394382), японского энцефалита (EF623989) и денге (MG599596).
Выравнивание и анализ аминокислотных последовательностей
Поиск близкородственных белков, пространственные структуры которых уже были решены экспериментально, был выполнен с помощью NCBI BLAST (National Center for Biotechnology Information Basic Local Alignment Search Tool) по базе данных PDB с использованием алгоритма blastp (protein-protein BLAST). Множественное выравнивание аминокислотных последовательностей было выполнено в программе Unipro UGENE («УНИПРО», Россия) с использованием итеративного метода выравнивания Muscle. Данная программа также была применена для поиска и картирования аминокислотных замен и анализа их расположения. Функциональная аннотация вирусных белков была произведена с помощью программ Protomenal1 и MOTIF Search2. Поиск мотивов проводился по базам данных Pfam и NCBI CDD (Conserved Domains Database) (All). Выравнивание аминокислотных последовательностей вирусных белков KITV с последовательностями вирусов Зика, жёлтой лихорадки, Западного Нила, японского энцефалита и денге было визуализировано с помощью программы ESPript 3.0 [11].
Моделирование и анализ пространственных структур вирусных белков
Для моделирования пространственных структур вирусных белков была использована облачная версия программы AlphaFold2 – AlphaFold2_advanced.ipynb [12]. Отбор пространственных моделей для дальнейшего теоретического анализа производился на основе коэффициента достоверности для каждой аминокислоты с учётом прогнозируемой локальной разности расстояний (pLDDT) AlphaFold2.
Попарное выравнивание пространственных структур белка NS5 и хеликазного домена белка NS3 вирусов денге, клещевого энцефалита и Alongshan, взятых из базы данных RCSB (Research Collaboratory for Structural Bioinformatics) PDB (6KR2, 7OJ4 и 6M40), и полученных моделей пространственных структур вирусных белков исследуемых штаммов производилось с помощью программного обеспечения Pairwise Structure Alignment, предоставленного базой данных RCSB PDB. Данная программа также использовалась для попарного выравнивания полученных моделей пространственных структур исследуемых штаммов. Был выбран тип попарного выравнивания jFATCAT (жёсткий) со следующими параметрами:
– отсечка среднеквадратичного стандартного отклонения – 3;
– предельное расстояние выровненных пар фрагментов (AFP) – 5;
– длина фрагмента – 8.
Основываясь на коэффициентах среднеквадратичного отклонения (RMSD) и оценки моделирования шаблона (TM (template modeling) score), полученных при попарном выравнивании, был установлен уровень топологического сходства между структурами.
Визуализация пространственных моделей вирусных белков была выполнена с помощью программы UCSF Chimera [13].
Результаты
Аминокислотные последовательности четырёх сегментов KITV/2018/1 и KITV/2018/2 из базы данных PDB были использованы для поиска близкородственных белков, чьи пространственные структуры уже известны. Для белка NS5 KITV было обнаружено сходство с 31 аминокислотной последовательностью различных вирусных белков. Белок NS5 вируса денге второго серотипа (PDB ID: 6KR2) имел наилучшую идентичность в 26% для KITV/2018/1 и KITV/2018/2. Для белка NS3 KITV/2018/1 и KITV/2018/2 было обнаружено сходство с 27-й и 19-й аминокислотными последовательностями вирусных белков соответственно, включая NS3 хеликазу вируса Alongshan (PDB ID: 6M40) с коэффициентом идентичности 47%. Коэффициент идентичности с остальными вирусными аминокислотными последовательностями не превышал 16%, например, с NS3 хеликазой вируса клещевого энцефалита (PDB ID: 7OJ4). Интересно, что для структурных белков VP1–VP3 не было обнаружено схожих белков во всех исследованных базах данных.
При моделировании пространственных структур вирусных белков KITV были получены коэффициенты достоверности pLDDT AlphaFold2 для каждой модели (табл. 1). Установлено, что рассчитанные пространственные модели структурных белков VP1–VP3 обладают низкими коэффициентами достоверности, что не позволило проводить их дальнейший анализ. Значение коэффициентов достоверности для белков NS3 и NS5 составило больше 80, что свидетельствовало о высоком уровне достоверности полученных моделей и возможности их использования для дальнейшего анализа.
Таблица 1. Значения pLDDT AlphaFold2 пространственных моделей белков KITV
Table 1. Values of pLDDT AlphaFold2 spatial models of KITV proteins
Название штамма KITV (вирусный белок) Name of strain KITV (viral protein) | Значение pLDDT AlphaFold2 The value of pLDDT AlphaFold2 |
KITV/2017/1 (NS5) | 83,89 |
KITV/2017/1 (VP1) | 50,20 |
KITV/2017/1 (NS3) | 59,86 |
KITV/2017/1 (хеликазный домен NS3) (helicase domain NS3) | 87,21 |
KITV/2017/1 (VP2) | 33,05 |
KITV/2017/1 (VP3) | 40,99 |
KITV/2018/1 (NS5) | 84,55 |
KITV/2018/1 (VP1) | 45,62 |
KITV/2018/1 (NS3) | 54,35 |
KITV/2018/1 (хеликазный домен NS3) (helicase domain NS3) | 87,92 |
KITV/2018/1 (VP2) | 41,49 |
KITV/2018/1 (VP3) | 41,04 |
KITV/2018/2 (NS5) | 84,43 |
KITV/2018/2 (VP1) | 47,28 |
KITV/2018/2 (NS3) | 57,86 |
KITV/2018/2 (хеликазный домен NS3) (helicase domain NS3) | 83,95 |
KITV/2018/2 (VP2) | 41,49 |
KITV/2018/2 (VP3) | 40,39 |
Примечание. Жирным шрифтом отмечены модели, обладающие высоким коэффициентом достоверности.
Note. Models with a high confidence coefficient are marked in bold.
Установлено, что модели пространственных структур белков NS3 и NS5 обладают высоким уровнем топологического сходства (значения TM-score для всех сравниваемых пар структур превышают 0,5) с пространственными структурами одноимённых белков вирусов клещевого энцефалита и денге, несмотря на то что процент идентичности между аминокислотными последовательностями был менее 30% (табл. 2).
Таблица 2. Коэффициенты подобия пространственных моделей белков NS3 и NS5 между штаммами KITV, вирусом клещевого энцефалита (PDB ID: 7OJ4 для NS3), вирусом Alongshan (PDB ID: 6M40 для NS3) и вирусом денге (PDB ID: 6KR2 для NS5)
Table 2. Similarity coefficients of spatial models of NS3 and NS5 proteins between KITV strains, tick-borne encephalitis virus (PDB ID: 7OJ4 for NS3), Alongshan virus (PDB ID: 6M40 for NS3) and dengue virus (PDB ID: 6KR2 for NS5)
Белок Protein | Название вируса и (или) вирусного штамма Name of virus and/or viral strain | RMSD | TM-score |
NS5 | KITV/2017/1 и KITV/2018/1 KITV/2017/1 and KITV/2018/1 | 13,17 | 0,62 |
KITV/2017/1 и KITV/2018/2 KITV/2017/1 and KITV/2018/2 | 13,11 | 0,63 | |
KITV/2018/1 и KITV/2018/2 KITV/2018/1 and KITV/2018/2 | 4,49 | 0,85 | |
Вирус денге и KITV/2017/1 Dengue virus and KITV/2017/1 | 4,7 | 0,65 | |
Вирус денге и KITV/2018/1 Dengue virus and KITV/2018/1 | 6,94 | 0,59 | |
Вирус денге и KITV/2018/2 Dengue virus and KITV/2018/2 | 7,53 | 0,61 | |
NS3 | KITV/2017/1 и KITV/2018/1 KITV/2017/1 and KITV/2018/1 | 0,68 | 0,99 |
KITV/2017/1 и KITV/2018/2 KITV/2017/1 and KITV/2018/2 | 1,69 | 0,96 | |
KITV/2018/1 иKITV/2018/2 KITV/2018/1 and KITV/2018/2 | 1,78 | 0,96 | |
Вирус клещевого энцефалита и KITV/2017/1 Tick-borne encephalitis virus and KITV/2017/1 | 3,1 | 0,73 | |
Вирус клещевого энцефалита и KITV/2018/1 Tick-borne encephalitis virus and KITV/2018/1 | 3,1 | 0,73 | |
Вирус клещевого энцефалита и KITV/2018/2 Tick-borne encephalitis virus and KITV/2018/2 | 3,02 | 0,69 | |
Вирус Alongshan и KITV/2017/1 Virus Alongshan and KITV/2017/1 | 1,32 | 0,88 | |
Вирус Alongshan и KITV/2018/1 Virus Alongshan and KITV/2018/1 | 1,41 | 0,87 | |
Вирус Alongshan и KITV/2018/2 Virus Alongshan and KITV/2018/2 | 2,18 | 0,85 |
У белка NS5 KITV, как и у всех других представителей рода флавивирусов, обнаружен домен метилтрансферазы (capping_2-OMTase_viral, NCBI-CDD cl41719) в позициях с 65-й по 267-ю аминокислоту и домен РНК-зависимой РНК-полимеразы (RdRp) (Pfam: pfam00972) в позициях 350–913. В RdRp обнаружены субдомены пальцев, ладони (положения 350–730, Pfam: PF00972) и большого пальца (положения 742–842, Pfam: PF20483). Кроме этого, были обнаружены характерные для флавивирусов структурные мотивы A (575–582), B (641–655), C (691–700), D (725–728), E (746–751), F (497–524) (рис. 1, 2).
Рис. 1. Модели пространственной организации NS5: а – наложение моделей пространственных структур NS5: KITV/2018/1 (синий), KITV/2018/2 (зелёный) и вируса денге (красный); б – пространственная модель NS5 KITV/2018/1 с консервативными мотивами A–F; в – наложение пространственных структур NS5 KITV/2018/1 (белый/синий) и KITV/2018/2 (серый/зелёный), где цветом выделены обнаруженные аминокислотные замены.
Fig. 1. Models of spatial organization NS5: a – imposition models of spatial structures NS5: KITV/2018/1 (blue), KITV/2018/2 (green) and dengue virus (red); b – spatial model NS5 KITV/2018/1 with conservative motives A–F; c – imposition of spatial structures NS5 KITV/2018/1 (white/blue) and KITV/2018/2 (gray/green), where detected amino acid substitutions are highlighted in color.
Рис. 2. Выравнивание аминокислотных последовательностей NS3 (а) и NS5 (б) KITV с флавивирусами. Красным цветом выделены высококонсервативные аминокислоты, зелёными стрелочками – высококонсервативные аминокислоты, функции которых известны для флавивирусов. Участки аминокислотных последовательностей, соответствующие обнаруженным мотивам, выделены цветными линиями. Элементы вторичной структуры вирусных белков указаны для штамма KITV/2018/1.
Fig. 2. Alignment of amino acid sequences NS3 (a) and NS5 (b) KITV with flaviviruses. Highly conserved amino acids are highlighted in red; highly conserved amino acids, whose functions are known for flaviviruses, are highlighted with green arrows. Sections of amino acid sequences corresponding to detected motifs are highlighted with colored lines. Elements of secondary structure of viral proteins are indicated for the KITV/2018/1 strain.
Установлено, что в субдоменах пальцев и большого пальца происходят аминокислотные замены в положениях связывания RdRp с ионами цинка. В первом сайте замены приходятся на позиции 484, 488, 493 и 496: F484 → E484, H488 → L488, C493 → P493 и C496 → A496. Второй сайт связывания у KITV предположительно состоит из трёх аминокислот вместо четырёх; во втором сайте – H750 → R750, C765 → V765, а в позиции 875 происходит делеция, в то время как у флавивирусов в этом положении располагается цистеин. Позиция 752 у флавивирусов вариабельна по аминокислотному составу, а у KITV представлена триптофаном. При этом аналогично пространственной структуре RdRp флавивирусов первые две аминокислоты первого сайта связывания находятся у KITV в альфа-спирали, а две другие – в свободной петле; второй сайт расположен в бета-листах.
При анализе аминокислотной последовательности полноразмерного белка NS3 KITV установлено, что он не содержит домена сериновой протеазы, что нетипично для NS3 флавивирусов. Со стороны С-конца белка NS3 KITV располагается домен хеликазы (NS3-Hel), который состоит из трёх субдоменов (D1–D3) и восьми структурных флавивирусных мотивов (I, Ia, II, III, IV, IVa, V и VI), находящихся в D1 и D2. Субдомен D1 имеет характерный для флавивирусов регион DEXHc_viral_NS3 (DEXH-box helicase domain of NS3 protease-helicase, NCBI-CDD cd17931), располагающийся с 341-й по 493-ю позицию. Хеликазные мотивы располагаются в позициях I – 348–353, Ia – 365–377, II – 433–440, III – 464–478, IV – 515–523, IVa – 544–552, V – 573–582 и VI – 610–623 (рис. 2, 3).
Рис. 3. Модели пространственной организации NS3: а – наложение моделей пространственных структур NS3-Hel: KITV/2018/1 (синий), KITV/2018/2 (зелёный), вируса клещевого энцефалита (красный); б – наложение моделей пространственных структур NS3: KITV/2018/1 (синий), KITV/2018/2 (зелёный), вирус Alongshan (оранжевый); в – пространственная модель NS3-Hel KITV/2018/1 с консервативными мотивами I–VI; г – наложение пространственных структур NS3-Hel KITV/2018/1 (белый/синий) и KITV/2018/2 (серый/зелёный), где цветом выделены обнаруженные аминокислотные замены.
Fig. 3. Models of spatial organization NS3: a – Imposition models of spatial structures NS3-Hel: KITV/2018/1 (blue), KITV/2018/2 (green), tick-borne encephalitis virus (red); b – imposition models of spatial structure NS3: KITV/2018/1 (blue), KITV/2018/2 (green), Alongshan virus (orange); c – spatial model NS3-Hel KITV/2018/1 with conservative motives I–VI; d – imposition of spatial structures NS3-Hel KITV/2018/1 (white/blue) and KITV/2018/2 (gray/green), where detected amino acid substitutions are highlighted in color.
Кроме того, в NS3 и NS5 KITV были обнаружены непротяжённые высококонсервативные аминокислотные последовательности, характерные для вирусов Зика, жёлтой лихорадки, Западного Нила, японского энцефалита и денге. Большинство высококонсервативных аминокислот находятся в обнаруженных функционально важных мотивах белков NS3 и NS5 KITV (рис. 2).
При множественном выравнивании аминокислотных последовательностей KITV были обнаружены различные аминокислотные замены, в том числе и те, которые могут влиять на топологию вирусных белков. Для KITV/2018/1 и KITV/2018/2 было обнаружено по две замены в белках VP1 и VP3, пять замен в белке NS5 и четыре – в NS3. В аминокислотных последовательностях KITV/2017/1 и KITV/2018/1 обнаружено 24 замены, а для KITV/2017/1 и KITV/2018/2 – 35 (табл. 3). Обнаруженные аминокислотные замены в белке NS5 KITV/2018/1 и KITV/2018/2 локализованы в положениях 135 – альфа-спираль 5 (α-5), 217 – петля между α-8 и бета-листом 7 (β-7), 233 – α-9, 674 – α-27, 908 – α-37. Замены V135 → I135, A217 → V217, K233 → R233 не изменяют общую топологию, но приводят к пространственному сдвигу трёхмерных структур белка NS5 KITV/2018/1 и KITV/2018/2 относительно друг друга (рис. 1 в). Аминокислотные замены в NS3 для KITV/2018/1 и KITV/2018/2 локализованы в положениях 476 – петля между β-7 и β-8, 625 – петля между α-10 и β-16, 673 – α-13 (рис. 3 г).
Таблица 3. Замены в аминокислотных последовательностях белков KITV
Table 3. Substitutions in amino acid sequences of KITV proteins
Белок Protein | Положение в аминокислотной последовательности Position in the amino acid sequence | Название штамма KITV Name of strain KITV | ||
KITV/2017/1 | KITV/2018/1 | KITV/2018/2 | ||
NS5 | 135 | V | V | I |
217 | A | A | V | |
233 | K | K | R | |
277 | S | R | R | |
610 | R | H | H | |
674 | A | A | T | |
747 | Y | C | C | |
908 | Q | Q | R | |
VP1 | 76 | S | F | F |
89 | P | H | H | |
103 | H | Q | Q | |
160 | L | F | F | |
247 | G | V | V | |
368 | I | I | V | |
380 | A | T | T | |
435 | K | E | E | |
465 | S | G | G | |
604 | A | V | V | |
622 | A | A | T | |
NS3 | 236 | A | V | V |
247 | A | V | V | |
291 | V | I | V | |
379 | A | V | V | |
459 | N | K | K | |
474 | S | R | R | |
476 | S | S | F | |
604 | R | G | G | |
625 | K | K | R | |
673 | E | E | Q | |
VP2 | 140 | N | S | S |
VP3 | 6 | V | D | D |
18 | I | M | M | |
78 | N | N | S | |
208 | K | K | R | |
338 | G | V | V | |
353 | L | F | F |
Обсуждение
Одним из способов получения информации о пространственном устройстве генома, в частности о трехмёрной структуре белков, является моделирование. Программа AlphaFold2 позволяет проводить предсказания пространственных структур белка. В её основе лежит использование глубокого машинного обучения и сверхточных нейронных сетей для предсказания углов и расстояний между атомами в создаваемом программой шаблоне структуры, что позволяет получать трёхмерные модели исследуемого белка с высокой точностью, даже несмотря на низкий уровень гомологии с прототипом, который может быть менее 30% [14].
Полученные модели структурных белков VP1, VP2, VP3 KITV обладали низкими коэффициентами достоверности и были исключены из дальнейшего анализа. Отсутствие известных прототипов для этих белков подчеркивает их уникальность среди структурных белков РНК-содержащих вирусов. Это не позволяет определить возможные функционально важные мотивы этих белков и оценить эволюционные взаимоотношения с другими известными вирусами. Можно только предположить, что эти белки обеспечивают формирование вирусных частиц, рецепторные взаимодействия с чувствительными клетками организма хозяина, защиту геномной РНК и проникновение геномной РНК KITV в клетки беспозвоночных и позвоночных хозяев. Факты преодоления межвидовых барьеров многокомпонентными флавиподобными вирусами подтверждают высказанные предположения [15]. Вполне очевидно, что VP1, VP2, VP3, являясь структурными белками KITV, также должны предопределять взаимодействие с иммунной системой организма хозяина. К сожалению, к настоящему моменту отсутствуют прямые данные о формировании иммунного ответа организма на сегментированные флавиподобные вирусы, но фактически глобальный характер распространения этих вирусов может свидетельствовать об их потенциальной способности к уклонению от контроля иммунной системы хозяина.
Выравнивание аминокислотных последовательностей белков NS3 и NS5 KITV с последовательностями вирусов Зика, жёлтой лихорадки, Западного Нила, японского энцефалита и денге показало крайне низкий уровень гомологии между ними. Уровень идентичности был менее 30%, что, без сомнения, затрудняет структурно-функциональный анализ этих белков. Тем не менее с использованием биоинформационных методов удалось создать пространственные модели белков NS3 и NS5 KITV и показать, что, несмотря на низкий уровень гомологии KITV с вирусами клещевого энцефалита и денге, они обладают высоким уровнем топологического сходства с белками флавивирусов.
Белок NS3 KITV имеет характерный для флавивирусов C-концевой хеликазный домен, состоящий из трёх субдоменов (D1–D3) и восьми структурных мотивов (I, Ia, II, III, IV, IVa, V и VI), находящихся в D1 и D2, но не имеет N-концевого протеазного домена. Принято считать, что мотивы I, II, III, VI флавивирусов принимают непосредственное участие в связывании и гидролизе аденозинтрифосфата. Мотивы Ia, IV, IVa, V ответственны за взаимодействие с РНК, транслокацию и междоменную коммуникацию. Субдомен D3 KITV обладает ограниченным сходством с субдоменом D3 флавивирусов, что объясняется высоким уровнем вариабельности этой области у вирусов семейства Flaviviridae [10]. Полученные результаты хорошо согласуются с единственной экспериментально полученной структурой С-концевой части белка NS3 сегментированного флавиподобного вируса Alongshan [10]. Отсутствие домена сериновой протеазы NS3, активность которого активируется у флавивирусов кофактором NS2B и который отвечает за расщепление вирусного полипротеина в участках между неструктурными белками NS2A/NS2B, NS2B/NS3, NS3/NS4A и NS4B/NS5 [16], может быть обусловлено уникальным строением упакованного в отдельные частицы вирусного генома, который эволюционно сформировался у сегментированных флавиподобных вирусов при отсутствии необходимости расщепления вирусного полипротеина, в отличие от несегментированных флавивирусов.
Также в NS3 обнаружены аминокислотные последовательности, консервативные для KITV и несегментированных флавивирусов. Благодаря консервативным аминокислотам G, K, T в мотиве I, а также элементу DEAD-бокса в мотиве II (рис. 2), происходят координация иона магния внутри кармана связывания аденозинтрифосфата и связывание NTPase у флавивирусов. В VI мотиве четыре аминокислоты R (рис. 2) имеют решающее значение для активности NTPase и RTPase. Предполагается, что консервативные аминокислоты P из мотивов Ia и IV (рис. 2) взаимодействуют с рибозной 2’-гидроксильной группой оцРНК, в то время как R из мотива Ia, R и K из мотива IVa и T из мотива V взаимодействуют с фосфатным остатком оцРНК [16].
Созданная модель вирусного белка NS5 KITV также показала наличие характерных для флавивирусов доменов метилтрансферазы и RdRp и шести структурных мотивов RdRp: A, B, C, D, E, F, а также высококонсервативных аминокислотных последовательностей, функции которых описаны для флавивирусов (рис. 1, 2). Домен метилтрансферазы у флавивирусов обладает двумя ферментативными активностями – метилированием гуанина-N7 и нуклеозида-2’-O, увеличивающими стабильность вновь синтезированной РНК. RdRp необходима для репликации вирусной РНК. Мотивы A и C RdRp флавивирусов участвуют в полимеризации нуклеотидов благодаря наличию в них аспарагиновой кислоты. Мотив B RdRp способствует беспрепятственному движению полимеразного комплекса по вирусной РНК благодаря наличию в нём аминокислот серина и глицина [17]. Мотивы E и С RdRp взаимодействуют с остовом РНК-продукта [18]. Основная функция мотива F RdRp, состоящего из трёх бета-листов и соединительных петель [17], заключается в связывании трифосфата NTP [19]. Аргинин в данном мотиве непосредственно участвует в каталитической активности полимеразы, что уже было экспериментально показано для несегментированных флавивирусов [20]. Мотив D RdRp важен для осуществления структурных перестроек фермента, а именно закрытия активного сайта RdRp лизином, который располагается перед мотивом F RdRp [17].
В RdRp KITV и флавивирусов были обнаружены аминокислотные замены в положениях, соответствующих сайтам связывания RdRp с ионами цинка, которые характерны для флавивирусной RdRp и необходимы для ее стабилизации на молекуле вирусной РНК [17]. Аминокислотный состав некоторых сайтов был полностью другим, что свидетельствует об отсутствии сайтов связывания с ионами цинка у RdRp KITV: либо расположение сайтов не совпадает с таковыми у представителей рода флавивирусов, либо же у KITV существует свой собственный механизм стабилизации репликационного комплекса. Это может указывать на различие в механизмах работы репликационного комплекса сегментированных флавиподобных вирусов и классических флавивирусов. Не исключено, что большую роль в этом процессе играют 5’- и 3’-нетранслируемые регионы, которыми обладает каждый сегмент геномной РНК KITV.
Таким образом, для NS3 и NS5 KITV удалось обнаружить домены, мотивы и консервативные аминокислотные последовательности, характерные для несегментированных вирусов семейства Flaviviridae. При этом обнаружены отличия: в частности, отсутствует информация о структуре предполагаемых белков капсида VP1–VP3 KITV, не удалось обнаружить домен сериновой протеазы в белке NS3 KITV и сайтов связывания RdRp KITV с ионами цинка. Обнаруженные отличия указывают как на сходство, так и выраженные различия между сегментированными флавиподобными вирусами и несегментированными флавивирусами.
Заключение
В результате проведённого исследования получены данные о пространственном устройстве вирусных белков нового сегментированного флавиподобного вируса KITV. Обнаружено, что предполагаемые структурные белки VP1–VP3 KITV не имеют аналогов с известными в настоящее время вирусными белками. Данные моделирования вирусных белков NS3 и NS5 позволили с высокой степенью достоверности установить, что белок NS5 KITV является РНК-зависимой РНК-полимеразой и дополнительно обладает метилтрансферазной активностью. Белок NS3 KITV, по всей вероятности, обладает только хеликазной активностью. Удалось получить первые модели пространственных структур белков NS3 и NS5 KITV. Они имели высокий уровень топологического сходства с белками NS3 и NS5 вирусов денге и клещевого энцефалита при низком уровне схожести аминокислотных последовательностей с этими несегментированными флавивирусами (менее 30%). У NS5 KITV обнаружены типичные домены, характерные для флавивирусной метилтрансферазы и РНК-зависимой РНК-полимеразы, а также типичные структурные мотивы A, B, C, D, E, F. Идентифицированы хеликазный домен и его основные структурные мотивы, характерные для NS3 KITV. Однако домена сериновой протеазы, типичной для NS3 флавивирусов, обнаружено не было. В аминокислотной последовательности белков NS3 и NS5 KITV обнаружены высококонсервативные последовательности протяжённостью 3–7 аминокислот, характерные для KITV и несегментированных флавивирусов. Обнаружено восемь аминокислотных замен, пять из них предположительно локализованы в альфа-спиралях и три – в свободных петлях неструктурных белков полногеномных последовательностей KITV/2018/1 и KITV/2018/2. Причём полногеномная последовательность KITV 2017 г. имела 24–35 замен, что говорит о существенной изменчивости KITV.
Полученные результаты показывают наличие структурного сходства белков NS3 и NS5 сегментированных флавиподобных вирусов и несегментированных флавивирусов при фактически полном отсутствии схожести структурных белков вирионов.
1Protomenal: protein functional annotation by deep metric learning. Available at: https://protomenal.com/
2MOTIF Search. Available at: https://www.genome.jp/tools/motif/
Участие авторов: Гладышева А.А. – проведение экспериментов, сбор, анализ и интерпретация данных, подготовка текста статьи; Гладышева А.В. – концепция и дизайн исследования, интерпретация данных, подготовка текста статьи; Терновой В.А. – руководство исследованиями; Локтев В.Б. – руководство исследованиями, участие в подготовке статьи для публикации.
Финансирование. Работа выполнена при финансовой поддержке Министерство науки и высшего образования Российской Федерации (соглашение от 12.10.2021 № 075-15-2021-1355) в рамках реализации отдельных мероприятий Федеральной научно-технической программы развития синхротронных и нейтронных исследований и исследовательской инфраструктуры на 2019–2027 гг.
Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.
Contribution: Gladysheva A.A. – conducting of the experiments, collection, analysis, and interpretation of the data, writing original draft of the article; Gladysheva A.V. – concept and design of the study, interpretation of the data, writing and editing original draft of the article; Ternovoi V.A. – supervision; Loktev V.B. – supervision, editing original draft of the article.
Funding. The study was supported by the Ministry of Science and Higher Education of the Russian Federation (agreement No. 075-15-2021-1355 dated October 12, 2021) as a part of the implementation of certain activities of the Federal Scientific and Technical Program for the Development of Synchrotron and Neutron Research and Research Infrastructure for 2019–2027.
Conflict of interest. The authors declare no conflict of interests.
About the authors
A. A. Gladysheva
State Scientific Center of Virology and Biotechnology «Vector»; Novosibirsk National Research State University
Email: gladysheva_aa@vector.nsc.ru
ORCID iD: 0000-0002-9490-1939
Graduate student, Assistant, Department of Molecular Virology for Flaviviruses and Viral Hepatitis
Russian Federation, 630559, Novosibirsk region, Koltsovo; 630090, NovosibirskA. V. Gladysheva
State Scientific Center of Virology and Biotechnology «Vector»
Author for correspondence.
Email: gladysheva_av@vector.nsc.ru
ORCID iD: 0000-0002-7396-3954
SPIN-code: 5214-3421
Scopus Author ID: 57194590629
Postgraduate student, Juniour Researcher, Department of Molecular Virology for Flaviviruses and Viral Hepatitis
Russian Federation, 630559, Novosibirsk region, KoltsovoV. A. Ternovoi
State Scientific Center of Virology and Biotechnology «Vector»
Email: tern@vector.nsc.ru
ORCID iD: 0000-0003-1275-171X
PhD, Leading Researcher, Department of Molecular Virology for Flaviviruses and Viral Hepatitis
Russian Federation, 630559, Novosibirsk region, KoltsovoV. B. Loktev
State Scientific Center of Virology and Biotechnology «Vector»; Novosibirsk National Research State University
Email: loktev@vector.nsc.ru
ORCID iD: 0000-0002-0229-321X
Dr. Sci. (Biol.), Professor, Head of the Department of Molecular Virology for Flaviviruses and Viral Hepatitis
Russian Federation, 630559, Novosibirsk region, Koltsovo; 630090, NovosibirskReferences
- Ternovoi V.A., Protopopova E.V., Shvalov A.N., Kartashov M.Yu., Bayandin R.B., Tregubchak T.V., et al. Complete coding genome sequence for a novel multicomponent Kindia tick virus detected from ticks collected in Guinea. bioRxiv. 2020. Preprint. https://doi.org/10.1101/2020.04.11.036723
- Qin X.C., Shi M., Tian J.H., Lin X.D., Gao D.Y., He J.R., et al. A tick-borne segmented RNA virus contains genome segments derived from unsegmented viral ancestors. Proc. Natl Acad. Sci. USA. 2014; 111(18): 6744–9. https://doi.org/10.1073/pnas.1324194111
- Ladner J.T., Wiley M.R., Beitzel B., Auguste A.J., Dupuis A.P., Lindquist M.E., et al. A multicomponent animal virus isolated from mosquitoes. Cell Host Microbe. 2016; 20(3): 357–67. https://doi.org/10.1016/j.chom.2016.07.011
- Kholodilov I.S., Litov A.G., Klimentov A.S., Belova O.A., Polienko A.E., Nikitin N.A., et al. Isolation and characterisation of Alongshan virus in Russia. Viruses. 2020; 12(4): 362. https://doi.org/10.3390/v12040362
- Zhang X., Wang N., Wang Z., Liu Q. The discovery of segmented flaviviruses: implications for viral emergence. Curr. Opin. Virol. 2020; 40: 11–8. https://doi.org/10.1016/j.coviro.2020.02.001
- Kholodilov I.S., Belova O.A., Morozkin E.S., Litov A.G., Ivannikova A.Y., Makenov M.T., et al. Geographical and tick-dependent distribution of flavi-like Alongshan and Yanggou tick viruses in Russia. Viruses. 2021; 13(3): 458. https://doi.org/10.3390/v13030458
- Jia N., Liu H.B., Ni X.B., Bell-Sakyi L., Zheng Y.C., Song J.L., et al. Emergence of human infection with Jingmen tick virus in China: A retrospective study. EBioMedicine. 2019; 43: 317–24. https://doi.org/10.1016/j.ebiom.2019.04.004
- Ternovoy V.A., Gladysheva A.V., Sementsova A.O., Zaykovskaya A.V., Volynkina A.S., Kotenev E.S., et al. Detection of the RNA for new multicomponent virus in patients with Crimean-Congo hemorrhagic fever in southern Russia. Vestnik Rossiyskoy akademii meditsinskikh nauk. 2020; 75(2): 192–34. https://doi.org/10.15690/vramn1192 (in Russian)
- Emmerich P., Jakupi X., von Possel R., Berisha L., Halili B., Günther S., et al. Viral metagenomics, genetic and evolutionary characteristics of Crimean-Congo hemorrhagic fever orthonairovirus in humans, Kosovo. Infect. Genet. Evol. 2018; 65: 6–11. https://doi.org/10.1016/j.meegid.2018.07.010
- Gao X., Zhu K., Wojdyla J.A., Chen P., Qin B., Li Z., et al. Crystal structure of the NS3-like helicase from Alongshan virus. IUCrJ. 2020; 7(Pt. 3): 375–82. https://doi.org/10.1107/S2052252520003632
- Robert X., Gouet P. Deciphering key features in protein structures with the new ENDscript server. Nucleic Acids Res. 2014; 42(W1): W320–4. https://doi.org/10.1093/nar/gku316
- Jumper J., Evans R., Pritzel A., Green T., Figurnov M., Ronneberger O., et al. Highly accurate protein structure prediction with AlphaFold. Nature. 2021; 596(7873): 583–9. https://doi.org/10.1038/s41586-021-03819-2
- Pettersen E.F., Goddard T.D., Huang C.C., Couch G.S., Greenblatt D.M., Meng E.C., et al. UCSF Chimera? A visualization system for exploratory research and analysis. J. Comput. Chem. 2004; 25(13): 1605–12. https://doi.org/10.1002/jcc.20084
- Tunyasuvunakool K., Adler J., Wu Z., Green T., Zielinski M., Žídek A., et al. Highly accurate protein structure prediction for the human proteome. Nature. 2021; 596(7873): 590–6. https://doi.org/10.1038/s41586-021-03828-1
- Guo J.J., Lin X.D., Chen Y.M., Hao Z.Y., Wang Z.X., Yu Z.M., et al. Diversity and circulation of Jingmen tick virus in ticks and mammals. Virus Evol. 2020; 6(2): veaa051. https://doi.org/10.1093/ve/veaa051
- Du Pont K.E., McCullagh M., Geiss B.J. Conserved motifs in the flavivirus NS3 RNA helicase enzyme. Wiley Interdiscip. Rev RNA. 2022; 13(2): e1688. https://doi.org/10.1002/wrna.1688
- Dubankova A., Boura E. Structure of the yellow fever NS5 protein reveals conserved drug targets shared among flaviviruses. Antiviral Res. 2019; 169: 104536. https://doi.org/10.1016/j.antiviral.2019.104536
- Duan Y., Zeng M., Jiang B., Zhang W., Wang M., Jia R., et al. Flavivirus RNA-dependent RNA polymerase interacts with genome UTRs and viral proteins to facilitate flavivirus RNA replication. Viruses. 2019; 11(10): 929. https://doi.org/10.3390/v11100929
- Lu G., Gong P. A structural view of the RNA-dependent RNA polymerases from the Flavivirus genus. Virus Res. 2017; 234: 34–43. https://doi.org/10.1016/j.virusres.2017.01.020
- Potapova U., Feranchuk S., Leonova G., Belikov S. The rearrangement of motif F in the flavivirus RNA-directed RNA polymerase. Int. J. Biol. Macromol. 2018; 108: 990–8. https://doi.org/10.1016/j.ijbiomac.2017.11.009