Analysis of changes in the genome of the Omsk hemorrhagic fever virus (Flaviviridae: Orthoflavivirus) during laboratory practices for virus preservation

Cover Image


Cite item

Full Text

Abstract

Introduction. Omsk hemorrhagic fever (OHF) is a severe disease identified in the 1940s in Western Siberia, Russia. Disease is caused by the OHF virus, which belongs to the genus Orthoflavivirus.

The purpose of the work. Analysis of changes in the genome associated with the isolation of OHF virus strains in laboratory animals (Mus musculus).

Materials and methods. Whole-genome nucleotide sequences of OHF virus strains from the working collection of the laboratory of arboviral infections of the department of natural focal viral infections of the Omsk Research Institute of Natural Focal Infections of Rospotrebnadzor were used in the study, as well as sequences from GenBank. Assessment of adaptive changes in the genome of the OHF virus was carried out using discriminant analysis methods, analyzing the composition and localization of emerging substitutions in viral RNA sequences obtained during the adaptation of viruses to the mouse organism as a result of passaging. Linked nucleotide substitutions were identified by calculating the mutual information for each pair of columns in the array of aligned nucleotide sequences. In the phylogenetic analysis, the relaxed clock algorithm of the BEAST program was used.

Results. It has been shown that point substitutions during adaptation of OHF viruses to the mouse organism occur in all parts of the genome. Many of these substitutions are included in the pattern of linked substitutions identified in the genome of the OHF virus. Discriminant analysis of differences in nucleotide substitutions for groups combining sequences by the number of passages does not allow reliable discrimination between original sequences obtained from muskrat and sequences from first passages, but it recognizes well sequences from 7 or more passages, which suggests the possibility of adaptive selection of nucleotide substitutions when interacting with the body of a white mouse. Calculation of the average rate of substitutions per site per year without taking into account the occurrence of adaptive and related substitutions gives a value of 10−5, which is almost an order of magnitude different from the result when their presence is taken into account ‒ 10−4.

Conclusion. Changes in the nucleotide sequences of OHF that occur during laboratory virus preservation practices may influence the evolutionary rate values determined when analyzing these sequences and require further study.

Full Text

Введение

Омская геморрагическая лихорадка (ОГЛ) ‒ тяжелое заболевание, выявленное в России в 1940-х гг. в Западной Сибири [1]. Вызывается вирусом ОГЛ, относящимся к роду Orthoflavivirus (семейство Flaviviridae). В период эпизоотических вспышек в популяциях интродуцированного вида – ондатры (Ondatra zibethicus) ‒ вирус ОГЛ был выявлен более чем у 30 видов теплокровных животных. Источником инфекции для человека являются ондатра и иксодовые клещи (во все периоды эпидемической активности природных очагов ОГЛ преобладал нетрансмиссивный путь заражения, в том числе и в первый период регистрации активности вируса в 40–50-х гг. XX века). В эволюционной истории ОГЛ остаются вопросы. В частности, оценка даты происхождения и последующей дивергенции вируса ОГЛ имеет противоречивый характер. Так, время возникновения вируса оценивается по-разному – от 4,5 тыс. лет [2] до 50 лет [3]. Ранее [4] время происхождения вируса ОГЛ было отнесено к XIV веку, а периоды дивергенции вируса – к XVII, XIX и началу XX вв. Такой разброс этого показателя связан, прежде всего, с отсутствием возможности адекватного оценивания скорости накопления мутаций, в связи с чем вводятся искусственные условия, определяемые, как правило, точкой зрения автора.

При отсутствии возможности сравнения с предковыми формами, представляется целесообразным изучить и определить мутационные изменения в геноме, связанные с адаптацией вируса к разным системам (позвоночные – членистоногие, разные группы хозяев из числа позвоночных), и мутации, не связанные с адаптацией к разным организмам. В частности, нами предпринята попытка оценить изменения в геноме, связанные с изоляцией штаммов вируса на лабораторных животных (белых мышах). Предполагая ревертивный характер этих мутаций, мы попытались оценить сроки происхождения и дивергенции вируса ОГЛ на основании исключения из анализа мутаций этого типа, а также связанных с данными мутациями изменений в других областях генома. О наличии связанных замен в геноме ортофлавивирусов сообщалось ранее [5].

В настоящее время влияние различных ортофлавивирусов на организмы специфичных и случайных хозяев, и в частности, на клетки хозяина, изучено достаточно хорошо [6, 7]. Подобные исследования проводились как на лабораторных животных, так и в культурах клеток [6, 8]. Однако об особенностях адаптации большинства ортофлавивирусов к их резервуарным хозяевам известно намного меньше и совсем мало информации о влиянии на вирус его случайных хозяев. При взаимодействии флавивирусов с клетками инфицированного животного происходят многочисленные изменения в геноме вируса, которые могут затрагивать как кодирующую, так и некодирующую части генома [9‒13].

Цель работы ‒ анализ изменений в геноме, связанных с изоляцией штаммов вируса ОГЛ, на лабораторных животных (белых мышах).

Материалы и методы

Для первоначального изучения возможного влияния организма мыши на геном вируса ОГЛ проводили анализ нуклеотидных последовательностей вируса ОГЛ, полученных от инфицированных ондатр в 2007 г. в первичном материале от O. zibethicus (мозг – 3 последовательности); от инфицированных белых мышей (Mus musculus) при первичном заражении (мозг – 7; урина ‒ 1) и после первого (мозг – 9; урина – 1) и второго пассажей (мозг – 4) в процессе изоляции штаммов вируса ОГЛ (в табл. 1 эти последовательности представлены под номерами 22–46). Таким образом, оценку изменений в геноме вируса осуществляли на основе анализа состава и локализации в геноме вируса точечных мутаций в серии последовательностей, полученных из первичного материала от ондатр и (или) при изоляции возбудителя на этапах первичного заражения, первого и второго пассажей из органов, крови и (или) урины лабораторных животных (новорожденные белые мыши). После этого проводили расширенный анализ нуклеотидных замен с привлечением полноразмерных последовательностей вирусов ОГЛ, полученных в другие годы (табл. 1), для выявления возможной связи мутаций, возникающих при взаимодействии с организмом мыши, с типичной локализацией наиболее частых замен или наличием связанных замен в геноме ОГЛ.

 

Таблица 1. Происхождение анализируемых последовательностей

Table 1. Origin of analyzed sequences

Код доступа | Accession number

(VGARus и GenBank)

Обозначение на схемах

Designation in figures

Год извлечения

Year of isolation

Лабораторный хозяин (пассаж, орган)

Laboratory host (passage, organ)

1.

onii004151

Oz-41_Br_9724_O_2000

2000

Mus musculus (2, мозг | brain)

2.

onii004143

Oz-2_Br_10371_O_2001

2001

Mus musculus (0, мозг | brain)

3.

onii004170

t-Balangul_O_1955

1955

Mus musculus (‒, мозг | brain)

4.

onii004156

Mr-506_Br_11400_O_2003

2003

Mus musculus (4, мозг | brain)

5.

onii004155

Oz_S20-10530_O_2000

2000

Mus musculus (5, мозг | brain)

6.

onii004167

Hs_Bl-4-4710_N_1991

1991

Mus musculus (1, мозг | brain)

7.

onii004148

Oz-32_Kd_10797_N_1991

1991

Mus musculus (1, мозг | brain)

8.

onii004146

Oz-31_Kd_10866_N_1991

1991

Mus musculus (3, мозг | brain)

9.

onii004171

Oz-40_Br_9725_O_1999

1999

Mus musculus (2, мозг | brain)

10.

onii004152

Oz-58_Br_10469_O_2001

2001

Mus musculus (1, мозг | brain)

11.

onii004150

Oz-39_Br_9723_O_2000

2000

Mus musculus (2, мозг | brain)

12.

onii004169

t_Krutinkа_O_1973

1973

Mus musculus (‒, мозг | brain)

13.

onii004168

Hs_B_Goloshubinа_O_1948

1948

Mus musculus (‒, мозг | brain)

14.

onii004153

Oz-351-Ur-11707_O_2007

2007

Mus musculus (1, мозг | brain)

15.

onii004144

Oz-3_Br_10360_O_2001

2001

Mus musculus (0, мозг | brain)

16.

onii004149

Oz-37_Br_9721

2000

Mus musculus (2, мозг | brain)

17.

onii004154

Oz_Br_8341_Kurgan_K_1972

1972

Mus musculus (‒, мозг | brain)

18.

onii004141

Mo-1003_Br_5857-58_N_1991

1991

Mus musculus (3, мозг | brain)

19.

onii004142

AS_G-26_5143_N_1991

1991

Mus musculus (2, мозг | brain)

20.

onii004147

Oz_Br-32-2106_N_1989

1989

Mus musculus (0, мозг | brain)

21.

onii004145

Oz-29_Br_2101_N_1991

1991

Mus musculus (0, мозг | brain)

22.

OL689381

Oz_Bl-351/11704_O_2007

2007

Mus musculus (1, урина | urine)

23.

OL689372

Oz_Bl-352/13981_O_2007

2007

Mus musculus (1, мозг | brain)

24.

OL689373

Oz_Br-352/11656_O_2007

2007

Mus musculus (0, мозг | brain)

25.

OL689383

Oz_Br-352/352_O_2007

2007

Первичный материал | Primary sample

26.

OL689379

Oz_Br-353-0/11661_O_2007

2007

Mus musculus (0, мозг | brain)

27.

OL689380

Oz_Br-353-1/13973_O_2007

2007

Mus musculus (1, мозг | brain)

28.

OL689378

Oz_Ur-353/13965_O_2007

2007

Mus musculus (3, мозг | brain)

29.

OL689387

Oz_Br-354/354_O_2007

2007

Первичный материал | Primary sample

30.

OL689388

Oz_Br-354/11662_O_2007

2007

Mus musculus (0, мозг | brain)

31.

OL689366

Oz_Br-356-1/13959_O_2007

2007

Mus musculus (1, мозг | brain)

32.

OL689367

Oz_Br-356-2/13971_O_2007

2007

Mus musculus (2, мозг | brain)

33.

OL689376

Oz_Br-356-1/13969_O_2007

2007

Mus musculus (1, мозг | brain)

34.

OL689377

Oz_Br-356-2/13964_O_2007

2007

Mus musculus (2, мозг | brain)

35.

OL689368

Oz_Br-356-0/13957_O_2007

2007

Mus musculus (0, мозг | brain)

36.

OL689374

Oz_Ur-356-0/13977_O_2007

2007

Mus musculus (0, мозг | brain)

37.

OL689375

Oz_Ur-356-1/13980_O_2007

2007

Mus musculus (1, мозг | brain)

38.

OL689365

Oz_Liv-356-1/13955_O_2007

2007

Mus musculus (0, мозг | brain)

39.

OL689364

Oz_Liv-356-0/13967_O_2007

2007

Mus musculus (1, мозг | brain)

40.

OL689386

Oz_Ur-359/13965_O_2007

2007

Mus musculus (0, мозг | brain)

41.

OL689384

Oz_Br-361/361_O_2007

2007

Первичный материал | Primary sample

42.

OL689385

Oz_Br-361/13948_O_2007

2007

Mus musculus (2, мозг | brain)

43.

OL689370

Oz_Liv-362/13943_O_2007

2007

Mus musculus (1, мозг | brain)

44.

OL689371

Oz_Liv-362/13952_O_2007

2007

Mus musculus (1, мозг | brain)

45.

OL689369

Oz_Kid-362/13944_O_2007

2007

Mus musculus (1, мозг | brain)

46.

OL689382

Oz_Ur-353/13977_O_2007

2007

Mus musculus (0, мозг | brain)

47.

MT354615

Oz_P-15/2213_N_1990

1990

Mus musculus (1, мозг | brain)

48.

MT354618

Oz_M-19/5099_N_1991

1991

Mus musculus (5, мозг | brain)

49.

MT354622

Oz_B-41/9687_O_2000

2000

Mus musculus (1, мозг | brain)

50.

MT354623

Oz_B-37/9866_O_1999

1999

Mus musculus (1, мозг | brain)

51.

MT354624

Oz_B-30/10146_N_1990

1990

Mus musculus (1, мозг | brain)

52.

MT354626

Mo_pr.1007/10817_N_1991

1991

Mus musculus (4, мозг | brain)

53.

MT354627

Oz_362Bl/362Bl_O_2007

2007

Первичный материал | Primary sample

54.

MT354628

Oz_42M/9722_O_1999

1999

Mus musculus (2, мозг | brain)

55.

MT354629

Oz_17N/11153_O_2002

2002

Mus musculus (7, мозг | brain)

56.

MT354620

m_G17/10783_N_1991

1991

Mus musculus (1, мозг | brain)

57.

MT354621

Oz_Veselovka-753/11084_N_1963

1963

Mus musculus (‒, мозг | brain)

58.

MT354625

Oz_Br-1/10186_K_1992

1992

Mus musculus (3, мозг | brain)

59.

MT354616

OZ-97/11285_O_2004

2004

Mus musculus (0, мозг | brain)

60.

MT354617

OZ-96/11293_O_2004

2004

Mus musculus (0, мозг | brain)

61.

MT354619

t_Kabyrdak-39/10944_O_1962

1962

Mus musculus (‒, мозг | brain)

62.

MT354614

t_Bogolubovka/1048_O_1948

1948

Mus musculus (‒, мозг | brain)

Примечание. В таблице представлены обозначения (3-й столбец), использующиеся при построении деревьев. В начале обозначения содержится указание на организм из которого получен вирус: OZ ‒ Ondatra zibethicus, HS ‒ Homo sapiens, AS ‒ Aedes subdiversus, MO ‒ Microtus oeconomus, t ‒ клещи, m ‒ комар; далее, если есть информация, указан орган из которого произошло извлечение биоматериала: Bl ‒ кровь, Br ‒ мозг, Liv ‒ печень, Kid ‒ почки, Ur ‒ урина; следующим идет буквенно-цифровое обозначение изолята; обозначение области, где был получен вирус: N ‒ Новосибирская, O ‒ Омская, К ‒ Курганская; год получения первичного материала, из которого получены штаммы вируса или вирусная РНК. Коды доступа последовательностей, размещенных на платформе VGARus (https://www.crie.ru/about/aggregation/vgarus.php), расположены в строках таблицы под номерами с 1 по 21; в строках таблицы под номерами с 22 по 62 расположены коды доступа последовательностей, размещенных в GenBank.

Note. The table presents the names (3rd column) used in constructing trees. The name begins with an indication of the organism from which the virus was isolated: OZ ‒ Ondatra zibethicus, HS ‒ Homo sapiens, AS ‒ Aedes subdiversus, MO ‒ Microtus oeconomus, t ‒ ticks, m ‒ mosquito; then, if information is available, the organ from which the biomaterial was extracted is indicated: Bl ‒ blood, Br ‒ brain, Liv ‒ liver, Kid ‒ kidneys, Ur ‒ urine; next comes the alphanumeric name of the isolate; the name of the region where the virus was isolated: N ‒ Novosibirsk, O ‒ Omsk, K ‒ Kurgan; the year of receipt of the primary material from which the virus strains or viral RNA were obtained. Access codes for sequences placed on the VGARus platform (https://www.crie.ru/about/aggregation/vgarus.php) are located in the table rows under numbers 1 through 21; access codes for sequences placed in GenBank are located in the table rows under numbers 22 through 62.

 

Всего в исследовании были использованы нуклеотидные последовательности геномов штаммов вируса ОГЛ (полногеномные последовательности 62 штаммов) из рабочей коллекции лаборатории арбовирусных инфекций отдела ПОВИ ФБУН «Омский НИИ природно-очаговых инфекций» Роспотребнадзора (табл. 1). Рабочая коллекция включает штаммы периодов эпидемической и эпизоотической активности природных очагов ОГЛ и межэпидемических периодов, начиная с 1946 г., когда вирус был описан как самостоятельная нозологическая форма [14]. Штаммы вируса были изолированы в Новосибирской, Омской и Курганской областях от разных источников возбудителя. Кроме штамма «Боголюбовка» (Bogolubovka), остальные штаммы были изолированы сотрудниками института в разные периоды времени. В анализе также использовали 9 последовательностей вируса ОГЛ, имеющих свободный доступ в GenBank (в скобках – обозначение на рисунках): AB507800 (HS_B_Guriev_AB507800_O_1948), OP037815 (HS_B_Guriev_OP037815_O_1948), MW847419 (Oz_Nikitina_ MW847419), MT350781 (Nikitina_ MT350781), AY193805 (t_Bogoluvovska_ AY193805), NC_005062 (t_Bogoluvovska_NC_005062), AY438626 (Hs_B_Kubrin_1947), AY323489 (Bogolubovka), OP292291(OZ_MO-1007_O_2004).

Из 62 полноразмерных последовательностей вируса ОГЛ (табл. 1) 3 были взяты из мозга ондатр, погибших во время эпизоотии (декабрь 2007 г., Омская область, Тюкалинский – Крутинский районы, оз. Салтаим-Тенис). Остальные представляют собой РНК вируса из мозга или урины (один образец) белых мышей, полученную при изоляции штаммов вируса методом биопробы в разные периоды эпидемической и эпизоотической активности природных очагов ОГЛ. Источник, время и место изоляции штаммов отражены в табл. 1.

Изоляцию вируса проводили на сосунках (2‒3 сут от рождения) беспородных белых мышей, путем интрацеребрального заражения 10% суспензией первичного материала (органов, крови и (или) урины павших ондатр) или (в дальнейшем, при проведении пассажей, мозга белых мышей с клиническими признаками заболевания). В качестве источника РНК вируса ОГЛ использовали 10% суспензию мозга ондатр (первичный материал) или (и) сосунков белых мышей с клиническими признаками заболевания от первичного заражения (0 пассаж) и последующих пассажей.

Образцы органов для выделения РНК гомогенизировались и представляли собой суспензию на среде 199, образцы урины не подвергали предварительной обработке. Выделение РНК проводили из 130 мкл суспензии и полного объема урины на колонках Qiagen QIAamp Viral RNA Mini (Qiagen, Нидерланды). Далее проводили полногеномную амплификацию с «БиоМастер ОТ-ПЦР-Премиум (2Ч)» (Биолабмикс, Новосибирск) по протоколу 45° ‒ 30 мин; 93° ‒ 5 мин; 93° ‒ 10 с, 56° ‒ 30 с, 68° ‒ 2 мин 30 сек (45 циклов); 68° ‒ 7 мин. Последовательности использованных праймеров указаны в таблице S1, находящейся в дополнительном файле.

Для проведения амплификации праймеры были сгруппированы в два пула ‒ пары 1, 3, 5, 7, 9, 11 и пары 2, 4, 6, 8, 10, 12. В реакцию брали 5 мкл выделенной РНК, 2,5 мкл пула праймеров в концентрации 10 пмоль/мкл и 17,5 мкл ОТ-ПЦР смеси. Результаты оценивали по кривой плавления с SYBR Green и, дополнительно, методом электрофореза в агарозном геле.

Для пробоподготовки к секвенированию Oxford Nanopore использовали наборы реагентов Ligation Sequencing kit 1D (SQK-LSK109) и Native Barcoding Expansion 1-96 (EXP-NBD196) (Oxford Nanopore Technologies, Великобритания). Секвенирование проводили на приборе Oxford Nanopore MinION c проточной ячейкой R9.4.1 (Oxford Nanopore Technologies, Великобритания) согласно рекомендациям производителя.

Подготовку библиотек для секвенирования Illumina осуществляли с использованием набора реагентов Illumina DNA Prep и IDT for Illumina DNA UD Indexes (Illumina, США). Секвенирование проводили на приборе Illumina MiSeq (Illumina, США) с использованием набора MiSeq Reagent Kit v3 600-cycle (Illumina, США) согласно инструкции производителя. Для получения сборки консенсусных последовательностей из данных секвенирования Illumina использовали программы BWA-MEM [15], SAMtools [16] и iVar [17].

Для получения консенсусных последовательностей из данных секвенирования Oxford Nanopore применяли программы Minimap2 [18], SAMtools, iVar, Medaka [https://github.com/nanoporetech/medaka] и BCFtools [19]. Полученные консенсусные последовательности были депонированы в международной базе данных NCBI GenBank с кодами доступа, приведенными в табл. 1.

Полученные полноразмерные нуклеотидные последовательности ОГЛ выравнивали с использованием программы Clustal, с помощью которой было рассчитано филогенетическое дерево (метод BOOTSTRAP N-J TREE). Для построения дерева была добавлена нуклеотидная последовательность вируса клещевого энцефалита (ВКЭ) сибирского подтипа с кодом доступа JN003209 (Irkutsk-12).

Далее в выравнивании определяли координаты столбцов, в которых регистрировалось наличие замен. Содержимое этих столбцов анализировали при помощи методов дискриминантного анализа как значения категориальных переменных, а каждую последовательность рассматривали как объект, который описывается этими категориальными переменными (тип нуклеотидов). Дискриминантный анализ позволяет изучать различия между несколькими группами объектов (в нашем случае между группами нуклеотидных последовательностей) по значениям числовых или нечисловых переменных, описывающих объекты (в нашем случае значения каждой нечисловой переменной соответствуют типам нуклеотидов в столбце выровненных последовательностей) [20], а также интерпретировать межгрупповые различия и определять вклад каждой переменной при классификации объектов. После проведения анализа строили диаграммы рассеяния значений дискриминантных функций, рассчитанных для каждой кодирующей последовательности ОГЛ. По оси абсцисс на диаграммах рассеяния отложены значения дискриминантной функции f1, по оси ординат ‒ f2 для каждой последовательности, представленной точкой на этих диаграммах. Анализ проводили с помощью модуля «Общие модели дискриминантного анализа» (general discriminant analysis) программы Statistica 6.0.

Столбцы, в которых регистрировалось наличие замен, т.е. наличие различающихся нуклеотидов в одном и том же столбце в массиве выровненных последовательностей, также сравнивали между собой для выявления наличия связанных замен при помощи подсчета взаимной информации для каждой пары столбцов [21].

Координаты, соответствующие выявленным связанным заменам, сравнивали с координатами замен, важных для межгрупповых различий, которые были выявлены при проведении дискриминантного анализа. Полученную схему сопоставляли с известными описаниями замен из доступных литературных источников, возникающих при адаптации ВКЭ к разным хозяевам и тканям.

При дальнейшем проведении филогенетического анализа применяли алгоритм нестрогих (ослабленных) часов (relaxed molecular clock/uncorrelated lognormal) программы BEAST и программы MCMC Tree в пакете PAML [22], использующих байесовские методы для оценки времени дивергенции.

При оценке скорости возникновения мутаций создавали 30 выборок, в каждой из которых осуществляли 20 млн реализаций цепи Маркова, с шагом в 1000 эти деревья записывали в лог-файл, из рассмотрения исключали первые 10% генерируемых деревьев (параметр «burn in percentage»), а также шел отбор деревьев при помощи «marginal likelihood estimators». Отобранные эволюционные деревья максимальной достоверности клады суммировали с помощью подпрограммы TreeAnnotator v. 2.7.6. По полученному дереву вычисляли итоговые оценки скорости возникновения мутаций.

Авторы подтверждают соблюдение институциональных и национальных стандартов по использованию лабораторных животных в соответствии с Consensus author guidelines for animal use (IAVES 23.07.2010). Протокол исследования одобрен Этическим комитетом организации ФБУН «Омский НИИ природно-очаговых инфекций» Роспотребнадзора (Протокол № 5 от 10.11.2021).

Результаты

Филогенетический анализ

Сравнение полноразмерных нуклеотидных последовательностей ОГЛ показывает разделение их на 3 основных подтипа (рис. 1), различие которых друг от друга находится в пределах 10‒11% и соответствует данным, полученным ранее по меньшим выборкам или гену Е [4, 23, 24].

 

Рис. 1. Филогенетическое дерево, построенное по кодирующей части нуклеотидной последовательности вирусов ОГЛ.

В узлах указаны значения бутстреп-поддержки. Указана принадлежность последовательностей к основным подтипам вируса ОГЛ: OHFV-1, OHFV-2, OHFV-3.

Fig. 1. Phylogenetic tree constructed based on the coding part of the nucleotide sequence of OHF viruses. Bootstrap values are indicated for tree nodes.

The sequences belong to the main subtypes of the OHF virus: OHFV-1, OHFV-2, OHFV-3.

 

При этом не наблюдали явной связи между количеством различающихся нуклеотидов в последовательностях и годом или местом их извлечения, что затрудняет получение эволюционной временно́й шкалы для вируса ОГЛ. Кроме того, по дереву на рис. 1 нельзя однозначно утверждать, что наличие этих различий связано с адаптацией к организму того хозяина, из которого был извлечен биоматериал, возможно из-за недостаточного количества последовательностей, полученных не от O. zibethicus. Отличия всех подтипов от ближайшего вида ортофлавивирусов (ВКЭ) составляет 20%.

Анализ замен, наблюдаемых в последовательностях вирусной РНК, полученной из первичного материала от Ondatra zibethicus

Нуклеотидные последовательности OL689387, OL689384, OL689383 получены из первичного материала (мозг ондатр, погибших во время эпизоотии в декабре 2007 г.). Их нуклеотидные последовательности различались незначительно: OL689383 и OL689387 – 5 замен, OL689384 и OL689387 – 41 замена, OL689383 и OL689384 – 42 замены. Синонимичные и несинонимичные замены локализовались в разных частях генома и во всех генах, кодирующих вирусные белки. Число аминокислотных замен при сравнении: OL689383 и OL689387 – 1 замена, OL689384 и OL689387 – 13 замен, OL689383 и OL689384 – 14 замен.

К сожалению, не удалось отследить непрерывную цепочку изменений, которые могут возникать при пассировании вирусов от первичного материала к последующим пассажам, т.к. отсутствовали либо последовательности из первичного материала, либо из первичного заражения, либо определенные пассажи.

В связи с этим было проведено сравнение количества различий в последовательностях, полученных из первичного материала, и имеющихся последовательностей, полученных из организма мыши после их заражения, от этого первичного материала. При этом было обнаружено, что пассирование вируса в организме мыши может приводить к некоторому уменьшению числа различий между пассированными последовательностями по сравнению с последовательностями из первичного материала, от которых они были получены (рис. 2).

 

Рис. 2. Количество различающихся нуклеотидов при сравнении кодирующих последовательностей вирусов ОГЛ.

Количество различающихся нуклеотидов указано на стрелках схемы.

Fig. 2. The number of different nucleotides when comparing the coding sequences of OHF viruses.

The number of different nucleotides is indicated on the arrows in the diagram.

 

Замены, которые возникли при пассировании в организме мыши у вирусов Oz_Br-354/11661_O_2007 и Oz_Br-352/11656_O_2007, являются синонимичными и возникли в сайтах с номерами (5814, 6208, 9201) и (894, 7341, 9477) соответственно.

У вируса Oz_Br-361/13948_O_2007 замены оказались несинонимичными и расположены в сайтах с номерами 9478 и 9482.

Общий анализ замен, возникающих при пассировании в организме мыши

Оценку изменений в геноме вируса ОГЛ осуществляли, анализируя состав и локализацию появляющихся точечных замен в вирусной РНК последовательностей, полученных при адаптации вирусов к организму мыши (в табл. 1 номера 22‒46). В результате было показано, что точечные замены возникают во всех частях генома: в генах, кодирующих как структурные, так и неструктурные белки. Всего было выявлено 253 сайта, в которых возникли мутации. Большинство этих мутаций являлись синонимичными, только 41 сайт из 253 содержал несинонимичные мутации (табл. 2).

 

Таблица 2. Сайты, в которых возникли мутации (значения координат отложены от первого нуклеотида выровненных кодирующих последовательностей вирусов)

Table 2. Sites where mutations occurred (coordinate values are plotted from the first nucleotide of the aligned viral coding sequences)

Ген

Gene

Координата

Coordinate

Нуклеотидная замена

Nucleotide substitution

Аминокислотная замена

Amino acid substitution

M

617

С↔T

S↔L

761

C↔T

T↔I

Е

894

C↔T

1657

T↔C

2145

G↔A

2298

A↔G

NS1

2457

C↔T

2544

A↔C

3046

T↔G

S↔A

NS2a

3546

T↔G

H↔Q

3690

A↔G

NS2b

4257

T↔C

4485

T↔C

NS3

5118

T↔C

5814

T↔C

5816

C↔G

T↔R

5946

T↔A

6208

T↔C

NS4b

7341

C↔T

Полимераза

Polymerase

8148

G↔A

8379

T↔C

8388

C↔G

8695

T↔C

C↔R

8823

A↔T

8890

C↔T

H↔Y

9106

T↔C

9201

C↔T

9477

A↔G

9486

A↔C

Q↔H

9786

G↔A

10027

A↔G

S↔G

10110

A↔G

10125

T↔C

10240

T↔C

Примечание. Указаны сайты, в которых у 4 и более последовательностей возникли мутации при адаптации к организму мыши. В колонке «аминокислотная замена» ставится прочерк, если замена является синонимичной. Подчеркиванием выделены сайты, которые задействованы в схеме связанных нуклеотидных замен. Координаты сайтов задавались от первого нуклеотида кодирующей последовательности с кодом доступа OL689365 в GenBank. Тип замен в столбцах «нуклеотидная замена» и «аминокислотная замена» указан в виде: «A↔G», где первая буква соответствует последовательности OL689365, а вторая ‒ имеющемуся варианту в других последовательностях.

Note. The sites are indicated where mutations occurred in four or more sequences during adaptation to the mouse organism. A dash is put in the “amino acid substitution” column if the substitution is synonymous. The sites that are involved in the pattern of linked nucleotide substitutions are highlighted with underlining. The coordinates of the sites are specified according the coding region of the reference sequence (GenBank accession number OL689365). The type of substitutions in the “nucleotide substitution” and “amino acid substitution” columns is indicated as: “A↔G”, where the first letter corresponds to the OL689365 sequence, and the second ‒ to the variant present in other sequences.

 

Для проверки предположения о возможном влиянии процесса адаптации генома вируса ОГЛ к организму хозяина был проведен дискриминантный анализ для полученных 25 полноразмерных нуклеотидных последовательностей мРНК ОГЛ (в табл. 1 номера 22‒46).

Дискриминантный анализ различий в точечных нуклеотидных заменах для групп, объединяющих последовательности по типу органов, из которых они были получены от ондатр (1-я группа – почки и урина, 2-я группа ‒ мозг, 3-я группа – кровь), не показал значимых различий между ними.

Проведенный дискриминантный анализ точечных замен при разбиении всех последовательностей на 3 группы (0 ‒ последовательности, полученные из первичного материала от ондатры и после первичного заражения мыши (0 пассаж); 1п ‒ после первого пассажа в организме белой мыши; 2п ‒ после второго пассажа в организме белой мыши) выявил значимые отличия (уровень значимости p ≤ 15%), между последовательностями, полученными от ондатры, и последовательностями второго пассажа на белой мыши из этих же линий (рис. 3). При этом качество дискриминации довольно низкое и допускает случаи неправильной классификации последовательностей, т.к. отдельные последовательности далеко отстоят от центроидов своих групп и попадают в область перекрывания всех трех групп, что соответствует случаю ошибочной классификации (рис. 3). Как видно на рис. 3, главный вклад в дискриминацию вносит функция f1, использование функции f2 не дало значимых результатов. В этой связи были рассмотрены также различия двух составных групп: в 1-й группе объединены последовательности, полученные из первичного материала (мозг павших от ОГЛ ондатр) и из мозга зараженных белых мышей при первичном заражении; во 2-й группе ‒ последовательности из мозга зараженных белых мышей на первом и втором пассажах в процессе изоляции штаммов вируса. В этом случае дискриминация заметно улучшается (уровень значимости p ≤ 5%) и число случаев неправильной классификации последовательностей становится меньше.

 

Рис. 3. Диаграмма рассеяния для нуклеотидных последовательностей мРНК вируса ОГЛ в пространстве первой (f1) и второй (f2) дискриминантных функций

0 ‒ последовательности, полученные из первичного материала от ондатры и после первичного заражения мыши (0 пассаж); 1п ‒ последовательности первого пассажа в организме белой мыши; 2п ‒ последовательности второго пассажа в организме белой мыши.

Fig. 3. Scatterplot for mRNA nucleotide sequences of the OHF viruses in space, where the coordinates along the horizontal axis are the values of the discriminant function f1, and along the vertical axis the values of the discriminant function f2, calculated for each viral nucleotide sequence.

0 ‒ sequences obtained from muskrat and sequences of the 0 passage in the body of a white mouse; 1п ‒sequences of the first passage in the body of a white mouse; 2п ‒sequences of the second passage in the body of a white mouse.

 

Для проверки предположения о влиянии количества пассажей на возникновение изменений в геноме ОГЛ был проведен дополнительный анализ всех нуклеотидных последовательностей ОГЛ, для которых имелись данные о количестве пассажей (табл. 1). Для последовательностей t-Balangul_O_1955, t_Krutinka_O_1973, Hs_B_Goloshubina_O_1948, Oz_Br_8341_Kurgan_K_1972, Oz_Veselovka-753/11084_N_1963, t_Kabyrdak-39/10944_O_1962, t_Bogolubovka/1048_O_1948 предполагалось количество пассажей, намного большее, чем указано в табл. 1, далее на схемах эта группа обозначается символом «х».

По результатам дискриминантного анализа видно (рис. 4), что начиная с 7-го пассажа (Oz_17N/11153_O_2002) изменения в нуклеотидных последовательностях ОГЛ становятся настолько значительными, что классифицируемые последовательности можно выделять в отдельные группы. Причем последовательности t-Balangul_O_1955, Hs_B_Goloshubina_O_1948, Oz_Br_8341_Kurgan_K_1972, Oz_Veselovka-753/11084_N_1963, t_Kabyrdak-39/10944_O_1962, t_Bogolubovka/1048_O_1948 занимают на схеме практически одно положение, хотя принадлежат к разным кластерам филогенетического дерева. Это предположительно может означать закрепление в их геноме схожих нуклеотидных замен в ходе длительного пассирования. Как видно на рис. 4, главный вклад в дискриминацию вносит функция f1.

 

Рис. 4. Диаграмма рассеяния для нуклеотидных последовательностей мРНК вируса ОГЛ в пространстве первой (f1) и второй (f2) дискриминантных функций

0 ‒ последовательности, полученные из первичного материала от ондатры; 0п ‒ последовательности нулевого пассажа в организме белой мыши; 1п ‒ последовательности первого пассажа в организме белой мыши; 2п ‒ последовательности второго пассажа в организме белой мыши; 3п ‒ последовательности третьего пассажа в организме белой мыши; 4+ ‒ последовательности четвертого и большего количества пассажей в организме белой мыши; х ‒ последовательности с неизвестным числом пассажей.

Fig. 4. Scatterplot for mRNA nucleotide sequences of the OHF viruses in space, where the coordinates along the horizontal axis are the values of the discriminant function f1, and along the vertical axis the values of the discriminant function f2, calculated for each viral nucleotide sequence

0 ‒ sequences obtained from muskrat; 0п ‒sequences of the 0 passage in the body of a white mouse; 1п ‒ sequences of the first passage in the body of a white mouse; 2п ‒ sequences of the second passage in the body of a white mouse; 3п ‒ sequences of the third passage in the body of a white mouse; 4+ ‒ sequences of the fourth and higher number of passages in the body of a white mouse; x ‒ sequences with an unknown number of passages.

 

Функция f2 и остальные дискриминантные функции не позволяют провести надежную дискриминацию последовательностей (группы последовательностей сильно перекрываются).

Был проведен также дискриминантный анализ последовательностей отдельно по структурным и неструктурным генам. При этом менялись расстояния между отдельными последовательностями, но общая картина сохранялась аналогичной рис. 4.

Это позволяет предположить наличие положительного отбора, который проявляется при пассировании, ведущего к накоплению мутаций вдоль всей кодирующей последовательности в процессе адаптации к новому хозяину.

Возможно, что обнаруженные замены и их местоположение не являются типичными при адаптации к любому новому хозяину и отличаются для разных хозяев, что требует дальнейшего исследования. Ранее уже было показано на примере ВКЭ, что вновь возникающие мутации не являются единственно необходимыми для адаптации к той или иной клеточной системе и могут встречаться в единичных случаях [25].

Кроме того, для ВКЭ и некоторых других ортофлавивирусов было показано, что разные варианты последовательностей сосуществуют в одном организме-хозяине как квазивиды, разные по численности [9]. И нуклеотидные изменения, выявленные в полногеномных последовательностях новых вариантов, присутствуют наряду с нуклеотидной последовательностью, несущей особенности родительского штамма («дикий тип» вируса), т.е. ортофлавивирус вероятно существует в организме любого хозяина в виде гетерогенной популяции, содержащей варианты вируса, предварительно адаптированные к размножению в различных средах, что способствует выживанию вируса в организмах клещей и млекопитающих. Возможно, то же справедливо и для вируса ОГЛ.

Выявление связанных замен

Обнаружено наличие связанных замен, возникающих в геноме ОГЛ, продемонстрированное ранее для других ортофлавивирусов [26], но не выявленное прежде у вирусов ОГЛ из-за недостаточного количества полноразмерных нуклеотидных последовательностей. Для этого подсчитывали значение взаимной информации [21] для каждой пары столбцов в массиве всех выровненных полноразмерных кодирующих последовательностей ОГЛ (к 62 последовательностям из табл. 1 были добавлены 9 последовательностей из GenBank, упомянутых в разделе «Материалы и методы»), по которому определяли сходство при возникновении нуклеотидных замен в этих позициях.

Большинство связанных замен у ОГЛ выявляется в последовательностях, кодирующих неструктурные вирусные белки, так же как и у других ортофлавивирусов [5]. Некоторые из мутаций, входящие в систему связанных замен у вируса ОГЛ, по своему местоположению в геноме соответствуют аналогичной схеме связанных замен, наблюдаемой у ВКЭ, но бо́льшая их часть (> 60%) в эту схему не укладывается. Нами обнаружены 93 сайта, в которых возникают значимые связанные замены. Из них 49 сайтов в кодирующей части нуклеотидной последовательности вируса ОГЛ со следующими координатами от начала кодирующей последовательности: 591, 601, 621, 634, 668, 780, 1020, 1242, 1489, 2466, 2604, 2751, 2847, 2904, 2988, 3065, 3072, 3123, 3189, 3847, 4113, 4251, 4548, 4851, 4884, 4911, 4998, 5034, 5145, 5229, 5364, 5712, 5838, 5880, 6048, 6174, 6384, 6546, 6618, 7383, 7500, 7554, 7638, 8133, 8154, 8238, 8427, 8997, 9850 н, ‒ являются своеобразными «узловыми точками», каждой из которых соответствует более 10 случаев связанных замен в других сайтах. При этом значимые связи при возникновении замен наблюдали между удаленными друг от друга частями генома, и наибольшее количество таких точек соответствовало предполагаемым однонитевым участкам шпилечных структур вирусной РНК и местам возникновения синонимичных замен.

Выявленные случаи связанных замен предположительно могут быть объяснены наличием вторичных и третичных взаимодействий в вирусной РНК. Такие взаимодействия между вторичными структурами РНК в некодирующих участках генома ортофлавивирусов были описаны при циклизации вирусного генома, необходимой для репликации. Есть также свидетельства, что определенные вторичные и третичные структуры РНК, способные к «дальнодействующим взаимодействиям РНК-РНК», могут находиться в кодирующих областях ортофлавивирусных геномов [5, 27, 28], образуя при этом сложные трехмерные структуры. Каким образом эти элементы влияют на приспособленность вируса, в настоящее время неизвестно. Однако имеются экспериментальные данные, которые показывают, что удаленные взаимодействия > 500 н между частями РНК более характерны для РНК ортофлавивирусов, находящейся в вирионе, чем для вирусной РНК, находящейся в клетке [27], что предполагает или разрушение вирусных структур внутри клеток, или их необходимость для упаковки внутри нуклеокапсида. Последнее предположение подкрепляется полученными ранее сведениями о наличии связанных замен в кодирующей части сегментированного генома хантавирусов, локализующихся в разных сегментах [21].

Оценка скорости возникновения мутаций

При расчете скорости возникновения мутаций у ОГЛ по всем имеющимся полноразмерным кодирующим последовательностям вируса были получены значения, укладывающиеся в интервал от 1,3 × 10−4 до 5,8 × 10−4 замен на сайт в год. Была рассчитана также скорость возникновения мутаций для последовательностей ОГЛ, у которых из массива анализируемых замен исключены замены, возникающие в процессе пассирования (координаты этих замен указаны в табл. 2). Полученные значения скорости возникновения мутаций были ожидаемо ниже ‒ от 1,5 × 10−5 до 8,6 × 10−5. Структура филогенетического дерева при этом осталась такой же, как на рис. 1, лишь незначительно увеличилась длина ветвей внутри кластера OHFV-1 (деревья приведены на рис. S1 и S2 в дополнительном файле).

Обсуждение

Предположения о наличии селективных изменений при пассировании арбовирусов через организм теплокровных (лабораторных белых мышей) и членистоногих (иксодовых клещей) подтверждаются не только по данным анализа возникающих нуклеотидных замен, но и по изменениям характера гибридизации вирусной РНК со специфическими зондами в реакции молекулярной гибридизации нуклеиновых кислот [29, 30]. Эти изменения касались вариабельных участков структурных геном, кодирующих капсидный белок (С), поверхностные белки (Pr-M и M), а также области неструктурного гена NS1, кодирующего белок, функционально связанный со сборкой нуклеокапсида. Изменение характера гибридизации регистрировалось на уровне 5‒6-го и (или) 9-го и (или) после 11 последовательных пассажей через организм белых мышей (путем интрацеребрального заражения). При заражении иксодовых клещей материалом от последнего (15-го) пассажа изменение характера гибридизации наиболее регулярно затрагивало область, кодирующую поверхностные белки (ген М).

Учет факторов, влияющих на оценку скорости накопления замен в геноме ОГЛ, может вызвать затруднения из-за ограниченности информации об их влиянии. Репликация РНК-вирусов сопровождается случайным возникновением мутаций из-за низкой точности их РНК-зависимых РНК-полимераз (RdRP) и отсутствия механизмов исправления ошибок у отдельных вирусов. Причем повышение точности репликации может привести к потере приспособленности из-за предотвращения накопления адаптивных мутаций [31]. Отбор наиболее жизнеспособных РНК идет уже на уровне гетерогенной популяции вируса и направляется условиями взаимодействия вирусной РНК как с вирусными белками, так и с организмом хозяина. Эти процессы возникновения мутаций и отбора определяют скорость накопления изменений в геноме вируса и влияют на оценку длительности процессов эволюции в вирусной популяции. Процессы отбора также могут приводить к ревертированию возникших замен, как синонимичных, так и несинонимичных, если это повышает приспособленность вируса. Пример подобного процесса показан для флавируса Зика [32], у которого выявлены 4 мутации, произошедшие незадолго до эпидемического появления вируса Зика в Америке и являющиеся реверсиями предыдущих мутаций, которые сопровождали более раннее распространение вируса из Африки в Азию и раннюю циркуляцию в этих регионах. Первоначальные мутации снижали приспособленность к передаче вируса, в то время как реверсии ее восстановили, увеличив риск эпидемии. При отсутствии у исследователя азиатских вариантов вируса, анализ скорости эволюции показал бы меньшие значения, чем при их наличии. Таким образом, наличие невыявленной реверсии может влиять на оценки скорости эволюции РНК вирусов.

Кроме того, приспособительный отбор у ортофлавивирусов, которые в большинстве являются арбовирусами, в организме разных хозяев может приводить к неодинаковым результатам отбора мутаций, как это было показано на примере вируса японского энцефалита [33]. Здесь единственная мутация в белке М приводила к тому, что вирус терял способность образовывать инфекционные частицы в клетках млекопитающих, но сохранял ее в клетках насекомых. Подобные адаптационные изменения (например, к лабораторным животным), которые могли бы быть элиминированы отбором в случае нахождения вируса в природных условиях, сохранятся и также могут повлиять на оценки скорости эволюции вирусов.

Влияние процессов адаптации к организму хозяина и процессов возникновения ревертивных мутаций на оценку скорости эволюции вирусной РНК может быть даже более значительным, чем это предполагается, если мы учтем наличие связанных с ними замен в геноме ортофлавивирусов, поскольку отбор должен затрагивать и их. Для некоторых ортофлавивирусов были показаны возможности как ревертирования замен, возникающих при адаптации к хозяину, так и возникновения компенсаторных замен в удаленных частях генома [33, 34]. Таким образом, нарушениям, вызванным нуклеотидными заменами, можно противодействовать либо реверсиями, либо компенсаторными мутациями другого сайта [31].

В этой связи нами была сделана попытка оценить влияние адаптивных замен на расчетные значения скорости накопления замен в геноме вируса. Среднюю скорость возникновения замен в кодирующей части генома ОГЛ оценивали с использованием модели нестрогих часов (расслабленные часы, Relaxed clock). Первоначальная оценка количества замен в кодирующей части генома при анализе всего массива имеющихся последовательностей (71 последовательность) имела значение около 10−4 замен на сайт в год.

В этом и ранее проводимых анализах скорости накопления замен не учитывали как возможность наличия адаптивных замен в ходе изоляции штаммов вируса (все анализы ранее проводили исключительно с РНК штаммов вируса ОГЛ), так и возможность реверсии этих изменений при возвращении в исходную систему (к дикому типу). Тем более не учитывали наличие связанных замен в геноме.

Если считать замены, возникающие в процессе пассирования, случайными и ревертируемыми и исключить их из массива анализируемых замен у всех последовательностей (координаты исключаемых замен указаны в табл. 2), то полученная оценка количества замен кодирующей части генома имеет значение близкое к 10−5 замен на сайт в год.

Таким образом, при анализе средней скорости возникновения замен без учета адаптационных и связанных замен было получено значение, почти на порядок отличающееся от результата, учитывающего их наличие. Это согласуется с вариативностью оценок скоростей эволюции у различных вирусов, полученных на разных по длительности временны́х отрезках [35, 36]. Исключая сайты, в которых возникают адаптивные замены, которые с высокой вероятностью могут быть ревертируемыми, можно учесть эффекты насыщения, появляющиеся в процессе эволюции, при отсутствии информации об изменчивости вирусов в процессе длительного наблюдения.

Возможно, различные адаптивные изменения в нуклеотидных последовательностях ОГЛ, которые возникают при лабораторных практиках сохранения вируса, влияют на определяемые значения скорости эволюции при анализе этих последовательностей, чем и объясняется значительный разброс в ее оценках, полученный разными авторами по последовательности кодирующего белка Е: 10−5‒10−4 замен на сайт в год [4], 1,56 ± 0,29 × 10−4 [24], а также по полноразмерным кодирующим последовательностям: 9,1 × 10−5–1,8 × 10−4 [23]. Такой разброс данных способствует возникновению противоречий при воссоздании эволюционной истории вируса ОГЛ. Считают, что вирусы ОГЛ и ВКЭ имели общего предка, но при попытке определить возможную дату их разделения, авторы сильно расходятся во мнениях. Так, S.Y. Kovalev и E.A. Mazurina [3] предполагают, что вирус ОГЛ произошел непосредственно от дальневосточного подтипа ВКЭ за счет быстрой смены хозяина при переходе от Ixodes persulcatus к O. zibethicus в XX в. при переселении ондатры на территорию Западной Сибири, в то время как другие авторы оценивают возраст этого события в 1000 лет и более [4].

Заключение

Для генома вируса ОГЛ, как и других представителей ортофлавивирусов, характерно наличие связанных замен.

При изоляции штаммов вируса ОГЛ методом биопробы определяются изменения в структуре генома вируса, выражающиеся в возникновении нуклеотидных замен (как синонимичных, так и несинонимичных), которые затрагивают гены, кодирующие как структурные, так и неструктурные белки.

Дискриминантный анализ различий в точечных нуклеотидных заменах для групп, объединяющих последовательности по типу органов, из которых они были получены от ондатр (1-я группа – почки и урина, 2-я группа – мозг, 3-я группа – кровь), не показал значимых различий между ними.

Дискриминантный анализ различий в точечных нуклеотидных заменах для групп, объединяющих последовательности по числу пассажей, не позволяет надежно разделять последовательности из первичного материала и последовательности первых пассажей, но хорошо распознает последовательности, прошедшие 7 и более пассажей, что предполагает возможность адаптивного отбора нуклеотидных замен при взаимодействии с организмом лабораторного хозяина ‒ белой мыши.

Анализ имеющейся 71 полноразмерной последовательности позволил оценить скорость возникновения замен как 10−4 замены на сайт в год. Если считать замены, возникающие в процессе пассирования случайными и ревертируемыми и исключить их из массива анализируемых замен у всех последовательностей, то полученная оценка скорости возникновения замен в кодирующей части генома ОГЛ имеет значение близкое к 10−5 замен на сайт в год.

С учетом вероятности ревертивных изменений в геноме вируса ОГЛ, происходящих при адаптации вируса к организму лабораторных животных, и наличия связанных замен в геноме вируса, оценка скорости возникновения мутаций имеет значение, близкое к 10−5 замен на сайт в год, что соответствует времени дивергенции с предковой формой более 1500 лет.

×

About the authors

Zhanna S. Tyulko

Omsk Research Institute of Natural Focal Infections (Federal Service for Supervision of Consumer Rights Protection and Human Welfare); Omsk State Medical University of the Russian Ministry of Health

Author for correspondence.
Email: tjs@omsk-osma.ru
ORCID iD: 0000-0001-8536-0520

senior researcher, Omsk Research Institute of Natural Focal Infections (Federal Service for Supervision of Consumer Rights Protection and Human Welfare); assistant professor, State budget educational institution Omsk State Medical University of the Russian Ministry of Health

Россия, Omsk; Omsk

Artem V. Fadeev

Smorodintsev Research Institute of Influenza, Ministry of Health of Russian Federation

Email: afadeew@gmail.com
ORCID iD: 0000-0003-3558-3261

senior researcher

Россия, St. Petersburg

Aleksei G. Vasilenko

Omsk Research Institute of Natural Focal Infections (Federal Service for Supervision of Consumer Rights Protection and Human Welfare)

Email: Vasilenko_AG@oniipi.org
ORCID iD: 0000-0002-2754-6359

researcher, epidemiologist

Россия, Omsk

Ekaterina A. Gradoboeva

Omsk Research Institute of Natural Focal Infections (Federal Service for Supervision of Consumer Rights Protection and Human Welfare)

Email: Gradoboeva_EA@oniipi.org
ORCID iD: 0000-0002-2046-9872

junior researcher

Россия, Omsk

Valerii V. Yakimenko

Omsk Research Institute of Natural Focal Infections (Federal Service for Supervision of Consumer Rights Protection and Human Welfare)

Email: vyakimenko78@yandex.ru
ORCID iD: 0000-0001-9088-3668

head of laboratory

Россия, Omsk

Andrey B. Komissarov

Smorodintsev Research Institute of Influenza, Ministry of Health of Russian Federation

Email: a.b.komissarov@gmail.com
ORCID iD: 0000-0003-1733-1255

head of laboratory

Россия, St. Petersburg

References

  1. Rudakov N.V., Yastrebov V.K., Yakimenko V.V. Epidemiology of Omsk haemorragic fever. Epidemiologiya i vaktsinoprofilaktika. 2015; 14(1): 39–48. https://elibrary.ru/tkcfxf (in Russian)
  2. Heinze D.M., Gould E.A., Forrester N.L. Revisiting the clinal concept of evolution and dispersal for the tick-borne flaviviruses by using phylogenetic and biogeographic analyses. J. Virol. 2012; 86(16): 8663–71. https://doi.org/10.1128/jvi.01013-12
  3. Kovalev S.Y., Mazurina E.A. Omsk hemorrhagic fever virus is a tick-borne encephalitis virus adapted to muskrat through host-jumping. J. Med. Virol. 2022; 94(6): 2510–8. https://doi.org/10.1002/jmv.27581
  4. Karan L.S., Ciccozzi M., Yakimenko V.V., Lo Presti A., Cella E., Zehender G., et al. The deduced evolution history of Omsk hemorrhagic fever virus. J. Med. Virol. 2014; 86(7): 1181–7. https://doi.org/10.1002/jmv.23856
  5. Tyul’ko Zh.S., Yakimenko V.V. The origin of related nucleotide substitutions in the TBEV genome, determined by the viral genome structure as the result of adaptation mechanisms’ activity. Natsional’nye prioritety Rossii. 2016; (4): 103–8. https://elibrary.ru/yhxelz (in Russian)
  6. Lyapunova N.A., Khasnatinov M.A., Danchinova G.A. Autecological aspects of co-adaptation of TBEV and vertebrate hosts – an experimental approach. In: Voynikov V.K., ed. Mechanisms of Adaptation of Microorganisms to Various Environmental Conditions: Abstracts of the All-Russian Scientific Conference with International Participation [Mekhanizmy adaptatsii mikroorganizmov k razlichnym usloviyam sredy obitaniya: Tezisy Vserossiyskoy nauchnoy konferentsii s mezhdunarodnym uchastiem]. Irkutsk; 2019: 122–5. (in Russian)
  7. Gritsun T.S., Lashkevich V.A., Gould E.A. Tick-borne encephalitis. Antiviral Res. 2003; 57(1-2): 129–46. https://doi.org/10.1016/s0166-3542(02)00206-1
  8. Tonteri E., Kipar A., Voutilainen L., Vene S., Vaheri A., Vapalahti O., et al. The three subtypes of tick-borne encephalitis virus induce encephalitis in a natural host, the bank vole (Myodes glareolus). PLoS One. 2013; 8(12): e81214. https://doi.org/10.1371/journal.pone.0081214
  9. Helmová R., Honig V., Tykalová H., Palus M., Bell-Sakyi L., Grubhoffer L. Tick-borne encephalitis virus adaptation in different host environments and existence of quasispecies. Viruses. 2020; 12(8): 902. https://doi.org/10.3390/v12080902
  10. Li Y., Wang D., Du X. Adaptive genetic diversifications among tick-borne encephalitis virus subtypes: A genome-wide perspective. Virology. 2019; 530: 32–8. https://doi.org/10.1016/j.virol.2019.02.006
  11. Simón D., Fajardo A., Sóñora M., Delfraro A., Musto H. Host influence in the genomic composition of flaviviruses: A multivariate approach. Biochem. Biophys. Res. Commun. 2017; 492(4): 572–8. https://doi.org/10.1016/j.bbrc.2017.06.088
  12. Villordo S.M., Carballeda J.M., Filomatori C.V., Gamarnik A.V. RNA structure duplications and flavivirus host adaptation. Trends Microbiol. 2016; 24(4): 270–83. https://doi.org/10.1016/j.tim.2016.01.002
  13. Yang J., Jing X., Yi W., Li X.D., Yao C., Zhang B., et al. Crystal structure of a tick-borne flavivirus RNA-dependent RNA polymerase suggests a host adaptation hotspot in RNA viruses. Nucleic Acids Res. 2021; 49(3): 1567–80. https://doi.org/10.1093/nar/gkaa1250
  14. Chumakov M.P., Belyaeva A.P., Gagarina A.V., Slavina N.S. Isolation and study of strains of the causative agent of Omsk hemorrhagic fever. In: Endemic Viral Infections (Hemorrhagic Fevers): Proceedings of the Institute of Polio and Viral Encephalitis of the USSR Academy of Medical Sciences. Volume 7 [Endemicheskie virusnye infektsii (gemorragicheskie likhoradki): Trudy instituta poliomielita i virusnykh entsefalitov AMN SSSR. Tom 7]. Moscow: 1965: 327–44. (in Russian)
  15. Li H. Aligning Sequence Reads, Clone Sequences and Assembly Contigs with BWA-MEM. arXiv. 2013; arXiv:13033997[q-bio.GN]. https://doi.org/10.48550/arXiv.1303.3997
  16. Li H., Handsaker B., Wysoker A., Fennell T., Ruan J., Homer N. et al. The Sequence alignment/map (SAM) format and SAMtools. Bioinformatics. 2009; 25(16): 2078–9. https://doi.org/10.1093/bioinformatics/btp352
  17. Grubaugh N.D., Gangavarapu K., Quick J., Matteson N.L., De Jesus J.G., Main B.J., et al. An amplicon-based sequencing framework for accurately measuring intrahost virus diversity using PrimalSeq and iVar. Genome Biol. 2019; 20(1): 8. https://doi.org/10.1186/s13059-018-1618-7
  18. Li H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 2018; 34(18): 3094–100. https://doi.org/10.1093/bioinformatics/bty191
  19. Li H. A statistical framework for SNP calling, mutation discovery, association mapping and population genetical parameter estimation from sequencing data. Bioinformatics. 2011; 27(21): 2987–93. https://doi.org/10.1093/bioinformatics/btr509
  20. Khalafyan A.A. Textbook STATISTIKA 6. Statistical Data Analysis [Uchebnik STATISTIKA 6. Statisticheskiy analiz dannykh]. Moscow: Binom; 2007. (in Russian)
  21. Tyul’ko Zh.S., Yakimenko V.V. Related substitutions in the small segment of old world hantavirus genome. Voprosy virusologii. 2008; 53(3): 28–34. https://elibrary.ru/jscbxv (in Russian)
  22. Yang Z. PAML4: phylogenetic analysis by maximum likelihood. Mol. Biol. Evol. 2007; 24(8): 1586–91. https://doi.org/10.1093/molbev/msm088
  23. Bondaryuk A.N., Belykh O.I., Andaev E.I., Bukin Y.S. Inferring evolutionary timescale of Omsk hemorrhagic fever virus. Viruses. 2023; 15(7): 1576. https://doi.org/10.3390/v15071576
  24. Kovalev S.Y., Mazurina E.A., Yakimenko V.V. Molecular variability and genetic structure of Omsk hemorrhagic fever virus, based on analysis of the complete genome sequences. Ticks Tick Borne Dis. 2021; 12(2): 101627. https://doi.org/10.1016/j.ttbdis.2020.101627
  25. Lyapunova N.A. Peculiarities of tick-borne encephalitis virus reproduction in continuous cell lines of wild mammals - reservoir and accidental hosts of the virus: Diss. Kol’tsovo; 2021. (in Russian)
  26. Tyul’ko Zh.S., Yakimenko V.V. The nucleotide sequences variability of genomes of tick-borne encephalitis virus associated with their structure. Sibirskiy meditsinskiy zhurnal (Irkutsk). 2012; 111(4): 27–30. https://elibrary.ru/ozhwfv (in Russian)
  27. Huber R.G., Lim X.N., Ng W.C., Sim A.Y.L., Poh H.X., Shen Y., et al. Structure mapping of dengue and Zika viruses reveals functional long-range interactions. Nat. Commun. 2019; 10(1): 1408. https://doi.org/10.1038/s41467-019-09391-8
  28. Dethoff E.A., Boerneke M.A., Gokhale N.S., Muhire B.M., Martin D.P., Sacco M.T., et al. Pervasive tertiary structure in the dengue virus RNA genome. Proc. Natl Acad. Sci. USA. 2018; 115(45): 11513–8. https://doi.org/10.1073/pnas.1716689115
  29. Yakimenko V.V., Drokin D.A., Kalmin O.B., Bogdanov I.I., Ivanov D.I. On the issue of host power-the effect on the strain variability of the tick-borne encephalitis virus. Voprosy virusologii. 1996; 41(3): 112–7. (in Russian)
  30. Yakimenko V.V., Mal’kova M.G., Tyul’ko ZH.S., Tkachev S.E., Makenov M.T., Vasilenko A.G. Transmissible Viral Infections of Western Siberia (Regional Aspects of Epidemiology, Environmental Pathogens and Issues of Microevolution) [Transmissivnye virusnye infektsii Zapadnoi Sibiri (regional’nye aspekty epidemiologii, ekologii vozbuditelei i voprosy mikroevolyutsii)]. Omsk: KAN; 2019. https://elibrary.ru/qhcwds (in Russian)
  31. Agol V.I., Gmyl A.P. Emergency services of viral RNAs: repair and remodeling. Microbiol. Mol. Biol. Rev. 2018; 82(2): e00067-17. https://doi.org/10.1128/mmbr.00067-17
  32. Liu J., Liu Y., Shan C., Nunes B.T.D., Yun R., Haller S.L., et al. Role of mutational reversions and fitness restoration in Zika virus spread to the Americas. Nat. Commun. 2021; 12(1): 595. https://doi.org/10.1038/s41467-020-20747-3
  33. de Wispelaere M., Khou C., Frenkiel M.P., Desprès P., Pardigon N. A single amino acid substitution in the M protein attenuates Japanese encephalitis virus in mammalian hosts. J. Virol. 2015; 90(5): 2676–89. https://doi.org/10.1128/jvi.01176-15
  34. Li X.D., Shan C., Deng C.L., Ye H.Q., Shi P.Y., Yuan Z.M., et al. The interface between methyltransferase and polymerase of NS5 is essential for flavivirus replication. PLoS Negl. Trop. Dis. 2014; 8(5): e2891. https://doi.org/10.1371/journal.pntd.0002891
  35. Ghafari M., Simmonds P., Pybus O.G., Katzourakis A. A mechanistic evolutionary model explains the time-dependent pattern of substitution rates in viruses. Curr. Biol. 2021; 31(21): 4689–96.e5. https://doi.org/10.1016/j.cub.2021.08.020
  36. Duchêne S., Holmes E.C., Ho S.Y.W. Analyses of evolutionary dynamics in viruses are hindered by a time-dependent bias in rate estimates. Proc. Biol. Sci. 2014; 281(1786): 20140732. https://doi.org/10.1098/rspb.2014.0732

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Fig. 1. Phylogenetic tree constructed based on the coding part of the nucleotide sequence of OHF viruses. Bootstrap values are indicated for tree nodes. The sequences belong to the main subtypes of the OHF virus: OHFV-1, OHFV-2, OHFV-3.

Download (313KB)
3. Fig. 2. The number of different nucleotides when comparing the coding sequences of OHF viruses. The number of different nucleotides is indicated on the arrows in the diagram.

Download (132KB)
4. Fig. 3. Scatterplot for mRNA nucleotide sequences of the OHF viruses in space, where the coordinates along the horizontal axis are the values of the discriminant function f1, and along the vertical axis the values of the discriminant function f2, calculated for each viral nucleotide sequence. 0 ‒ sequences obtained from muskrat and sequences of the 0 passage in the body of a white mouse; 1п ‒sequences of the first passage in the body of a white mouse; 2п ‒sequences of the second passage in the body of a white mouse.

Download (75KB)
5. Fig. 4. Scatterplot for mRNA nucleotide sequences of the OHF viruses in space, where the coordinates along the horizontal axis are the values of the discriminant function f1, and along the vertical axis the values of the discriminant function f2, calculated for each viral nucleotide sequence 0 ‒ sequences obtained from muskrat; 0п ‒sequences of the 0 passage in the body of a white mouse; 1п ‒ sequences of the first passage in the body of a white mouse; 2п ‒ sequences of the second passage in the body of a white mouse; 3п ‒ sequences of the third passage in the body of a white mouse; 4+ ‒ sequences of the fourth and higher number of passages in the body of a white mouse; x ‒ sequences with an unknown number of passages.

Download (196KB)
6. Supplementary to the article
Download (483KB)

Copyright (c) 2024 Tyulko Z.S., Fadeev A.V., Vasilenko A.G., Gradoboeva E.A., Yakimenko V.V., Komissarov A.B.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № ФС77-77676 от 29.01.2020.


This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies