Анализ изменений в геноме вируса омской геморрагической лихорадки (Flaviviridae: Orthoflavivirus) при лабораторных практиках сохранения вируса
- Авторы: Тюлько Ж.С.1,2, Фадеев А.В.3, Василенко А.Г.1, Градобоева Е.А.1, Якименко В.В.1, Комиссаров А.Б.3
-
Учреждения:
- ФБУН «Омский научно-исследовательский институт природно-очаговых инфекций» Роспотребнадзора
- ФГБОУ ВО «Омский государственный медицинский университет» Минздрава России
- ФГБУ «Научно-исследовательский институт гриппа им. А.А. Смородинцева» Минздрава России
- Выпуск: Том 69, № 6 (2024)
- Страницы: 509-523
- Раздел: ОРИГИНАЛЬНЫЕ ИССЛЕДОВАНИЯ
- Дата подачи: 25.09.2024
- Дата публикации: 15.12.2024
- URL: https://virusjour.crie.ru/jour/article/view/16686
- DOI: https://doi.org/10.36233/0507-4088-266
- EDN: https://elibrary.ru/zfqkev
- ID: 16686
Цитировать
Полный текст
Аннотация
Введение. Омская геморрагическая лихорадка (ОГЛ) ‒ тяжелое заболевание, выявленное в России в 1940-х гг. в Западной Сибири. Вызывается вирусом ОГЛ, относящимся к роду Orthoflavivirus.
Цель работы. Анализ изменений в геноме, связанных с изоляцией штаммов вируса ОГЛ, на лабораторных животных (белых мышах).
Материалы и методы. Использованы полногеномные нуклеотидные последовательности штаммов вируса ОГЛ из рабочей коллекции лаборатории арбовирусных инфекций отдела ПОВИ ФБУН «Омский НИИ природно-очаговых инфекций» Роспотребнадзора, а также последовательности из GenBank. Оценку изменений в геноме вируса ОГЛ осуществляли при помощи методов дискриминантного анализа, анализируя состав и локализацию появляющихся точечных замен в последовательностях вирусной РНК, полученных при адаптации вирусов к организму мыши в результате пассирования. Связанные нуклеотидные замены выявляли при вычислении взаимной информации для каждой пары столбцов в массиве выровненных нуклеотидных последовательностей. При филогенетическом анализе применяли алгоритм нестрогих (ослабленных) часов программы BEAST.
Результаты. Показано, что точечные замены в случае пассирования в организме мыши возникают во всех частях генома вирусов ОГЛ. Причем многие из них входят в схему связанных замен, выявленную в геноме ОГЛ. Дискриминантный анализ различий в точечных нуклеотидных заменах для групп, объединяющих последовательности по числу пассажей, не позволяет надежно разделять последовательности, полученные из первичного материала (мозга ондатры), и последовательности первых пассажей, но хорошо распознает последовательности, прошедшие 7 и более пассажей, что предполагает возможность адаптивного отбора нуклеотидных замен при взаимодействии с организмом лабораторного хозяина ‒ белой мыши. Расчет средней скорости возникновения замен на сайт в год без учета возникновения адаптационных и связанных замен дает значение 10−5, что почти на порядок отличается от результата, учитывающего их наличие ‒ 10−4.
Заключение. Изменения в нуклеотидных последовательностях ОГЛ, которые возникают при лабораторных практиках сохранения вируса, могут влиять на определяемые значения скорости эволюции при анализе этих последовательностей и требуют дальнейшего изучения.
Полный текст
Введение
Омская геморрагическая лихорадка (ОГЛ) ‒ тяжелое заболевание, выявленное в России в 1940-х гг. в Западной Сибири [1]. Вызывается вирусом ОГЛ, относящимся к роду Orthoflavivirus (семейство Flaviviridae). В период эпизоотических вспышек в популяциях интродуцированного вида – ондатры (Ondatra zibethicus) ‒ вирус ОГЛ был выявлен более чем у 30 видов теплокровных животных. Источником инфекции для человека являются ондатра и иксодовые клещи (во все периоды эпидемической активности природных очагов ОГЛ преобладал нетрансмиссивный путь заражения, в том числе и в первый период регистрации активности вируса в 40–50-х гг. XX века). В эволюционной истории ОГЛ остаются вопросы. В частности, оценка даты происхождения и последующей дивергенции вируса ОГЛ имеет противоречивый характер. Так, время возникновения вируса оценивается по-разному – от 4,5 тыс. лет [2] до 50 лет [3]. Ранее [4] время происхождения вируса ОГЛ было отнесено к XIV веку, а периоды дивергенции вируса – к XVII, XIX и началу XX вв. Такой разброс этого показателя связан, прежде всего, с отсутствием возможности адекватного оценивания скорости накопления мутаций, в связи с чем вводятся искусственные условия, определяемые, как правило, точкой зрения автора.
При отсутствии возможности сравнения с предковыми формами, представляется целесообразным изучить и определить мутационные изменения в геноме, связанные с адаптацией вируса к разным системам (позвоночные – членистоногие, разные группы хозяев из числа позвоночных), и мутации, не связанные с адаптацией к разным организмам. В частности, нами предпринята попытка оценить изменения в геноме, связанные с изоляцией штаммов вируса на лабораторных животных (белых мышах). Предполагая ревертивный характер этих мутаций, мы попытались оценить сроки происхождения и дивергенции вируса ОГЛ на основании исключения из анализа мутаций этого типа, а также связанных с данными мутациями изменений в других областях генома. О наличии связанных замен в геноме ортофлавивирусов сообщалось ранее [5].
В настоящее время влияние различных ортофлавивирусов на организмы специфичных и случайных хозяев, и в частности, на клетки хозяина, изучено достаточно хорошо [6, 7]. Подобные исследования проводились как на лабораторных животных, так и в культурах клеток [6, 8]. Однако об особенностях адаптации большинства ортофлавивирусов к их резервуарным хозяевам известно намного меньше и совсем мало информации о влиянии на вирус его случайных хозяев. При взаимодействии флавивирусов с клетками инфицированного животного происходят многочисленные изменения в геноме вируса, которые могут затрагивать как кодирующую, так и некодирующую части генома [9‒13].
Цель работы ‒ анализ изменений в геноме, связанных с изоляцией штаммов вируса ОГЛ, на лабораторных животных (белых мышах).
Материалы и методы
Для первоначального изучения возможного влияния организма мыши на геном вируса ОГЛ проводили анализ нуклеотидных последовательностей вируса ОГЛ, полученных от инфицированных ондатр в 2007 г. в первичном материале от O. zibethicus (мозг – 3 последовательности); от инфицированных белых мышей (Mus musculus) при первичном заражении (мозг – 7; урина ‒ 1) и после первого (мозг – 9; урина – 1) и второго пассажей (мозг – 4) в процессе изоляции штаммов вируса ОГЛ (в табл. 1 эти последовательности представлены под номерами 22–46). Таким образом, оценку изменений в геноме вируса осуществляли на основе анализа состава и локализации в геноме вируса точечных мутаций в серии последовательностей, полученных из первичного материала от ондатр и (или) при изоляции возбудителя на этапах первичного заражения, первого и второго пассажей из органов, крови и (или) урины лабораторных животных (новорожденные белые мыши). После этого проводили расширенный анализ нуклеотидных замен с привлечением полноразмерных последовательностей вирусов ОГЛ, полученных в другие годы (табл. 1), для выявления возможной связи мутаций, возникающих при взаимодействии с организмом мыши, с типичной локализацией наиболее частых замен или наличием связанных замен в геноме ОГЛ.
Таблица 1. Происхождение анализируемых последовательностей
Table 1. Origin of analyzed sequences
№ | Код доступа | Accession number (VGARus и GenBank) | Обозначение на схемах Designation in figures | Год извлечения Year of isolation | Лабораторный хозяин (пассаж, орган) Laboratory host (passage, organ) |
1. | onii004151 | Oz-41_Br_9724_O_2000 | 2000 | Mus musculus (2, мозг | brain) |
2. | onii004143 | Oz-2_Br_10371_O_2001 | 2001 | Mus musculus (0, мозг | brain) |
3. | onii004170 | t-Balangul_O_1955 | 1955 | Mus musculus (‒, мозг | brain) |
4. | onii004156 | Mr-506_Br_11400_O_2003 | 2003 | Mus musculus (4, мозг | brain) |
5. | onii004155 | Oz_S20-10530_O_2000 | 2000 | Mus musculus (5, мозг | brain) |
6. | onii004167 | Hs_Bl-4-4710_N_1991 | 1991 | Mus musculus (1, мозг | brain) |
7. | onii004148 | Oz-32_Kd_10797_N_1991 | 1991 | Mus musculus (1, мозг | brain) |
8. | onii004146 | Oz-31_Kd_10866_N_1991 | 1991 | Mus musculus (3, мозг | brain) |
9. | onii004171 | Oz-40_Br_9725_O_1999 | 1999 | Mus musculus (2, мозг | brain) |
10. | onii004152 | Oz-58_Br_10469_O_2001 | 2001 | Mus musculus (1, мозг | brain) |
11. | onii004150 | Oz-39_Br_9723_O_2000 | 2000 | Mus musculus (2, мозг | brain) |
12. | onii004169 | t_Krutinkа_O_1973 | 1973 | Mus musculus (‒, мозг | brain) |
13. | onii004168 | Hs_B_Goloshubinа_O_1948 | 1948 | Mus musculus (‒, мозг | brain) |
14. | onii004153 | Oz-351-Ur-11707_O_2007 | 2007 | Mus musculus (1, мозг | brain) |
15. | onii004144 | Oz-3_Br_10360_O_2001 | 2001 | Mus musculus (0, мозг | brain) |
16. | onii004149 | Oz-37_Br_9721 | 2000 | Mus musculus (2, мозг | brain) |
17. | onii004154 | Oz_Br_8341_Kurgan_K_1972 | 1972 | Mus musculus (‒, мозг | brain) |
18. | onii004141 | Mo-1003_Br_5857-58_N_1991 | 1991 | Mus musculus (3, мозг | brain) |
19. | onii004142 | AS_G-26_5143_N_1991 | 1991 | Mus musculus (2, мозг | brain) |
20. | onii004147 | Oz_Br-32-2106_N_1989 | 1989 | Mus musculus (0, мозг | brain) |
21. | onii004145 | Oz-29_Br_2101_N_1991 | 1991 | Mus musculus (0, мозг | brain) |
22. | OL689381 | Oz_Bl-351/11704_O_2007 | 2007 | Mus musculus (1, урина | urine) |
23. | OL689372 | Oz_Bl-352/13981_O_2007 | 2007 | Mus musculus (1, мозг | brain) |
24. | OL689373 | Oz_Br-352/11656_O_2007 | 2007 | Mus musculus (0, мозг | brain) |
25. | OL689383 | Oz_Br-352/352_O_2007 | 2007 | Первичный материал | Primary sample |
26. | OL689379 | Oz_Br-353-0/11661_O_2007 | 2007 | Mus musculus (0, мозг | brain) |
27. | OL689380 | Oz_Br-353-1/13973_O_2007 | 2007 | Mus musculus (1, мозг | brain) |
28. | OL689378 | Oz_Ur-353/13965_O_2007 | 2007 | Mus musculus (3, мозг | brain) |
29. | OL689387 | Oz_Br-354/354_O_2007 | 2007 | Первичный материал | Primary sample |
30. | OL689388 | Oz_Br-354/11662_O_2007 | 2007 | Mus musculus (0, мозг | brain) |
31. | OL689366 | Oz_Br-356-1/13959_O_2007 | 2007 | Mus musculus (1, мозг | brain) |
32. | OL689367 | Oz_Br-356-2/13971_O_2007 | 2007 | Mus musculus (2, мозг | brain) |
33. | OL689376 | Oz_Br-356-1/13969_O_2007 | 2007 | Mus musculus (1, мозг | brain) |
34. | OL689377 | Oz_Br-356-2/13964_O_2007 | 2007 | Mus musculus (2, мозг | brain) |
35. | OL689368 | Oz_Br-356-0/13957_O_2007 | 2007 | Mus musculus (0, мозг | brain) |
36. | OL689374 | Oz_Ur-356-0/13977_O_2007 | 2007 | Mus musculus (0, мозг | brain) |
37. | OL689375 | Oz_Ur-356-1/13980_O_2007 | 2007 | Mus musculus (1, мозг | brain) |
38. | OL689365 | Oz_Liv-356-1/13955_O_2007 | 2007 | Mus musculus (0, мозг | brain) |
39. | OL689364 | Oz_Liv-356-0/13967_O_2007 | 2007 | Mus musculus (1, мозг | brain) |
40. | OL689386 | Oz_Ur-359/13965_O_2007 | 2007 | Mus musculus (0, мозг | brain) |
41. | OL689384 | Oz_Br-361/361_O_2007 | 2007 | Первичный материал | Primary sample |
42. | OL689385 | Oz_Br-361/13948_O_2007 | 2007 | Mus musculus (2, мозг | brain) |
43. | OL689370 | Oz_Liv-362/13943_O_2007 | 2007 | Mus musculus (1, мозг | brain) |
44. | OL689371 | Oz_Liv-362/13952_O_2007 | 2007 | Mus musculus (1, мозг | brain) |
45. | OL689369 | Oz_Kid-362/13944_O_2007 | 2007 | Mus musculus (1, мозг | brain) |
46. | OL689382 | Oz_Ur-353/13977_O_2007 | 2007 | Mus musculus (0, мозг | brain) |
47. | MT354615 | Oz_P-15/2213_N_1990 | 1990 | Mus musculus (1, мозг | brain) |
48. | MT354618 | Oz_M-19/5099_N_1991 | 1991 | Mus musculus (5, мозг | brain) |
49. | MT354622 | Oz_B-41/9687_O_2000 | 2000 | Mus musculus (1, мозг | brain) |
50. | MT354623 | Oz_B-37/9866_O_1999 | 1999 | Mus musculus (1, мозг | brain) |
51. | MT354624 | Oz_B-30/10146_N_1990 | 1990 | Mus musculus (1, мозг | brain) |
52. | MT354626 | Mo_pr.1007/10817_N_1991 | 1991 | Mus musculus (4, мозг | brain) |
53. | MT354627 | Oz_362Bl/362Bl_O_2007 | 2007 | Первичный материал | Primary sample |
54. | MT354628 | Oz_42M/9722_O_1999 | 1999 | Mus musculus (2, мозг | brain) |
55. | MT354629 | Oz_17N/11153_O_2002 | 2002 | Mus musculus (7, мозг | brain) |
56. | MT354620 | m_G17/10783_N_1991 | 1991 | Mus musculus (1, мозг | brain) |
57. | MT354621 | Oz_Veselovka-753/11084_N_1963 | 1963 | Mus musculus (‒, мозг | brain) |
58. | MT354625 | Oz_Br-1/10186_K_1992 | 1992 | Mus musculus (3, мозг | brain) |
59. | MT354616 | OZ-97/11285_O_2004 | 2004 | Mus musculus (0, мозг | brain) |
60. | MT354617 | OZ-96/11293_O_2004 | 2004 | Mus musculus (0, мозг | brain) |
61. | MT354619 | t_Kabyrdak-39/10944_O_1962 | 1962 | Mus musculus (‒, мозг | brain) |
62. | MT354614 | t_Bogolubovka/1048_O_1948 | 1948 | Mus musculus (‒, мозг | brain) |
Примечание. В таблице представлены обозначения (3-й столбец), использующиеся при построении деревьев. В начале обозначения содержится указание на организм из которого получен вирус: OZ ‒ Ondatra zibethicus, HS ‒ Homo sapiens, AS ‒ Aedes subdiversus, MO ‒ Microtus oeconomus, t ‒ клещи, m ‒ комар; далее, если есть информация, указан орган из которого произошло извлечение биоматериала: Bl ‒ кровь, Br ‒ мозг, Liv ‒ печень, Kid ‒ почки, Ur ‒ урина; следующим идет буквенно-цифровое обозначение изолята; обозначение области, где был получен вирус: N ‒ Новосибирская, O ‒ Омская, К ‒ Курганская; год получения первичного материала, из которого получены штаммы вируса или вирусная РНК. Коды доступа последовательностей, размещенных на платформе VGARus (https://www.crie.ru/about/aggregation/vgarus.php), расположены в строках таблицы под номерами с 1 по 21; в строках таблицы под номерами с 22 по 62 расположены коды доступа последовательностей, размещенных в GenBank.
Note. The table presents the names (3rd column) used in constructing trees. The name begins with an indication of the organism from which the virus was isolated: OZ ‒ Ondatra zibethicus, HS ‒ Homo sapiens, AS ‒ Aedes subdiversus, MO ‒ Microtus oeconomus, t ‒ ticks, m ‒ mosquito; then, if information is available, the organ from which the biomaterial was extracted is indicated: Bl ‒ blood, Br ‒ brain, Liv ‒ liver, Kid ‒ kidneys, Ur ‒ urine; next comes the alphanumeric name of the isolate; the name of the region where the virus was isolated: N ‒ Novosibirsk, O ‒ Omsk, K ‒ Kurgan; the year of receipt of the primary material from which the virus strains or viral RNA were obtained. Access codes for sequences placed on the VGARus platform (https://www.crie.ru/about/aggregation/vgarus.php) are located in the table rows under numbers 1 through 21; access codes for sequences placed in GenBank are located in the table rows under numbers 22 through 62.
Всего в исследовании были использованы нуклеотидные последовательности геномов штаммов вируса ОГЛ (полногеномные последовательности 62 штаммов) из рабочей коллекции лаборатории арбовирусных инфекций отдела ПОВИ ФБУН «Омский НИИ природно-очаговых инфекций» Роспотребнадзора (табл. 1). Рабочая коллекция включает штаммы периодов эпидемической и эпизоотической активности природных очагов ОГЛ и межэпидемических периодов, начиная с 1946 г., когда вирус был описан как самостоятельная нозологическая форма [14]. Штаммы вируса были изолированы в Новосибирской, Омской и Курганской областях от разных источников возбудителя. Кроме штамма «Боголюбовка» (Bogolubovka), остальные штаммы были изолированы сотрудниками института в разные периоды времени. В анализе также использовали 9 последовательностей вируса ОГЛ, имеющих свободный доступ в GenBank (в скобках – обозначение на рисунках): AB507800 (HS_B_Guriev_AB507800_O_1948), OP037815 (HS_B_Guriev_OP037815_O_1948), MW847419 (Oz_Nikitina_ MW847419), MT350781 (Nikitina_ MT350781), AY193805 (t_Bogoluvovska_ AY193805), NC_005062 (t_Bogoluvovska_NC_005062), AY438626 (Hs_B_Kubrin_1947), AY323489 (Bogolubovka), OP292291(OZ_MO-1007_O_2004).
Из 62 полноразмерных последовательностей вируса ОГЛ (табл. 1) 3 были взяты из мозга ондатр, погибших во время эпизоотии (декабрь 2007 г., Омская область, Тюкалинский – Крутинский районы, оз. Салтаим-Тенис). Остальные представляют собой РНК вируса из мозга или урины (один образец) белых мышей, полученную при изоляции штаммов вируса методом биопробы в разные периоды эпидемической и эпизоотической активности природных очагов ОГЛ. Источник, время и место изоляции штаммов отражены в табл. 1.
Изоляцию вируса проводили на сосунках (2‒3 сут от рождения) беспородных белых мышей, путем интрацеребрального заражения 10% суспензией первичного материала (органов, крови и (или) урины павших ондатр) или (в дальнейшем, при проведении пассажей, мозга белых мышей с клиническими признаками заболевания). В качестве источника РНК вируса ОГЛ использовали 10% суспензию мозга ондатр (первичный материал) или (и) сосунков белых мышей с клиническими признаками заболевания от первичного заражения (0 пассаж) и последующих пассажей.
Образцы органов для выделения РНК гомогенизировались и представляли собой суспензию на среде 199, образцы урины не подвергали предварительной обработке. Выделение РНК проводили из 130 мкл суспензии и полного объема урины на колонках Qiagen QIAamp Viral RNA Mini (Qiagen, Нидерланды). Далее проводили полногеномную амплификацию с «БиоМастер ОТ-ПЦР-Премиум (2Ч)» (Биолабмикс, Новосибирск) по протоколу 45° ‒ 30 мин; 93° ‒ 5 мин; 93° ‒ 10 с, 56° ‒ 30 с, 68° ‒ 2 мин 30 сек (45 циклов); 68° ‒ 7 мин. Последовательности использованных праймеров указаны в таблице S1, находящейся в дополнительном файле.
Для проведения амплификации праймеры были сгруппированы в два пула ‒ пары 1, 3, 5, 7, 9, 11 и пары 2, 4, 6, 8, 10, 12. В реакцию брали 5 мкл выделенной РНК, 2,5 мкл пула праймеров в концентрации 10 пмоль/мкл и 17,5 мкл ОТ-ПЦР смеси. Результаты оценивали по кривой плавления с SYBR Green и, дополнительно, методом электрофореза в агарозном геле.
Для пробоподготовки к секвенированию Oxford Nanopore использовали наборы реагентов Ligation Sequencing kit 1D (SQK-LSK109) и Native Barcoding Expansion 1-96 (EXP-NBD196) (Oxford Nanopore Technologies, Великобритания). Секвенирование проводили на приборе Oxford Nanopore MinION c проточной ячейкой R9.4.1 (Oxford Nanopore Technologies, Великобритания) согласно рекомендациям производителя.
Подготовку библиотек для секвенирования Illumina осуществляли с использованием набора реагентов Illumina DNA Prep и IDT for Illumina DNA UD Indexes (Illumina, США). Секвенирование проводили на приборе Illumina MiSeq (Illumina, США) с использованием набора MiSeq Reagent Kit v3 600-cycle (Illumina, США) согласно инструкции производителя. Для получения сборки консенсусных последовательностей из данных секвенирования Illumina использовали программы BWA-MEM [15], SAMtools [16] и iVar [17].
Для получения консенсусных последовательностей из данных секвенирования Oxford Nanopore применяли программы Minimap2 [18], SAMtools, iVar, Medaka [https://github.com/nanoporetech/medaka] и BCFtools [19]. Полученные консенсусные последовательности были депонированы в международной базе данных NCBI GenBank с кодами доступа, приведенными в табл. 1.
Полученные полноразмерные нуклеотидные последовательности ОГЛ выравнивали с использованием программы Clustal, с помощью которой было рассчитано филогенетическое дерево (метод BOOTSTRAP N-J TREE). Для построения дерева была добавлена нуклеотидная последовательность вируса клещевого энцефалита (ВКЭ) сибирского подтипа с кодом доступа JN003209 (Irkutsk-12).
Далее в выравнивании определяли координаты столбцов, в которых регистрировалось наличие замен. Содержимое этих столбцов анализировали при помощи методов дискриминантного анализа как значения категориальных переменных, а каждую последовательность рассматривали как объект, который описывается этими категориальными переменными (тип нуклеотидов). Дискриминантный анализ позволяет изучать различия между несколькими группами объектов (в нашем случае между группами нуклеотидных последовательностей) по значениям числовых или нечисловых переменных, описывающих объекты (в нашем случае значения каждой нечисловой переменной соответствуют типам нуклеотидов в столбце выровненных последовательностей) [20], а также интерпретировать межгрупповые различия и определять вклад каждой переменной при классификации объектов. После проведения анализа строили диаграммы рассеяния значений дискриминантных функций, рассчитанных для каждой кодирующей последовательности ОГЛ. По оси абсцисс на диаграммах рассеяния отложены значения дискриминантной функции f1, по оси ординат ‒ f2 для каждой последовательности, представленной точкой на этих диаграммах. Анализ проводили с помощью модуля «Общие модели дискриминантного анализа» (general discriminant analysis) программы Statistica 6.0.
Столбцы, в которых регистрировалось наличие замен, т.е. наличие различающихся нуклеотидов в одном и том же столбце в массиве выровненных последовательностей, также сравнивали между собой для выявления наличия связанных замен при помощи подсчета взаимной информации для каждой пары столбцов [21].
Координаты, соответствующие выявленным связанным заменам, сравнивали с координатами замен, важных для межгрупповых различий, которые были выявлены при проведении дискриминантного анализа. Полученную схему сопоставляли с известными описаниями замен из доступных литературных источников, возникающих при адаптации ВКЭ к разным хозяевам и тканям.
При дальнейшем проведении филогенетического анализа применяли алгоритм нестрогих (ослабленных) часов (relaxed molecular clock/uncorrelated lognormal) программы BEAST и программы MCMC Tree в пакете PAML [22], использующих байесовские методы для оценки времени дивергенции.
При оценке скорости возникновения мутаций создавали 30 выборок, в каждой из которых осуществляли 20 млн реализаций цепи Маркова, с шагом в 1000 эти деревья записывали в лог-файл, из рассмотрения исключали первые 10% генерируемых деревьев (параметр «burn in percentage»), а также шел отбор деревьев при помощи «marginal likelihood estimators». Отобранные эволюционные деревья максимальной достоверности клады суммировали с помощью подпрограммы TreeAnnotator v. 2.7.6. По полученному дереву вычисляли итоговые оценки скорости возникновения мутаций.
Авторы подтверждают соблюдение институциональных и национальных стандартов по использованию лабораторных животных в соответствии с Consensus author guidelines for animal use (IAVES 23.07.2010). Протокол исследования одобрен Этическим комитетом организации ФБУН «Омский НИИ природно-очаговых инфекций» Роспотребнадзора (Протокол № 5 от 10.11.2021).
Результаты
Филогенетический анализ
Сравнение полноразмерных нуклеотидных последовательностей ОГЛ показывает разделение их на 3 основных подтипа (рис. 1), различие которых друг от друга находится в пределах 10‒11% и соответствует данным, полученным ранее по меньшим выборкам или гену Е [4, 23, 24].
Рис. 1. Филогенетическое дерево, построенное по кодирующей части нуклеотидной последовательности вирусов ОГЛ.
В узлах указаны значения бутстреп-поддержки. Указана принадлежность последовательностей к основным подтипам вируса ОГЛ: OHFV-1, OHFV-2, OHFV-3.
Fig. 1. Phylogenetic tree constructed based on the coding part of the nucleotide sequence of OHF viruses. Bootstrap values are indicated for tree nodes.
The sequences belong to the main subtypes of the OHF virus: OHFV-1, OHFV-2, OHFV-3.
При этом не наблюдали явной связи между количеством различающихся нуклеотидов в последовательностях и годом или местом их извлечения, что затрудняет получение эволюционной временно́й шкалы для вируса ОГЛ. Кроме того, по дереву на рис. 1 нельзя однозначно утверждать, что наличие этих различий связано с адаптацией к организму того хозяина, из которого был извлечен биоматериал, возможно из-за недостаточного количества последовательностей, полученных не от O. zibethicus. Отличия всех подтипов от ближайшего вида ортофлавивирусов (ВКЭ) составляет 20%.
Анализ замен, наблюдаемых в последовательностях вирусной РНК, полученной из первичного материала от Ondatra zibethicus
Нуклеотидные последовательности OL689387, OL689384, OL689383 получены из первичного материала (мозг ондатр, погибших во время эпизоотии в декабре 2007 г.). Их нуклеотидные последовательности различались незначительно: OL689383 и OL689387 – 5 замен, OL689384 и OL689387 – 41 замена, OL689383 и OL689384 – 42 замены. Синонимичные и несинонимичные замены локализовались в разных частях генома и во всех генах, кодирующих вирусные белки. Число аминокислотных замен при сравнении: OL689383 и OL689387 – 1 замена, OL689384 и OL689387 – 13 замен, OL689383 и OL689384 – 14 замен.
К сожалению, не удалось отследить непрерывную цепочку изменений, которые могут возникать при пассировании вирусов от первичного материала к последующим пассажам, т.к. отсутствовали либо последовательности из первичного материала, либо из первичного заражения, либо определенные пассажи.
В связи с этим было проведено сравнение количества различий в последовательностях, полученных из первичного материала, и имеющихся последовательностей, полученных из организма мыши после их заражения, от этого первичного материала. При этом было обнаружено, что пассирование вируса в организме мыши может приводить к некоторому уменьшению числа различий между пассированными последовательностями по сравнению с последовательностями из первичного материала, от которых они были получены (рис. 2).
Рис. 2. Количество различающихся нуклеотидов при сравнении кодирующих последовательностей вирусов ОГЛ.
Количество различающихся нуклеотидов указано на стрелках схемы.
Fig. 2. The number of different nucleotides when comparing the coding sequences of OHF viruses.
The number of different nucleotides is indicated on the arrows in the diagram.
Замены, которые возникли при пассировании в организме мыши у вирусов Oz_Br-354/11661_O_2007 и Oz_Br-352/11656_O_2007, являются синонимичными и возникли в сайтах с номерами (5814, 6208, 9201) и (894, 7341, 9477) соответственно.
У вируса Oz_Br-361/13948_O_2007 замены оказались несинонимичными и расположены в сайтах с номерами 9478 и 9482.
Общий анализ замен, возникающих при пассировании в организме мыши
Оценку изменений в геноме вируса ОГЛ осуществляли, анализируя состав и локализацию появляющихся точечных замен в вирусной РНК последовательностей, полученных при адаптации вирусов к организму мыши (в табл. 1 номера 22‒46). В результате было показано, что точечные замены возникают во всех частях генома: в генах, кодирующих как структурные, так и неструктурные белки. Всего было выявлено 253 сайта, в которых возникли мутации. Большинство этих мутаций являлись синонимичными, только 41 сайт из 253 содержал несинонимичные мутации (табл. 2).
Таблица 2. Сайты, в которых возникли мутации (значения координат отложены от первого нуклеотида выровненных кодирующих последовательностей вирусов)
Table 2. Sites where mutations occurred (coordinate values are plotted from the first nucleotide of the aligned viral coding sequences)
Ген Gene | Координата Coordinate | Нуклеотидная замена Nucleotide substitution | Аминокислотная замена Amino acid substitution |
M | 617 | С↔T | S↔L |
761 | C↔T | T↔I | |
Е | 894 | C↔T | ‒ |
1657 | T↔C | ‒ | |
2145 | G↔A | ‒ | |
2298 | A↔G | ‒ | |
NS1 | 2457 | C↔T | ‒ |
2544 | A↔C | ‒ | |
3046 | T↔G | S↔A | |
NS2a | 3546 | T↔G | H↔Q |
3690 | A↔G | ‒ | |
NS2b | 4257 | T↔C | ‒ |
4485 | T↔C | ‒ | |
NS3 | 5118 | T↔C | ‒ |
5814 | T↔C | ‒ | |
5816 | C↔G | T↔R | |
5946 | T↔A | ‒ | |
6208 | T↔C | ‒ | |
NS4b | 7341 | C↔T | ‒ |
Полимераза Polymerase | 8148 | G↔A | ‒ |
8379 | T↔C | ‒ | |
8388 | C↔G | ‒ | |
8695 | T↔C | C↔R | |
8823 | A↔T | ‒ | |
8890 | C↔T | H↔Y | |
9106 | T↔C | ‒ | |
9201 | C↔T | ‒ | |
9477 | A↔G | ‒ | |
9486 | A↔C | Q↔H | |
9786 | G↔A | ‒ | |
10027 | A↔G | S↔G | |
10110 | A↔G | ‒ | |
10125 | T↔C | ‒ | |
10240 | T↔C | ‒ |
Примечание. Указаны сайты, в которых у 4 и более последовательностей возникли мутации при адаптации к организму мыши. В колонке «аминокислотная замена» ставится прочерк, если замена является синонимичной. Подчеркиванием выделены сайты, которые задействованы в схеме связанных нуклеотидных замен. Координаты сайтов задавались от первого нуклеотида кодирующей последовательности с кодом доступа OL689365 в GenBank. Тип замен в столбцах «нуклеотидная замена» и «аминокислотная замена» указан в виде: «A↔G», где первая буква соответствует последовательности OL689365, а вторая ‒ имеющемуся варианту в других последовательностях.
Note. The sites are indicated where mutations occurred in four or more sequences during adaptation to the mouse organism. A dash is put in the “amino acid substitution” column if the substitution is synonymous. The sites that are involved in the pattern of linked nucleotide substitutions are highlighted with underlining. The coordinates of the sites are specified according the coding region of the reference sequence (GenBank accession number OL689365). The type of substitutions in the “nucleotide substitution” and “amino acid substitution” columns is indicated as: “A↔G”, where the first letter corresponds to the OL689365 sequence, and the second ‒ to the variant present in other sequences.
Для проверки предположения о возможном влиянии процесса адаптации генома вируса ОГЛ к организму хозяина был проведен дискриминантный анализ для полученных 25 полноразмерных нуклеотидных последовательностей мРНК ОГЛ (в табл. 1 номера 22‒46).
Дискриминантный анализ различий в точечных нуклеотидных заменах для групп, объединяющих последовательности по типу органов, из которых они были получены от ондатр (1-я группа – почки и урина, 2-я группа ‒ мозг, 3-я группа – кровь), не показал значимых различий между ними.
Проведенный дискриминантный анализ точечных замен при разбиении всех последовательностей на 3 группы (0 ‒ последовательности, полученные из первичного материала от ондатры и после первичного заражения мыши (0 пассаж); 1п ‒ после первого пассажа в организме белой мыши; 2п ‒ после второго пассажа в организме белой мыши) выявил значимые отличия (уровень значимости p ≤ 15%), между последовательностями, полученными от ондатры, и последовательностями второго пассажа на белой мыши из этих же линий (рис. 3). При этом качество дискриминации довольно низкое и допускает случаи неправильной классификации последовательностей, т.к. отдельные последовательности далеко отстоят от центроидов своих групп и попадают в область перекрывания всех трех групп, что соответствует случаю ошибочной классификации (рис. 3). Как видно на рис. 3, главный вклад в дискриминацию вносит функция f1, использование функции f2 не дало значимых результатов. В этой связи были рассмотрены также различия двух составных групп: в 1-й группе объединены последовательности, полученные из первичного материала (мозг павших от ОГЛ ондатр) и из мозга зараженных белых мышей при первичном заражении; во 2-й группе ‒ последовательности из мозга зараженных белых мышей на первом и втором пассажах в процессе изоляции штаммов вируса. В этом случае дискриминация заметно улучшается (уровень значимости p ≤ 5%) и число случаев неправильной классификации последовательностей становится меньше.
Рис. 3. Диаграмма рассеяния для нуклеотидных последовательностей мРНК вируса ОГЛ в пространстве первой (f1) и второй (f2) дискриминантных функций
0 ‒ последовательности, полученные из первичного материала от ондатры и после первичного заражения мыши (0 пассаж); 1п ‒ последовательности первого пассажа в организме белой мыши; 2п ‒ последовательности второго пассажа в организме белой мыши.
Fig. 3. Scatterplot for mRNA nucleotide sequences of the OHF viruses in space, where the coordinates along the horizontal axis are the values of the discriminant function f1, and along the vertical axis the values of the discriminant function f2, calculated for each viral nucleotide sequence.
0 ‒ sequences obtained from muskrat and sequences of the 0 passage in the body of a white mouse; 1п ‒sequences of the first passage in the body of a white mouse; 2п ‒sequences of the second passage in the body of a white mouse.
Для проверки предположения о влиянии количества пассажей на возникновение изменений в геноме ОГЛ был проведен дополнительный анализ всех нуклеотидных последовательностей ОГЛ, для которых имелись данные о количестве пассажей (табл. 1). Для последовательностей t-Balangul_O_1955, t_Krutinka_O_1973, Hs_B_Goloshubina_O_1948, Oz_Br_8341_Kurgan_K_1972, Oz_Veselovka-753/11084_N_1963, t_Kabyrdak-39/10944_O_1962, t_Bogolubovka/1048_O_1948 предполагалось количество пассажей, намного большее, чем указано в табл. 1, далее на схемах эта группа обозначается символом «х».
По результатам дискриминантного анализа видно (рис. 4), что начиная с 7-го пассажа (Oz_17N/11153_O_2002) изменения в нуклеотидных последовательностях ОГЛ становятся настолько значительными, что классифицируемые последовательности можно выделять в отдельные группы. Причем последовательности t-Balangul_O_1955, Hs_B_Goloshubina_O_1948, Oz_Br_8341_Kurgan_K_1972, Oz_Veselovka-753/11084_N_1963, t_Kabyrdak-39/10944_O_1962, t_Bogolubovka/1048_O_1948 занимают на схеме практически одно положение, хотя принадлежат к разным кластерам филогенетического дерева. Это предположительно может означать закрепление в их геноме схожих нуклеотидных замен в ходе длительного пассирования. Как видно на рис. 4, главный вклад в дискриминацию вносит функция f1.
Рис. 4. Диаграмма рассеяния для нуклеотидных последовательностей мРНК вируса ОГЛ в пространстве первой (f1) и второй (f2) дискриминантных функций
0 ‒ последовательности, полученные из первичного материала от ондатры; 0п ‒ последовательности нулевого пассажа в организме белой мыши; 1п ‒ последовательности первого пассажа в организме белой мыши; 2п ‒ последовательности второго пассажа в организме белой мыши; 3п ‒ последовательности третьего пассажа в организме белой мыши; 4+ ‒ последовательности четвертого и большего количества пассажей в организме белой мыши; х ‒ последовательности с неизвестным числом пассажей.
Fig. 4. Scatterplot for mRNA nucleotide sequences of the OHF viruses in space, where the coordinates along the horizontal axis are the values of the discriminant function f1, and along the vertical axis the values of the discriminant function f2, calculated for each viral nucleotide sequence
0 ‒ sequences obtained from muskrat; 0п ‒sequences of the 0 passage in the body of a white mouse; 1п ‒ sequences of the first passage in the body of a white mouse; 2п ‒ sequences of the second passage in the body of a white mouse; 3п ‒ sequences of the third passage in the body of a white mouse; 4+ ‒ sequences of the fourth and higher number of passages in the body of a white mouse; x ‒ sequences with an unknown number of passages.
Функция f2 и остальные дискриминантные функции не позволяют провести надежную дискриминацию последовательностей (группы последовательностей сильно перекрываются).
Был проведен также дискриминантный анализ последовательностей отдельно по структурным и неструктурным генам. При этом менялись расстояния между отдельными последовательностями, но общая картина сохранялась аналогичной рис. 4.
Это позволяет предположить наличие положительного отбора, который проявляется при пассировании, ведущего к накоплению мутаций вдоль всей кодирующей последовательности в процессе адаптации к новому хозяину.
Возможно, что обнаруженные замены и их местоположение не являются типичными при адаптации к любому новому хозяину и отличаются для разных хозяев, что требует дальнейшего исследования. Ранее уже было показано на примере ВКЭ, что вновь возникающие мутации не являются единственно необходимыми для адаптации к той или иной клеточной системе и могут встречаться в единичных случаях [25].
Кроме того, для ВКЭ и некоторых других ортофлавивирусов было показано, что разные варианты последовательностей сосуществуют в одном организме-хозяине как квазивиды, разные по численности [9]. И нуклеотидные изменения, выявленные в полногеномных последовательностях новых вариантов, присутствуют наряду с нуклеотидной последовательностью, несущей особенности родительского штамма («дикий тип» вируса), т.е. ортофлавивирус вероятно существует в организме любого хозяина в виде гетерогенной популяции, содержащей варианты вируса, предварительно адаптированные к размножению в различных средах, что способствует выживанию вируса в организмах клещей и млекопитающих. Возможно, то же справедливо и для вируса ОГЛ.
Выявление связанных замен
Обнаружено наличие связанных замен, возникающих в геноме ОГЛ, продемонстрированное ранее для других ортофлавивирусов [26], но не выявленное прежде у вирусов ОГЛ из-за недостаточного количества полноразмерных нуклеотидных последовательностей. Для этого подсчитывали значение взаимной информации [21] для каждой пары столбцов в массиве всех выровненных полноразмерных кодирующих последовательностей ОГЛ (к 62 последовательностям из табл. 1 были добавлены 9 последовательностей из GenBank, упомянутых в разделе «Материалы и методы»), по которому определяли сходство при возникновении нуклеотидных замен в этих позициях.
Большинство связанных замен у ОГЛ выявляется в последовательностях, кодирующих неструктурные вирусные белки, так же как и у других ортофлавивирусов [5]. Некоторые из мутаций, входящие в систему связанных замен у вируса ОГЛ, по своему местоположению в геноме соответствуют аналогичной схеме связанных замен, наблюдаемой у ВКЭ, но бо́льшая их часть (> 60%) в эту схему не укладывается. Нами обнаружены 93 сайта, в которых возникают значимые связанные замены. Из них 49 сайтов в кодирующей части нуклеотидной последовательности вируса ОГЛ со следующими координатами от начала кодирующей последовательности: 591, 601, 621, 634, 668, 780, 1020, 1242, 1489, 2466, 2604, 2751, 2847, 2904, 2988, 3065, 3072, 3123, 3189, 3847, 4113, 4251, 4548, 4851, 4884, 4911, 4998, 5034, 5145, 5229, 5364, 5712, 5838, 5880, 6048, 6174, 6384, 6546, 6618, 7383, 7500, 7554, 7638, 8133, 8154, 8238, 8427, 8997, 9850 н, ‒ являются своеобразными «узловыми точками», каждой из которых соответствует более 10 случаев связанных замен в других сайтах. При этом значимые связи при возникновении замен наблюдали между удаленными друг от друга частями генома, и наибольшее количество таких точек соответствовало предполагаемым однонитевым участкам шпилечных структур вирусной РНК и местам возникновения синонимичных замен.
Выявленные случаи связанных замен предположительно могут быть объяснены наличием вторичных и третичных взаимодействий в вирусной РНК. Такие взаимодействия между вторичными структурами РНК в некодирующих участках генома ортофлавивирусов были описаны при циклизации вирусного генома, необходимой для репликации. Есть также свидетельства, что определенные вторичные и третичные структуры РНК, способные к «дальнодействующим взаимодействиям РНК-РНК», могут находиться в кодирующих областях ортофлавивирусных геномов [5, 27, 28], образуя при этом сложные трехмерные структуры. Каким образом эти элементы влияют на приспособленность вируса, в настоящее время неизвестно. Однако имеются экспериментальные данные, которые показывают, что удаленные взаимодействия > 500 н между частями РНК более характерны для РНК ортофлавивирусов, находящейся в вирионе, чем для вирусной РНК, находящейся в клетке [27], что предполагает или разрушение вирусных структур внутри клеток, или их необходимость для упаковки внутри нуклеокапсида. Последнее предположение подкрепляется полученными ранее сведениями о наличии связанных замен в кодирующей части сегментированного генома хантавирусов, локализующихся в разных сегментах [21].
Оценка скорости возникновения мутаций
При расчете скорости возникновения мутаций у ОГЛ по всем имеющимся полноразмерным кодирующим последовательностям вируса были получены значения, укладывающиеся в интервал от 1,3 × 10−4 до 5,8 × 10−4 замен на сайт в год. Была рассчитана также скорость возникновения мутаций для последовательностей ОГЛ, у которых из массива анализируемых замен исключены замены, возникающие в процессе пассирования (координаты этих замен указаны в табл. 2). Полученные значения скорости возникновения мутаций были ожидаемо ниже ‒ от 1,5 × 10−5 до 8,6 × 10−5. Структура филогенетического дерева при этом осталась такой же, как на рис. 1, лишь незначительно увеличилась длина ветвей внутри кластера OHFV-1 (деревья приведены на рис. S1 и S2 в дополнительном файле).
Обсуждение
Предположения о наличии селективных изменений при пассировании арбовирусов через организм теплокровных (лабораторных белых мышей) и членистоногих (иксодовых клещей) подтверждаются не только по данным анализа возникающих нуклеотидных замен, но и по изменениям характера гибридизации вирусной РНК со специфическими зондами в реакции молекулярной гибридизации нуклеиновых кислот [29, 30]. Эти изменения касались вариабельных участков структурных геном, кодирующих капсидный белок (С), поверхностные белки (Pr-M и M), а также области неструктурного гена NS1, кодирующего белок, функционально связанный со сборкой нуклеокапсида. Изменение характера гибридизации регистрировалось на уровне 5‒6-го и (или) 9-го и (или) после 11 последовательных пассажей через организм белых мышей (путем интрацеребрального заражения). При заражении иксодовых клещей материалом от последнего (15-го) пассажа изменение характера гибридизации наиболее регулярно затрагивало область, кодирующую поверхностные белки (ген М).
Учет факторов, влияющих на оценку скорости накопления замен в геноме ОГЛ, может вызвать затруднения из-за ограниченности информации об их влиянии. Репликация РНК-вирусов сопровождается случайным возникновением мутаций из-за низкой точности их РНК-зависимых РНК-полимераз (RdRP) и отсутствия механизмов исправления ошибок у отдельных вирусов. Причем повышение точности репликации может привести к потере приспособленности из-за предотвращения накопления адаптивных мутаций [31]. Отбор наиболее жизнеспособных РНК идет уже на уровне гетерогенной популяции вируса и направляется условиями взаимодействия вирусной РНК как с вирусными белками, так и с организмом хозяина. Эти процессы возникновения мутаций и отбора определяют скорость накопления изменений в геноме вируса и влияют на оценку длительности процессов эволюции в вирусной популяции. Процессы отбора также могут приводить к ревертированию возникших замен, как синонимичных, так и несинонимичных, если это повышает приспособленность вируса. Пример подобного процесса показан для флавируса Зика [32], у которого выявлены 4 мутации, произошедшие незадолго до эпидемического появления вируса Зика в Америке и являющиеся реверсиями предыдущих мутаций, которые сопровождали более раннее распространение вируса из Африки в Азию и раннюю циркуляцию в этих регионах. Первоначальные мутации снижали приспособленность к передаче вируса, в то время как реверсии ее восстановили, увеличив риск эпидемии. При отсутствии у исследователя азиатских вариантов вируса, анализ скорости эволюции показал бы меньшие значения, чем при их наличии. Таким образом, наличие невыявленной реверсии может влиять на оценки скорости эволюции РНК вирусов.
Кроме того, приспособительный отбор у ортофлавивирусов, которые в большинстве являются арбовирусами, в организме разных хозяев может приводить к неодинаковым результатам отбора мутаций, как это было показано на примере вируса японского энцефалита [33]. Здесь единственная мутация в белке М приводила к тому, что вирус терял способность образовывать инфекционные частицы в клетках млекопитающих, но сохранял ее в клетках насекомых. Подобные адаптационные изменения (например, к лабораторным животным), которые могли бы быть элиминированы отбором в случае нахождения вируса в природных условиях, сохранятся и также могут повлиять на оценки скорости эволюции вирусов.
Влияние процессов адаптации к организму хозяина и процессов возникновения ревертивных мутаций на оценку скорости эволюции вирусной РНК может быть даже более значительным, чем это предполагается, если мы учтем наличие связанных с ними замен в геноме ортофлавивирусов, поскольку отбор должен затрагивать и их. Для некоторых ортофлавивирусов были показаны возможности как ревертирования замен, возникающих при адаптации к хозяину, так и возникновения компенсаторных замен в удаленных частях генома [33, 34]. Таким образом, нарушениям, вызванным нуклеотидными заменами, можно противодействовать либо реверсиями, либо компенсаторными мутациями другого сайта [31].
В этой связи нами была сделана попытка оценить влияние адаптивных замен на расчетные значения скорости накопления замен в геноме вируса. Среднюю скорость возникновения замен в кодирующей части генома ОГЛ оценивали с использованием модели нестрогих часов (расслабленные часы, Relaxed clock). Первоначальная оценка количества замен в кодирующей части генома при анализе всего массива имеющихся последовательностей (71 последовательность) имела значение около 10−4 замен на сайт в год.
В этом и ранее проводимых анализах скорости накопления замен не учитывали как возможность наличия адаптивных замен в ходе изоляции штаммов вируса (все анализы ранее проводили исключительно с РНК штаммов вируса ОГЛ), так и возможность реверсии этих изменений при возвращении в исходную систему (к дикому типу). Тем более не учитывали наличие связанных замен в геноме.
Если считать замены, возникающие в процессе пассирования, случайными и ревертируемыми и исключить их из массива анализируемых замен у всех последовательностей (координаты исключаемых замен указаны в табл. 2), то полученная оценка количества замен кодирующей части генома имеет значение близкое к 10−5 замен на сайт в год.
Таким образом, при анализе средней скорости возникновения замен без учета адаптационных и связанных замен было получено значение, почти на порядок отличающееся от результата, учитывающего их наличие. Это согласуется с вариативностью оценок скоростей эволюции у различных вирусов, полученных на разных по длительности временны́х отрезках [35, 36]. Исключая сайты, в которых возникают адаптивные замены, которые с высокой вероятностью могут быть ревертируемыми, можно учесть эффекты насыщения, появляющиеся в процессе эволюции, при отсутствии информации об изменчивости вирусов в процессе длительного наблюдения.
Возможно, различные адаптивные изменения в нуклеотидных последовательностях ОГЛ, которые возникают при лабораторных практиках сохранения вируса, влияют на определяемые значения скорости эволюции при анализе этих последовательностей, чем и объясняется значительный разброс в ее оценках, полученный разными авторами по последовательности кодирующего белка Е: 10−5‒10−4 замен на сайт в год [4], 1,56 ± 0,29 × 10−4 [24], а также по полноразмерным кодирующим последовательностям: 9,1 × 10−5–1,8 × 10−4 [23]. Такой разброс данных способствует возникновению противоречий при воссоздании эволюционной истории вируса ОГЛ. Считают, что вирусы ОГЛ и ВКЭ имели общего предка, но при попытке определить возможную дату их разделения, авторы сильно расходятся во мнениях. Так, S.Y. Kovalev и E.A. Mazurina [3] предполагают, что вирус ОГЛ произошел непосредственно от дальневосточного подтипа ВКЭ за счет быстрой смены хозяина при переходе от Ixodes persulcatus к O. zibethicus в XX в. при переселении ондатры на территорию Западной Сибири, в то время как другие авторы оценивают возраст этого события в 1000 лет и более [4].
Заключение
Для генома вируса ОГЛ, как и других представителей ортофлавивирусов, характерно наличие связанных замен.
При изоляции штаммов вируса ОГЛ методом биопробы определяются изменения в структуре генома вируса, выражающиеся в возникновении нуклеотидных замен (как синонимичных, так и несинонимичных), которые затрагивают гены, кодирующие как структурные, так и неструктурные белки.
Дискриминантный анализ различий в точечных нуклеотидных заменах для групп, объединяющих последовательности по типу органов, из которых они были получены от ондатр (1-я группа – почки и урина, 2-я группа – мозг, 3-я группа – кровь), не показал значимых различий между ними.
Дискриминантный анализ различий в точечных нуклеотидных заменах для групп, объединяющих последовательности по числу пассажей, не позволяет надежно разделять последовательности из первичного материала и последовательности первых пассажей, но хорошо распознает последовательности, прошедшие 7 и более пассажей, что предполагает возможность адаптивного отбора нуклеотидных замен при взаимодействии с организмом лабораторного хозяина ‒ белой мыши.
Анализ имеющейся 71 полноразмерной последовательности позволил оценить скорость возникновения замен как 10−4 замены на сайт в год. Если считать замены, возникающие в процессе пассирования случайными и ревертируемыми и исключить их из массива анализируемых замен у всех последовательностей, то полученная оценка скорости возникновения замен в кодирующей части генома ОГЛ имеет значение близкое к 10−5 замен на сайт в год.
С учетом вероятности ревертивных изменений в геноме вируса ОГЛ, происходящих при адаптации вируса к организму лабораторных животных, и наличия связанных замен в геноме вируса, оценка скорости возникновения мутаций имеет значение, близкое к 10−5 замен на сайт в год, что соответствует времени дивергенции с предковой формой более 1500 лет.
Об авторах
Жанна Сергеевна Тюлько
ФБУН «Омский научно-исследовательский институт природно-очаговых инфекций» Роспотребнадзора; ФГБОУ ВО «Омский государственный медицинский университет» Минздрава России
Автор, ответственный за переписку.
Email: tjs@omsk-osma.ru
ORCID iD: 0000-0001-8536-0520
старший научный сотрудник ФБУН «Омский научно-исследовательский институт природно-очаговых инфекций» Роспотребнадзора; доцент кафедры физики, математики, медицинской информатики ФГБОУ ВО «Омский государственный медицинский университет» Минздрава России
Россия, Омск; ОмскАртем Викторович Фадеев
ФГБУ «Научно-исследовательский институт гриппа им. А.А. Смородинцева» Минздрава России
Email: afadeew@gmail.com
ORCID iD: 0000-0003-3558-3261
старший научный сотрудник
Россия, Санкт-ПетербургАлексей Геннадьевич Василенко
ФБУН «Омский научно-исследовательский институт природно-очаговых инфекций» Роспотребнадзора
Email: Vasilenko_AG@oniipi.org
ORCID iD: 0000-0002-2754-6359
научный сотрудник, врач-эпидемиолог
Россия, ОмскЕкатерина Алексеевна Градобоева
ФБУН «Омский научно-исследовательский институт природно-очаговых инфекций» Роспотребнадзора
Email: Gradoboeva_EA@oniipi.org
ORCID iD: 0000-0002-2046-9872
младший научный сотрудник
Россия, ОмскВалерий Викторович Якименко
ФБУН «Омский научно-исследовательский институт природно-очаговых инфекций» Роспотребнадзора
Email: vyakimenko78@yandex.ru
ORCID iD: 0000-0001-9088-3668
заведующий лабораторией
Россия, ОмскАндрей Борисович Комиссаров
ФГБУ «Научно-исследовательский институт гриппа им. А.А. Смородинцева» Минздрава России
Email: a.b.komissarov@gmail.com
ORCID iD: 0000-0003-1733-1255
заведующий лабораторией
Россия, Санкт-ПетербургСписок литературы
- Рудаков Н.В., Ястребов В.К., Якименко В.В. Эпидемиология омской геморрагической лихорадки. Эпидемиология и вакцинопрофилактика. 2015; 14(1): 39–48. https://elibrary.ru/tkcfxf
- Heinze D.M., Gould E.A., Forrester N.L. Revisiting the clinal concept of evolution and dispersal for the tick-borne flaviviruses by using phylogenetic and biogeographic analyses. J. Virol. 2012; 86(16): 8663–71. https://doi.org/10.1128/jvi.01013-12
- Kovalev S.Y., Mazurina E.A. Omsk hemorrhagic fever virus is a tick-borne encephalitis virus adapted to muskrat through host-jumping. J. Med. Virol. 2022; 94(6): 2510–8. https://doi.org/10.1002/jmv.27581
- Karan L.S., Ciccozzi M., Yakimenko V.V., Lo Presti A., Cella E., Zehender G., et al. The deduced evolution history of Omsk hemorrhagic fever virus. J. Med. Virol. 2014; 86(7): 1181–7. https://doi.org/10.1002/jmv.23856
- Тюлько Ж.С., Якименко В.В. Возникновение связанных нуклеотидных замен в геноме ВКЭ, определяется структурой вирусного генома и является результатом действия адаптационных механизмов. Национальные приоритеты России. 2016; (4): 103–8. https://elibrary.ru/yhxelz
- Ляпунова Н.А., Хаснатинов М.А., Данчинова Г.А. Аутэкологические аспекты ко-адаптации ВКЭ и позвоночных хозяев – экспериментальный подход. В кн.: Войников В.К., ред. Механизмы адаптации микроорганизмов к различным условиям среды обитания: Тезисы Всероссийской научной конференции с международным участием. Иркутск; 2019: 122–5. https://elibrary.ru/rqxawq
- Gritsun T.S., Lashkevich V.A., Gould E.A. Tick-borne encephalitis. Antiviral Res. 2003; 57(1-2): 129–46. https://doi.org/10.1016/s0166-3542(02)00206-1
- Tonteri E., Kipar A., Voutilainen L., Vene S., Vaheri A., Vapalahti O., et al. The three subtypes of tick-borne encephalitis virus induce encephalitis in a natural host, the bank vole (Myodes glareolus). PLoS One. 2013; 8(12): e81214. https://doi.org/10.1371/journal.pone.0081214
- Helmová R., Honig V., Tykalová H., Palus M., Bell-Sakyi L., Grubhoffer L. Tick-borne encephalitis virus adaptation in different host environments and existence of quasispecies. Viruses. 2020; 12(8): 902. https://doi.org/10.3390/v12080902
- Li Y., Wang D., Du X. Adaptive genetic diversifications among tick-borne encephalitis virus subtypes: A genome-wide perspective. Virology. 2019; 530: 32–8. https://doi.org/10.1016/j.virol.2019.02.006
- Simón D., Fajardo A., Sóñora M., Delfraro A., Musto H. Host influence in the genomic composition of flaviviruses: A multivariate approach. Biochem. Biophys. Res. Commun. 2017; 492(4): 572–8. https://doi.org/10.1016/j.bbrc.2017.06.088
- Villordo S.M., Carballeda J.M., Filomatori C.V., Gamarnik A.V. RNA structure duplications and flavivirus host adaptation. Trends Microbiol. 2016; 24(4): 270–83. https://doi.org/10.1016/j.tim.2016.01.002
- Yang J., Jing X., Yi W., Li X.D., Yao C., Zhang B., et al. Crystal structure of a tick-borne flavivirus RNA-dependent RNA polymerase suggests a host adaptation hotspot in RNA viruses. Nucleic Acids Res. 2021; 49(3): 1567–80. https://doi.org/10.1093/nar/gkaa1250
- Чумаков М.П., Беляева А.П., Гагарина А.В., Славина Н.С. Выделение и изучение штаммов возбудителя омской геморрагической лихорадки. В кн.: Эндемические вирусные инфекции (геморрагические лихорадки): Труды института полиомиелита и вирусных энцефалитов АМН СССР. Том 7. М.; 1965: 327–44.
- Li H. Aligning Sequence Reads, Clone Sequences and Assembly Contigs with BWA-MEM. arXiv. 2013; arXiv:13033997[q-bio.GN]. https://doi.org/10.48550/arXiv.1303.3997
- Li H., Handsaker B., Wysoker A., Fennell T., Ruan J., Homer N. et al. The Sequence alignment/map (SAM) format and SAMtools. Bioinformatics. 2009; 25(16): 2078–9. https://doi.org/10.1093/bioinformatics/btp352
- Grubaugh N.D., Gangavarapu K., Quick J., Matteson N.L., De Jesus J.G., Main B.J., et al. An amplicon-based sequencing framework for accurately measuring intrahost virus diversity using PrimalSeq and iVar. Genome Biol. 2019; 20(1): 8. https://doi.org/10.1186/s13059-018-1618-7
- Li H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 2018; 34(18): 3094–100. https://doi.org/10.1093/bioinformatics/bty191
- Li H. A statistical framework for SNP calling, mutation discovery, association mapping and population genetical parameter estimation from sequencing data. Bioinformatics. 2011; 27(21): 2987–93. https://doi.org/10.1093/bioinformatics/btr509
- Халафян А.А. Учебник STATISTIKA 6. Статистический анализ данных. М.: Бином; 2007.
- Тюлько Ж.С., Якименко В.В. Связанные замены в малом сегменте генома хантавирусов старого света. Вопросы вирусологии. 2008; 53(3): 28–34. https://elibrary.ru/jscbxv
- Yang Z. PAML4: phylogenetic analysis by maximum likelihood. Mol. Biol. Evol. 2007; 24(8): 1586–91. https://doi.org/10.1093/molbev/msm088
- Bondaryuk A.N., Belykh O.I., Andaev E.I., Bukin Y.S. Inferring evolutionary timescale of Omsk hemorrhagic fever virus. Viruses. 2023; 15(7): 1576. https://doi.org/10.3390/v15071576
- Kovalev S.Y., Mazurina E.A., Yakimenko V.V. Molecular variability and genetic structure of Omsk hemorrhagic fever virus, based on analysis of the complete genome sequences. Ticks Tick Borne Dis. 2021; 12(2): 101627. https://doi.org/10.1016/j.ttbdis.2020.101627
- Ляпунова Н.А. Особенности репродукции вируса клещевого энцефалита в перевиваемых линиях клеток диких млекопитающих – резервуарных и случайных хозяев вируса: Автореф. дисс. ... канд. биол. наук. Кольцово; 2021.
- Тюлько Ж.С., Якименко В.В. Вариабельность нуклеотидных последовательностей геномов вируса клещевого энцефалита, связанная с их структурой. Сибирский медицинский журнал (Иркутск). 2012; 111(4): 27–30. https://elibrary.ru/ozhwfv
- Huber R.G., Lim X.N., Ng W.C., Sim A.Y.L., Poh H.X., Shen Y., et al. Structure mapping of dengue and Zika viruses reveals functional long-range interactions. Nat. Commun. 2019; 10(1): 1408. https://doi.org/10.1038/s41467-019-09391-8
- Dethoff E.A., Boerneke M.A., Gokhale N.S., Muhire B.M., Martin D.P., Sacco M.T., et al. Pervasive tertiary structure in the dengue virus RNA genome. Proc. Natl Acad. Sci. USA. 2018; 115(45): 11513–8. https://doi.org/10.1073/pnas.1716689115
- Якименко В.В., Дрокин Д.А., Калмин О.Б., Богданов И.И., Иванов Д.И. К вопросу о влиянии host-эффекта на штаммовую изменчивость вируса клещевого энцефалита. Вопросы вирусологии. 1996; 41(3): 112–7.
- Якименко В.В., Малькова М.Г., Тюлько Ж.С., Ткачев С.Е., Макенов М.Т., Василенко А.Г. Трансмиссивные вирусные инфекции Западной Сибири (региональные аспекты эпидемиологии, экологии возбудителей и вопросы микроэволюции). Омск: КАН; 2019. https://elibrary.ru/qhcwds
- Agol V.I., Gmyl A.P. Emergency services of viral RNAs: repair and remodeling. Microbiol. Mol. Biol. Rev. 2018; 82(2): e00067-17. https://doi.org/10.1128/mmbr.00067-17
- Liu J., Liu Y., Shan C., Nunes B.T.D., Yun R., Haller S.L., et al. Role of mutational reversions and fitness restoration in Zika virus spread to the Americas. Nat. Commun. 2021; 12(1): 595. https://doi.org/10.1038/s41467-020-20747-3
- de Wispelaere M., Khou C., Frenkiel M.P., Desprès P., Pardigon N. A single amino acid substitution in the M protein attenuates Japanese encephalitis virus in mammalian hosts. J. Virol. 2015; 90(5): 2676–89. https://doi.org/10.1128/jvi.01176-15
- Li X.D., Shan C., Deng C.L., Ye H.Q., Shi P.Y., Yuan Z.M., et al. The interface between methyltransferase and polymerase of NS5 is essential for flavivirus replication. PLoS Negl. Trop. Dis. 2014; 8(5): e2891. https://doi.org/10.1371/journal.pntd.0002891
- Ghafari M., Simmonds P., Pybus O.G., Katzourakis A. A mechanistic evolutionary model explains the time-dependent pattern of substitution rates in viruses. Curr. Biol. 2021; 31(21): 4689–96.e5. https://doi.org/10.1016/j.cub.2021.08.020
- Duchêne S., Holmes E.C., Ho S.Y.W. Analyses of evolutionary dynamics in viruses are hindered by a time-dependent bias in rate estimates. Proc. Biol. Sci. 2014; 281(1786): 20140732. https://doi.org/10.1098/rspb.2014.0732