Loading...

СПбГУ

Российские биоинформатики в соавторстве с исследователями со всего мира помогли открыть более 130 тыс. новых вирусов в публичных базах геномных данных. Научная статья о проделанной работе опубликована в журнале Nature, а в проекте участвовали эксперты из Центра биоинформатики и алгоритмической биотехнологии СПбГУ, Института Пастера (Франция), Университета Британской Колумбии (Канада), Калифорнийского университета в Беркли (США), Гейдельбергского института теоретических исследований (Германия).

Исследователи полагают, что в природе есть триллионы вирусов, которые пока не открыты, но скрываются в геномах других организмов. Многие из них могут быть не опасны для человека, поражая иные организмы (например, бактерии). Однако некоторые из них могут быть потенциально патогенными и способны спровоцировать новую пандемию. Именно поэтому так важно изучение вирусов.

Ученые создали платформу Serratus, которая предназначена для работы с информацией в облаке и содержит ряд компьютерных инструментов для операций с ней. Необходимость создания такой платформы объясняется тем, что биоинформатики работают в сфере петабайтной геномики. Они проанализировали 16 петабайт геномных последовательностей, а один петабайт равен квадриллиону (1015) байт. Инструменты, которые есть на платформе Serratus, помогли отобрать среди этого массива данных последовательности, относящиеся к РНК-вирусам. Благодаря этому объем информации был сокращен до гигабайтов. Обработка таких данных уже легче для современных вычислительных мощностей. Российские биоинформатики были ответственны за разработку сборщика coronaSPAdes. Эта программа позволяет «пересобрать» вирусные последовательности РНК. В результате исследования ученые открыли более 130 тыс. новых РНК-вирусов. Число известных РНК-вирусов таким образом увеличилось почти в десять раз.

Среди изучаемых данных исследователи не всегда могли выделить полные геномы вирусов, и им удавалось получить только фрагменты последовательностей. Тем не менее даже в таких условиях ученые смогли успешно построить филогенетические деревья вирусов, показав их связи между собой. Так, они открыли около 250 гигантских вирусов, паразитирующих на бактериях и похожих на вирусы, которые ранее выделялись из водорослей. Исследователи обнаружили родственников этих вирусов у жителя Бангладеш, а также у кошек и собак из Великобритании.

«Созданный на данный момент общедоступный репозиторий разработанных инструментов и уже полученных результатов таит в себе множество новых открытий, особенно с учетом того, что количество облачных общедоступных последовательностей ДНК и РНК растет экспоненциально изо дня в день. Мы бы хотели идентифицировать к концу десятилетия более 100 миллионов РНК-вирусов», — поделился планами Дмитрий Мелешко из Центра биоинформатики и алгоритмической биотехнологии СПбГУ.


Подписывайтесь на InScience.News в социальных сетях: ВКонтактеTelegramFacebook и Twitter.


Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram, Одноклассники.