Loading...

tq tally/Flickr/PxHere

Американские ученые использовали модель машинного обучения для прогнозирования успешности и влияния научных публикаций. В отличие от стандартных методов оценки, опирающихся в основном только на цитирование, новый способ учитывает и другие факторы. Статья опубликована в журнале Nature Biotechnology.

Ученые из Массачусетского технологического института использовали машинное обучение для прогнозирования влияния научных публикаций. Модель определяет 5% лучших статей, опубликованных за любой год, и может дополнить существующие библиографические системы, которые полагаются в основном только на показатели, использующие цитирование статей.

Методы машинного обучения позволяют использовать и другие аспекты, связанные с результатами исследований, чтобы определить влияние опубликованной работы. Авторы пришли к выводу, что алгоритм машинного обучения, используемый для ранжирования важности веб-страниц, может быть применен к результатам исследования. Новая модель получила название DELPHI, при ее обучении авторы использовали 1 687 850 уникальных статей, опубликованных в период с 1980 по 2019 год. В итоге получился набор из 29 характеристик, относящихся к статье, автору и журналу в период от года до пяти лет после публикации. Затем характеристики каждой статьи использовались для обучения алгоритма.

После обучения модель смогла правильно определить 19 из 20 основополагающих биотехнологий 1980 — 2014 годов. Кроме того, алгоритм предсказал, что в 2018 году будет опубликовано 50 статей из 42 журналов, связанных с биотехнологией, которые в будущем войдут в топ-5%. Эти статьи могут быть использованы для определения направления финансирования. Однако ученые считают, что для оценки эффективности подхода в областях, не относящихся к биотехнологиям, еще потребуется дальнейшее тестирование.


Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram, Одноклассники.