Loading...
Логический тип данных — наиболее примитивный в информатике. Он может принимать всего два значения — ноль или единица, правда или ложь, да или нет. Такой тип данных на самом деле может часто встречаться в различных сферах, например в биологии. Даже экспрессию гена можно описать с помощью логического типа данных: «вкл», если экспрессия высокая, «выкл», если ген практически не экспрессируется или заглушен полностью. Сейчас для обучения машин работе с логическими данными используется подход REVEAL, который смешивает разные источники информации. Он характеризуется вычислительной сложностью и высокими затратами на машинное обучение. К тому же для анализа данных ученым приходится избавляться от шума. Кроме того, REVEAL не подходит для решения количественных биологических задач, в которых нужен поиск причинно-следственных связей.
Американские ученые разработали новый подход, который назвали булевой оптимальной энтропией причин и следствий. В этом случае при машинном обучении постепенно сужается число возможных правильных решений задачи. Такой метод отлично подходит для диагностики болезней. Он может превратить диагностический процесс в дерево решений, состоящие из закрытых вопросов: есть ли у пациента тошнота? жар? боль в конечностях? Помимо диагностики, многие научные, причем необязательно биологические, задачи можно свести к подобным схемам.
Чтобы проверить работу подхода, ученые проанализировали 958 возможных конечных конфигураций доски в крестиках-ноликах. Затем доску и игровые ходы выразили с помощью математических выражений и дали машине задачу: предсказать, какой из игроков победит. Также ученые проверили метод, использовав набор изображений, полученных с помощью МРТ сердца. Система в 80% случаев смогла выдать правильный диагноз, проанализировав снимки. Это говорит о том, что новый подход весьма эффективен.
Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram.
Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram, Одноклассники.