Loading...

Credit: FutureHouse

Американская компания FutureHouse представила новую модель искусственного интеллекта под названием ether0, уже открытую для пользователей. Она разработана специально для науки, а точнее — для генерации формул и реакций в химии. Главное отличие ether0 от других ИИ — она умеет рассуждать и показывать ход своих мыслей, а не просто выдавать готовый ответ. В будущем такие модели позволят автоматизировать научный процесс и ускорить разработку новых материалов и лекарств, сообщает Nature.

Обычные большие языковые модели хорошо справляются с текстами и могут решать научные задачи. Они учатся на учебниках, книгах и статьях по теме, но этого не хватает для полноценного участия искусственного интеллекта в исследованиях.

Американские ученые из стартапа FutureHouse решили разработать модель ИИ, которая будет автоматизировать процесс поиска лекарств и выполнения других задач в химии. Для этого они выбрали относительно небольшую языковую архитектуру от французской компании Mistral AI — она примерно в 25 раз меньше другой ИИ-модели DeepSeek-R1 и может управляться с ноутбука.

Главное отличие новой модели в том, что она обучена не на чтении книг, а на экзаменах. Ученые собрали результаты лабораторных исследований по химии из 45 научных работ и преобразовали их в 577 790 вопросов, поддающихся проверке. Чтобы научить модель думать, авторы заставили ее читать чужие ошибки и рассуждения — цепочки шагов, сгенерированные DeepSeek-R1. Затем команда объединила логические цепочки, повторно их проверила и объединила в финальную версию модели, получившей название ether0. Модель уже доступна для всех пользователей с открытым исходным кодом.

По словам авторов, ether0 превосходит передовые модели GPT-4.1 и DeepSeek-R1 практически по всем параметрам до двух раз. Нейросеть может генерировать решения в виде молекулярных формул и реакций, подобных лекарственным средствам. ether0 отслеживает ход своих мыслей и показывает его пользователю, таким образом лучше отвечая на вопросы, которые требуют сложных рассуждений. Некоторые исследователи уже опробовали модель, находящуюся в открытом доступе, — она успешно понимает молекулярные структуры, ранее ей не встречавшиеся, и изменяет их формулу под нужные условия.

В ходе обучения модели ученые обнаружили, что если дать ей «думать» дольше, то ответы будут точнее, но запутаннее. Команда решила поставить в приоритет интерпретируемость данных, а не их точность, ограничив время на рассуждения. Это решение может повлиять на качество данных ether0, но, по словам авторов, модель останется эффективным «научным калькулятором».

В будущем компания планирует автоматизировать подготовку научного исследования от начала и до конца и выйти за рамки химии. Это позволит ускорить разработку новых материалов, лекарств и технологий и дать людям возможность сосредоточиться на другой задаче — выбирать, какими исследовательскими вопросами им заниматься.


Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram, Одноклассники.