29 апреля, 2024

SolusNews.com

Последние новости

Meta утверждает, что создала модель фолдинга белков нового поколения • The Register

Meta утверждает, что создала модель фолдинга белков нового поколения • The Register

Исследователи искусственного интеллекта из Meta говорят, что они разработали крупнейшую на сегодняшний день модель сворачивания белков, которая способна предсказывать структуру более 600 миллионов белков.

команда грудь Модель, основанная на адаптере ESM-2 из 15 миллиардов вариантов и базе данных для прогнозов структуры белка, получившей название Атлас Метагеномный ESM, Вторник. Эта база данных включает изоформы белков, которые ученые еще не наблюдали.

Белки представляют собой сложные биологические молекулы, содержащие до 20 видов аминокислот, и выполняют в живых организмах все виды биологических функций. Важно отметить, что они складываются в сложные трехмерные структуры, и их форма жизненно важна для их функционирования; Знание того, как оно выглядит, помогает ученым понять, как оно работает, и, исходя из этого, найти способы имитировать, изменить или противодействовать этому поведению.

К сожалению, нельзя просто взять аминокислотный состав и сразу работать над конечной структурой. Вы можете запускать симуляции или экспериментировать, чтобы выяснить это, но это займет много времени. В наши дни вы можете предоставить специально обученное программное обеспечение для машинного обучения для изучения химической структуры белка, и модель будет быстро и относительно точно предсказывать структуру.

На самом деле, DeepMind многое показал со своей моделью AlphaFold, которая выиграть — выиграть Международный двухгодичный конкурс CASP по складыванию белков в 2020 году. Благодаря входной цепочке аминокислот AlphaFold и другое программное обеспечение для машинного обучения могут генерировать соответствующую трехмерную структуру.

С тех пор исследователи из лондонской компании DeepMind усовершенствовали свою систему, чтобы гордость Науке известна структура более 200 миллионов белков. Последняя система ESM от Meta пошла еще дальше, предсказывая сотни миллионов после обучения на миллионах белковых последовательностей.

Предварительный документ команды Meta — Лин и др. — объясняющий конструкцию ESM-2. можно найти здесь. Интересно, согласно Исследователи, система на самом деле представляет собой большую лингвистическую модель, которая предназначена «для изучения эволюционных закономерностей и создания точных сквозных структурных предсказаний непосредственно из белковых последовательностей». AlphaFold, например, не является модельным языком и использует другой подход.

READ  Из-за сбоя в работе останавливаются Steam, Newegg, PlayStation Network и многие другие

Как отмечает Боффин в своей статье, эти большие языковые модели можно использовать не только для работы с человеческими языками: «Современные языковые модели с десятками и сотнями миллиардов параметров развивают такие возможности, как быстрый языковой перевод, логические рассуждения и математика. , Решение проблем Все без явного контроля.

«Эти наблюдения повышают вероятность появления параллельной формы лингвистических моделей, обученных последовательностям белков».

Результатом стал ESM-2, который, несмотря на лингвистическую модель, был обучен предсказывать физическую форму белка по текстовой строке, представляющей аминокислоты.

ESM-2 — самая крупная модель в своем роде, очевидно предсказывающая структуры быстрее, чем аналогичные системы; По данным Meta, это до 60 раз быстрее, чем последние предыдущие системы, такие как AlphaFold или Rosetta, которым может потребоваться более десяти минут для создания вывода.

Модель смогла создать Метагеномный атлас ESM и предсказала более 600 миллионов структур из MGnify90 База данных белков всего за две недели работает на 2000 графических процессорах. На одном графическом процессоре Nvidia V100 для имитации белка, состоящего из 384 аминокислот, требуется всего 14,2 секунды. Из исследовательской работы следует, что Meta заявила, что ее система в основном, но не полностью, соответствует AlphaFold с точки зрения точности, хотя ее скорость является ключевым моментом, позволяющим ей предсказывать больше белков.

«С использованием современных вычислительных инструментов прогнозирование структуры сотен миллионов белковых цепей в практические сроки может занять годы, даже с использованием ресурсов крупного исследовательского учреждения. Чтобы делать прогнозы на уровне метагеномики, прорыв в скорости прогнозирования имеет решающее значение», — сказал владелец Facebook.

Мета надеется, что ESM-2 и метагеномный атлас ESM будут способствовать развитию науки, помогая ученым изучать историю эволюции или бороться с болезнями и изменением климата. «Чтобы еще больше расширить эту работу, мы изучаем, как лингвистические модели можно использовать для разработки новых белков и содействия решению проблем в области здоровья, болезней и окружающей среды», — заключил Пиз. ®

READ  Посмотрите на видео прототип Porsche 911 ST Heritage, горящий на Нюрбургринге.