28 апреля, 2024

SolusNews.com

Последние новости

Мозговой штурм с ботом | Мираж Новости

Мозговой штурм с ботом |  Мираж Новости

Исследователь только что закончил писать научную статью. Она знает, что ее работа может выиграть с другой точки зрения. Я что-то упустил из виду? Или, может быть, у ее исследований есть применение, о котором она не подумала. Было бы здорово иметь вторую пару глаз, но даже самые дружелюбные сотрудники могут не найти время, чтобы прочитать все важные сообщения, необходимые для того, чтобы наверстать упущенное.

Кевин Йегер— Лидер Группа электронных наноматериалов в Центр функциональных наноматериалов (CFN), Центр научных пользователей Министерства энергетики в Брукхейвенской национальной лаборатории Министерства энергетики. Как недавние достижения в области искусственного интеллекта (ИИ) и машинного обучения (МО) могут помочь в научном мозговом штурме и мышлении. Чтобы добиться этого, он разработал чат-бота, хорошо разбирающегося в тех видах науки, которыми он занимался.

Быстрый прогресс в области искусственного интеллекта и машинного обучения уступил место программному обеспечению, способному генерировать креативный текст и полезный код. Эти чат-боты общего назначения недавно захватили воображение общественности. Существующим чат-ботам, основанным на больших и разнообразных языковых моделях, не хватает детальных знаний о научных субдоменах. Используя преимущества метода поиска документов, робот Ягера обладает опытом в области науки о наноматериалах, которого нет у других роботов. Недавно были опубликованы подробности этого проекта и то, какую пользу другие ученые могут получить от этого коллеги по искусственному интеллекту в своей работе. Цифровое открытие.

Расцвет роботов

«CFN уже давно ищет новые способы использования искусственного интеллекта и машинного обучения для ускорения открытия наноматериалов. Теперь это нам быстро помогает. Идентификация, индексирование и отбор образцов, Автоматизируйте экспериментыконтрольно-измерительное оборудование и Откройте для себя новые материалы. Эстер Цаймир в Группа электронных наноматериалов В CFN это Разработка компаньона с искусственным интеллектом Чтобы ускорить исследовательские испытания материалов в Национальный источник синхротронного света II (NSLS-II)». NSLS-II — это еще один объект для пользователей Управления науки Министерства энергетики США в Брукхейвенской лаборатории.

READ  PS5 и PS4 потеряют опционы X Share 13 ноября

В CFN было проведено много работы в области искусственного интеллекта/машинного обучения, которое может помочь в экспериментах за счет использования автоматизации, средств управления, робототехники и анализа, но наличие программного обеспечения, способного манипулировать научным текстом, было тем, что исследователи не исследовали глубоко. Способность быстро документировать, понимать и передавать информацию об опыте может помочь во многих отношениях: от преодоления языковых барьеров до экономии времени за счет обобщения более крупных фрагментов работы.

Следи за языком

Для создания специализированного чат-бота программному обеспечению требуется скрипт, специфичный для предметной области, язык, взятый из областей, на которых бот стремится сосредоточиться. В данном случае текст представляет собой научные публикации. Текст, специфичный для предметной области, помогает модели ИИ понимать новые термины и определения и знакомит его с ведущими научными концепциями. Самое главное, что этот тщательно подобранный набор документов позволяет модели ИИ обосновывать свои рассуждения, используя надежные факты.

Чтобы имитировать естественный человеческий язык, модели ИИ обучаются на существующем тексте, что позволяет им изучать структуру языка, запоминать различные факты и развивать примитивный тип мышления. Вместо кропотливого переобучения модели ИИ на текстах по нанонауке, Ягер предоставил ей возможность искать соответствующую информацию в тщательно подобранной коллекции публикаций. Предоставить ему библиотеку соответствующих данных было только половиной дела. Чтобы использовать этот текст точно и эффективно, боту понадобится способ декодировать правильный контекст.

«Общая проблема с языковыми моделями заключается в том, что они иногда галлюцинируют звуки, которые правдоподобны, но не соответствуют действительности», — объяснил Джагер. «Это была фундаментальная проблема, которую нужно было решить для чат-бота, используемого для исследований, а не для того, кто делал что-то вроде написания стихов. Мы не хотели, чтобы он придумывал факты или цитаты. Эту проблему нужно было решить. Решение этой проблемы было тем, что мы называем «встраивание»» «Это способ быстро классифицировать и связать информацию за кулисами».

READ  Pokemon Brilliant Diamond и Shiny Pearl просочились рано

Встраивание — это процесс преобразования слов и фраз в числовые значения. Полученный «вектор внедрения» определяет смысл текста. Когда пользователь задает вопрос чат-боту, он также отправляется в модель внедрения машинного обучения для расчета ее векторного значения. Этот вектор используется для поиска в заранее рассчитанной базе данных текстовых фрагментов из включенных аналогичным образом научных статей. Затем бот использует фрагменты текста, которые, по его мнению, лингвистически связаны с вопросом, чтобы получить более полное понимание контекста.

Запрос пользователя и фрагменты текста объединяются в «подсказку», которая отправляется в большую языковую модель — расширенную программу, генерирующую текст, смоделированный по образцу естественного человеческого языка, который генерирует окончательный ответ. Встраивание гарантирует, что извлекаемый текст соответствует контексту вопроса пользователя. Предоставляя фрагменты текста из массива авторитетных документов, чат-бот генерирует основанные на фактах ответы.

«Программа должна быть справочным библиотекарем», — сказал Йегер. «Вы должны в значительной степени полагаться на документацию, чтобы предоставить ответы из источников. Вы должны быть в состоянии точно интерпретировать то, что спрашивают люди, и уметь эффективно собирать воедино контекст этих вопросов, чтобы получить наиболее релевантную информацию. Хотя ответы могут быть не такими, как в идеале, это уже способен отвечать на сложные вопросы и вызывать интересные идеи при планировании новых проектов и исследований».

Роботы расширяют возможности людей

CFN разрабатывает системы искусственного интеллекта и машинного обучения как инструменты, которые могут освободить исследователей-людей для работы над более сложными и интересными проблемами и максимально эффективно использовать свое ограниченное время, в то время как компьютеры автоматизируют повторяющиеся задачи в фоновом режиме. Об этом новом способе работы все еще много неизвестного, но эти вопросы являются началом важных дискуссий, которые сейчас ведут ученые, чтобы гарантировать, что использование ИИ/МО является безопасным и этичным.

READ  Директор Winter Ember говорит: «В Сиднее не так много поддержки» для разработки игр

«Есть ряд задач, которые такой узкоспециализированный чат-бот может снять с ученого рабочую нагрузку. Категоризация и систематизация документов, обобщение сообщений, ссылки на соответствующую информацию и быстрое освоение новой предметной области — это лишь некоторые из задач. потенциальных применений», — отметил Ягер. «Однако мне не терпится увидеть, к чему все это приведет. Мы никогда не могли себе представить, где мы находимся сейчас три года назад, и я с нетерпением жду того, где мы будем через три года».

Исследователи, желающие самостоятельно опробовать это программное обеспечение, могут найти исходный код чат-бота CFN и связанных с ним инструментов. В этом репозитории GitHub.

/Общий выпуск. Этот материал исходной организации/авторов может носить хронологический характер и отредактирован для ясности, стиля и объема. Mirage.News не занимает корпоративных позиций или партий, и все мнения, позиции и выводы, выраженные здесь, принадлежат исключительно автору(ам). Полный текст можно посмотреть здесь.