Роботы создают картинки и рассказывают анекдоты. 5 вещей, которые нужно знать о фундаментальных моделях и следующем поколении ИИ

Если вы видите фотографии Чайник с авокадо Или прочитать хорошо написанную статью Немного отклоняется от странных тенейВозможно, вы столкнулись с новой тенденцией в области искусственного интеллекта (ИИ).

Их называют системами машинного обучения. ДАЛЛ-ЭИ GPT И ладонь, ладонь Они внедряют инновации благодаря своей удивительной способности создавать творческие работы.

Эти системы известны как «базовые модели», и не все они представляют собой шумиху и уловки для вечеринок. Так как же работает этот новый подход к ИИ? Будет ли это концом человеческого творчества и началом ложного кошмара?

1. Что такое базовые модели?

базовые модели Работайте, обучая одну огромную систему на больших объемах общедоступных данных, а затем адаптируя систему к новым проблемам. Предыдущие модели, как правило, начинали с нуля для каждой новой проблемы.

DALL-E 2, например, был обучен сопоставлять изображения (например, изображение домашнего кота) с подписью («Мистер Пушистики, полосатый кот отдыхает на солнце») путем сканирования сотен миллионов примеров. После обучения эта модель знает, как выглядят кошки (и другие вещи) на картинках.

Но модель также можно использовать для многих других интересных задач ИИ, таких как создание новых фотографий только на основе комментария («Покажите мне коалу, забивающую мяч») или редактирования фотографий на основе письменных инструкций («Сделайте так, чтобы он выглядел так, будто эта обезьяна платит за деньги»). налоги»).

2. Как они работают?

базовые модели работают наглубокие нейронные сети«, частично вдохновленный тем, как работает мозг. Это включает в себя сложную математику и огромную вычислительную мощность, но сводится к очень сложному виду сопоставления с образцом.

Например, просматривая миллионы типичных изображений, глубокая нейронная сеть может связать слово «кошка» с шаблонами пикселей, которые часто появляются на изображениях кошек, например, с мягкими, пушистыми, мохнатыми пятнами. Чем больше примеров видит модель (чем больше данных показано) и чем больше модель (чем больше «слоев» или «глубины»), тем более сложными могут быть эти шаблоны и корреляции.

Прочитайте больше:
Что такое нейронная сеть? Ученый-компьютерщик объясняет

Фундаментальные модели, с одной стороны, являются просто расширением парадигмы «глубокого обучения», которая доминировала в исследованиях ИИ в последнее десятилетие. Тем не менее, они демонстрируют незапрограммированное или «возникающее» поведение, которое может быть неожиданным и новым.

Например, языковая модель Google PaLM, по-видимому, способна объяснить сложные метафоры и шутки. Это просто превосходит Имитировать типы данных, для обработки которых они изначально были обучены.

Пользователь взаимодействует с языковой моделью PaLM, вводя вопросы. Система ИИ отвечает, печатая ответы. — Языковая модель PaLM может отвечать на сложные вопросы.
ИИ Google

3. Доступ ограничен — пока

Трудно представить себе масштабы этих систем ИИ. PaLM имеет 540 миллиардов Параметры, а это значит, что даже если бы все на планете запомнили 50 чисел, у нас не хватило бы места для хранения, чтобы воспроизвести модель.

Модели настолько массивны, что их обучение требует огромного количества вычислительных и других ресурсов. По одной из оценок стоимость обучения языковой модели OpenAI GPT-3 оценивается на уровне . Около 5 миллионов долларов США.

Прочитайте больше:
Могут ли роботы писать? Машинное обучение дает впечатляющие результаты, но некоторая сборка все же требуется

В результате только крупные технологические компании, такие как OpenAI, Google и Baidu, в настоящее время могут позволить себе создавать базовые модели. Эти компании определяют, кто может получить доступ к системам, что имеет экономический смысл.

Ограничения на использование могут дать нам некоторое утешение. В ближайшее время эти системы не будут использоваться в гнусных целях (например, для создания поддельных новостей или клеветнического контента). Но это также означает, что независимые исследователи не могут исследовать эти системы и делиться результатами открыто и подотчетно. Таким образом, мы еще не знаем всех последствий его использования.

4. Что эти модели будут означать для «креативных» отраслей?

В ближайшие годы будет выпущено больше базовых моделей. Меньшие модели уже публикуются в Формы с открытым исходным кодомтехнологические компании начали это Опыт лицензирования и маркетинга этих инструментов И исследователи ИИ усердно работают над тем, чтобы сделать эту технологию более эффективной и доступной.

Замечательная креативность, продемонстрированная такими моделями, как PaLM и DALL-E 2, показывает, что эта технология может повлиять на творческие профессиональные рабочие места раньше, чем предполагалось изначально.

Прочитайте больше:
ИИ может стать радиологом будущего в условиях кадрового кризиса

Здравый смысл всегда гласит, что роботы в первую очередь заменят рабочие места «синих воротничков». Предполагалось, что работа «белых воротничков» будет относительно защищена от автоматизации, особенно профессиональная работа, требующая творческого подхода и обучения.

Модели ИИ для глубокого обучения уже демонстрируют сверхъестественную человеческую точность в таких задачах, как Рентгеновский обзор И Обнаружение состояния глаз дегенерация желтого пятна. Корпоративные формы вскоре могут обеспечить дешевое, «достаточно хорошее» творчество в таких областях, как реклама, копирайтинг, стоковая фотография или графический дизайн.

Будущее профессиональной и творческой работы может выглядеть несколько иначе, чем мы ожидали.

5. Что это означает для юридических доказательств, новостей и СМИ?

Базовые модели неизбежно повлиять на закон В таких областях, как интеллектуальная собственность и доказательства, потому что мы не сможем предположить Креативный контент — результат человеческой деятельности.

Нам также придется столкнуться с проблемой дезинформации и дезинформации, создаваемой этими системами. У нас уже есть огромные проблемы с дезинформацией, как мы видим в Разворачивающееся российское вторжение в Украину И назревшая проблема глубокая подделка фото и видео, но базовые модели превосходно подготовлены для решения этих задач.

Прочитайте больше:
Ежедневно в сети публикуется 3,2 миллиарда фотографий и 720 000 часов видео. Сможете ли вы отличить настоящее от подделки?

Пришло время подготовиться

исследователи, которые Изучение влияния искусственного интеллекта на общество, мы думаем, что базовые модели сильно изменятся. Они жестко контролируются (пока), поэтому у нас, вероятно, будет немного времени, чтобы понять их последствия, прежде чем они станут серьезной проблемой.

Джин еще не совсем выпущен из бутылки, но базовые модели — это довольно большая бутылка, а внутри довольно умный джинн.

Alexei Smirnov

Алексей Смирнов — автор новостного издания Solusnews.com, освещающий широкий круг тем, включая политику, экономику, технологии, спорт, культуру и повседневную жизнь. В своих материалах он делает акцент на понятной подаче информации и внимательном отношении к актуальным событиям. Алексей стремится предоставлять читателям только проверенные и полезные новости, помогая ориентироваться в быстро меняющейся повестке. Его тексты ориентированы на объективность, ясность и практическую ценность для широкой аудитории.

1. Что такое базовые модели?

2. Как они работают?

3. Доступ ограничен — пока

4. Что эти модели будут означать для «креативных» отраслей?

5. Что это означает для юридических доказательств, новостей и СМИ?

Пришло время подготовиться

Отказ от физических дисков для PlayStation назвали закономерным этапом развития игровой индустрии

REDMI Note 17 получит 7-дюймовый OLED-дисплей, а версия Pro — аккумулятор на 9000 мА·ч

Nintendo приостановила продажи многоязычной версии Switch 2 в Японии из-за перекупщиков

Anthropic представила платформу Claude Science для научных исследований и заявила о планах по разработке лекарств с помощью ИИ

Отказ от физических дисков для PlayStation назвали закономерным этапом развития игровой индустрии

Американские компании сокращают расходы на ИИ и переходят на открытые нейросети

REDMI Note 17 получит 7-дюймовый OLED-дисплей, а версия Pro — аккумулятор на 9000 мА·ч

Main Menu

Свежие записи

Pages

1. Что такое базовые модели?

2. Как они работают?

3. Доступ ограничен — пока

4. Что эти модели будут означать для «креативных» отраслей?

5. Что это означает для юридических доказательств, новостей и СМИ?

Пришло время подготовиться

Добавить комментарий Отменить ответ

More Stories

Отказ от физических дисков для PlayStation назвали закономерным этапом развития игровой индустрии

REDMI Note 17 получит 7-дюймовый OLED-дисплей, а версия Pro — аккумулятор на 9000 мА·ч

Nintendo приостановила продажи многоязычной версии Switch 2 в Японии из-за перекупщиков

You may have missed

Anthropic представила платформу Claude Science для научных исследований и заявила о планах по разработке лекарств с помощью ИИ

Отказ от физических дисков для PlayStation назвали закономерным этапом развития игровой индустрии

Американские компании сокращают расходы на ИИ и переходят на открытые нейросети

REDMI Note 17 получит 7-дюймовый OLED-дисплей, а версия Pro — аккумулятор на 9000 мА·ч