Если вы видите фотографии Чайник с авокадо Или прочитать хорошо написанную статью Немного отклоняется от странных тенейВозможно, вы столкнулись с новой тенденцией в области искусственного интеллекта (ИИ).
Их называют системами машинного обучения. ДАЛЛ-ЭИ GPT И ладонь, ладонь Они внедряют инновации благодаря своей удивительной способности создавать творческие работы.
Эти системы известны как «базовые модели», и не все они представляют собой шумиху и уловки для вечеринок. Так как же работает этот новый подход к ИИ? Будет ли это концом человеческого творчества и началом ложного кошмара?
1. Что такое базовые модели?
базовые модели Работайте, обучая одну огромную систему на больших объемах общедоступных данных, а затем адаптируя систему к новым проблемам. Предыдущие модели, как правило, начинали с нуля для каждой новой проблемы.
DALL-E 2, например, был обучен сопоставлять изображения (например, изображение домашнего кота) с подписью («Мистер Пушистики, полосатый кот отдыхает на солнце») путем сканирования сотен миллионов примеров. После обучения эта модель знает, как выглядят кошки (и другие вещи) на картинках.
Но модель также можно использовать для многих других интересных задач ИИ, таких как создание новых фотографий только на основе комментария («Покажите мне коалу, забивающую мяч») или редактирования фотографий на основе письменных инструкций («Сделайте так, чтобы он выглядел так, будто эта обезьяна платит за деньги»). налоги»).
2. Как они работают?
базовые модели работают наглубокие нейронные сети«, частично вдохновленный тем, как работает мозг. Это включает в себя сложную математику и огромную вычислительную мощность, но сводится к очень сложному виду сопоставления с образцом.
Например, просматривая миллионы типичных изображений, глубокая нейронная сеть может связать слово «кошка» с шаблонами пикселей, которые часто появляются на изображениях кошек, например, с мягкими, пушистыми, мохнатыми пятнами. Чем больше примеров видит модель (чем больше данных показано) и чем больше модель (чем больше «слоев» или «глубины»), тем более сложными могут быть эти шаблоны и корреляции.
Прочитайте больше:
Что такое нейронная сеть? Ученый-компьютерщик объясняет
Фундаментальные модели, с одной стороны, являются просто расширением парадигмы «глубокого обучения», которая доминировала в исследованиях ИИ в последнее десятилетие. Тем не менее, они демонстрируют незапрограммированное или «возникающее» поведение, которое может быть неожиданным и новым.
Например, языковая модель Google PaLM, по-видимому, способна объяснить сложные метафоры и шутки. Это просто превосходит Имитировать типы данных, для обработки которых они изначально были обучены.
3. Доступ ограничен — пока
Трудно представить себе масштабы этих систем ИИ. PaLM имеет 540 миллиардов Параметры, а это значит, что даже если бы все на планете запомнили 50 чисел, у нас не хватило бы места для хранения, чтобы воспроизвести модель.
Модели настолько массивны, что их обучение требует огромного количества вычислительных и других ресурсов. По одной из оценок стоимость обучения языковой модели OpenAI GPT-3 оценивается на уровне . Около 5 миллионов долларов США.
Прочитайте больше:
Могут ли роботы писать? Машинное обучение дает впечатляющие результаты, но некоторая сборка все же требуется
В результате только крупные технологические компании, такие как OpenAI, Google и Baidu, в настоящее время могут позволить себе создавать базовые модели. Эти компании определяют, кто может получить доступ к системам, что имеет экономический смысл.
Ограничения на использование могут дать нам некоторое утешение. В ближайшее время эти системы не будут использоваться в гнусных целях (например, для создания поддельных новостей или клеветнического контента). Но это также означает, что независимые исследователи не могут исследовать эти системы и делиться результатами открыто и подотчетно. Таким образом, мы еще не знаем всех последствий его использования.
4. Что эти модели будут означать для «креативных» отраслей?
В ближайшие годы будет выпущено больше базовых моделей. Меньшие модели уже публикуются в Формы с открытым исходным кодомтехнологические компании начали это Опыт лицензирования и маркетинга этих инструментов И исследователи ИИ усердно работают над тем, чтобы сделать эту технологию более эффективной и доступной.
Замечательная креативность, продемонстрированная такими моделями, как PaLM и DALL-E 2, показывает, что эта технология может повлиять на творческие профессиональные рабочие места раньше, чем предполагалось изначально.
Прочитайте больше:
ИИ может стать радиологом будущего в условиях кадрового кризиса
Здравый смысл всегда гласит, что роботы в первую очередь заменят рабочие места «синих воротничков». Предполагалось, что работа «белых воротничков» будет относительно защищена от автоматизации, особенно профессиональная работа, требующая творческого подхода и обучения.
Модели ИИ для глубокого обучения уже демонстрируют сверхъестественную человеческую точность в таких задачах, как Рентгеновский обзор И Обнаружение состояния глаз дегенерация желтого пятна. Корпоративные формы вскоре могут обеспечить дешевое, «достаточно хорошее» творчество в таких областях, как реклама, копирайтинг, стоковая фотография или графический дизайн.
Будущее профессиональной и творческой работы может выглядеть несколько иначе, чем мы ожидали.
5. Что это означает для юридических доказательств, новостей и СМИ?
Базовые модели неизбежно повлиять на закон В таких областях, как интеллектуальная собственность и доказательства, потому что мы не сможем предположить Креативный контент — результат человеческой деятельности.
Нам также придется столкнуться с проблемой дезинформации и дезинформации, создаваемой этими системами. У нас уже есть огромные проблемы с дезинформацией, как мы видим в Разворачивающееся российское вторжение в Украину И назревшая проблема глубокая подделка фото и видео, но базовые модели превосходно подготовлены для решения этих задач.
Прочитайте больше:
Ежедневно в сети публикуется 3,2 миллиарда фотографий и 720 000 часов видео. Сможете ли вы отличить настоящее от подделки?
Пришло время подготовиться
исследователи, которые Изучение влияния искусственного интеллекта на общество, мы думаем, что базовые модели сильно изменятся. Они жестко контролируются (пока), поэтому у нас, вероятно, будет немного времени, чтобы понять их последствия, прежде чем они станут серьезной проблемой.
Джин еще не совсем выпущен из бутылки, но базовые модели — это довольно большая бутылка, а внутри довольно умный джинн.
More Stories
Сложный подъем для велосипедистов
AirPods Pro в списке «лучших изобретений» показывает, что Apple по-прежнему впечатляет
Apple включает неожиданные улучшения функций в свой MacBook Pro начального уровня