Модернизация
Изображение: стабильный спред
Der Artikel kann nur mit aktiviertem JavaScript dargestellt werden. Немного активируйте JavaScript в браузере и на новой странице.
Обновлено 21 августа 2022 г.:
Open Diffusion теперь доступен через веб-интерфейс. После входа в систему вы можете создавать изображения с помощью текстовых сообщений, аналогично DALL-E 2, и у вас есть несколько дополнительных опций для тонкой настройки. Как и в случае с DALL-E 2, существуют ограничения на претензии, например изображения сексуального характера или сцены насилия.
Модель Open Diffusion, которую можно запускать локально или в облаке, не будет иметь этих ограничений. Ожидается, что модель будет запущена на Github в ближайшие несколько дней.
Вы можете попробовать Web Open Diffusion бесплатно. За эквивалент чуть менее 12 долларов вы можете приобрести около 1000 подсказок. Фактическое количество доступных претензий зависит от сложности вычислений и точности вашего изображения.
Нажмите здесь, чтобы перейти в DreamstudioОткройте веб-интерфейс Diffusion.
Оригинал статьи датирован 14 августа 2022 года:
Конкурент DALL-E с открытым исходным кодом от OpenAI работает на вашей видеокарте.
DALL-E 2 от OpenAI получает бесплатный конкурс. И за этим стоит движение ИИ с открытым исходным кодом и стартап ИИ.
Искусственный интеллект, способный создавать изображения из текстовых описаний, стремительно развивается с начала 2021 года. В то время OpenAI показал впечатляющие результаты с DALL-E 1 и CLIP. Сообщество открытого исходного кода использовало CLIP для нескольких альтернативных проектов в течение года. Затем в 2022 году OpenAI выпустила впечатляющую версию. ДАЛЛ-Э 2Google показал Изображение И партияИ Medjourney достиг миллионовИ Craiyon заполонил социальные сети изображениями с искусственным интеллектом.
Startup Stability AI объявил о выпуске стабильный спредеще одна система, похожая на DALL-E 2, которая будет постепенно предоставляться новым исследователям и другим группам через сервер Discord.
После этапа тестирования Stable Diffusion будет выпущен бесплатно — обученный код и модель будут опубликованы как открытый исходный код. Также будет размещена версия с веб-интерфейсом, чтобы пользователи могли протестировать систему.
Финансируемый ИИ Стабильность Конкурент Бесплатно DALL-E 2
Стабильная диффузия является результатом сотрудничества исследователей из Stability AI, RunwayML, LMU Munich, EleutherAI и LAION. Исследовательская группа EleutherAI наиболее известна своими языковыми моделями с открытым исходным кодом GPT-J-6B и GPT-NeoX-20Bсреди прочего, а также проводит исследования мультимедийных моделей.
Некоммерческая организация LAION (Открытая сеть для крупномасштабного искусственного интеллекта) предоставила обучающие данные с набором данных LAION 5B с открытым исходным кодом, который был отфильтрован с помощью отзывов людей на начальном этапе тестирования для создания окончательного набора обучающих данных для LAION-Aesthetics.
Патрик Эссер ВПП и Робин Ромбах из LMU Munich возглавили проект, основанный на их работе в CompVis Group в Гейдельбергском университете. Там они создали ВКГАН И Скрытая диффузия. Последний послужил основой для Stable Diffusion с исследованиями OpenAI и Google Brain.
Джазовые роботы. Автор TheRealBissy #StableDiffusion #ИИАрт # работа Встроить твит pic.twitter.com/V6hBWZUuM9
— Стабильные диффузионные изображения (DiffusionPics) 14 августа 2022 г.
Stability AI, основанный в 2020 году, поддерживается математиком и компьютерщиком Эмадом Мостеки. Несколько лет он работал аналитиком в нескольких хедж-фондах, прежде чем заняться общим бизнесом. В 2019 году он помог основать Symmitree, проект, целью которого является снижение стоимости смартфонов и доступа в Интернет для малообеспеченных слоев населения.
Благодаря стабильному ИИ и собственному богатству Mostaque стремится укрепить сообщество исследователей ИИ с открытым исходным кодом. Например, его стартап ранее поддерживал создание набора данных «LAION 5B». Для обучения модели стабильного развертывания Stability AI представила серверы с 4000 графическими процессорами Nvidia A100.
«Никто не имеет права голоса, кроме наших 75 сотрудников — ни миллиардеров, ни крупных фондов, ни правительств, ни кого-либо еще, кто контролирует компанию или сообщества, которые мы поддерживаем. Мы полностью независимы», — сказал Мостак TechCrunch. «Мы планируем использовать наши вычисления для ускорения фундаментального искусственного интеллекта с открытым исходным кодом».
Stable Deployment — учитель с открытым исходным кодом
В настоящее время проводится тестирование стабильного развертывания, при этом новые дополнения распространяются волнами. Результаты, которые можно увидеть, например, в Твиттере, показывают появление здесь реального конкурента DALL-E-2.
В отличие от DALL-E 2, стабильная диффузия может генерировать VIP-портреты И другие темы, которые OpenAI запрещен в DALL-E 2. Другие системы, такие как Midjourney или Pixelz.ai, тоже могут это делать, но они не достигают такого же качества с высокой универсальностью, как в Stable Diffusion, и ни одна из других систем не имеет открытого исходного кода.
оказаться # распространять Действительно крутые интерполяции между текстовыми подсказками можно сделать, если вы исправите шум инициализации и ошибку между мгновенными векторами кондиционирования: pic.twitter.com/lWOoETYVZ3
— Ксандер Стенбрюгге (@xsteenbrugge) 7 августа 2022 г.
Ожидается, что Stable Diffusion будет работать на одной видеокарте с 5,1 ГБ видеопамяти, что делает технологию ИИ доступной пока только через облачные сервисы. Таким образом, Stable Diffusion предоставляет исследователям и заинтересованным сторонам, не имеющим доступа к серверам GPU, возможность испытать современную генеративную модель ИИ. Предполагается, что модель также будет работать на MacBook с чипом Apple M1. Однако для создания изображения требуется несколько минут, а не секунд.
Сам ИИ стабильности также хочет, чтобы компании могли обучать свой вариант стабильного развертывания. Таким образом, мультимедийные модели следуют по пути, по которому ранее шли большие языковые модели: от одного поставщика к широкой доступности многих альтернатив через открытый исходный код.
Runway уже ищет редактирование текста в видео с поддержкой Stable Diffusion.
# распространять Контрольные точки преобразования текста в изображение теперь доступны для целей поиска по требованию в https://t.co/7SFUVKoUdl
Работайте над более мягким редактированием и контрольными точками в краске.
Скоро ™ подходит к Встроить твит Редактировать текст в видео pic.twitter.com/7XVKydxTeD
— Патрик Эссер (@pess_r) 11 августа 2022 г.
Стабильный спред: ящик Пандоры и чистый процент
Конечно, с открытым доступом и возможностью запустить модель на широкодоступном графическом процессоре вероятность злоупотреблений резко возрастает.
«Есть процент людей, которые просто неприятны и странны, но это человечество», — сказал Мустак. «На самом деле, мы думаем, что эта технология станет основной, и несколько патерналистское и снисходительное отношение многих энтузиастов ИИ вводит в заблуждение недоверие общества».
Однако Мостаки утверждает, что бесплатная доступность позволяет сообществу разрабатывать контрмеры.
«Мы принимаем значительные меры безопасности, в том числе разрабатываем передовые инструменты, чтобы помочь уменьшить потенциальный ущерб в нашей версии и сервисах. С сотнями тысяч разработанных на основе этой модели, мы уверены, что чистая выгода будет очень положительной, и с миллиардами использования, эти убытки будут сведены на нет Технология».
Более подробная информация доступна по адресу Стабильный спред на GitHub. Вы можете найти множество примеров возможностей создания образа Stable Diffusion в файле Стабильный сабреддит. иди сюда за Подписка на стабильную бета-версию Diffusion.
Примечание: Ссылки на интернет-магазины в статьях можно назвать партнерскими ссылками. Если вы покупаете по этой ссылке, MIXED получает комиссию от провайдера. Для вас цена не меняется.
«Чрезвычайный решатель проблем. Ниндзя для путешествий. Типичный веб-наркоман. Проводник. Писатель. Читатель. Неизлечимый организатор».
More Stories
Сложный подъем для велосипедистов
AirPods Pro в списке «лучших изобретений» показывает, что Apple по-прежнему впечатляет
Apple включает неожиданные улучшения функций в свой MacBook Pro начального уровня