Приближается генеративный ИИ для видео. Новое место , QuickVidобъединяет несколько генеративных систем искусственного интеллекта в одном инструменте для автоматического создания коротких видеороликов для YouTube, Instagram, TikTok и Snapchat.
Получив всего одно слово, QuickVid выбирает фоновое видео из библиотеки, записывает текст и ключевые слова и закрывает изображения, созданные ДАЛЛ-Э 2 Он добавляет синтетический голос за кадром и фоновую музыку из бесплатной музыкальной библиотеки YouTube. Создатель QuickVid Даниэль Хабиб говорит, что он создает сервис, чтобы помочь создателям удовлетворить «постоянно растущий» спрос со стороны их поклонников.
«Предоставляя создателям инструменты для быстрого и простого создания высококачественного контента, QuickVid помогает создателям увеличить производство контента, снижая риск выгорания», — сказал Хабиб TechCrunch в интервью по электронной почте. «Наша цель — дать возможность вашему любимому автору не отставать от потребностей своей аудитории, используя достижения в области искусственного интеллекта».
Но в зависимости от того, как они используются, такие инструменты, как QuickVid, могут затопить и без того переполненные каналы спамом и повторяющимся контентом. Они также сталкиваются с потенциальной негативной реакцией со стороны создателей, которые предпочитают не использовать инструменты, будь то из-за стоимости (10 долларов в месяц) или из-за принципа, но, возможно, им придется конкурировать с множеством новых видео, созданных ИИ.
Иди за видео
QuickVid, который Хабиб, разработчик-самоучка, ранее работавший над мета- и видео-инфраструктурой Facebook Live, запустил в течение нескольких недель, QuickVid — 27 декабря. На данный момент это относительно голый скелет — Хабиб говорит, что в январе появится больше возможностей для настройки, — но QuickVid может собрать воедино компоненты, которые составляют типичный информативный короткометражный ролик YouTube или TikTok, включая подписи и даже аватары.
Это простой в использовании. Сначала пользователь вводит подсказку, описывающую, о чем видео, которое он хочет создать. QuickVid использует приглашение для создания сценария, используя возможности генеративного сценария GPT-3. Из ключевых слов, извлеченных из сценария автоматически или введенных вручную, QuickVid выбирает фоновое видео из бесплатной медиатеки Pexels и создает наложения с помощью DALL-E 2. Хабиб говорит, что они смогут воспроизвести собственный голос, прежде чем объединять все эти элементы в видео.
Кредиты изображений: QuickVid
Посмотрите это видео, сделанное по подсказке «кошки»:
Что это за новый секрет:
QuickVid определенно не раздвигает границы возможного с генеративным искусственным интеллектом. Владеет как Meta, так и Google показано Системы искусственного интеллекта, которые могут создавать совершенно оригинальные клипы при режиссуре текста. Но QuickVid интегрирует существующий ИИ, чтобы использовать типичный повторяющийся формат коротких, тяжелых видеороликов B-roll, решая проблему создания самого материала.
«Успешные создатели имеют очень качественную ленту и не заинтересованы в публикации контента, который, по их мнению, не соответствует их голосу», — сказал Хабиб. «Это вариант использования, на котором мы сосредоточены».
В этом случае с точки зрения качества видео QuickVid, как правило, представляют собой смешанную сумку. Фоновые видео, как правило, немного случайны или имеют лишь косвенное отношение к теме, что неудивительно, учитывая, что QuickVids в настоящее время ограничен каталогом Pexels. Между тем изображения, созданные с помощью DALL-E 2, демонстрируют ограничения современной технологии преобразования текста в изображение, такие как искаженный текст и неправильные пропорции.
В ответ на мой отзыв Хабиб сказал, что QuickVid «ежедневно тестируется и дорабатывается».
Вопросы авторского права
По словам Хабиба, пользователи QuickVid оставляют за собой право на коммерческое использование созданного ими контента и получают разрешение на его монетизацию на таких платформах, как YouTube. Но статус авторских прав в отношении контента, созданного ИИ… неясен, по крайней мере, на данный момент. Недавно Бюро по патентам и товарным знакам США (USPTO). он сдвинулся Отменить защиту авторских прав на комикс, созданный искусственным интеллектом, например, утверждая, что произведения, защищенные авторским правом, требуют авторства человека.
На вопрос, как решение USPTO может повлиять на QuickVid, Хабиб сказал, что, по его мнению, оно касается только «патентных прав» на продукты, созданные с помощью ИИ, а не прав создателей на использование и монетизацию своего контента. Он отметил, что авторы часто не регистрируют патенты на видео и обычно склонны к экономике авторов, позволяя другим авторам повторно использовать свои клипы для увеличения охвата.
«Создатели заинтересованы в выпуске высококачественного контента с их голосом, который поможет развитию их канала», — сказал Хабиб.
Еще одна юридическая проблема на горизонте может повлиять на интеграцию QuickVid с DALL-E 2 и, как следствие, на способность сайта генерировать наложения изображений. Создаются Microsoft, GitHub и OpenAI иск в коллективном иске, обвиняющем их в нарушении закона об авторском праве, позволив Copilot, системе генерации кода, возвращать части лицензионного кода без предоставления кредита. (Copilot был разработан совместно OpenAI и GitHub, принадлежащим Microsoft.) Этот случай имеет значение для генеративного искусства ИИ, такого как DALL-E 2, который был обнаружен аналогичным образом. скопировать и вставить из наборов данных, на которых они обучались (т. е. изображений).
Хабиб не беспокоится, утверждая, что джинн генеративного ИИ уже выпущен из бутылки. «Если завтра возникнет еще один судебный процесс и OpenAI исчезнет, есть несколько альтернатив, которые могут привести в действие QuickVid», — сказал он, имея в виду систему с открытым исходным кодом, подобную DALL-E 2. стабильный спред. QuickVid уже тестирует Stable Diffusion для создания аватаров.
Модерация и спам
Помимо юридических дилемм, у QuickVid вскоре могут возникнуть проблемы с модерацией. В то время как OpenAI реализовал фильтры и методы для предотвращения этого, генеративный ИИ имеет известные проблемы с токсичностью и реалистичной точностью. Трубы ГПТ-3 дезинформация, особенно в связи с недавними событиями, которые выходят за пределы ее базы знаний. И ChatGPT, тонко настроенный потомок GPT-3, был Показано За использование расистских и сексистских выражений.
Это вызывает беспокойство, особенно у людей, которые используют QuickVid для создания информационных видеороликов. В ходе быстрого теста мой партнер, который более изобретателен, чем я, особенно в этой области, ввел несколько оскорбительных подсказок, чтобы посмотреть, что сгенерирует QuickVid. По мнению QuickVid, проблемные утверждения, такие как «новый еврейский мировой порядок» и «теория заговора 11 сентября», явно не привели к появлению токсичных текстов. Но для того, чтобы Теория критической расы внушала ученикам идеологию, QuickVid выпустила видео, в котором предполагается, что Теория критической расы может быть использована для промывания мозгов школьникам.
Мы видим:
Хабиб говорит, что он полагается на фильтры OpenAI, чтобы выполнять большую часть работы по модерации, и утверждает, что пользователи должны вручную просматривать каждое видео, созданное QuickVid, чтобы убедиться, что «все находится в рамках закона».
«Как правило, я думаю, что люди должны иметь возможность выражать себя и создавать любой контент, который они хотят», — сказал Хабиб.
Похоже, что это спам. Хабиб утверждает, что алгоритмы видеоплатформ, а не QuickVid, лучше всего подходят для определения качества видео, и что люди, производящие некачественный контент, «только наносят ущерб своей репутации». Он говорит, что репутационный ущерб, естественно, отпугнет людей от массовых спам-кампаний с помощью QuickVid.
Он добавил: «Если люди не хотят смотреть ваше видео, вы не сможете распространяться на таких платформах, как YouTube». «Создание некачественного контента также приведет к тому, что люди будут негативно относиться к вашему каналу».
Но стоит взглянуть на рекламные агентства, такие как Fractl, которые в 2019 году использовали систему искусственного интеллекта под названием Grover для создания сайта, полного маркетинговых материалов — будь проклята репутация. в интервью Что касается The Verge, партнер Fractl Кристин Тински сказала, что ожидает, что генеративный ИИ позволит «массировать цунами компьютерного контента повсюду, где только можно вообразить».
В любом случае, платформам обмена видео, таким как TikTok и YouTube, не приходилось иметь дело с модификацией контента, созданного ИИ, в больших масштабах. Дипфейки — синтетические видеоролики, заменяющие существующего человека внешностью другого человека — начали появляться на таких платформах, как YouTube, несколько лет назад. Инструментальный привод это упростило съемку глубины. Но в отличие от сегодняшних самых убедительных дипфейков, ясно, что типы видео, которые создает QuickVid, никоим образом не создаются ИИ.
Политика поиска Google в отношении текста, сгенерированного искусственным интеллектом, может быть предварительным просмотром того, что произойдет в области видео. Google обрабатывает синтетический текст иначе, чем текст, написанный человеком, с точки зрения поискового рейтинга, но принимает меры Содержит контент, «предназначенный для управления поисковым рейтингом, а не для помощи пользователям». Он включает контент, сгруппированный вместе или собранный с разных веб-страниц.[doesn’t] добавляя достаточную ценность», а также контент, созданный с помощью полностью автоматизированных процессов, оба из которых могут относиться к QuickVid.
Другими словами, видеоролики, созданные ИИ, не могут быть запрещены на платформах напрямую, если они запущены в массовом порядке, а скорее становятся издержками ведения бизнеса. Это вряд ли рассеет опасения экспертов, которые считают, что такие платформы, как TikTok, становятся их новым домом. вводящий в заблуждение видео, но, как сказал Хабиб в интервью, «революцию генеративного ИИ не остановить».
More Stories
Сложный подъем для велосипедистов
AirPods Pro в списке «лучших изобретений» показывает, что Apple по-прежнему впечатляет
Apple включает неожиданные улучшения функций в свой MacBook Pro начального уровня