В это же время в прошлом году социальные сети буквально взорвались вирусной песней MyHeritage «Глубокая ностальгия», чья магия искусственного интеллекта оживляет наши старые семейные фотографии с пугающим реализмом. Что ж, если вас это напугало, подождите, пока вы не увидите новую функцию, которую я только что назвал Живая история.
На этот раз технология онлайн-генеалогической компании — это не создание небольшого клипа из 10-20 роликов на основе старой фотографии вашего родственника. Вместо этого LiveStory идет дальше, создавая более длинное анимационное видео вашего предка, которое рассказывает историю всей его жизни, дополненное звуком с синхронизацией губ и слайд-шоу из старых фотографий.
Как и прежде, он работает с использованием технологии «реконструкции» на базе искусственного интеллекта, которая анимирует изображение лица вашего родственника. Но на этот раз вы также получаете голос, который автоматически генерируется из генеалогического дерева MyHeritage или вводится вами вручную. Затем технология преобразования текста в речь оживляет историю, а голос синхронизируется с движущимся динамиком вашего родственника.
Как это работает?
Как и прошлогодняя технология «Глубокая ностальгия», анимация LiveStory создается с использованием большой коллекции «видео водителей». После того, как алгоритмы службы проанализируют загруженное вами изображение, его характерные особенности или черты лица затем сопоставляются с видео водителя, чтобы создать впечатление движения. Алгоритмы также заполняют любые недостающие детали. Генератор синтетического голоса также создает повествование на основе информации в профиле человека, или вы можете создать свой собственный сценарий с нуля. Вы также можете загрузить собственную аудиозапись.
MyHeritage и D-ID, израильская компания, которая создает и лицензирует эту технологию, говорят, что конечный результат полностью настраиваемый, что дает вам возможность изменять повествование, изображения и аудио перед отправкой в семью или в социальные сети. LiveStory также поддерживает 31 язык, десятки диалектов и сотни голосовых персонажей, а также различные варианты мужского и женского голоса.
Несмотря на все это, нет никаких сомнений в том, что технологии немного жуткие и уводят нас в еще большее путешествие в сверхъестественную долину. Для некоторых добавление звука могло зайти слишком далеко, и MyHeritage пришлось добавить некоторые заявления об отказе от ответственности, чтобы гарантировать, что технология не будет злоупотреблять. В нем говорится, что LiveStory «предназначен для использования только на фотографиях умерших людей, обычно их предков» и что «никогда не следует использовать на фотографиях живых людей без их разрешения».
Тем не менее, многие в социальных сетях обнаружили, что прошлогодняя техника «глубокой ностальгии» была утешительным или даже согревающим способом для отношений, которых они никогда раньше не видели в реальной жизни. Как и эта функция, LiveStory в настоящее время доступна для бесплатной пробной версии на ПК и мобильных устройствах (как через Сайт MyHeritage) и в мобильном приложении MyHeritage. Вы можете создать несколько LiveStories бесплатно, но после этого вам нужно будет заплатить за подписку (от 119 долларов США / 89 фунтов стерлингов в год).
Анализ: более смелый шаг в зловещую долину
Как и в случае с прошлогодней «Глубокой ностальгией», нас немного раздражает новая функция MyHeritage «LiveStory». Нет никаких сомнений в том, что технология великолепна, и тот факт, что она может автоматически генерировать 90-секундную биографию из фотографии, генеалогического древа и некоторого текста, одновременно впечатляет и пугает.
Тем не менее, мы не можем не чувствовать, что большая часть предыдущего вирусного успеха технологии (которая привела к 100 миллионам мультфильмов) связана с ее точностью. Движущиеся лица, созданные Deep Nostalgia, время от времени моргали или наклоняли головы, но это было так — и это ограничение помогло создать иллюзию, маскируя ограничения технологии.
Добавление звука является логичным шагом и, без сомнения, окажется популярным инструментом для тех, кого не пугает неоспоримый фактор ползучести. Но из примеров, которые мы видели до сих пор, интонация иногда автоматизирована, и тот факт, что звук не взят из оригинала, делает его несколько искусственным.
В настоящее время LiveStory кажется более подходящим для музеев или образования, где его способность оживлять исторические личности (а не личные отношения) может быть полезным способом сделать историю более увлекательной для посетителей и детей.
Конечно, существует также вероятность неправомерного использования, хотя D-ID (создатель технологии) установил некоторые барьеры, чтобы предотвратить это. Все пользователи должны принять условия, включая обещание, что они не будут использовать его на живых людях, прежде чем они смогут создать LiveStory. На борту также есть алгоритм модификации текста для проверки на оскорбительную, клеветническую или ложную информацию, хотя неясно, как проверяется последняя.
когда Мы говорили с D-ID в прошлом году в эксклюзивном интервью.Мы впечатлены ее стремлением следить за тем, чтобы ее технология искусственного интеллекта не использовалась в гнусных целях, а также слегка раздражены ее прогнозом о том, что большинство визуальных медиа, которые мы видим в Интернете, будут синтетическими «в течение 5-10 лет». LiveStory явно еще один шаг на пути к этому треку, если не ходу, то вирусному хиту, который был «глубокой ностальгией» в прошлом году.
More Stories
Сложный подъем для велосипедистов
AirPods Pro в списке «лучших изобретений» показывает, что Apple по-прежнему впечатляет
Apple включает неожиданные улучшения функций в свой MacBook Pro начального уровня