По мнению OpenAI и Google, они обучали свои модели ИИ на расшифрованном тексте из видеороликов YouTube, что потенциально нарушает авторские права создателей контента. Газета «Нью-Йорк Таймс. В отчете, описывающем усилия компаний OpenAI, Google и Meta по максимизации объема данных, которые они могут передавать в свои системы искусственного интеллекта, цитируются несколько человек, знакомых с практикой компаний. Это произошло всего через несколько дней после того, как генеральный директор YouTube Нил Мохан заявил в интервью Блумберг Происхождение Предполагаемое использование OpenAI видеороликов YouTube для обучения своего нового генератора текста в видео Sora. Это будет противоречить политике платформы..
Согласно Нью-Йорк ТаймсOpenAI использовала инструмент распознавания речи Whisper для расшифровки более миллиона часов видео с YouTube, который затем использовался для обучения GPT-4. информация Ранее я сообщал, что OpenAI использовала видео и подкасты YouTube для обучения своих систем искусственного интеллекта. Сообщается, что среди членов этой команды был глава OpenAI Грег Брокман. Мэтт Брайант, представитель Google, заявил, что согласно правилам Google «несанкционированное вырезание или загрузка контента YouTube» не допускается. Нью-Йорк ТаймсТакже говорится, что компания не знала о таком использовании OpenAI.
Однако в отчете утверждается, что в Google были люди, которые знали об OpenAI, но не предприняли никаких действий, поскольку Google использовал видео с YouTube для обучения своих моделей ИИ. Google сказал Нью-Йорк Таймс Это происходит только с видео от создателей контента, которые согласились на это. Engadget обратился к Google и OpenAI за комментариями.
тот Нью-Йорк Таймс В отчете также утверждается, что Google попросил команду внести изменения в свою политику конфиденциальности в июне 2023 года, чтобы охватить использование ею более широкого общедоступного контента, включая Google Docs и Google Sheets, для обучения своих моделей и продуктов искусственного интеллекта. Изменения, которые, по словам Google, были внесены для ясности, были опубликованы в июле. Брайант сказал Нью-Йорк Таймс Этот тип данных используется только с разрешения пользователей, которые подписались на бета-тестирование функций Google, и компания «не начала обучение дополнительным типам данных на основе этого изменения языка». Изменение добавило Барда в качестве примера того, для чего можно использовать эти данные.
Поправка, 6 апреля 2024 г., 15:45 по восточному времени: Первоначально в этой статье сообщалось, что Google обновил свою политику конфиденциальности в июне 2022 года. Фактически обновление политики было сделано в 2023 году. Приносим извинения за ошибку.
More Stories
Сложный подъем для велосипедистов
AirPods Pro в списке «лучших изобретений» показывает, что Apple по-прежнему впечатляет
Apple включает неожиданные улучшения функций в свой MacBook Pro начального уровня