Sora 2: как пользоваться, что умеет ИИ-модель и насколько она безопасна

Что умеет Sora 2 и как ее оценивают пользователи

Пользователи уже больше недели тестируют Sora 2 — обновленную ИИ-модель от OpenAI, которая способна генерировать короткие видеоролики на основе текстового промпта. Если собрать все рецензии и отзывы, вердикт таков: возможности Sora 2 взрывают мозг — как в хорошем, так и в плохом смысле.

Выпуская вторую Sora в массы, в OpenAI утверждали, что она создает более реалистичные ролики с меньшим количеством графических артефактов и ошибок, лучше справляется с физикой людей и предметов, а еще поддерживает синхронизацию диалогов и звуковых эффектов с видеорядом. Это значит, что с помощью Sora 2 пользователи могут генерировать полноценные аудиовизуальные сцены.

Sora 2 может делать вещи, которые раньше были очень сложными, а в некоторых случаях и вовсе невозможными для ИИ-моделей предыдущих поколений. Например, элементы спортивной гимнастики или сальто назад с правильной динамикой и физикой человека.
OpenAI

Параллельно разработчики выкатили специальное приложение Sora — социальную сеть, похожую на TikTok, с одним главным отличием: рекомендательная лента целиком состоит из роликов, созданных с помощью ИИ. Пользователи могут генерировать 10-секундные видео, делиться ими с друзьями и делать ремиксы на чужие работы. Приложение работает пока только на iOS у жителей США и Канады по системе инвайтов: у одного человека есть возможность пригласить максимум трех друзей. К слову, коды-приглашения для Sora уже продают на eBay по цене от $5 до $45.

Несмотря на систему инвайтов, приложение закрепилось в топе бесплатных сервисов американского App Store, обогнав даже ChapGPT. Всего за несколько дней бесконечную ленту платформы заполонили странные фантазии пользователей. Там можно увидеть, как женщина кланяется слону и перекидывает его через плечо, фигуристка бегает по кольцам Сатурна, а глава OpenAI Сэм Альтман крадет графический процессор из магазина Target (и выглядит это так, будто снято на скрытую камеру видеонаблюдения). Используют ИИ-модель и для более понятных целей: создают вполне реалистичную и правдоподобную рекламу для автомобилей и трейлеры к фильмам.

Сэм Альтман крадет графический процессор из магазина Target. Видео сгенерировано Sora 2 — **Скриншот «Московских новостей» из X**

Трейлер для фильма в исполнении Sora 2 — **Скриншот «Московских новостей» из X**

Те, кто уже протестировал Sora 2, отмечают действительно высокое качество видео и звука и хорошую проработку сложных движений. Лучше всего ИИ справляется с роликами, стилизованными под анимацию или компьютерные игры, — в этом случае реалистичность и не нужна. Но система все еще не идеальна: Sora 2 допускает ошибки (например, путает буквы в длинном тексте), не справляется с деталями на фоне, иногда делает звук слишком «роботизированным», а изображение — чересчур гладким и неестественным.

Почему Sora 2 пугает пользователей

В соцсетях, конечно, обсуждают галлюцинации и забавные ошибки Sora 2. Один из популярных кейсов — проблемы у ИИ с машинами: она не понимает, как правильно посадить водителя за руль, выдумывает неестественные позы и даже лишает героев роликов ног. Но самые активные дебаты развернулись вокруг отдельной функции Sora 2, которая получила название Cameo. При регистрации приложение дает пользователю возможность создать собственную цифровую копию — для этого необходимо показать лицо на камеру и произнести вслух несколько цифр. ИИ-версию себя можно добавлять в любое видео. Также сервис предлагает поделиться этим образом с друзьями (или со всеми юзерами), чтобы они тоже могли воспользоваться им для генерации контента. Отсюда и огромное количество роликов с лицом Сэма Альтмана в ленте приложения.

Сэм Альтман — Ролики с Сэмом Альтманом в приложении Sora
Фото: OpenAI

Пользователи публикуют ИИ-ролики, в которых они играют в бейсбол на стадионе с роботами, дерутся с помощью чизбургеров, прыгают с парашютом в виде пиццы и оправдываются перед полицейскими после ареста. Подписчики всерьез интересуются в комментариях, происходило ли это в действительности, а эксперты предупреждают о проблемах с конфиденциальностью и отмечают, что технология сильно упрощает процесс создания дипфейков для преступников.

Я впервые почувствовала, что искусственный интеллект близок к тому, чтобы имитировать реальную жизнь. При просмотре видеороликов, созданных Sora, вам, возможно, будет трудно отличить, что реальность, а что — фейк. С этой новой возможностью создавать реалистичные ролики с участием реальных людей нам есть о чем беспокоиться: о мошенничестве, буллинге, вымогательстве и дипфейках. И я уверена, что есть еще много проблем, о которых мы даже не подозреваем, потому что все это очень ново.
Кэти Нотопулос
корреспондент Business Insider, специализируется на технологиях

Чтобы отличить контент, сгенерированный ИИ, эксперты рекомендуют обращать внимание на несколько моментов:

освещение (Sora плохо работает со сложным светом);
неестественное выражение лица (кто-то слишком странно улыбается или плачет с широко открытыми глазами);
чересчур идеальную «фарфоровую» кожу;
детали фона, которые могут исчезать или видоизменяться по мере просмотра видео.

Разработчики Sora 2, в свою очередь, напоминают: на каждом ролике, сгенерированном ИИ, есть специальный водяной знак (но на YouTube блогеры уже рассказывают, как его удалять).

Еще одна претензия к Sora — тот факт, что приложение делает все возможное для удержания пользователей и поощряет бездумный скроллинг бессмысленных роликов. Для этого есть даже специальный термин — AI slop, что в дословном переводе означает «ИИ-помои». Так называют сгенерированный ИИ низкопробный контент, который все больше засоряет соцсети. Например, в приложении можно полюбоваться роликами, в которых летают собаки, по улицам расхаживают бегемоты, а Авраам Линкольн занимается серфингом вместе с Мэрилин Монро. Vox отмечает, что в данном случае продукт OpenAI никак не соотносится с миссией компании: «Обеспечить, чтобы ИИ приносил пользу всему человечеству».

Sora 2 сочетает в себе, пожалуй, худший аспект больших языковых моделей, таких как ChatGPT, — их мощную способность привлекать к себе пользователей — с тем, что, бесспорно, является худшим аспектом современных медиа: бесконечным скроллингом бессмысленных вертикальных видеороликов, которые, помимо прочих негативных последствий, уничтожили способность людей к концентрации внимания. Это как наркотик, который вызывает сильное привыкание, заставляет тупо смотреть в экран и снижает IQ на несколько десятков пунктов?
Брайан Уолш
шеф-редактор издания Vox

Ко всему прочему в приложении быстро появились фейковые ролики со взрывами, сценами боевых действий в Газе и Мьянме, массовыми расстрелами и людьми в панике. И это притом что, анонсируя Sora 2, глава OpenAI Сэм Альтман заявил: компания ограничивает создание и распространение «сексуального контента, сцен насилия с участием реальных людей, пропаганду экстремизма и контента, разжигающего ненависть».

Sora 2 и копирайт: новые правила

После того как доступ к Sora 2 открыли, пользователи сразу же начали генерировать ролики с персонажами из поп-культуры. В ленте приложения появились Губка Боб, Рик и Морти, герои из «Южного Парка». Пикачу в ИИ-видео повышает тарифы на товары из Китая и крадет розы из сада Белого дома, а Губка Боб планирует войну с США и одевается как Адольф Гитлер. Все это в очередной раз напомнило о том, что нейросети нарушают авторские права кинокомпаний, анимационных студий, разработчиков игр и многих других создателей уникального контента.

В результате OpenAI объявила об изменениях в политике: компания переходит от модели «используем, пока правообладатель не запретит», к более жесткой схеме «нельзя использовать без явного согласия». Предполагается, что теперь система откажет пользователю в генерации роликов с персонажами, защищенными авторским правом. Под запрет попадают также логотипы и элементы франшиз.

Sora очень быстро завоевала популярность. Мы думали, что сможем контролировать рост, но этого не произошло. Очевидно, что мы действительно заботимся о правообладателях и о пользователях. Поэтому мы хотим создать эти дополнительные способы контроля. Я думаю, вы увидите, что многие элементы контента будут доступны с ограничениями.
Сэм Альтман
глава OpenAI

Фото обложки: Cfoto / Keystone Press Agency / Global Look Press

Sora 2 восхищает и пугает одновременно. Что происходит в полузакрытом аналоге TikTok для генерации ИИ-видео

Что умеет Sora 2 и как ее оценивают пользователи

Почему Sora 2 пугает пользователей

Sora 2 и копирайт: новые правила