КиберпанкДеталиТехнологии

ChatGPT 5, ИИ от Apple и виртуальный музыкант от Adobe: гид по нейросетям в 2024 году

«Яндекс» запустил новый поисковый сервис «Нейро»: он черпает факты не из собственной памяти, а напрямую из интернета. По словам разработчиков, пользователь получит самую актуальную информацию — даже если она появилась «всего несколько часов назад». В основе сервиса — обновленная нейросеть YandexGPT 3. Над новой версией ИИ работает и OpenAI: компания планирует представить ChatGPT 5 летом 2024 года.

«Яндекс» запустил «Нейро»: как работает новый поисковый сервис

Сервис «Нейро», представленный «Яндексом», способен отвечать на сложные запросы и работать с несколькими источниками информации. В качестве примера в компании привели запросы «какие растения могут жить в темной комнате дома и не требуют ежедневного полива» и «стоит ли ехать осенью в Карелию и чем там заняться». «Нейро» анализирует вопрос и собирает топ релевантных источников по теме в поисковой выдаче. Из этого списка система выбирает пять наиболее подходящих материалов, компилирует информацию и выдает одно сообщение со ссылками на источники. 

Нейро понимает естественный язык общения. Чтобы спросить его о чем-то, не нужно подбирать формулировки: можно писать запросы так, как они приходят в голову. А еще к текстовому запросу можно добавить картинки. Например, сфотографировать настольную игру и попросить объяснить ее правила.

пресс-служба «Яндекса»

Пользователь может задать «Нейро» дополнительные вопросы или уточнить информацию в режиме диалога. Сервис доступен в приложении «Яндекс» и в «Яндекс Браузере». В компании ожидают, что аудитория «Нейро» к концу 2024 года достигнет 10 млн пользователей в сутки при текущей суточной аудитории поиска примерно в 50 млн человек. 

«Нейро» берет факты не из памяти модели, а из источников в интернете. Это значит, что в его ответах содержится свежая и актуальная информация, даже если она появилась всего несколько часов назад. Каждый факт в ответе подкреплен ссылкой на источник. Благодаря таким ссылкам пользователи смогут углубиться в интересующую тему, а площадки — получить дополнительный трафик.

Андрей Сюткин
ML-разработчик «Яндекса», ответственный за ML-трек в «Нейро»

При этом владельцы веб-сайтов могут установить ограничения для поисковых роботов «Яндекса»: в таком случае сайт не будут использовать в качестве источника данных для «Нейро». Этой опцией уже воспользовались администраторы сайтов «Городские порталы» («Фонтанка», MSK1.RU, E1.ru, NGS.ru и др.), которые принадлежат компании Skhulev Media Holding. Издатели опасаются снижения трафика из-за того, что пользователям будет достаточно информации от «Нейро», они будут реже переходить на конкретные сайты. 

Нейросети 2024: новая версия ChatGPT, обновление Gemini и ИИ от Apple

OpenAI

ChatGPT 5

Компания OpenAI планирует выпустить модель GPT-5 летом 2024 года, сообщил Business Insider. Ранее гендиректор компании Сэм Альтман заявил, что новая модель будет «потрясающей» и по всем характеристикам обойдет GPT-4. По данным СМИ, GPT-5 сможет адаптироваться к стилю письма пользователей, создавать точные прогнозы на основе конкретных данных, а также, вероятно, перестанет «галлюцинировать» (генерировать ложную информацию). 

ChatGPT научится работать с крайне прикладными сценариями лучше, чем можно ожидать от какой-то общей модели. Например, не исключено появление медицинской версии, при общении с которой, по сути, можно получить консультацию терапевта, в роли которого выступит машина. Огромный рывок ожидается в области Copilot, связанной с разработкой ПО. То есть программист просто дает задачу, а ChatGPT пишет код, оптимизирует его, исправляет ошибки и так далее. Это и сейчас машина умеет делать, но этот Copilot станет в разы лучше.

Евгений Черешнев
вице-президент по стратегии и инновациям МТС, CEO Future Crew, центра инноваций МТС

Sora

В феврале 2024-го компания OpenAI показала нейросеть Sora: модель способна генерировать реалистичные короткие видеоролики по текстовым запросам продолжительностью до минуты. Ранее похожие сервисы выпустили Meta* и Google, но они могут генерировать ролики длительностью не более пяти секунд. На данный момент доступ к Sora есть у ряда художников, дизайнеров и режиссеров, которые тестируют нейросеть. В открытом доступе Sora появится в текущем году.

Google

Gemini 1.5 Pro

В феврале 2024 года Google представила Gemini 1.5 Pro — обновленную версию модели Gemini Pro. А уже в марте к ней открыли доступ для всех желающих. Новая версия может работать с 11 часами аудио, часом видео, 700 тыс. слов и 30 тыс. строк кода. Главное преимущество нейросети — способность анализировать и обобщать большие объемы контента. Например, на основе стенограммы полета «Аполлона-11» на Луну (402 страницы) Gemini 1.5 Pro может сделать краткую выжимку или «рассуждать» о событиях и деталях, упоминающихся в документе. 

Gemini Pro можно воспользоваться в чат-боте Gemini: для этого необходимо войти в аккаунт Google (в России инструмент работает только с VPN). 

Lumiere

В конце января 2024 года Google продемонстрировала работу Lumiere — нейросети для генерации коротких видео продолжительностью до пяти секунд. Кроме того, Lumiere может скопировать стиль ролика и на его основе создать новый, анимировать статичное изображение и дорисовывать объекты в кадре. Доступ к сервису пока ограничен.

Нейросеть от Apple

По данным СМИ, Apple работает над собственной нейросетью, которая станет частью iOS 18. Business Insider пишет, что ИИ будет называться ReALM и «превзойдет ChatGPT-4 по способности понимать контекст запроса». Генеральный директор Apple Тим Кук подтвердил, что компания разрабатывает собственный ИИ, который представит уже в 2024 году.

Huawei

Китайская компания Huawei в этом году создала «конкурента Midjourney» — новую нейросеть PixArt-Σ. Она генерирует изображения в высоком разрешении (до 3840x2560 пикселей, то есть в 4K) — в отличие от большинства других ИИ, которые способны создавать картинки на основе текстового описания. 

Adobe

Компания Adobe в конце февраля анонсировала ИИ-инструмент Project Music GenAI Control: проект находится в стадии разработки, у него пока нет даже пользовательского интерфейса. В Adobe рассказали, что Project Music GenAI Control сможет генерировать аудио по текстовому запросу, а также редактировать уже существующие треки: пользователи смогут попросить нейросеть замедлить трек, зациклить, добавить звуковые эффекты и т.д. По словам разработчиков, инструмент «сделает из любого пользователя дирижера виртуального оркестра и поможет даже тем, кто не является музыкантом». Когда Project Music GenAI Control выйдет в открытый доступ, в Adobe не сообщили.

«Сбер»

GigaChat

«Сбер» представил собственную нейросеть GigaChat год назад — в апреле 2023-го. А в декабре 2023-го появился GigaChat PRO — версия для решения сложных, узкоспециализированных задач. В январе 2024-го разработчики провели для ИИ «экзамен» и заявили, что GigaChat PRO «превосходит GPT-3.5 по качеству ответов на русском и английском языках». 

В ходе экзамена, проведенного специалистами банка, российская модель на 6% лучше конкурента справилась с вопросами в тесте MMLU (Massive Multitask Language Understanding). Он включал в себя вопросы в 57 областях знаний, среди которых математика, история, медицина, физика, знания о мире и способности решать проблемы. 

Андрей Белевцев
вице-президент, руководитель блока «Технологии» «Сбера»

Kandinsky 3.1 

В начале апреля «Сбер» сообщил, что усовершенствовал свою нейросеть Kandinsky, которая создает изображения по текстовому описанию на русском и английском языках. Обновленная версия Kandinsky 3.1 в 10 раз быстрее генерирует картинки в разрешении до 4K.

По сравнению с предыдущей моделью Kandinsky 3.1 стал еще быстрее, удобнее и реалистичнее. Kandinsky 3.1 — это гибкий, многофункциональный и абсолютно бесплатный инструмент, который превратит любого человека в художника и творца.

Александр Ведяхин
первый заместитель председателя правления «Сбера»

Доступ к Kandinsky 3.1 на данный момент получил только ряд художников, дизайнеров и блогеров. Неограниченный доступ откроют «в ближайшее время». По данным «Сбера», совокупная аудитория GigaChat и Kandinsky в марте 2024-го достигла 18 млн пользователей.

«Яндекс»

YandexGPT 3

В конце марта «Яндекс» представил YandexGPT 3 — третье поколение языковых моделей компании. Например, YandexGPT 3 Pro (доступна на сайте Yandex Cloud) «эффективнее решает сложные задачи и лучше понимает контекст беседы» по сравнению с YandexGPT 2. Языковая модель хорошо обрабатывает инструкции с несколькими условиями, а еще — корректнее работает с фактами, дает более точные и полные ответы и допускает меньше стилистических ошибок. 

Языковая модель хорошо обрабатывает инструкции с несколькими условиями, а еще — корректнее работает с фактами, дает более точные и полные ответы и допускает меньше стилистических ошибок. Новая нейросеть особенно хорошо проявляет себя в таких сферах, как клиентская поддержка, онлайн-продажи, цифровые коммуникации, маркетинг, реклама и управление персоналом. Также языковая модель лучше работает с документами: например, составляет договоры, счета, нормативную документацию, должностные инструкции и не только. 

пресс-служба «Яндекса»

В апреле «Яндекс» обновил «Алису»: в основе виртуального помощника нового поколения — YandexGPT 3. Теперь с «Алисой» можно общаться, как «с умным вдумчивым собеседником»: она научилась объяснять сложные понятия и явления, предлагать идеи и удерживать контекст беседы. На базе YandexGPT 3 работает и поисковая система «Нейро».

«Шедеврум»

В январе «Яндекс» добавил в «Шедеврум» — нейросеть для генерации изображений — функцию «фильтрумов»: это восемь креативных режимов, с помощью которых можно изменить картинки. Например, изображения можно стилизовать под плюшевые или вязаные игрушки, пиксельную графику или нарисованные кистью картины. 

*Компания Meta признана в России экстремистской.

Фото обложки: sostav.ru