«Галлюцинирует», но программирует: Google запускает новую модель ИИ — Gemini. Заменит ли она ChatGPT

Что произошло

Google запускает Gemini 1.0 — модель искусственного интеллекта, которая, как заявили в компании, превосходит по возможностям ChatGPT. Gemini — мультимодальный ИИ, то есть нейросеть может работать с текстом, аудио, изображением, видео и компьютерным кодом.

Разработчики представили три версии Gemini. Версия Nano — облегченный вариант — предназначена для решения задач на смартфонах с Android. Gemini Pro — более мощную версию — интегрируют в чат-бот Bard. Самая продвинутая система — Gemini Ultra — будет доступна только со следующего года, эта версия предназначена для решения задач в дата-центрах и корпоративных приложениях. Сейчас Ultra проходит этап внешнего тестирования: независимые эксперты проверяют «точность и эффективность» системы.
На данный момент Gemini работает в 170 странах на английском языке, но ожидается, что нейросеть будет поддерживать и другие языки. В будущем разработчики также интегрируют модель в поисковую систему Google, браузер Chrome и другие приложения.

Детали

Самое главное преимущество Gemini — в способности модели качественно работать с видео и аудио, пишет The Verge. Например, в рекламном ролике показано, как чат-бот Bard на основе Gemini используют для доработки бумажного самолетика: на видео популярный американский ютубер Марк Робер фотографирует эскизы, а Gemini помогает ему выбрать наиболее точно сложенный самолет.

В еще одном ролике родители загружают в Bard фотографии домашнего задания для своих детей, а чат-бот объясняет, где ребенок совершил ошибку.
В Google рассказали, что «тщательно протестировали» Gemini и выяснили, что ИИ по точности и производительности превосходит последнюю модель ChatGPT (GPT-4) в 30 из 32 тестов. Но иногда это всего несколько процентов или даже доли процента: Gemini более успешна в решении сложных арифметических задач (83,6% верных решений против 83,1% у GPT-4), в распознавании текста на фото или видео (82,4% против 80,9%), в генерации кода на языке программирования Python (74,4% против 67%) и т.д.
Кроме того, аналитики отдельно протестировали версию Gemini Pro: она превзошла GPT-3.5 (модель ИИ в бесплатной версии ChatGPT) в 6 из 8 тестов. А Gemini Ultra стала первой моделью, которая обошла людей-экспертов в выполнении бенчмарка MMLU с вопросами из 57 экзаменов по разным предметам, включая математику, физику, историю, юриспруденцию, медицину и этику. К тому же Ultra будет использовать новый инструмент для написания кода — AlphaCode2, который, по словам разработчиков из Google, работает на уровне профессиональных программистов.

Что говорят

Главный исполнительный директор Google Сундар Пичаи охарактеризовал запуск Gemini как начало новой эры для компании.

В случае с Bard люди просто обнаружат, что продукт стал намного лучше. Он лучше понимает их намерения, лучше отвечает на запросы. Он выдает больше фактов, работает качественно. Если вы пытаетесь писать код и заниматься программированием, это лучший инструмент для вас.
Сундар Пичаи
главный исполнительный директор Google

Platformer пишет, что новая модель Google действительно может догнать продукты Open AI. А The Verge отмечает, что Google уже 10 лет называет себя «компанией, ориентированной на развитие ИИ», и только сейчас, «наконец, делает первый большой шаг».
При этом обозреватель The Verge считает, что настоящую проверку возможностей Gemini проведут обычные пользователи и сейчас делать выводы о производительности инструмента рано. К тому же вице-президент по продуктам Google DeepMind Эли Коллинз сообщила, что у Gemini все еще есть проблема многих нейросетей — склонность к «галлюцинациям», то есть к искажению информации. Все подобные модели не имеют представления о том, что является правдой, поэтому могут генерировать текст с ложной информацией.
Кроме того, ранее ряд СМИ писали, что в начале декабря Google отложил запуск Gemini на несколько дней — из-за неточностей в ответах нейросети, особенно при обработке запросов не на английском языке.

Контекст

Версия Bard на базе Pro пока не выйдет в Великобритании и странах Европейской экономической зоны. В Google сообщили, что запросили разрешение на запуск Gemini и ведут переговоры с британским Институтом безопасности ИИ.
В начале ноября в Великобритании прошел международный саммит по безопасному использованию ИИ, на котором ряд государств, включая страны ЕС, Японию и Южную Корею, договорились с ИТ-гигантами (Google, Microsoft, Open AI и др.) о совместном тестировании новых моделей ИИ до и после их вывода на рынок. Разработки будут проверять на предмет «безопасности для общества», чтобы выработать общие правила регулирования нейросетей и минимизировать риски.