КиберпанкДеталиТехнологии

Работа с видео и вайб-кодинг: что умеет Gemini 3 и способна ли ИИ-модель от Google обойти конкурентов

Google представила новое поколение своей ИИ-модели — Gemini 3. «Самая интеллектуальная» нейросеть может одновременно работать с разными видами информации — текстом, изображениями, аудио и видео. Она лучше своих предшественников понимает контекст беседы и справляется с программированием. Кстати, для написания кода в Google создали отдельную платформу Antigravity с множеством «умных» помощников. 

Что нового в Gemini 3 

Корпорация Google выпустила Gemini 3 — новое поколение своей ИИ-модели. Причем пользователям открыли доступ сразу к Gemini 3 Pro. Разработчики называют ее «самой интеллектуальной» и универсальной из всех в семействе Gemini: нейросеть лучше своих предшественников справляется с программированием, понимает контекст беседы и обрабатывает широкий спектр информации. 

Каждое поколение Gemini развивалось на основе предыдущего, позволяя вам делать больше. Gemini 1 расширила возможности обработки информации. Gemini 2 заложила основу для агентских функций и расширила границы логического мышления, помогая решать более сложные задачи. А теперь мы представляем Gemini 3 — нашу самую интеллектуальную модель, которая сочетает в себе все возможности Gemini, чтобы вы могли воплотить в жизнь любую идею.

Сундар Пичаи
глава Google 

Gemini 3 Pro мультимодальна, то есть нейросеть может одновременно работать с текстом, изображениями, видео и звуком, а контекстное окно на 1 млн токенов позволяет ей взаимодействовать с очень длинными материалами. Например, новая ИИ-модель способна расшифровать старые кулинарные рецепты, написанные на бумаге от руки на разных языках, а затем создать семейную кулинарную книгу с уникальным дизайном. Gemini 3 Pro готова помочь пользователям в учебе: в нейросеть можно загрузить длинные видеолекции и учебные пособия, а она сгенерирует карточки или презентацию с понятным текстом для лучшего усвоения информации. Кроме того, система способна проанализировать видеозапись игры в футбол, определить области, в которых необходимо улучшить результат, и составить план тренировок. 

Разработчики говорят, что Gemini 3 Pro сделала «огромный скачок» в рассуждениях и сравнялась по уровню с доктором наук. В частности, нейросеть от Google показала самый высокий результат среди всех ИИ-моделей в тесте Humanity’s Last Exam — 37,5%. Он состоит из 2,5 тыс. академических вопросов по разным темам и предназначен для оценки общих экспертных знаний и способностей машины к рассуждению. Предыдущий рекорд составлял 31,64% и принадлежал GPT-5 Pro. 

Ответы Gemini 3 Pro умны, лаконичны и прямолинейны. Вместо банальностей и лести — настоящая проницательность: нейросеть дает вам то, что вам нужно услышать, а не только то, что вы хотите услышать. Gemini 3 Pro действует как настоящий интеллектуальный партнер, который дает вам новые способы самовыражения — от программирования до творческого мозгового штурма.

Google

Кроме того, Gemini 3 Pro позиционируют как лучшую и самую мощную на сегодняшний день ИИ-модель Google для вайб-кодинга. Так называют современный подход к программированию, при котором разработчик описывает задачи на простом языке, а нейросеть генерирует соответствующий код. По словам разработчиков, новое поколение ИИ от Google лучше предшественников справляется с этой задачей, причем не только пишет код, но и правильно использует дополнительные инструменты и внешние API. 

Как воспользоваться Gemini 3 Pro

Gemini 3 Pro уже доступна в приложении Gemini для всех пользователей, а также в поиске Google (AI Mode) для подписчиков Pro и Ultra в США. 

Новые функции и инструменты Gemini 3 

Gemini Agent

Google постепенно превращает Gemini в полноценного ИИ-агента — инструмент, способный от имени пользователя управлять компьютером и самостоятельно выполнять конкретные задачи задачи. Эта функция получила название Gemini Agent и пока остается «экспериментальной»: доступ к ней есть только у пользователей тарифа Ultra в США. 

Системе можно делегировать многоэтапные задачи: ИИ-помощник умеет запускать Chrome, переходить по ссылкам, взаимодействовать с веб-страницами и приложениями Google (календарь, почта и т.д.). Например, к Gemini Agent можно обратиться с просьбой найти письмо в Gmail и составить черновик ответа или забронировать столик в ресторане. 

Google Antigravity

Новая платформа для разработчиков, ориентированная на использование нескольких автономных ИИ-агентов. Google предлагает инженерам и программистам работать «на более высоком уровне»: не писать код самостоятельно, а наблюдать за «умными» агентами, которые сами планируют процесс, запускают команды и параллельно предоставляют отчет о своей деятельности (Artifacts) в виде чек-листов, скриншотов и промежуточных черновиков. Человек только принимает финальные решения и выступает как «архитектор».

Antigravity работает на Gemini 3 Pro, Gemini 2.5 Computer Use (для управления браузером) и движке Nano Banana (для генерации и редактирования изображений). По замыслу Google, инструмент должен составить конкуренцию популярным ИИ-редакторам вроде Cursor и GitHub Copilot. 

Gemini 3 Deep Think

Google анонсировала «улучшенный» режим рассуждений — Gemini 3 Deep Think. Инструмент проходит финальное тестирование и в ближайшие недели станет доступен пользователям тарифа Ultra. Его предлагают использовать для глубоких исследований и сложных задач в математике, программировании и научном анализе. 

Что происходит у конкурентов Google

Reuters отмечает, что Gemini 3 появилась всего через 11 месяцев после релиза второго поколения ИИ-модели. Google стремится обогнать своих конкурентов и предложить клиентам более широкий функционал, особенно после провального запуска GPT-5 от OpenAI в августе. Но даже если у Google есть все технические возможности для этого, Gemini все еще уступает в имиджевой и репутационной гонке, пишет Business Insider: ChatGPT остается синонимом слову «нейросеть», а ИИ-модель от Google тем временем все чаще оказывается в центре скандалов. Так, например, в средние ноября Gemini обвинили в тайном сборе личных данных пользователей из Gmail, Google Meet и Google Chat.

По числу пользователей Google тоже пока отстает от OpenAI: к ChatGPT каждую неделю обращаются около 700 млн человек, а у Gemini 650 млн активных пользователей в месяц. 

До выхода Gemini 3 обновленные версии своих нейросетей также представили OpenAI, Anthropic и xAI. 

  • GPT-5.1. Есть два основных режима: Instant (ориентирован на «теплый разговорный стиль», подойдет для повседневных диалогов и решения базовых задач) и Thinking (рассчитан на сложные задачи и вычисления, программирование, планирование и аналитическую работу). Также разработчики добавили стили общения: можно выбрать «Стандартный», «Профессиональный», «Дружелюбный», «Эффективный», «Искренний» или «Эксцентричный». 
  • Claude Sonnet 4.5. Разработчики продвигают нейросеть как лучшую в истории Anthropic для написания кода, причем по всем параметрам — производительность, системный дизайн, безопасность и следование инструкциям. К тому же Sonnet 4.5 лучше предшественников справляется с творческими задачами, в том числе с созданием презентаций и другого визуального контента.  
  • Grok 4.1. Компания Илона Маска xAI сосредоточилась на снижении числа галлюцинаций, развитии эмоционального интеллекта и креативности у своей нейросети. Обновленная модель, по словам разработчиков, общается более естественно и способна понимать эмоции человека и проявлять эмпатию. 

Главное о Gemini 3 от Google

Что нового в Gemini 3?

Разработчики называют ее «самой интеллектуальной» и универсальной из всех в семействе Gemini: нейросеть лучше своих предшественников справляется с программированием, понимает контекст беседы и работает одновременно с разными видами информации — текстом, изображениями, звуком и видео. 

Кому доступна нейросеть Gemini 3?

Нейросеть от Google бесплатно доступна в приложении Gemini для всех пользователей, а также в поиске Google (AI Mode) для подписчиков Pro и Ultra в США. 

Что такое Google Antigravity?

Новая платформа на основе Gemini 3 для разработчиков. Google предлагает программистам перейти «на более высокий уровень»: не писать код самостоятельно, а управлять несколькими автономными ИИ-агентами, которые сами планируют процесс, запускают команды и параллельно предоставляют отчет о своей деятельности. 

Какие еще ИТ-компании обновили свои нейросети?

До выхода Gemini 3 обновленные версии своих нейросетей также представили OpenAI (более «разговорчивый» GPT-5.1), Anthropic (Claude Sonnet 4.5 — «лучший» для программирования) и xAI (более «эмпатичный» и «креативный» Grok 4.1). 

Фото обложки: VCG / TASS

Копировать ссылкуСкопировано