Google представил «самую умную» рассуждающую модель ИИ

Google представила новое поколение своего искусственного интеллекта — модель Gemini 2.5 Pro, которая умеет «размышлять» перед тем, как дать ответ. Компания называет модель самой умной на сегодняшний день.

Gemini 2.5 Pro — мультимодальная модель, способная работать с текстом, изображениями, видео, аудио и программным кодом. Её ключевая особенность — пошаговое логическое мышление. Модель анализирует задачи поэтапно, прежде чем сформулировать ответ, что позволяет достигать большей точности и глубины в решениях.

По словам генерального директора Google DeepMind Демиса Хассабиса, Gemini 2.5 Pro значительно превосходит конкурентов в области кодирования, точных наук и мультимодального анализа. «Это потрясающая современная модель», — отметил он. Gemini 2.5 Pro показал впечатляющие результаты в ряде бенчмарков, особенно в задачах, требующих логики, памяти и работы с длинными контекстами.

Сравнение моделей в разных бенчмарках. Изображение: Google

В математических тестах модель набрала 92% на AIME 2024 и 86,7% на AIME 2025, уступив только Grok 3 Beta от xAI. В задачах по программированию у Gemini 70,4% на LiveCodeBench v5 (одиночный проход) и 74% в тесте Aider Polyglot по редактированию кода — результат, который превосходит GPT-4.5 и Claude 3.7 (64,9%).

В бенчмарке MRCR, предназначенном для проверки способности ИИ анализировать тексты объемом до 128 тыс. токенов, модель показала 91,5% точности. Даже при работе с контекстом в миллион токенов Gemini сохранила высокий результат — 83,1%, превзойдя всех конкурентов.

Также Gemini 2.5 Pro уверенно выступила в одном из самых сложных тестов на рассуждение — Humanity’s Last Exam или «Последний экзамен человечества». Результат в тесте без использования вспомогательных инструментов — 8,8%. Для сравнения: GPT-4.5 справилась с ним на 6,4%, а Claude 3.7 — на 8,9%. Этот бенчмарк считается одним из самых требовательных и приближенных к реальным задачам, требующим глубинного понимания и логики.

Технические характеристики впечатляют: модель работает с контекстным окном объёмом в 1 млн токенов, а в будущем Google обещает увеличить его до 2 млн. Модель уже доступна разработчикам через Google AI Studio и подписчикам тарифа Gemini Advanced ($20 в месяц). Цены на доступ к API пока не раскрыты — компания обещает сообщить подробности в ближайшее время.


Читать далее:

Миллионы «невидимых» людей: ученые нашли ошибку в оценке населения Земли

Вселенная внутри черной дыры: наблюдения «Уэбба» подтверждают странную гипотезу

Сразу четыре похожих на Землю планеты нашли у ближайшей одиночной звезды

На обложке: Изображение от freepik, сведения о лицензии

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Живые клетки обрабатывают информацию в миллиарды раз быстрее, чем считалось ранее
Наука
Яндекс опубликовал нейросеть YandexGPT 5 Lite в открытом доступе
Новости
Эксперты обсудили управление персоналом в эпоху цифровых технологий
Новости
Роспотребнадзор опроверг информацию о новом опасном вирусе в России
Новости
Последствия невесомости для скелета изучили на мышах-космонавтах
Космос
Томские химики создали экономичные катализаторы для зеленой промышленности
Наука
Ученые создали перчатку, с которой можно «ощущать» объекты в виртуальной реальности
Наука
Ученые в тупике: «Уэбб» засек невозможный свет в галактике
Космос
Новый сплав для имплантатов имитирует кость человека
Наука
РКН пообещал обезличить данные россиян, но эксперты сомневаются эффективности метода
Новости
Rutube недоступен в Турции: что происходит, блокировка или нет
Новости
Квантовый компьютер сгенерировал по-настоящему случайные числа
Новости
Загадка древних гигантов: ученые нашли организм, не похожий ни на что живое
Наука
Вскрытие мамонтенка Яны: в Якутии изучили древнюю тушу
Наука
Anthropic изучила «внутренний мир ИИ»: как языковые модели принимают решения
Новости
Дрон доставил обед: в Иннополисе испытали курьера с Telegram-управлением
Иннополис
Зонд Parker сблизился с Солнцем, собрав важнейшие данные
Космос
Спутниковую связь для обычных смартфонов протестируют в РФ
Новости
Российские ученые нашли безазотную замену тротилу и ракетному топливу
Наука
Российский рынок промышленной автоматизации удвоится к 2030 году, но есть сложности  
Новости