Gemini 2.5: новая вершина reasoning в AI
Google выкатила Gemini 2.5 Pro — экспериментальную версию самой продвинутой модели, которая мысленно проговаривает ответ, прежде чем его выдать. Это не просто генерация, а полноценное размышление: анализ, выводы, контекст, логика.
В итоге модель вышла на первое место в LMArena (оценка на основе предпочтений людей) и побила конкурентов на математических, научных и кодинговых бенчмарках.
Что особенно интересно:
– 18.8% на Humanity’s Last Exam — это экзамен по frontier-навыкам, придуманный сотнями экспертов;
– 63.8% на SWE-Bench Verified — одном из главных тестов на «агентное программирование»;
– контекстное окно — до миллиона токенов уже сейчас, два миллиона — скоро.
Gemini 2.5 умеет порождать сложные веб-приложения, редактировать и трансформировать код, и даже делать игры из одного промпта. Причём делает это, опираясь на reasoning, а не просто угадывая токены.
Скоро будет доступна и на Vertex AI. Пока можно играть в Google AI Studio или в Gemini Advanced.
