🧠 Anthropic выложили свое тестовое задание для инженеров в открытый доступ
Причина простая - Claude Opus 4.5 теперь справляется с ним лучше людей. За 2 часа модель выдает результат на уровне лучших человеческих решений (1790 тактов), а с расширенным временем на размышления - превосходит их (1363 такта против человеческого рекорда).
Задание - оптимизация кода для минимизации тактов на симулированной машине. Классическая задача competitive programming, только теперь её решает искусственный интеллект.
Интересный момент: если ты сможешь выбить меньше 1487 тактов - Anthropic приглашает на интервью. То есть порог для найма теперь "превзойди нашу лучшую модель".
Это хороший пример того, как test-time compute (дополнительное время на рассуждения) улучшает результаты. Claude с 2 часов до 11.5 часов улучшил результат с 1790 до 1487 тактов. Больше думаешь - лучше решаешь.
👨💻 Github: https://github.com/anthropics/original_performance_takehome