Anthropic выложили тестовое задание для инженеров

🧠 Anthropic выложили свое тестовое задание для инженеров в открытый доступ

Причина простая - Claude Opus 4.5 теперь справляется с ним лучше людей. За 2 часа модель выдает результат на уровне лучших человеческих решений (1790 тактов), а с расширенным временем на размышления - превосходит их (1363 такта против человеческого рекорда).

Задание - оптимизация кода для минимизации тактов на симулированной машине. Классическая задача competitive programming, только теперь её решает искусственный интеллект.

Интересный момент: если ты сможешь выбить меньше 1487 тактов - Anthropic приглашает на интервью. То есть порог для найма теперь "превзойди нашу лучшую модель".

Это хороший пример того, как test-time compute (дополнительное время на рассуждения) улучшает результаты. Claude с 2 часов до 11.5 часов улучшил результат с 1790 до 1487 тактов. Больше думаешь - лучше решаешь.

👨‍💻 Github: https://github.com/anthropics/original_performance_takehome