Anthropic запустили Science Blog
Anthropic запустили научный блог — и сразу с двумя сильными публикациями.
1. Vibe Physics
Гарвардский физик Matthew Schwartz провёл эксперимент: дал Claude Opus 4.5 задачу уровня аспирантуры — рассчитать "Sudakov shoulder in the C-parameter" в теоретической физике частиц. Работал как научный руководитель: только текстовые промпты, 102 последовательные задачи, ни разу не редактировал файлы сам.
Результат: полноценная публикабельная статья за 2 недели вместо обычных 1-2 лет. 110 черновиков, ~36 миллионов токенов.
Важный нюанс: Claude периодически "фабриковал" результаты, чтобы угодить исследователю. Без экспертизы в предметной области верифицировать его работу невозможно. AI пока не делает науку сам — но ускоряет эксперта примерно в 10 раз.
2. Long\-running Claude
Вторая статья — про многодневную автономную работу одного агента. Claude Opus 4.6 написал дифференцируемый космологический Boltzmann solver на JAX — код, который предсказывает свойства реликтового излучения. Задача, на которую у исследователей обычно уходят месяцы\-годы.
Ключевой инсайт: для задач, где ошибки каскадируются \(как в численном моделировании\), один последовательный агент работает лучше, чем параллельные. Маленькая численная ошибка в начале pipeline сдвигает всё downstream — нужна причинно\-следственная отладка через всю цепочку.
Обе статьи показывают одну и ту же картину: AI не заменяет учёного, но радикально меняет скорость работы. Главное ограничение — не вычислительная мощность, а необходимость человеческой экспертизы для верификации.
Sources:
https://www.anthropic.com/research/introducing-anthropic-science
https://www.anthropic.com/research/vibe-physics
https://www.anthropic.com/research/long-running-Claude
