**🤯 AGI уже через 7 месяцев? Новая метрика AI показывает стремительный прогресс.
**
Наткнулся на интересное исследование: ребята из METR предложили новую метрику прогресса AI, похожую на знаменитый закон Мура (напомню, он гласит, что число транзисторов в микросхеме удваивается примерно каждые два года).
Оказывается, за последние 6 лет длина задач, которые AI может выполнить самостоятельно (при 50%-ной вероятности успеха), удваивается каждые 7 месяцев. Несмотря на уточнение про "50% успеха", звучит впечатляюще.
Если тренд продолжится, уже в ближайшие 5 лет AI сможет самостоятельно выполнять значительную часть задач, на которые сейчас у людей уходят дни или недели.
Сами авторы пишут, что уже сейчас AI почти идеально справляется с задачами до 4 минут человеческого времени, но задачи свыше 4 часов пока даются с трудом (менее 10% успеха).
С такой скоростью прогресса к концу десятилетия нас ждут системы, которые будут автономно выполнять проекты длительностью месяц и более. Последствия этого сложно переоценить: от полностью автоматизированной работы до серьезных рисков, связанных с такой автономностью.
Подробности и методология тут:
https://metr.org/research/measuring-ai-ability
Paper: https://arxiv.org/abs/2503.14499
Github: https://github.com/METR/eval-analysis-public
