Компания Anthropic опубликовала доклад под названием «When AI builds itself» («Когда ИИ создаёт сам себя»), в котором прямо предупреждает: нынешний путь развития способен в конечном счёте лишить людей возможности контролировать системы искусственного интеллекта. Парадокс в том, что предупреждение подкреплено собственными достижениями фирмы — её модель Claude уже пишет более 80% кода, который попадает в производственную кодовую базу самой Anthropic.

Исследовательское подразделение компании, Anthropic Institute, заявило, что ИИ уже начал ускорять разработку ИИ, и эта тенденция способна привести к рекурсивному самосовершенствованию — к моменту, когда модель проектирует и обучает своего преемника практически без вмешательства человека. Авторы доклада, исследователи Марина Фаваро и Джек Кларк, подчёркивают: мир обязан сохранить возможность замедлить или приостановить разработку передовых моделей, пока такое самосовершенствование остаётся теоретическим. Они отдельно отмечают, что периодическое рассогласование, которое наблюдается у нынешних моделей, может становиться всё более частым и всё менее понятным по мере того, как одни модели будут создавать следующее поколение.

Источник изображения - Getty / BloombergИсточник изображения - Getty / Bloomberg

Цифры, которые компания раскрыла впервые

Anthropic подкрепляет свои предупреждения рядом внутренних показателей, которые ранее не публиковались. По состоянию на май 2026 года более 80% кода, внедрённого в производственную базу, было написано Claude. Для сравнения: до того как инструмент Claude Code вышел на стадию исследовательского предварительного показа в феврале 2025 года, эта доля исчислялась долями процента. Компания утверждает, что типичный инженер теперь внедряет примерно в 8 раз больше кода за квартал, чем в период с 2021 по 2025 год. Один из сотрудников, по словам авторов, не написал ни строки кода за пять месяцев — не потому, что работа закончилась, а потому, что её делает Claude.

При выполнении самых сложных и наименее формализованных задач по программированию Claude, по данным компании, успешно справлялся в 76% случаев в мае 2026 года. Это рост на 50 процентных пунктов всего за шесть месяцев. Растёт и «горизонт задач»: если в начале 2024 года модель надёжно справлялась с заданиями длиной в считаные минуты, то теперь — с задачами на 12 часов работы, причём этот горизонт удваивается примерно каждые четыре месяца. К 2027 году в Anthropic рассчитывают на автономные задачи длиной в неделю.

Особенно показателен повторяющийся внутренний тест, в котором каждую новую модель просят ускорить выполнение тренировочного кода. Результаты выросли резко: от примерно трёхкратного ускорения с Claude Opus 4 в мае 2025 года до примерно 52-кратного с ещё не выпущенной моделью Mythos Preview в апреле 2026 года. Для сравнения: опытному инженеру-человеку на то, чтобы добиться четырёхкратного ускорения, потребовалось бы от четырёх до восьми часов.

Три сценария будущего — от плохого к тревожному

Компания описала три довольно мрачных сценария развития событий в ближайшие годы, оставив самые серьёзные предупреждения для случая, когда модели станут способны полностью совершенствовать себя. В этом сценарии, по словам Anthropic, темпы прогресса будут определяться почти исключительно доступными вычислительными мощностями. Людей же оттеснят на роли надзора и проверки. Самосовершенствующаяся модель станет доминирующей силой, а её способности превзойдут способности создавших её людей.

Потенциальную проблему согласования (alignment) — удержания поведения системы в рамках человеческих намерений — в компании назвали той частью будущего, в которой они уверены меньше всего. Рассогласование, которое сегодня редко и поддаётся исправлению, может усугубляться от поколения к поколению, пока контроль не будет окончательно утерян. В докладе допускается, впрочем, что достаточно способная и при этом хорошо согласованная модель могла бы, напротив, сама решить остановить собственное развитие. Само рассогласование, как формулируют в Anthropic, рискует «становиться всё более частым, но всё менее понятным, пока мы не потеряем над ним контроль».

Почему остановиться в одиночку — бессмысленно

Anthropic подчёркивает: речь не о том, чтобы остановиться самой. Компания заявила, что замедлит или приостановит разработку лишь в том случае, если конкурирующие лаборатории — находящиеся на переднем крае или рядом с ним, включая ведущих игроков из США и Китая, — сделают то же самое проверяемым образом. Односторонняя остановка одной фирмы, по логике доклада, лишь изменит расстановку лидеров, но не приведёт ни к чему более масштабному. Джек Кларк сформулировал это образно: у индустрии ИИ сегодня есть «педаль газа», но нет «тормоза», и Anthropic хочет помочь этот тормоз построить. В ближайшие месяцы компания планирует собрать за одним столом представителей власти, исследователей, гражданское общество и другие ИИ-фирмы, чтобы обсудить, как именно мог бы работать такой механизм координации.

Что стоит держать в уме

Все цифры, приведённые Anthropic, являются самоотчётными и неаудированными. Они появились через несколько дней после того, как компания конфиденциально подала заявку на первичное публичное размещение акций (IPO) — на фоне раунда финансирования, оценившего её почти в триллион долларов. Это даёт повод для скепсиса: фирма одновременно продаёт инвесторам историю о стремительном внутреннем росте производительности и призывает общество готовить «тормоз» на случай, если риски рекурсивного самосовершенствования станут реальностью.

Ранее, в апреле, компания выпустила похожую самооценку, заявив, что Mythos Preview обнаружила тысячи серьёзных уязвимостей в программном обеспечении. Это утверждение позже вызвало вопросы — прежде всего из-за того, насколько широкий вывод был сделан на основе сравнительно небольшой ручной выборки.