news.shamcode.ru | Где поток ненужного софта? Почему заявления об ИИ-ассистентах не сходятся

Я в бешенстве. Я реально зол. Зол настолько, что хочется сносить чужие песочные замки, зарядить Дэниэлю ЛаРуссо по физиономии и поливать его грязью перед его девушкой^a.

Вообще-то я не из тех, кого легко разозлить, но ситуация в индустрии достала окончательно.

Я разбираюсь в разработке софта. Занимаюсь этим 25 лет¹, а если считать табулирование маркетинговых исследований на янтарных монохромных экранах — то и все 28, наверное. Да, я старый. Я задрот-программист зрелого возраста. Вся моя жизнь и самоидентификация завязаны на программировании, к лучшему это или к худшему. В моей жизни дофамин льётся по венам тогда, когда мы релизим крутые проекты.

Программирование с ИИ-ассистентами я освоил рано и оставался его фанатом до, наверное, пары месяцев назад, пока не прочитал исследование METR^b. Внезапно я начал сильно сомневаться. В этом исследовании авторы выяснили, что разработчики не могут надёжно оценивать собственную продуктивность. У программистов возникало ощущение, что ИИ делает их на 20 % быстрее, а на деле он их замедлял на 19 %. Меня это шокировало, поскольку за неделю до того я кому-то ныл про свои наблюдения: мне казалось, что ИИ меня ускоряет на какие-то 25 %, и этот прирост я считал маленьким. Я ушёл всего на 5 % относительно самооценок разработчиков из этого исследования.

Ситуация припугнула. Невозможно было не задаться вопросом: а если я тоже не могу себя оценить, как это случилось у респондентов METR? Не обманулся ли я картинкой мелькающего кода на экране? Не тратится ли на чтение и рецензирование всего этого больше времени, чем если бы я просто сделал всё сам?

Итак, я начал измерять свою продуктивность, немного модифицировав методику из того исследования. Брал задачу и прикидывал, сколько заняло бы написать её вручную. После этого я подбрасывал монетку: орёл — использую ИИ, решка — делаю сам. Потом записывал время старта и финиша. Получалась дельта, из которой я строил графики «ИИ и без-ИИ», чтобы увидеть тренды. Я делал так шесть недель подряд, всё аккуратно фиксируя. И знаете, что я обнаружил?

Личная продуктивность — отношение реального к оценке (чем выше, тем хуже)

Я обнаружил, что данных недостаточно, чтобы сделать статистически значимые выводы на сколько-нибудь вменяемом уровне. Чтобы доказать, ускоряет меня ИИ или замедляет, мне пришлось бы собирать новые точки ещё четыре месяца. Слишком уж значения идут ноздря в ноздрю.

Но отсутствие различий между группами само по себе очень интересно. Да, выборка ограниченная. Возможно, это так просто совпало. Но на данный момент факт остаётся фактом: ИИ замедляет меня по медиане на 21 %, что совпадает по результату с исследованием METR. Я могу уверенно сказать: я не вижу никакого массивного ускорения (скажем, в 2 раза) от использования ИИ-инструментов для программирования. Если бы оно было, результаты были бы статистически значимыми, и исследование уже можно было бы закрывать.

Это очень разочаровывает.

Я бы хотел, чтобы мечта о программировании с ИИ-ассистентами была реальностью. Хотел бы материализовать в коде каждую дурацкую идею, что у меня когда-либо была. Хотел бы в понедельник сделать приложку для обучения грифу, в среду — тренажёр корейского, а в субботу — игру. Я б это всё зарелизил. Я бы затопил мир потоком ширпотребного трэшового софта^c, какого мир ещё не видел. Если бы ИИ действительно усиливал продуктивность, я бы так точно сделал.

Однако, как выясняется — а я собрал про это много данных — ИИ не повышает производительность труда не только у меня, он не повышает продуктивность ни у кого. И я сейчас это докажу.

Но сперва давайте поглядим, какими сильными и популярными словами рекомендуют продуктивность от ИИ. Слоган Cursor: «Создан, чтобы сделать вас экстраординарно продуктивными». У Claude Code: «Пишите ПО лучше и быстрее». У GitHub Copilot: «Делегируйте как профи». Google утверждает, что их БЯМ делает разработчиков компании на 25 % быстрее. OpenAI публикует свои собственные исследования и громкие заявления об эффективности программирования². И даже сами разработчики не лучше: 14% утверждают, что видят «десятикратный» рост производительности труда благодаря ИИ³.

Рекламные слоганы были бы не так важны, если не максимальная серьёзность темы. Технические руководители по всей отрасли поддаются FOMO^d: конкуренты имеют колоссальный прирост эффективности, а мы этого не получаем! Подобное заставляет ребрендироваться в компании жанра AI-First⁴, оправдывать увольнения новообретёнными нарративами о продуктивности и занижать зарплаты разработчиков, исходя из предположения, что ИИ фундаментально изменил уравнение ценности.

И всё же, несмотря на максимально широкое внедрение, какое только можно вообразить⁵, эти инструменты не работают.

Мой довод: если так много разработчиков стали экстраординарно продуктивными благодаря этим инструментам, где же поток ширпотребного софта? Нашему взору должны предстать приложения всех форм и размеров, видеоигры, новые сайты, мобильные приложения, SaaS — нас должно утопить в изобилии. Мы должны были бы жить в разгаре инди-революции в софте. Мы должны были бы видеть 10 000 клонов «Тетриса» в Steam.

Просто подумайте. Вы много знаете о программировании с ИИ-ассистентами и его широком внедрении. Если я покажу вам графики мировых релизов софта, какую форму вы ожидаете увидеть? Несомненно, устремившуюся вверх и вправо экспоненту, поскольку внедрение ИИ набирает обороты, и софта пишут больше?

Чтобы собрать данные для этой статьи, я потратил много денег и недели времени, в некоторых случаях обрабатывал десятки терабайт. Надеюсь, вы оцените, насколько эти разочаровывающие графики слабо изменяются по всем крупным сегментам разработки.

Среднее число в месяц новых релизов приложений iOS с марта 2019 по апрель 2025 года. Statista

Среднее число в месяц новых релизов приложений в Google Play с марта 2019 года по май 2025 года. Statista

Всего зарегистрированных доменных имён. Domain Name Industry Brief от Verisign

Число новых публичных репозиториев GitHub в месяц. Я спустил $70 на BigQuery, чтобы построить этот график. Через GH Archive

Самое интересное в этих графиках — чего на них нет. На них нет внезапного всплеска или «клюшки» скачка. В лучшем случае они плоские. Нет вспышки трэшового софта. Нет внезапного инди-бума после 2022 и 2023 годов. По этим графикам вы не сможете сказать, когда код стали писать с помощью ИИ-ассистентов. Базовая посылка ошибочна. Никто не релизит больше, чем раньше.

Влияние на человеческие жизни огромно. Людей увольняют за то, что они недостаточно быстро осваивают эти инструменты⁶. Люди сидят на нелюбимой работе, потому что боятся, что в другом месте будет хуже. Люди тратят кучу времени, пытаясь прокачать навыки промптинга, у них не получается, и они чувствуют себя ещё хуже.

Что это за хрень происходит?

Итак, давайте разберёмся. Если вы разработчик и чувствуете давление срочно внедрять эти инструменты — давление от менеджера, коллег или общего отраслевого психоза, — доверьтесь интуиции. Если инструменты кажутся корявыми, если они тормозят вас, если вас сбивает с толку, как другие достигают такой продуктивности, — не надо думать, что с вами что-то не так. Ваш опыт подтверждается данными. Вы не отстаете от остальных, если продолжаете работать так, как у вас получается. Если хватит смелости, покажите эти графики своему менеджеру и спросите, что он о них думает.

Если выносить отсюда какие-то выводы:

Разработчики выпускают не больше, чем раньше. И это единственная метрика, которая важна.
Если кто-то — будь то глава вашей компании, техлид или какой-нибудь умник с Reddit — утверждает, что благодаря ИИ повысил производительность труда на порядок, это почти наверняка неправда. Требуйте предъявить пруфы или катиться к чертям.

О да, я знаю, как бывает в Интернете. Прекрасно знаю, что многие из вас, лопухов, скажут, могу всё угадать. Так что давайте сразу к делу:

«Ну если бы ты научился нормально промптить, ты тоже стал бы 10x-инженером, как я».
Посмотрите на данные. Нет никаких новых 10x-инженеров. Если бы были — если бы 14 % тех, кто объявляет себя 10x-инженером за счёт ИИ, действительно были таковыми — это более чем вдвое увеличило бы мировую выработку нового софта. Этого не случилось. А ты, лично ты, покажи 30 приложений, которые ты сделал в этом году. Я не собираюсь это обсуждать без пруфов.
«Ну это новая технология, в неё так много вложено, и нужно время…»
Да, в эти инструменты вложены миллиарды долларов. И миллиарды долларов будут вкладывать и дальше. Проблема в том, что ИИ-продукты продают и дают им оценки (в том числе затрагивающие реальные жизни людей) так, будто эти продукты работают уже сегодня. Не повторяйте мне мантру, что в будущем всё улучшится. Сейчас сентябрь 2025, ИИ-ассистенты существуют уже годы, но они всё ещё сосут. Наверное, когда-нибудь сосать перестанут, но нам потребуется объективное макродоказательство их влияния на реальную скорость релиза продуктов.
«Ну сейчас ИИ помогает так себе, но если не освоишь ИИ, то останешься позади».
Нет никаких индикаторов, что промптинг трудно освоить. В GitHub про Copilot говорят, что пользователи поначалу принимали лишь 29 % предложенных подсказок кода. Кстати, это само по себе удивительно откровенное признание неэффективности — зачем это публиковать? Дальше GitHub пишет, что программисты естественным путём нарабатывают навык, поэтому за шесть месяцев показатель растёт аж до 34 %. Видимо, полгода опыта улучшает навыки промптинга на 5 %^e.
«Ну качество растёт, возможно. Просто проекты не релизятся быстрее…»
Бред какой-то. Мы все знаем, что отрасль откатилась по качеству кода минимум на десятилетие. Софт уже почти никто не тестирует. В последний раз я слышал фразы «continuous improvement» или «test-driven development» до ковида. Вы же не хуже меня знаете: если бы был инструмент, делающий людей 10x-программистами, нас бы уже утопило в ширпотребном трэшаке.
«Ну просто сейчас всё делают на технологиях веба, и людям уже не так важны отдельные домены; все сидят на поддоменах по типу Vercel».
Да ладно. Люди обожают свои личные домены.
«Ну зато домены в .ai выросли на 47 % в этом году…»
Да, потому что все стартапы запивотились в AI. Это единственный способ выжать деньги из FOMO у инвесторов. А что, общее количество доменных имён выросло беспрецедентно? Нет. Посмотрите на график новых доменов.
«Ну если бы ты был настоящим инженером, ты бы знал, что бо́льшая часть разработки — это не написание кода».
Это верно только в больших корпорациях. Когда ты один — то есть ты и стейкхолдер, и разработчик — у тебя нет митингов. Вы мне хотите сказать, что люди перестали шипить что-то в одиночку? Что люди перестали заводить новые проекты на GitHub, хотя им чешется поработать? Как вообще создание софта может не предполагать написание кода?

1. 28 лет опыта — это примерно 55 000 часов. Мне показалась забавной эта метрика. ↑

2. Сэм Альтман говорит, что с ИИ-программированием разработчики теперь «в 10 раз продуктивнее». И что мир хочет «в 100 раз, может, в 1000 раз больше софта». (С этим я согласен). Альтман также прогнозирует, что программисты «будут зарабатывать втрое больше» в будущем. ↑

3. 78 % использующих ИИ разработчиков сообщают о росте продуктивности, при этом 17 % из них (13–14 % всех опрошенных) заявляют о «десятикратном» увеличении производительности труда благодаря ИИ. ↑

4. Забавно, что ни одна из технологических контор, которая заявляет себя как «AI-First», не обучает, как с ИИ разрабатывать программы на порядок быстрее. «Экспериментируйте и разбирайтесь сами» — вот типичный совет. Видимо, официальные гайды по промптингу (1, 2, 3) не сто́ят и выеденного яйца, потому что не работают. Улавливаете диссонанс? ↑

5. 60 % разработчиков сообщают, что пользуются ИИ-инструментами для программирования ежедневно, 82 % — как минимум еженедельно. ↑

6. На прошлой неделе глава Coinbase уволил инженеров, которые отказывались пользоваться Cursor или Copilot. ↑

Примечания переводчика

a. Дэниэль ЛаРуссо — главный герой кинофраншизы «Парень-каратист» (The Karate Kid). В данном случае перечисляются действия, которые совершил бы оппонент Дэниэля в фильме 1984 года, чем автор дополнительно ещё раз обозначает свой возраст. Тем не менее это неточная отсылка к сюжету: в фильме Джонни Лоуренс не ломает замков из песка, в сцене на пляже он разве что бросает радио на песок. ↑

b. Также это исследование хорошо описано на Хабре. ↑

c. Здесь и далее автор использует конкретный термин shovelware, который в русском языке используется редко. К примеру, на Хабре всего два упоминания термина в статьях. ↑

d. FOMO — Fear Of Missing Out, страх упустить тренд или возможность. ↑

e. Здесь оговорка, поскольку значение выросло на 5 процентных пунктов или на 17,2 %. ↑

Об авторе

Майк Джадж (mikelovesrobots) — американский инженер-программист и руководитель разработки из Сиэтла. Джадж работает директором по разработке в студии Substantial с 2021 года. Он руководил командами, занимался полным циклом проектов и, в числе заметных работ, курировал мобильный порт популярной карточной игры «Взрывные котята». Как инди-разработчик Майк создавал собственные проекты, в том числе учебное приложение Morse Toad (азбука Морзе) и шутливое Places I've Pooped.

Cреди любимых технологий Джаджа — TypeScript/JavaScript, React/React Native, Ruby on Rails, C#, PostgreSQL/GraphQL, Python.