Марио Цехнер о будущем программирования: «Не позволяйте ИИ проектировать архитектуру, он учился на плохом коде»

В эпоху доминирования больших языковых моделей (LLM) индустрия разработки ПО переживает фундаментальную трансформацию. Марио Цехнер (Mario Zechner), создатель ИИ-агента Pi (проект Tokens), в беседе с Дэвидом Ондреем (David Ondrej) анализирует, почему популярные инструменты вроде Claude Code теряют эффективность из-за избыточных функций, как «экономика токенов» создает новый разрыв между богатыми и бедными, и почему человеческое понимание архитектуры остается единственной защитой от «мусорного кода», генерируемого ИИ.

🤖 Рождение Pi: от Claude Code к собственной «инструментальной обвязке» 0:26

Марио Цехнер занимается машинным обучением и NLP с начала 2000-х годов . Несмотря на многолетний опыт, настоящий прорыв в использовании LLM для разработки он зафиксировал лишь в 2024 году с появлением редактора Cursor, а затем — Claude Code . По словам Марио, ключевой инновацией команды Anthropic стало предоставление агенту доступа к терминалу (bash), что позволило модели самостоятельно исследовать кодовую базу . Это явление получило название «агентированный поиск» (agentic search).

Однако успех Claude Code привел к типичной проблеме растущих продуктов — перенасыщению функциями (bloatware). Марио Цехнер отмечает несколько критических проблем, возникших в Claude Code к лету 2025 года:

«Максимизация токенов»: По мнению Марио, разработчики начали добавлять функции, которые неоправданно увеличивают расход токенов.
Нестабильность системных промптов: Постоянные изменения во внутренней логике приложения начали ломать устоявшиеся рабочие процессы пользователя .
«Лоботомия» сессий: В марте 2025 года Anthropic внедрила очистку «цепочек размышлений» (thinking traces) после часа бездействия для снижения задержек . По утверждению Цехнера, это лишает модель памяти о контексте сессии, фактически обнуляя прогресс сложной задачи.

Именно стремление к полному контролю над контекстом и системным промптом побудило Марио создать Pi — минималистичный и стабильный инструмент, лишенный «лишнего мусора» .

💰 Экономика токенов: «Игра для богатых» 10:59

Марио Цехнер и Дэвид Ондрей сошлись во мнении, что текущий этап развития ИИ превращается в «игру для богатых». Обладание средствами производства сегодня означает способность оплачивать огромные счета за токены .

Ценовой барьер: Подписка в $200 в месяц на продвинутых агентов (например, план Codex) уже является экономическим барьером для 99% населения планеты, хотя в ИТ-тусовке эта сумма кажется «копейками» .
Преимущество профессионалов: Марио считает, что опытные разработчики получают кратное преимущество, так как знают, как именно использовать рычаг (leverage) ИИ-агентов.
Внутренняя эффективность: По оценке Дэвида Ондрея, 80–90% реальной пользы от ИИ сейчас извлекается внутри компаний для автоматизации рутины, а не в создании новых публичных продуктов .

В качестве примера Марио привел свою жену-лингвиста. Будучи далекой от программирования, она с помощью Claude Code за два вечера научилась писать Python-скрипты для обработки 18 000 строк данных в Excel и генерации сложных графиков. Ее продуктивность выросла в 5 раз . При этом, как подчеркивает Марио, код может быть «абсолютным слопом» (некачественным), но если он экономит время и решает задачу — это работает .

🇨🇳 Наступление китайских моделей и оптимизация затрат 17:43

Оба участника дискуссии с энтузиазмом встретили появление новых моделей с открытыми весами, таких как DeepSeek-V4 и Kimi (Kimmy). По мнению Марио, американские лаборатории вроде Anthropic удерживают маржинальность на уровне 70% и выше, но китайские конкуренты начинают «разрушать их токеномику» .

Локальный запуск: Марио экспериментирует с запуском моделей Kimmy на собственных GPU-кластерах, что обходится дешевле, чем API Anthropic, при сопоставимом уровне интеллекта .
Конфиденциальность: Собственный хостинг позволяет оставлять данные внутри компании, что критически важно для бизнеса .
Требования к железу: Дэвид Ондрей отметил, что для комфортной работы с локальными моделями (например, новыми Gemma или DeepSeek) ему уже не хватает 128 ГБ ОЗУ на MacBook, и он ожидает модели с 256 ГБ для запуска сетей на 300+ млрд параметров .

🇪🇺 Почему Европа проигрывает ИИ-гонку? 24:48

Обсуждая отсутствие значимых ИИ-игроков в Европе, Марио Цехнер выделил системные причины, не связанные с регуляцией (AI Act):

Утечка мозгов: США активно переманивают таланты из Европы и Китая, предлагая капиталы, которых нет в ЕС .
Юридическая фрагментация: В США регистрация компании в Делавэре дает единый правовой фреймворк для всех штатов. В Европе при открытии офиса в новой стране приходится сталкиваться с уникальным законодательством .
Сложность инвестиций: Механизмы опционов (RSU) и налогообложения в ЕС гораздо сложнее и менее выгодны для сотрудников и инвесторов, чем в США .

Марио поддерживает движение EU Inc., направленное на унификацию корпоративного права в Евросоюзе, но выражает скепсис относительно способности бюрократов реализовать это без ошибок .

🛠️ Ворклоу и архитектурное мышление 38:42

Марио Цехнер раскрыл свой подход к разработке с помощью Pi. Его рабочий процесс строится на строгих шаблонах промптов:

Анализ: Агент получает задачу из GitHub, анализирует её и предлагает план реализации.
Параллелизм: Марио запускает до 4 терминалов с разными задачами одновременно .
Человеческий контроль: Рефакторинг и изменения в API Марио часто делает вручную, чтобы сохранить «чувство кода» и понимание системы .

Главное предостережение для молодых разработчиков: ИИ отлично справляется с написанием кода (синтаксисом), но плох в проектировании систем (архитектуре). Модели обучались на огромном количестве старого и некачественного кода из интернета . Если доверить ИИ дизайн системы, он предложит усредненное, посредственное решение.

🧠 Пределы LLM: проблема обучающих данных 44:24

Марио Цехнер выдвинул гипотезу, почему ИИ вряд ли заменит человека в высших когнитивных задачах в ближайшее время. Проблема заключается в «облаке данных»:

Интерполяция vs Экстраполяция: Модель может комбинировать точки внутри «облака» изученных данных, но не способна выйти за его пределы .
Отсутствие данных о процессе: В интернете много готового кода (результата), но практически нет записей самого процесса проектирования и принятия архитектурных решений .
Статистическая предвзятость: 90% кода в обучающей выборке — «мусор». Высококачественные, гениальные решения составляют ничтожную долю и подавляются статистической мощью посредственных примеров при обучении .

«Мягкие человеческие навыки», жизненный опыт и вкус — это то, что невозможно закодировать в токены . Именно это, по мнению гостя, останется главным преимуществом человека.