В эпоху доминирования больших языковых моделей (LLM) индустрия разработки ПО переживает фундаментальную трансформацию. Марио Цехнер (Mario Zechner), создатель ИИ-агента Pi (проект Tokens), в беседе с Дэвидом Ондреем (David Ondrej) анализирует, почему популярные инструменты вроде Claude Code теряют эффективность из-за избыточных функций, как «экономика токенов» создает новый разрыв между богатыми и бедными, и почему человеческое понимание архитектуры остается единственной защитой от «мусорного кода», генерируемого ИИ.
🤖 Рождение Pi: от Claude Code к собственной «инструментальной обвязке» 0:26
Марио Цехнер занимается машинным обучением и NLP с начала 2000-х годов . Несмотря на многолетний опыт, настоящий прорыв в использовании LLM для разработки он зафиксировал лишь в 2024 году с появлением редактора Cursor, а затем — Claude Code . По словам Марио, ключевой инновацией команды Anthropic стало предоставление агенту доступа к терминалу (bash), что позволило модели самостоятельно исследовать кодовую базу . Это явление получило название «агентированный поиск» (agentic search).
Однако успех Claude Code привел к типичной проблеме растущих продуктов — перенасыщению функциями (bloatware). Марио Цехнер отмечает несколько критических проблем, возникших в Claude Code к лету 2025 года:
- «Максимизация токенов»: По мнению Марио, разработчики начали добавлять функции, которые неоправданно увеличивают расход токенов.
- Нестабильность системных промптов: Постоянные изменения во внутренней логике приложения начали ломать устоявшиеся рабочие процессы пользователя .
- «Лоботомия» сессий: В марте 2025 года Anthropic внедрила очистку «цепочек размышлений» (thinking traces) после часа бездействия для снижения задержек . По утверждению Цехнера, это лишает модель памяти о контексте сессии, фактически обнуляя прогресс сложной задачи.
Именно стремление к полному контролю над контекстом и системным промптом побудило Марио создать Pi — минималистичный и стабильный инструмент, лишенный «лишнего мусора» .
💰 Экономика токенов: «Игра для богатых» 10:59
Марио Цехнер и Дэвид Ондрей сошлись во мнении, что текущий этап развития ИИ превращается в «игру для богатых». Обладание средствами производства сегодня означает способность оплачивать огромные счета за токены .
- Ценовой барьер: Подписка в $200 в месяц на продвинутых агентов (например, план Codex) уже является экономическим барьером для 99% населения планеты, хотя в ИТ-тусовке эта сумма кажется «копейками» .
- Преимущество профессионалов: Марио считает, что опытные разработчики получают кратное преимущество, так как знают, как именно использовать рычаг (leverage) ИИ-агентов.
- Внутренняя эффективность: По оценке Дэвида Ондрея, 80–90% реальной пользы от ИИ сейчас извлекается внутри компаний для автоматизации рутины, а не в создании новых публичных продуктов .
В качестве примера Марио привел свою жену-лингвиста. Будучи далекой от программирования, она с помощью Claude Code за два вечера научилась писать Python-скрипты для обработки 18 000 строк данных в Excel и генерации сложных графиков. Ее продуктивность выросла в 5 раз . При этом, как подчеркивает Марио, код может быть «абсолютным слопом» (некачественным), но если он экономит время и решает задачу — это работает .
🇨🇳 Наступление китайских моделей и оптимизация затрат 17:43
Оба участника дискуссии с энтузиазмом встретили появление новых моделей с открытыми весами, таких как DeepSeek-V4 и Kimi (Kimmy). По мнению Марио, американские лаборатории вроде Anthropic удерживают маржинальность на уровне 70% и выше, но китайские конкуренты начинают «разрушать их токеномику» .
- Локальный запуск: Марио экспериментирует с запуском моделей Kimmy на собственных GPU-кластерах, что обходится дешевле, чем API Anthropic, при сопоставимом уровне интеллекта .
- Конфиденциальность: Собственный хостинг позволяет оставлять данные внутри компании, что критически важно для бизнеса .
- Требования к железу: Дэвид Ондрей отметил, что для комфортной работы с локальными моделями (например, новыми Gemma или DeepSeek) ему уже не хватает 128 ГБ ОЗУ на MacBook, и он ожидает модели с 256 ГБ для запуска сетей на 300+ млрд параметров .
🇪🇺 Почему Европа проигрывает ИИ-гонку? 24:48
Обсуждая отсутствие значимых ИИ-игроков в Европе, Марио Цехнер выделил системные причины, не связанные с регуляцией (AI Act):
- Утечка мозгов: США активно переманивают таланты из Европы и Китая, предлагая капиталы, которых нет в ЕС .
- Юридическая фрагментация: В США регистрация компании в Делавэре дает единый правовой фреймворк для всех штатов. В Европе при открытии офиса в новой стране приходится сталкиваться с уникальным законодательством .
- Сложность инвестиций: Механизмы опционов (RSU) и налогообложения в ЕС гораздо сложнее и менее выгодны для сотрудников и инвесторов, чем в США .
Марио поддерживает движение EU Inc., направленное на унификацию корпоративного права в Евросоюзе, но выражает скепсис относительно способности бюрократов реализовать это без ошибок .
🛠️ Ворклоу и архитектурное мышление 38:42
Марио Цехнер раскрыл свой подход к разработке с помощью Pi. Его рабочий процесс строится на строгих шаблонах промптов:
- Анализ: Агент получает задачу из GitHub, анализирует её и предлагает план реализации.
- Параллелизм: Марио запускает до 4 терминалов с разными задачами одновременно .
- Человеческий контроль: Рефакторинг и изменения в API Марио часто делает вручную, чтобы сохранить «чувство кода» и понимание системы .
Главное предостережение для молодых разработчиков: ИИ отлично справляется с написанием кода (синтаксисом), но плох в проектировании систем (архитектуре). Модели обучались на огромном количестве старого и некачественного кода из интернета . Если доверить ИИ дизайн системы, он предложит усредненное, посредственное решение.
🧠 Пределы LLM: проблема обучающих данных 44:24
Марио Цехнер выдвинул гипотезу, почему ИИ вряд ли заменит человека в высших когнитивных задачах в ближайшее время. Проблема заключается в «облаке данных»:
- Интерполяция vs Экстраполяция: Модель может комбинировать точки внутри «облака» изученных данных, но не способна выйти за его пределы .
- Отсутствие данных о процессе: В интернете много готового кода (результата), но практически нет записей самого процесса проектирования и принятия архитектурных решений .
- Статистическая предвзятость: 90% кода в обучающей выборке — «мусор». Высококачественные, гениальные решения составляют ничтожную долю и подавляются статистической мощью посредственных примеров при обучении .
«Мягкие человеческие навыки», жизненный опыт и вкус — это то, что невозможно закодировать в токены . Именно это, по мнению гостя, останется главным преимуществом человека.