Эндрю Ли, основатель и генеральный директор Shortwave, зафиксировал экспоненциальный рост выручки компании в начале 2025 года . В интервью Натану Лабенцу он объяснил этот скачок переходом от базового ИИ-помощника к полноценному автономному агенту, который управляет почтой на уровне виртуального сотрудника . Shortwave больше не позиционирует себя как почтовый клиент с функциями ИИ. Теперь это ИИ-агент, интегрированный с коммуникационными каналами пользователя .
🛠 Эволюция продукта: от ассистента к агенту 5:09
Год назад функции ИИ в Shortwave ограничивались поиском и черновиками писем, которые Эндрю Ли оценивает как работающие «удовлетворительно» . Модель часто ошибалась в деталях и не имела доступа к управлению контактами или календарем. Пользователь не мог полностью доверять системе выполнение критических задач.
Текущая версия продукта имитирует поведение реального ассистента . Она способна анализировать сотни писем, извлекать задачи и самостоятельно принимать решения. Основные сценарии использования включают:
- Анализ вложений: поиск условий оплаты в PDF-контрактах или создание инвентарных описей на основе чеков из истории почты .
- Интеграция без кода: создание задач в сторонних сервисах (например, Linear) через генерацию специфических URL-адресов .
- Персонализированные рассылки: агент изучает историю переписки с каждым адресатом из списка, чтобы составить уникальное приветствие .
🏗 Технологический стек: полный перезапуск системы 14:11
За последний год команда Shortwave полностью переписала инфраструктуру проекта . Разработчики заменили модель эмбеддингов, векторную базу данных и логику работы агента.
Эндрю Ли перевёл систему на Pinecone Serverless . Эта архитектура разделяет хранение и вычисления, что критично при индексации огромных массивов электронной почты. Для поиска используется гибридная модель: она сочетает классический полнотекстовый поиск по ключевым словам и семантический поиск через модель BGE .
Ключевым изменением стал отказ от однократных запросов к языковым моделям в пользу итеративного подхода . Теперь агент может выполнять до 20 последовательных вызовов инструментов для решения одной задачи. Если поиск не дал результатов, модель анализирует ошибку и пробует другие параметры запроса.
💰 Оптимизация затрат и выбор моделей 34:04
Shortwave использует модели от трёх разных поставщиков, выбирая их под конкретные задачи. Для автодополнения текста применяется тонко настроенная GPT-4o mini из-за её низкой задержки . Быстрые ответы генерирует Llama 3.2 (3B), запущенная на Google Cloud Vertex .
Основным «мозгом» агента стала модель Claude 3.5 Sonnet (версия от октября 2024 года) . Эндрю Ли выбрал её из-за превосходной работы с инструментами и функции кэширования контекста .
Экономические аспекты использования Claude:
- Кэширование Anthropic снижает стоимость повторных вызовов на 90% .
- Без кэширования агентская работа с длинными контекстами (сотни тысяч токенов) была бы убыточной для бизнеса .
- Компания перешла на маржинально прибыльную модель, предлагая премиальные планы для активных пользователей ИИ .
📉 Стратегия «Маленькой команды» и новая культура 1:12:35
Эндрю Ли радикально изменил подход к найму и структуре компании. Он считает, что в эпоху ИИ единственным защитным преимуществом (moat) стартапа является скорость . Для её сохранения Shortwave планирует ограничивать штат 15–20 сотрудниками, избегая бюрократии крупных команд .
В компании формируется AI-forward культура . Роль сотрудника смещается от исполнения к управлению. Программисты в Shortwave не просто пишут код, они управляют ИИ-агентами в Cursor, которые исправляют баги в один клик . Дизайнеры начинают работу не с макетов в Figma, а с создания работающих прототипов через инструменты вроде Bolt.new .
Принципы найма в Shortwave:
- Обязательное присутствие в офисе в Сан-Франциско для максимальной скорости коммуникации .
- Поиск людей, увлечённых ИИ и умеющих делегировать задачи моделям .
- Отказ от традиционных тестовых заданий в пользу видеопрезентаций реальных проектов, созданных с помощью ИИ .
- Реферальный бонус в размере $10 000 за успешного кандидата .
🔮 Будущее софта и коммуникаций 1:43:28
Эндрю Ли прогнозирует, что через два года значительная часть кода в индустрии будет писаться ИИ . Ценность сместится от навыка написания кода к пониманию бизнес-задач и архитектурному мышлению .
Shortwave планирует стать слоем маршрутизации для всех деловых коммуникаций . В будущем агент сможет самостоятельно обрабатывать входящие события из Slack, LinkedIn и CRM, принимая решения на основе всей истории взаимодействия с контрагентом.
Разработчики следят за развитием моделей рассуждения (reasoning models) и нативного мультимодального голоса . Это позволит пользователям управлять рабочими процессами голосом, не будучи привязанными к экрану монитора.