Насрин Мостафазаде: «Современные языковые модели — вовсе не попугаи»

Насрин Мостафазаде, соосновательница диптех-стартапа Vernique, стала гостьей подкаста The TWIML AI Podcast, чтобы рассказать о своем пути в индустрии обработки естественного языка (NLP). В беседе с ведущим Сэмом Чаррингтон она раскрыла философию компании, создающей универсальный интерфейс для анализа любых данных, и поделилась взглядом на фундаментальные проблемы современных языковых моделей. Статья описывает путь стартапа от драматического запуска в начале 2020 года до выработки уникальных подходов к разработке и поиску технологического соответствия рынку.

🌍 Исток: От геополитического кризиса к запуску в разгар пандемии 1:08

Предыстория создания компании Vernique неразрывно связана с драматическими мировыми событиями начала 2020 года. Насрин Мостафазаде вспоминает, что ее предыдущее интервью на подкасте состоялось 3 января 2020 года — буквально на следующий день после того, как обострение отношений между США и Ираном поставило регион на грань войны. Спустя несколько дней, 8 января, произошла авиакатастрофа украинского самолета, унесшая жизни 176 человек, среди которых были школьные друзья Насрин. Эти потрясения заставили ее переосмыслить свою жизнь и ускорить реализацию давней мечты о создании собственного бизнеса, способного приносить реальную пользу миру.

Официальным первым днем работы стартапа Vernique в Нью-Йорке стало 1 марта 2020 года. Основатели планировали классическое развитие глубоко технологичной компании: постепенный наем команды и выход на раунды финансирования. Однако уже в середине марта мегаполис закрылся на карантин из-за пандемии COVID-19.

Вместо паники сооснователи приняли стратегическое решение:

Поставить активные бизнес-процессы на паузу на пару месяцев, чтобы оценить траекторию движения мирового рынка.
Сфокусироваться на внутренних исследованиях, пока венчурный сектор адаптировался к кризису.

Уже в конце 2020 года команда открыла раунд финансирования и успешно закрыла его всего за один месяц. По мнению Мостафазаде, экстремальные условия запуска помогли стартапу развить уникальную стойкость и управленческие «мышцы», которые теперь позволяют компании легко справляться с любыми текущими вызовами.

🎯 Миссия Vernique: Универсальный интерфейс для анализа данных 5:57

Глобальная цель Vernique заключается в том, чтобы позволить любому человеку принимать взвешенные решения на основе данных без необходимости обладать техническим бэкграундом. Насрин Мостафазаде отмечает, что компания работает в области человеко-машинных интерфейсов, стремясь заменить сложные языки программирования интуитивными модальностями взаимодействия, включая естественную человеческую речь.

Для иллюстрации проблемы фрагментации данных Мостафазаде приводит личный пример из сферы персонального здоровья:

Она практикует интервальное голодание и фиксирует часы отказа от пищи в одном приложении.
Параллельно она использует второе приложение для ведения дневника питания из-за определенных медицинских показаний.
Каждое утро она взвешивается на умных весах, которые отправляют данные в третье, отдельное приложение.

Даже для нее, как для технического специалиста, ответ на простой вопрос о корреляции между снижением веса и часами голодания требует выгрузки данных и написания скрипта на Python. Для обычных людей или малого бизнеса такие барьеры делают принятие решений вслепую неизбежным. Vernique стремится создать единый гибкий интерфейс, который сможет автономно ориентироваться в разрозненных источниках информации и предоставлять точные аналитические инсайты.

🔬 Научный фронт: Ограничения современных LLM и защита «мировых моделей» 21:51

Исследовательский путь Насрин Мостафазаде начался еще в старших классах с робототехники, после чего она переключилась на понимание естественного языка (NLU) и моделирование здравого смысла (common sense reasoning). Она занималась этой темой в эпоху доминирования сетей BiLSTM в 2015–2016 годах, а затем застала революцию трансформеров в 2017 году. В 2016 году Насрин разработала бенчмарк Story Cloze Test для проверки логики ИИ при завершении коротких историй, а в 2020 году участвовала в создании проекта Glucose в компании Elemental Cognition для построения причинно-следственных цепочек.

В подкасте развернулась дискуссия вокруг знаменитой научной статьи о «стохастических попугаях» (Stochastic Parrots), утверждающей, что большие языковые модели лишь имитируют речь, не понимая сути. Насрин Мостафазаде категорически не согласна с этой концепцией:

По ее мнению, отрицать наличие у моделей зачатков человеческого познания и «модели мира» (world model) научно некорректно.
Она утверждает, что дистрибутивная семантика является жизнеспособным способом репрезентации смыслов.
В качестве аргумента Мостафазаде приводит zero-shot результаты GPT-3 на ее тесте Story Cloze Test в 2020 году, где модель без предварительного обучения набрала более 80% правильных ответов, что превзошло все ожидания научного сообщества.

Впрочем, гостья признает текущую хрупкость (brittleness) ИИ-систем. По оценке Мостафазаде, современные коммерческие модели имеют критические изъяны: они глубоко предвзяты, их легко запутать, они непрозрачны и не поддаются прямому контролю со стороны пользователя. Именно на решении этих фундаментальных академических проблем сейчас сосредоточена R&D-команда Vernique.

Основные направления исследований стартапа включают:

Retrieval-Augmented Generation (RAG): создание систем, которые не генерируют факты «из головы», а извлекают их из верифицированных источников с сохранением точного происхождения (provenance) данных.
Управляемость и интерактивное обучение: разработка механизмов обратной связи, позволяющих пользователю точечно переобучать интерфейс или заставлять его «забывать» ошибочно усвоенную информацию.
Эффективность выборки (sample efficiency): снижение потребности моделей в гигантских объемах данных для быстрой адаптации к новым предметным областям.
Диалоговое планирование на базе BDI: интеграция классической концепции Belief-Desire-Intention (Убеждение-Желание-Намерение) для удержания контекста многошаговой беседы.

🛠️ Стратегия вывода продукта: Концепция «Lagom» и баланс 80/20 12:05

Масштаб научных задач стартапа выглядит огромным для команды из 8 человек. Отвечая на вопрос ведущего о формировании минимально жизнеспособного продукта (MVP), Насрин Мостафазаде ввела внутренний термин «Lagom Vernique». Шведское слово lagom означает «ровно столько, сколько нужно», и команда использует его как противовес традиционному подходу к MVP, который часто оказывается либо перегруженным, либо нежизнеспособным.

Чтобы не утонуть в фундаментальной науке и начать получать сигналы от реального рынка, руководство внедрило жесткое продуктовое правило:

Технология разворачивается последовательно — строго по одной предметной области (domain) за раз.
Ограничение кастомизации: если адаптация под конкретную индустрию требует изменения общего ядра платформы более чем на 20%, команда считает это избыточной спецификацией.
Базовый код должен оставаться универсальным на 80%, гарантируя последующую масштабируемость системы на другие рынки.

По мнению Мостафазаде, такой подход позволяет собирать чистый фидбек от пользователей, удерживая фокус на долгосрочном создании мультидоменной ИИ-платформы.

🚀 Культура разработки и текущий этап: Мем про Человека-паука в действии 43:45

Описывая внутреннюю культуру Vernique, Насрин Мостафазаде поделилась управленческим лайфхаком, основанным на популярном интернет-меме о наброске Человека-паука за 10 секунд и за 10 минут. Суть правила заключается в том, что даже признанный мастер своего дела обязан уметь выдать черновую, но рабочую версию продукта мгновенно.

Этот принцип «10 секунд» пронизывает всю работу стартапа:

Дизайнеру компании было выделено всего две недели на создание полноценного прототипа UI/UX с нуля, и задача была успешно выполнена.
Аналогичный подход применяется на этапах собеседования инженеров и исследователей.
Команда не пытается решить все научные проблемы одновременно, а последовательно создает экспресс-версии модулей для проверки гипотез.

Сейчас Vernique находится на стадии технологического стелс-режима в престижном районе Флэтайрон в Нью-Йорке. Штат компании состоит из 8 постоянных сотрудников, и ведется активный наем как в технический, так и в бизнес-департаменты с целью расширения команды до 12 человек.

В завершение встречи Мостафазаде отметила, что глубоко технологические стартапы сталкиваются со специфической проблемой — поиском не просто Product Market Fit, а Technology Market Fit. Это ситуация, когда у фаундеров есть мощная универсальная технология, и главная сложность заключается в сужении гигантского поискового пространства для выбора оптимального рынка и продукта. Насрин пообещала раскрыть первые практические результаты этого поиска во время следующей встречи на подкасте.