# Насрин Мостафазаде: «Современные языковые модели — вовсе не попугаи»

Источник: https://www.youtube.com/watch?v=FEVIGcL57Xc
Канал: The TWIML AI Podcast
Опубликовано: 24.11.2021

---

Насрин Мостафазаде, соосновательница диптех-стартапа Vernique, стала гостьей подкаста The TWIML AI Podcast, чтобы рассказать о своем пути в индустрии обработки естественного языка (NLP). В беседе с ведущим Сэмом Чаррингтон она раскрыла философию компании, создающей универсальный интерфейс для анализа любых данных, и поделилась взглядом на фундаментальные проблемы современных языковых моделей. Статья описывает путь стартапа от драматического запуска в начале 2020 года до выработки уникальных подходов к разработке и поиску технологического соответствия рынку.

## 🌍 Исток: От геополитического кризиса к запуску в разгар пандемии
[[JUMP:01:08]]

Предыстория создания компании Vernique неразрывно связана с драматическими мировыми событиями начала 2020 года. Насрин Мостафазаде вспоминает, что ее предыдущее интервью на подкасте состоялось 3 января 2020 года — буквально на следующий день после того, как обострение отношений между США и Ираном поставило регион на грань войны. Спустя несколько дней, 8 января, произошла авиакатастрофа украинского самолета, унесшая жизни 176 человек, среди которых были школьные друзья Насрин. Эти потрясения заставили ее переосмыслить свою жизнь и ускорить реализацию давней мечты о создании собственного бизнеса, способного приносить реальную пользу миру.

Официальным первым днем работы стартапа Vernique в Нью-Йорке стало 1 марта 2020 года. Основатели планировали классическое развитие глубоко технологичной компании: постепенный наем команды и выход на раунды финансирования. Однако уже в середине марта мегаполис закрылся на карантин из-за пандемии COVID-19.

Вместо паники сооснователи приняли стратегическое решение:

* Поставить активные бизнес-процессы на паузу на пару месяцев, чтобы оценить траекторию движения мирового рынка.
* Сфокусироваться на внутренних исследованиях, пока венчурный сектор адаптировался к кризису.

Уже в конце 2020 года команда открыла раунд финансирования и успешно закрыла его всего за один месяц. По мнению Мостафазаде, экстремальные условия запуска помогли стартапу развить уникальную стойкость и управленческие «мышцы», которые теперь позволяют компании легко справляться с любыми текущими вызовами.

## 🎯 Миссия Vernique: Универсальный интерфейс для анализа данных
[[JUMP:05:57]]

Глобальная цель Vernique заключается в том, чтобы позволить любому человеку принимать взвешенные решения на основе данных без необходимости обладать техническим бэкграундом. Насрин Мостафазаде отмечает, что компания работает в области человеко-машинных интерфейсов, стремясь заменить сложные языки программирования интуитивными модальностями взаимодействия, включая естественную человеческую речь.

Для иллюстрации проблемы фрагментации данных Мостафазаде приводит личный пример из сферы персонального здоровья:

* Она практикует интервальное голодание и фиксирует часы отказа от пищи в одном приложении.
* Параллельно она использует второе приложение для ведения дневника питания из-за определенных медицинских показаний.
* Каждое утро она взвешивается на умных весах, которые отправляют данные в третье, отдельное приложение.

Даже для нее, как для технического специалиста, ответ на простой вопрос о корреляции между снижением веса и часами голодания требует выгрузки данных и написания скрипта на Python. Для обычных людей или малого бизнеса такие барьеры делают принятие решений вслепую неизбежным. Vernique стремится создать единый гибкий интерфейс, который сможет автономно ориентироваться в разрозненных источниках информации и предоставлять точные аналитические инсайты.

## 🔬 Научный фронт: Ограничения современных LLM и защита «мировых моделей»
[[JUMP:21:51]]

Исследовательский путь Насрин Мостафазаде начался еще в старших классах с робототехники, после чего она переключилась на понимание естественного языка (NLU) и моделирование здравого смысла (common sense reasoning). Она занималась этой темой в эпоху доминирования сетей BiLSTM в 2015–2016 годах, а затем застала революцию трансформеров в 2017 году. В 2016 году Насрин разработала бенчмарк Story Cloze Test для проверки логики ИИ при завершении коротких историй, а в 2020 году участвовала в создании проекта Glucose в компании Elemental Cognition для построения причинно-следственных цепочек.

В подкасте развернулась дискуссия вокруг знаменитой научной статьи о «стохастических попугаях» (Stochastic Parrots), утверждающей, что большие языковые модели лишь имитируют речь, не понимая сути. Насрин Мостафазаде категорически не согласна с этой концепцией:

* По ее мнению, отрицать наличие у моделей зачатков человеческого познания и «модели мира» (world model) научно некорректно.
* Она утверждает, что дистрибутивная семантика является жизнеспособным способом репрезентации смыслов.
* В качестве аргумента Мостафазаде приводит zero-shot результаты GPT-3 на ее тесте Story Cloze Test в 2020 году, где модель без предварительного обучения набрала более 80% правильных ответов, что превзошло все ожидания научного сообщества.

Впрочем, гостья признает текущую хрупкость (brittleness) ИИ-систем. По оценке Мостафазаде, современные коммерческие модели имеют критические изъяны: они глубоко предвзяты, их легко запутать, они непрозрачны и не поддаются прямому контролю со стороны пользователя. Именно на решении этих фундаментальных академических проблем сейчас сосредоточена R&D-команда Vernique.

Основные направления исследований стартапа включают:

* **Retrieval-Augmented Generation (RAG):** создание систем, которые не генерируют факты «из головы», а извлекают их из верифицированных источников с сохранением точного происхождения (provenance) данных.
* **Управляемость и интерактивное обучение:** разработка механизмов обратной связи, позволяющих пользователю точечно переобучать интерфейс или заставлять его «забывать» ошибочно усвоенную информацию.
* **Эффективность выборки (sample efficiency):** снижение потребности моделей в гигантских объемах данных для быстрой адаптации к новым предметным областям.
* **Диалоговое планирование на базе BDI:** интеграция классической концепции Belief-Desire-Intention (Убеждение-Желание-Намерение) для удержания контекста многошаговой беседы.

## 🛠️ Стратегия вывода продукта: Концепция «Lagom» и баланс 80/20
[[JUMP:12:05]]

Масштаб научных задач стартапа выглядит огромным для команды из 8 человек. Отвечая на вопрос ведущего о формировании минимально жизнеспособного продукта (MVP), Насрин Мостафазаде ввела внутренний термин «Lagom Vernique». Шведское слово *lagom* означает «ровно столько, сколько нужно», и команда использует его как противовес традиционному подходу к MVP, который часто оказывается либо перегруженным, либо нежизнеспособным.

Чтобы не утонуть в фундаментальной науке и начать получать сигналы от реального рынка, руководство внедрило жесткое продуктовое правило:

1.  Технология разворачивается последовательно — строго по одной предметной области (domain) за раз.
2.  Ограничение кастомизации: если адаптация под конкретную индустрию требует изменения общего ядра платформы более чем на 20%, команда считает это избыточной спецификацией.
3.  Базовый код должен оставаться универсальным на 80%, гарантируя последующую масштабируемость системы на другие рынки.

По мнению Мостафазаде, такой подход позволяет собирать чистый фидбек от пользователей, удерживая фокус на долгосрочном создании мультидоменной ИИ-платформы.

## 🚀 Культура разработки и текущий этап: Мем про Человека-паука в действии
[[JUMP:43:45]]

Описывая внутреннюю культуру Vernique, Насрин Мостафазаде поделилась управленческим лайфхаком, основанным на популярном интернет-меме о наброске Человека-паука за 10 секунд и за 10 минут. Суть правила заключается в том, что даже признанный мастер своего дела обязан уметь выдать черновую, но рабочую версию продукта мгновенно.

Этот принцип «10 секунд» пронизывает всю работу стартапа:

* Дизайнеру компании было выделено всего две недели на создание полноценного прототипа UI/UX с нуля, и задача была успешно выполнена.
* Аналогичный подход применяется на этапах собеседования инженеров и исследователей.
* Команда не пытается решить все научные проблемы одновременно, а последовательно создает экспресс-версии модулей для проверки гипотез.

Сейчас Vernique находится на стадии технологического стелс-режима в престижном районе Флэтайрон в Нью-Йорке. Штат компании состоит из 8 постоянных сотрудников, и ведется активный наем как в технический, так и в бизнес-департаменты с целью расширения команды до 12 человек.

В завершение встречи Мостафазаде отметила, что глубоко технологические стартапы сталкиваются со специфической проблемой — поиском не просто Product Market Fit, а Technology Market Fit. Это ситуация, когда у фаундеров есть мощная универсальная технология, и главная сложность заключается в сужении гигантского поискового пространства для выбора оптимального рынка и продукта. Насрин пообещала раскрыть первые практические результаты этого поиска во время следующей встречи на подкасте.