Насрин Мостафазаде: «Современные языковые модели — вовсе не попугаи»

The TWIML AI Podcast 1,3 тыс. 53 мин 6 мин 24.11.2021
Главное

Насрин Мостафазаде, соосновательница диптех-стартапа Vernique, стала гостьей подкаста The TWIML AI Podcast, чтобы рассказать о своем пути в индустрии обработки естественного языка (NLP). В беседе с ведущим Сэмом Чаррингтон она раскрыла философию компании, создающей универсальный интерфейс для анализа любых данных, и поделилась взглядом на фундаментальные проблемы современных языковых моделей. Статья описывает путь стартапа от драматического запуска в начале 2020 года до выработки уникальных подходов к разработке и поиску технологического соответствия рынку.

🌍 Исток: От геополитического кризиса к запуску в разгар пандемии 1:08

Предыстория создания компании Vernique неразрывно связана с драматическими мировыми событиями начала 2020 года. Насрин Мостафазаде вспоминает, что ее предыдущее интервью на подкасте состоялось 3 января 2020 года — буквально на следующий день после того, как обострение отношений между США и Ираном поставило регион на грань войны. Спустя несколько дней, 8 января, произошла авиакатастрофа украинского самолета, унесшая жизни 176 человек, среди которых были школьные друзья Насрин. Эти потрясения заставили ее переосмыслить свою жизнь и ускорить реализацию давней мечты о создании собственного бизнеса, способного приносить реальную пользу миру.

Официальным первым днем работы стартапа Vernique в Нью-Йорке стало 1 марта 2020 года. Основатели планировали классическое развитие глубоко технологичной компании: постепенный наем команды и выход на раунды финансирования. Однако уже в середине марта мегаполис закрылся на карантин из-за пандемии COVID-19.

Вместо паники сооснователи приняли стратегическое решение:

Уже в конце 2020 года команда открыла раунд финансирования и успешно закрыла его всего за один месяц. По мнению Мостафазаде, экстремальные условия запуска помогли стартапу развить уникальную стойкость и управленческие «мышцы», которые теперь позволяют компании легко справляться с любыми текущими вызовами.

🎯 Миссия Vernique: Универсальный интерфейс для анализа данных 5:57

Глобальная цель Vernique заключается в том, чтобы позволить любому человеку принимать взвешенные решения на основе данных без необходимости обладать техническим бэкграундом. Насрин Мостафазаде отмечает, что компания работает в области человеко-машинных интерфейсов, стремясь заменить сложные языки программирования интуитивными модальностями взаимодействия, включая естественную человеческую речь.

Для иллюстрации проблемы фрагментации данных Мостафазаде приводит личный пример из сферы персонального здоровья:

Даже для нее, как для технического специалиста, ответ на простой вопрос о корреляции между снижением веса и часами голодания требует выгрузки данных и написания скрипта на Python. Для обычных людей или малого бизнеса такие барьеры делают принятие решений вслепую неизбежным. Vernique стремится создать единый гибкий интерфейс, который сможет автономно ориентироваться в разрозненных источниках информации и предоставлять точные аналитические инсайты.

🔬 Научный фронт: Ограничения современных LLM и защита «мировых моделей» 21:51

Исследовательский путь Насрин Мостафазаде начался еще в старших классах с робототехники, после чего она переключилась на понимание естественного языка (NLU) и моделирование здравого смысла (common sense reasoning). Она занималась этой темой в эпоху доминирования сетей BiLSTM в 2015–2016 годах, а затем застала революцию трансформеров в 2017 году. В 2016 году Насрин разработала бенчмарк Story Cloze Test для проверки логики ИИ при завершении коротких историй, а в 2020 году участвовала в создании проекта Glucose в компании Elemental Cognition для построения причинно-следственных цепочек.

В подкасте развернулась дискуссия вокруг знаменитой научной статьи о «стохастических попугаях» (Stochastic Parrots), утверждающей, что большие языковые модели лишь имитируют речь, не понимая сути. Насрин Мостафазаде категорически не согласна с этой концепцией:

Впрочем, гостья признает текущую хрупкость (brittleness) ИИ-систем. По оценке Мостафазаде, современные коммерческие модели имеют критические изъяны: они глубоко предвзяты, их легко запутать, они непрозрачны и не поддаются прямому контролю со стороны пользователя. Именно на решении этих фундаментальных академических проблем сейчас сосредоточена R&D-команда Vernique.

Основные направления исследований стартапа включают:

🛠️ Стратегия вывода продукта: Концепция «Lagom» и баланс 80/20 12:05

Масштаб научных задач стартапа выглядит огромным для команды из 8 человек. Отвечая на вопрос ведущего о формировании минимально жизнеспособного продукта (MVP), Насрин Мостафазаде ввела внутренний термин «Lagom Vernique». Шведское слово lagom означает «ровно столько, сколько нужно», и команда использует его как противовес традиционному подходу к MVP, который часто оказывается либо перегруженным, либо нежизнеспособным.

Чтобы не утонуть в фундаментальной науке и начать получать сигналы от реального рынка, руководство внедрило жесткое продуктовое правило:

  1. Технология разворачивается последовательно — строго по одной предметной области (domain) за раз.
  2. Ограничение кастомизации: если адаптация под конкретную индустрию требует изменения общего ядра платформы более чем на 20%, команда считает это избыточной спецификацией.
  3. Базовый код должен оставаться универсальным на 80%, гарантируя последующую масштабируемость системы на другие рынки.

По мнению Мостафазаде, такой подход позволяет собирать чистый фидбек от пользователей, удерживая фокус на долгосрочном создании мультидоменной ИИ-платформы.

🚀 Культура разработки и текущий этап: Мем про Человека-паука в действии 43:45

Описывая внутреннюю культуру Vernique, Насрин Мостафазаде поделилась управленческим лайфхаком, основанным на популярном интернет-меме о наброске Человека-паука за 10 секунд и за 10 минут. Суть правила заключается в том, что даже признанный мастер своего дела обязан уметь выдать черновую, но рабочую версию продукта мгновенно.

Этот принцип «10 секунд» пронизывает всю работу стартапа:

Сейчас Vernique находится на стадии технологического стелс-режима в престижном районе Флэтайрон в Нью-Йорке. Штат компании состоит из 8 постоянных сотрудников, и ведется активный наем как в технический, так и в бизнес-департаменты с целью расширения команды до 12 человек.

В завершение встречи Мостафазаде отметила, что глубоко технологические стартапы сталкиваются со специфической проблемой — поиском не просто Product Market Fit, а Technology Market Fit. Это ситуация, когда у фаундеров есть мощная универсальная технология, и главная сложность заключается в сужении гигантского поискового пространства для выбора оптимального рынка и продукта. Насрин пообещала раскрыть первые практические результаты этого поиска во время следующей встречи на подкасте.

💬 Цитаты

«Шведское слово lagom означает «ровно столько, сколько нужно», и команда использует его как противовес традиционному подходу к MVP.»

Насрин Мостафазаде 13:02

«По ее мнению, отрицать наличие у моделей зачатков человеческого познания и «модели мира» научно некорректно.»

Насрин Мостафазаде 29:08
👥 Спикеры
📖 Термины
Deep Tech (Диптех)
Стартапы, в основе которых лежат сложные научные исследования и серьезные инженерные вызовы.
Lagom
Шведская жизненная философия, означающая умеренность, достаточность и оптимальный баланс.
BDI (Belief-Desire-Intention)
Архитектура программных агентов, моделирующая их поведение через категории убеждений, желаний и намерений.
Technology Market Fit
Процесс поиска оптимального коммерческого рынка для сложной фундаментальной технологии.
📊 Цифры
🗓 Хронология
  1. 3 января 2020 Предыдущее интервью Насрин на подкасте на фоне обострения конфликта США и Ирана.
  2. 8 января 2020 Авиакатастрофа в Иране, подтолкнувшая Насрин к запуску собственного дела.
  3. 1 марта 2020 Официальный первый день работы стартапа Vernique в Нью-Йорке.
  4. Середина марта 2020 Введение жестких карантинных ограничений из-за COVID-19 и заморозка процессов.
  5. Конец 2020 Запуск и успешное закрытие раунда финансирования стартапа за один месяц.
⚖️ Другая сторона
Стартапы и бизнес Насрин Мостафазаде Vernique The TWIML AI Podcast Story Cloze Test