Дженнифер Глор из SambaNova рассказала о масштабировании моделей GPT для финтеха

Искусственный интеллект совершает тектонический сдвиг во многих отраслях, однако сфера финансовых услуг сталкивается с уникальными вызовами при масштабировании больших языковых моделей. В новом выпуске подкаста The TWIML AI Podcast вице-президент по работе с клиентами SambaNova Systems Дженнифер Глор рассказывает, как адаптировать модели классов BERT и GPT для банковского сектора. Она описывает практические шаги по преодолению инфраструктурных ограничений, снижению затрат и выходу из бесконечного цикла пилотных проектов.

🛠️ От чипов к готовым решениям: философия SambaNova Systems 0:00

Дженнифер Глор руководит командой клиентской инженерии в SambaNova Systems, отвечая за весь технический путь заказчика — от этапа предварительных продаж до развертывания и постпродажного обслуживания. До прихода в компанию она долгое время работала в Sun Microsystems и Oracle, где занималась программно-аппаратными комплексами (engineered systems) и облачными развертываниями критически важных приложений. Этот опыт помог ей понять системные требования ИИ-технологий нового поколения.

Компания SambaNova Systems была основана с миссией переосмыслить ИИ-платформы. Традиционные центральные (CPU) и графические (GPU) процессоры создавались для классических вычислительных задач, тогда как глубокие нейросети требуют принципиально иной организации памяти и потоков данных. По словам Дженнифер Глор, гибкость, конфигурируемость и точное соответствие софта железу критически важны для постоянно меняющихся ИИ-моделей.

Продуктовая линейка компании разделена на два направления, ориентированных на разные типы корпоративных клиентов:

Dataflow as a Service — дата-центричный сервис. Клиент предоставляет собственные данные, а SambaNova берет на себя оптимизацию, предобучение и обслуживание моделей. Решение ориентировано на компании, желающие максимально быстро развернуть технологии распознавания естественного языка (NLP) и компьютерного зрения (CV).
Data Scale — модельно-ориентированная платформа. Это комплекс из серверных стоек SambaNova и низкоуровневого ПО, передающий полный контроль над жизненным циклом ИИ клиенту. Продукт предназначен для крупных технологических команд, самостоятельно занимающихся исследованием моделей и тонкой настройкой гиперпараметров.

Клиенты, выбирающие Dataflow as a Service, делятся на две категории. С одной стороны, это компании в начале своего ИИ-пути с небольшим штатом дата-сайентистов, стремящиеся преодолеть отставание от рынка. С другой стороны, сервис привлекает и зрелые ИИ-команды: они покупают готовые NLP-модули, чтобы освободить внутренние ресурсы для решения специфических бизнес-задач.

📈 Почему GPT-3 меняет правила игры для бизнеса 5:38

Интерес SambaNova к большим языковым моделям продиктован архитектурными особенностями их платформы, обладающей огромным объемом памяти и высокой гибкостью конфигурации. Дженнифер Глор напоминает хронологию взрывного роста трансформеров: еще несколько лет назад индустрия работала с моделями BERT на 100–300 миллионов параметров, затем появилась GPT-2 с 1,5 миллиарда, а текущий стандарт GPT-3 насчитывает уже 175 миллиардов параметров. Подобный масштаб перегружает вычислительные мощности и подсистемы памяти традиционных серверных архитектур.

Как отмечает гостья подкаста, в реальном секторе наблюдается выраженная асимметрия ИИ-зрелости:

Гиперскейлеры (крупные облачные провайдеры) находятся на передовой и обновляют тяжелые модели каждые два-три месяца.
Традиционные предприятия осознают необходимость ИИ-трансформации из-за страха отстать от конкурентов, но глубина их интеграции сильно различается.

По мнению Дженнифер Глор, в финансовом секторе технология трансформеров применима практически везде — от локальных розничных банков до крупных корпораций и инвестиционных рынков капитала (capital markets). Модели способны одинаково эффективно реформировать как фронт-офис (взаимодействие с клиентами), так и бэк-офис компаний.

📞 Практический кейс: трансформация колл-центров 10:05

Самым очевидным примером применения NLP в банках остаются колл-центры. Большинство клиентов до сих пор имеют негативный опыт общения с автоматизированными системами поддержки. Потребители регулярно сталкиваются со стандартной проблемой: структурированные данные (информация об аккаунтах, балансе и транзакциях) банки обрабатывать научились, но извлечение пользы из неструктурированной информации остается барьером.

Интеграция GPT-моделей позволяет кардинально изменить этот процесс за счет реализации нескольких сценариев:

Интеллектуальный анализ тональности (Sentiment Analysis): Модель в реальном времени оценивает выбор слов и интонации клиента, сигнализируя оператору, является ли опыт общения строго негативным, нейтральным или позитивным.
Автоматическое извлечение данных (Entity Extraction): Система способна на лету выхватывать ключевые факты из речи или чата, избавляя клиента от необходимости вручную заполнять формы и повторно объяснять проблему новым операторам.
Ускорение поиска решений: Робот моментально подбирает релевантный ответ на сложный запрос, повышая показатель успешности первого звонка.

Дженнифер Глор предостерегает бизнес от попыток реализовать масштабные ИИ-стратегии одним махом. Подобный подход часто приводит к так называемому «чистилищу пилотных проектов» (POC purgatory), когда компания проводит массу тестов, но не внедряет решения в реальное производство. Эксперт рекомендует разбивать процесс на небольшие этапы.

📋 Пошаговое руководство по внедрению LLM в финансовый сектор 16:01

Для успешного развертывания трансформеров уровня GPT-3 без риска увязнуть в бесконечных экспериментах Дженнифер Глор предлагает следовать четкой последовательности шагов.

Шаг 1: Отраслевая адаптация базовой модели

Первым этапом является адаптация общей языковой модели под специфику бизнеса. Базовая модель (SambaNova поставляет ее уже предобученной на стандартных массивах английского языка) отлично справляется с бытовой речью, но пасует перед узкоспециализированным сленгом.

Организация должна собрать внутренние или открытые специализированные датасеты (custom corpuses) для тонкой настройки (fine-tuning). Как объясняет Дженнифер Глор, без этого контекст может быть грубо искажен: например, для банковского сотрудника фраза «end of quarter» (конец квартала) означает закрытие финансового периода, тогда как базовая модель может интерпретировать ее как завершение спортивного тайма.

Шаг 2: Тестирование на прикладных задачах

После дообучения необходимо провести оценку точности на так называемых downstream-задачах (анализ тональности, генерация резюме диалогов). На этом этапе важно выявить ложные срабатывания и понять, ориентируется ли ИИ в контексте коммерческого банкинга или рынков капитала.

Шаг 3: Глубокая интеграция в рабочие процессы

Только после достижения целевых показателей точности модель переносится в боевые рабочие процессы (workflows). Бизнес определяет, какие именно элементы цепочки обслуживания клиентов ИИ заменит полностью, а какие — расширит и автоматизирует в качестве суфлера для человека.

⚠️ Скрытые ловушки «сделай сам» (DIY) и облачных платформ 20:44

Многие предприятия считают, что развернуть LLM можно силами собственной разработки, скачав модель с Hugging Face или подключившись к API сторонних ИИ-сервисов. Однако Дженнифер Глор выделяет четыре ключевых барьера на этом пути:

Кадровый голод. Специалистов, способных оптимизировать алгоритмы на уровне GPT-масштаба, критически мало по всему миру. Гостья приводит пример крупного финучреждения: руководство компании взглянуло на конкурента, который за три года нанял сотни дата-сайентистов и потратил миллионы долларов на инфраструктуру, и осознало, что догнать их классическим путем DIY (do-it-yourself) уже физически невозможно — время упущено.
Проблема масштабирования оборудования. Полноценный запуск GPT-модели на стандартном серверном железе требует закупки гигантских кластеров из-за технологических ограничений. Продукты SambaNova позволяют развернуть преднастроенную систему всего на одной стойке и плавно масштабировать ее без изменения ИИ-среды.
Шокирующие счета за облака. Финансовые директора часто оказываются не готовы к стоимости аренды облачных мощностей. По словам Дженнифер Глор, постоянное обучение моделей, аренда GPU-часов и плата за сетевой трафик (network bandwidth) при передаче огромных массивов данных приводят к тому, что компании начинают экстренно возвращать рабочие нагрузки на локальное оборудование (on-premise).
Регуляторные ограничения. Финансовый сектор жестко скован правилами комплаенса и законами о защите персональных данных. Многие банки обязаны держать данные строго внутри корпоративного файрвола или в границах своего государства, что исключает использование публичных зарубежных API.

SambaNova решает эти проблемы за счет предоставления гибридной модели: они привозят готовый преднастроенный комплекс, который начинает работать в дата-центре клиента или выделенном облаке всего за один день.

🔍 Проверка на прочность: очистка данных и тестирование без разметки 25:55

Подготовка данных для обучения — один из самых трудоемких процессов. Дженнифер Глор напоминает, что при создании GPT-3 разработчики из OpenAI собирали данные со всего интернета и Reddit. Несмотря на публикации научных статей, в них никогда не раскрываются все коммерческие детали оптимизации и фильтрации данных.

В корпоративной среде подготовка корпоративного корпуса сталкивается с необходимостью жесткой санитизации (очистки) данных от конфиденциальной информации клиентов перед их отправкой в модель. Также компании вынуждены отслеживать скрытые смещения (bias) в открытых источниках.

Серьезным вызовом остается валидация работы нейросети. Например, в задаче анализа тональности утверждение о том, что акции Bank of America выросли на 10% за квартал, очевидно является позитивным. Однако в реальной практике стандартные большие модели BERT или GPT могут классифицировать специфические биржевые термины (такие как опционы «пут» или «колл») как нейтральные или негативные. Процесс контроля качества требует отсеивания таких ошибок.

Поскольку трансформеры обучаются на неразмеченных данных, тотальная разметка проверочных датасетов вручную невозможна из-за отсутствия масштабируемости. Компании прибегают к точечным выборочным проверкам (spot checking) и валидационным сетам для формирования статистических отчетов. По оценке Дженнифер Глор, единый общепринятый стандарт тестирования в индустрии ИИ на данный момент отсутствует и до сих пор является предметом дискуссий.

Поскольку язык и профессиональный сленг постоянно эволюционируют, ИИ-система не может быть внедрена по принципу «настроил и забыл». Предприятиям необходимо выстраивать непрерывный цикл мониторинга и регулярного дообучения моделей. Подводя итог, Дженнифер Глор признается, что за три года работы в SambaNova осознала: ИИ — это не просто очередная модная технология, а фундаментальный сдвиг поколения, сопоставимый по масштабу влияния на человечество с появлением интернета и мобильной связи.