Дев Риши: «Миру не нужен ИИ, читающий стихи в кассовом аппарате»

В новом выпуске подкаста «The Cognitive Revolution» (в рамках кроссовера с проектом «Inference» от Turing Post) встретились ведущая Кася (Cassia) и Дев Риши, сооснователь и CEO компании Predibase. В центре дискуссии — фундаментальный переход от статичных моделей ИИ к системам непрерывного обучения, а также роль специализированного интеллекта в трансформации бизнеса.

🔄 От статики к динамике: концепция «обучайся вечно» 4:10

Традиционный подход к машинному обучению подразумевает создание статичного слепка знаний, который быстро устаревает. Дев Риши утверждает, что сегодня индустрия стоит на пороге смены парадигмы: переход от модели, которую обучили один раз, к конвейеру (pipeline), который позволяет совершенствовать ИИ непрерывно, пока он находится в эксплуатации .

По словам Риши, сегодня большинство компаний используют модель, в которую кто-то другой вложил 99% усилий, и лишь добавляют 1% кастомизации под свои нужды . Однако будущее за системами, которые «учатся вечно». Ключевым инструментом для этого становится RFT (Reinforcement Fine-Tuning) — метод подкрепляемого тонкого тюнинга, который Predibase внедрила как полноценная платформа несколько месяцев назад .

🧪 Что такое RFT и почему это не просто «очередной трюк» 5:38

Риши подробно объясняет механику RFT. В отличие от стандартного контролируемого обучения (SFT), требующего огромных размеченных датасетов, RFT может работать всего на дюжине примеров .

Основная идея RFT:

Вместо меток используются функции вознаграждения (reward functions) — своего рода критерии оценки, которые пишет заказчик .
Модель получает баллы за соответствие критериям. Например, при написании кода: +5 баллов за формат, +10 за компиляцию, +20 за прохождение тестов .
Главный тезис Риши: «Если вы можете это измерить — вы можете это улучшить» .

Хотя сегодня RFT воспринимается как один из многих инструментов в арсенале инженера, CEO Predibase уверен, что в будущем это станет основой онлайн-обучения моделей в реальном времени .

🏥 Практическое применение и обратная связь в реальном времени 7:23

Наиболее продвинутые клиенты (например, в сфере здравоохранения) уже внедряют циклы непрерывной обратной связи. Риши приводит в пример создание медицинских ко-пилотов, где данные взаимодействий с пациентами анализируются как другими LLM (в роли судей), так и живыми врачами-клиницистами .

Основные барьеры на пути массового внедрения таких циклов:

Сбор данных: Для этого Predibase запустила функцию автоматического сбора промптов и ответов из продакшн-сред .
Эффективность обучения: Исследовательская команда Predibase работает над тем, как «подталкивать» (nudge) модель с помощью минимальных объемов пользовательского фидбека .

Риши обещает опубликовать новые исследования на тему агентных систем и систематизации потоков обратной связи в ближайшие месяцы .

🤖 Агентные воркауты: конец «красивых демо» 9:32

Обсуждая текущее состояние ИИ-агентов, Дев Риши называет их «хрупкими» . Он определяет агентный воркаут через два компонента: цепочку из множества вызовов LLM и способность вызывать внешние инструменты (tools) для выполнения задач .

Риши указывает на математическую ловушку: если точность каждого отдельного вызова LLM составляет 90%, то в цепочке из пяти шагов общая вероятность успеха падает ниже 50% . Будучи в прошлом продакт-менеджером Google Assistant, Риши подчеркивает, что индустрии нужно перейти от эффектных демо, работающих только по «золотому пути» (идеальному сценарию), к действительно надежным бизнес-системам .

🏢 Будущее корпоративного ИИ: Специализация против AGI 18:16

В вопросе будущего архитектуры ИИ Дев Риши занимает прагматичную позицию. Он считает, что мы не будем жить в мире «одну кольцо, чтобы править всеми» (одной всемогущей модели) .

Его аргументы в пользу специализации:

«Универсальный интеллект — это здорово, но мне не нужно, чтобы моя POS-система читала французскую поэзию» .
Высокопроизводительные задачи в бизнесе требуют глубокого понимания узких контекстов (например, анализ криминальных кодов в проверках сотрудников, как у клиента Predibase — компании Checker) .
Разнообразие моделей (open-source и closed-source) разных размеров позволяет выбирать оптимальный инструмент под конкретную задачу .

Термину AGI (искусственный общий интеллект) Риши предпочитает понятие «Practical Specialized Intelligence» (практический специализированный интеллект) . По его мнению, ИИ уже проходит тест Тьюринга, но для бизнеса важен не философский статус, а ступенчатый рост продуктивности .

🛠 Вызовы инференса и ценность Open Source 21:59

Инференс (вывод) моделей ИИ кажется простым на этапе прототипа, но становится крайне сложным в промышленном масштабе . Риши выделяет три уровня сложности:

Инфраструктурный: Дефицит GPU и необходимость настройки серверов (для чего Predibase открыла исходный код Lorax) .
Эксплуатационный: Обеспечение доступности 99.99%, отказоустойчивость, «сине-зеленые» развертывания .
Экономический: Оптимизация стоимости владения (TCO). Predibase использует технологию TurboLoRA для увеличения пропускной способности в 2 раза за счет программных методов .

Риши отмечает феноменальную скорость развития open-source. Если в 2023 году лучшим открытым вариантом была GPT-J, заметно отстававшая от GPT-3.5, то сегодня модели вроде DeepSeek R1 или Llama 4 идут вровень или даже опережают коммерческих гигантов . Это произошло на полгода раньше его самых смелых прогнозов .

📈 Риски и личная философия успеха 32:37

Главным риском Риши считает не «сценарии в стиле Терминатора», а возможность «цикла разочарования» . Если компании будут гнаться за надуманными кейсами использования вместо приземленных, но эффективных задач автоматизации, это может привести к охлаждению рынка. Однако Риши подчеркивает, что в отличие от волны ИИ 2012–2022 годов, нынешние технологии реально приносят бизнес-ценность уже сегодня .

В завершение беседы Риши поделился личным секретом продуктивности, упоминая книгу Шона Эйкора «Преимущество счастья» . Его позиция: успех не приносит счастье автоматически, но счастье делает человека гораздо более предрасположенным к успеху. Эту философию он старается внедрять и в Predibase, работая в условиях высокого давления и еженедельных технологических прорывов .