Дев Риши: «Миру не нужен ИИ, читающий стихи в кассовом аппарате»

The Cognitive Revolution 33,1 тыс. 38 мин 4 мин 16.07.2025
Главное

В новом выпуске подкаста «The Cognitive Revolution» (в рамках кроссовера с проектом «Inference» от Turing Post) встретились ведущая Кася (Cassia) и Дев Риши, сооснователь и CEO компании Predibase. В центре дискуссии — фундаментальный переход от статичных моделей ИИ к системам непрерывного обучения, а также роль специализированного интеллекта в трансформации бизнеса.

🔄 От статики к динамике: концепция «обучайся вечно» 4:10

Традиционный подход к машинному обучению подразумевает создание статичного слепка знаний, который быстро устаревает. Дев Риши утверждает, что сегодня индустрия стоит на пороге смены парадигмы: переход от модели, которую обучили один раз, к конвейеру (pipeline), который позволяет совершенствовать ИИ непрерывно, пока он находится в эксплуатации .

По словам Риши, сегодня большинство компаний используют модель, в которую кто-то другой вложил 99% усилий, и лишь добавляют 1% кастомизации под свои нужды . Однако будущее за системами, которые «учатся вечно». Ключевым инструментом для этого становится RFT (Reinforcement Fine-Tuning) — метод подкрепляемого тонкого тюнинга, который Predibase внедрила как полноценная платформа несколько месяцев назад .

🧪 Что такое RFT и почему это не просто «очередной трюк» 5:38

Риши подробно объясняет механику RFT. В отличие от стандартного контролируемого обучения (SFT), требующего огромных размеченных датасетов, RFT может работать всего на дюжине примеров .

Основная идея RFT:

Хотя сегодня RFT воспринимается как один из многих инструментов в арсенале инженера, CEO Predibase уверен, что в будущем это станет основой онлайн-обучения моделей в реальном времени .

🏥 Практическое применение и обратная связь в реальном времени 7:23

Наиболее продвинутые клиенты (например, в сфере здравоохранения) уже внедряют циклы непрерывной обратной связи. Риши приводит в пример создание медицинских ко-пилотов, где данные взаимодействий с пациентами анализируются как другими LLM (в роли судей), так и живыми врачами-клиницистами .

Основные барьеры на пути массового внедрения таких циклов:

  1. Сбор данных: Для этого Predibase запустила функцию автоматического сбора промптов и ответов из продакшн-сред .
  2. Эффективность обучения: Исследовательская команда Predibase работает над тем, как «подталкивать» (nudge) модель с помощью минимальных объемов пользовательского фидбека .

Риши обещает опубликовать новые исследования на тему агентных систем и систематизации потоков обратной связи в ближайшие месяцы .

🤖 Агентные воркауты: конец «красивых демо» 9:32

Обсуждая текущее состояние ИИ-агентов, Дев Риши называет их «хрупкими» . Он определяет агентный воркаут через два компонента: цепочку из множества вызовов LLM и способность вызывать внешние инструменты (tools) для выполнения задач .

Риши указывает на математическую ловушку: если точность каждого отдельного вызова LLM составляет 90%, то в цепочке из пяти шагов общая вероятность успеха падает ниже 50% . Будучи в прошлом продакт-менеджером Google Assistant, Риши подчеркивает, что индустрии нужно перейти от эффектных демо, работающих только по «золотому пути» (идеальному сценарию), к действительно надежным бизнес-системам .

🏢 Будущее корпоративного ИИ: Специализация против AGI 18:16

В вопросе будущего архитектуры ИИ Дев Риши занимает прагматичную позицию. Он считает, что мы не будем жить в мире «одну кольцо, чтобы править всеми» (одной всемогущей модели) .

Его аргументы в пользу специализации:

Термину AGI (искусственный общий интеллект) Риши предпочитает понятие «Practical Specialized Intelligence» (практический специализированный интеллект) . По его мнению, ИИ уже проходит тест Тьюринга, но для бизнеса важен не философский статус, а ступенчатый рост продуктивности .

🛠 Вызовы инференса и ценность Open Source 21:59

Инференс (вывод) моделей ИИ кажется простым на этапе прототипа, но становится крайне сложным в промышленном масштабе . Риши выделяет три уровня сложности:

  1. Инфраструктурный: Дефицит GPU и необходимость настройки серверов (для чего Predibase открыла исходный код Lorax) .
  2. Эксплуатационный: Обеспечение доступности 99.99%, отказоустойчивость, «сине-зеленые» развертывания .
  3. Экономический: Оптимизация стоимости владения (TCO). Predibase использует технологию TurboLoRA для увеличения пропускной способности в 2 раза за счет программных методов .

Риши отмечает феноменальную скорость развития open-source. Если в 2023 году лучшим открытым вариантом была GPT-J, заметно отстававшая от GPT-3.5, то сегодня модели вроде DeepSeek R1 или Llama 4 идут вровень или даже опережают коммерческих гигантов . Это произошло на полгода раньше его самых смелых прогнозов .

📈 Риски и личная философия успеха 32:37

Главным риском Риши считает не «сценарии в стиле Терминатора», а возможность «цикла разочарования» . Если компании будут гнаться за надуманными кейсами использования вместо приземленных, но эффективных задач автоматизации, это может привести к охлаждению рынка. Однако Риши подчеркивает, что в отличие от волны ИИ 2012–2022 годов, нынешние технологии реально приносят бизнес-ценность уже сегодня .

В завершение беседы Риши поделился личным секретом продуктивности, упоминая книгу Шона Эйкора «Преимущество счастья» . Его позиция: успех не приносит счастье автоматически, но счастье делает человека гораздо более предрасположенным к успеху. Эту философию он старается внедрять и в Predibase, работая в условиях высокого давления и еженедельных технологических прорывов .

💬 Цитаты

«Универсальный интеллект — это здорово, но мне не нужно, чтобы моя точка продаж читала французскую поэзию.»

«Если вы выпустили продукт, за который вам не стало хоть немного стыдно, вы ждали слишком долго.»

👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
RFT (Reinforcement Fine-Tuning)
Метод дообучения модели с помощью функций вознаграждения вместо ручной разметки данных.
Lorax
Open-source фреймворк от Predibase для эффективного инференса сотен адаптированных моделей на одном GPU.
TurboLoRA
Технология оптимизации, удваивающая пропускную способность вывода моделей.
📊 Цифры
🗓 Хронология
  1. Ноябрь 2022 Выход ChatGPT, ставший моментом демократизации глубокого обучения.
  2. Начало 2023 Predibase делает ставку исключительно на LLM и их кастомизацию.
  3. Начало 2025 Запуск RFT и выход моделей DeepSeek, изменивших ландшафт рынка.
⚖️ Другая сторона
Искусственный интеллект Dev Rishi Predibase RFT Open Source AI Inference