# Дев Риши: «Миру не нужен ИИ, читающий стихи в кассовом аппарате»

Источник: https://www.youtube.com/watch?v=dyCGSYcqpZM
Канал: The Cognitive Revolution
Опубликовано: 16.07.2025

---

В новом выпуске подкаста «The Cognitive Revolution» (в рамках кроссовера с проектом «Inference» от Turing Post) встретились ведущая Кася (Cassia) и Дев Риши, сооснователь и CEO компании Predibase. В центре дискуссии — фундаментальный переход от статичных моделей ИИ к системам непрерывного обучения, а также роль специализированного интеллекта в трансформации бизнеса.

## 🔄 От статики к динамике: концепция «обучайся вечно»
[[JUMP:04:10]]

Традиционный подход к машинному обучению подразумевает создание статичного слепка знаний, который быстро устаревает. Дев Риши утверждает, что сегодня индустрия стоит на пороге смены парадигмы: переход от модели, которую обучили один раз, к конвейеру (pipeline), который позволяет совершенствовать ИИ непрерывно, пока он находится в эксплуатации [04:34].

По словам Риши, сегодня большинство компаний используют модель, в которую кто-то другой вложил 99% усилий, и лишь добавляют 1% кастомизации под свои нужды [04:22]. Однако будущее за системами, которые «учатся вечно». Ключевым инструментом для этого становится **RFT (Reinforcement Fine-Tuning)** — метод подкрепляемого тонкого тюнинга, который Predibase внедрила как полноценная платформа несколько месяцев назад [05:26].

## 🧪 Что такое RFT и почему это не просто «очередной трюк»
[[JUMP:05:38]]

Риши подробно объясняет механику RFT. В отличие от стандартного контролируемого обучения (SFT), требующего огромных размеченных датасетов, RFT может работать всего на дюжине примеров [05:52].

Основная идея RFT:

*   Вместо меток используются **функции вознаграждения (reward functions)** — своего рода критерии оценки, которые пишет заказчик [06:04].
*   Модель получает баллы за соответствие критериям. Например, при написании кода: +5 баллов за формат, +10 за компиляцию, +20 за прохождение тестов [06:17].
*   Главный тезис Риши: «Если вы можете это измерить — вы можете это улучшить» [06:30].

Хотя сегодня RFT воспринимается как один из многих инструментов в арсенале инженера, CEO Predibase уверен, что в будущем это станет основой онлайн-обучения моделей в реальном времени [07:09].

## 🏥 Практическое применение и обратная связь в реальном времени
[[JUMP:07:23]]

Наиболее продвинутые клиенты (например, в сфере здравоохранения) уже внедряют циклы непрерывной обратной связи. Риши приводит в пример создание медицинских ко-пилотов, где данные взаимодействий с пациентами анализируются как другими LLM (в роли судей), так и живыми врачами-клиницистами [07:35].

Основные барьеры на пути массового внедрения таких циклов:

1.  **Сбор данных:** Для этого Predibase запустила функцию автоматического сбора промптов и ответов из продакшн-сред [08:28].
2.  **Эффективность обучения:** Исследовательская команда Predibase работает над тем, как «подталкивать» (nudge) модель с помощью минимальных объемов пользовательского фидбека [08:41].

Риши обещает опубликовать новые исследования на тему агентных систем и систематизации потоков обратной связи в ближайшие месяцы [09:07].

## 🤖 Агентные воркауты: конец «красивых демо»
[[JUMP:09:32]]

Обсуждая текущее состояние ИИ-агентов, Дев Риши называет их «хрупкими» [09:45]. Он определяет агентный воркаут через два компонента: цепочку из множества вызовов LLM и способность вызывать внешние инструменты (tools) для выполнения задач [09:58].

Риши указывает на математическую ловушку: если точность каждого отдельного вызова LLM составляет 90%, то в цепочке из пяти шагов общая вероятность успеха падает ниже 50% [10:51]. Будучи в прошлом продакт-менеджером Google Assistant, Риши подчеркивает, что индустрии нужно перейти от эффектных демо, работающих только по «золотому пути» (идеальному сценарию), к действительно надежным бизнес-системам [11:18].

## 🏢 Будущее корпоративного ИИ: Специализация против AGI
[[JUMP:18:16]]

В вопросе будущего архитектуры ИИ Дев Риши занимает прагматичную позицию. Он считает, что мы не будем жить в мире «одну кольцо, чтобы править всеми» (одной всемогущей модели) [19:35].

Его аргументы в пользу специализации:

*   «Универсальный интеллект — это здорово, но мне не нужно, чтобы моя POS-система читала французскую поэзию» [18:30].
*   Высокопроизводительные задачи в бизнесе требуют глубокого понимания узких контекстов (например, анализ криминальных кодов в проверках сотрудников, как у клиента Predibase — компании Checker) [18:43].
*   Разнообразие моделей (open-source и closed-source) разных размеров позволяет выбирать оптимальный инструмент под конкретную задачу [19:47].

Термину AGI (искусственный общий интеллект) Риши предпочитает понятие **«Practical Specialized Intelligence»** (практический специализированный интеллект) [31:23]. По его мнению, ИИ уже проходит тест Тьюринга, но для бизнеса важен не философский статус, а ступенчатый рост продуктивности [32:00].

## 🛠 Вызовы инференса и ценность Open Source
[[JUMP:21:59]]

Инференс (вывод) моделей ИИ кажется простым на этапе прототипа, но становится крайне сложным в промышленном масштабе [21:59]. Риши выделяет три уровня сложности:

1.  **Инфраструктурный:** Дефицит GPU и необходимость настройки серверов (для чего Predibase открыла исходный код Lorax) [22:40].
2.  **Эксплуатационный:** Обеспечение доступности 99.99%, отказоустойчивость, «сине-зеленые» развертывания [23:18].
3.  **Экономический:** Оптимизация стоимости владения (TCO). Predibase использует технологию TurboLoRA для увеличения пропускной способности в 2 раза за счет программных методов [23:45].

Риши отмечает феноменальную скорость развития open-source. Если в 2023 году лучшим открытым вариантом была GPT-J, заметно отстававшая от GPT-3.5, то сегодня модели вроде DeepSeek R1 или Llama 4 идут вровень или даже опережают коммерческих гигантов [28:18]. Это произошло на полгода раньше его самых смелых прогнозов [28:31].

## 📈 Риски и личная философия успеха
[[JUMP:32:37]]

Главным риском Риши считает не «сценарии в стиле Терминатора», а возможность «цикла разочарования» [33:42]. Если компании будут гнаться за надуманными кейсами использования вместо приземленных, но эффективных задач автоматизации, это может привести к охлаждению рынка. Однако Риши подчеркивает, что в отличие от волны ИИ 2012–2022 годов, нынешние технологии реально приносят бизнес-ценность уже сегодня [34:21].

В завершение беседы Риши поделился личным секретом продуктивности, упоминая книгу **Шона Эйкора «Преимущество счастья»** [35:50]. Его позиция: успех не приносит счастье автоматически, но счастье делает человека гораздо более предрасположенным к успеху. Эту философию он старается внедрять и в Predibase, работая в условиях высокого давления и еженедельных технологических прорывов [36:44].