Раза Хабиб: «В долгосрочной перспективе программисты будут автоматизированы первыми»

Генеративный искусственный интеллект открывает беспрецедентные возможности для бизнеса, однако превращение сырых языковых моделей в уникальные продукты сопряжено с множеством технологических вызовов. В рамках подкаста Y Combinator сооснователь платформы Humanloop Раза Хабиб обсуждает с ведущим Олли секреты создания дифференцированных ИИ-приложений, проблемы галлюцинаций и перспективы автоматизации труда самих разработчиков. В центре дискуссии — практические методы кастомизации больших языковых моделей, трансформация роли инженера и реальные сроки достижения общего искусственного интеллекта (AGI).

🧠 Что такое большие языковые модели: от предиктивного ввода до зачатков логики 1:33

Языковые модели сами по себе не являются принципиально новой технологией. По сути, они представляют собой статистические модели слов в языке. Принцип их работы строится на анализе огромного массива текстов с целью предсказания наиболее вероятного следующего слова на основе предыдущего контекста. Классическим примером такой цепочки является фраза «кошка села на...», где слово «коврик» имеет наивысшую статистическую вероятность.

Однако по мере масштабирования языковых моделей — как с точки зрения количества параметров, так и за счет увеличения объемов обучающих выборок — их предсказательная способность начинает качественно меняться. Для точного продолжения сложных предложений модели требуется не просто знание частоты букв или слов, а полноценное понимание устройства окружающего мира. Например, чтобы закончить фразу «Сегодня президент Соединенных Штатов подписал...», ИИ должен обладать актуальными фактами о текущей геополитической реальности. Аналогично, для продолжения математического уравнения модели приходится учиться решать заложенную в нем математическую задачу.

Настоящий технологический прорыв произошел с выходом моделей семейства GPT, среди которых именно GPT-3 заставила индустрию признать, что в ИИ-технологиях начался принципиально новый этап. Несмотря на то, что эти алгоритмы оперируют исключительно словами и формально ничего не знают о внешнем мире, они демонстрируют поразительные способности к логическому рассуждению.

🛑 Проблема галлюцинаций: почему ИИ уверенно врет и как с этим бороться 3:00

Одной из главных проблем коммерческого использования предобученных моделей остается их склонность к генерации ложной информации. Спикер ссылается на венчурного инвестора Мэтта Фридмана, который описал поведение современных ИИ-моделей как постоянные колебания между «потрясающим и безумным» (spooky and kooky). В одних ситуациях система демонстрирует невероятный уровень интеллекта, а в других — совершает чудовищные, очевидные ошибки.

Опасность заключается в том, что базовые модели обучаются выдавать экспертные предсказания, из-за чего они генерируют ложные факты чрезвычайно уверенно, авторитетно и убедительно. Это заставляет пользователей ошибочно доверять недостоверным ответам.

Для решения этой проблемы стартап Humanloop применяет подход, который позволяет снизить частоту галлюцинаций в коммерческих продуктах:

Разработчикам предоставляется удобный инструментарий для динамического добавления проверенного фактологического контекста непосредственно в промпт (запрос к модели).
Алгоритм начинает опираться на предоставленные точные данные, а не на собственные статистические абстракции.
Это существенно повышает надежность и безопасность ИИ-приложений в реальных бизнес-кейсах.

Помимо галлюцинаций, бизнес часто сталкивается со специфическим характером базовых моделей. По словам Разы Хабиба, после релиза ChatGPT многие пользователи выражали недовольство его «личностью»: тон ответов казался излишне угодническим, модель избегала высказывания четких позиций и постоянно уступала в споре. Это подчеркивает острую рыночную потребность в кастомизации ИИ под конкретную аудиторию и задачи.

🛠️ Секрет успеха ChatGPT: тонкая настройка и магия RLHF 4:33

Ключевое различие между феноменально успешной ChatGPT (или моделью text-daVinci-003) и базовыми моделями OpenAI, которые оставались без широкого внимания разработчиков на протяжении двух лет, заключается в процедуре тонкой настройки (fine-tuning). Архитектурно это была одна и та же базовая модель, но именно тонкая настройка позволила продукту привлечь один миллион пользователей всего за пять дней.

Процесс кастомизации под конкретную задачу состоит из сбора качественных примеров желаемых ответов и последующего дообучения нейросети на этих данных. Индустриальный стандарт создания диалоговых систем включает в себя несколько последовательных этапов:

Обучение модели на сгенерированных людьми парах «инструкция — идеальный ответ».
Применение методологии RLHF (Reinforcement Learning from Human Feedback) — обучения с подкреплением на основе отзывов людей.
Демонстрация оценщикам нескольких вариантов ответов ИИ с целью их ранжирования по качеству.
Использование полученных оценок для формирования сигнала вознаграждения, который окончательно корректирует веса модели.

Влияние RLHF на итоговую производительность системы трудно переоценить. Раза Хабиб приводит в пример официальное исследование Instruct GPT от OpenAI: в ходе тестов пользователи отдавали предпочтение ответам модели размером всего в 1–2 миллиарда параметров, прошедшей инструктивный тюнинг и RLHF, перед гигантской базовой моделью GPT-3, которая была в 100 раз больше.

В качестве альтернативного вектора развития спикер выделяет недавнюю научную работу компании Anthropic, исследователям которой удалось достичь схожих результатов без привлечения людей. В их подходе оценку и обратную связь генерирует вторая, контролирующая ИИ-модель, что делает процесс масштабирования кратно дешевле и быстрее.

📊 Три главных вызова для разработчиков ИИ-приложений 7:35

При создании продуктов на базе больших языковых моделей инженеры неизбежно сталкиваются с тремя фундаментальными барьерами, в преодолении которых и заключается главная ценность платформы Humanloop:

Прототипирование. Поиск идеального промпта для конкретного бизнес-кейса требует сотен итераций. Управление версиями запросов и отслеживание изменений превращаются в сложную инженерную задачу.
Оценка качества (Evaluation). В отличие от классического машинного обучения, где точность легко измерить на тестовом датасете, работа с LLM крайне субъективна. Становится трудно понять, насколько успешно приложение решает задачи конечных пользователей.
Дифференциация продукта. Поскольку все игроки на рынке имеют доступ к одним и тем же базовым моделям от OpenAI или Anthropic, долгосрочное конкурентное преимущество стартапа зависит от глубины кастомизации ИИ под уникальный контекст и данные клиентов.

Инвестиционный тезис Humanloop: Ценность ИИ-приложений стремительно смещается от владения базовыми алгоритмами к владению кастомными данными и инфраструктурой сбора обратной связи в реальном времени. Стартапы, способные автоматизировать сбор пользовательских реакций, создают непрерывный цикл улучшения продукта, который невозможно скопировать.

Для настройки тональности или специфического стиля коммуникации разработчики могут загружать в систему корпоративные чат-логи, архивы маркетинговых рассылок или историю отправленных писем. Самые ценные данные для fine-tuning поступают непосредственно из промышленной эксплуатации приложения.

В качестве примера Хабиб приводит сервис для автоматического составления писем отдела продаж. ИИ генерирует черновик, а система фиксирует действия менеджера: отправил ли он письмо без изменений, отредактировал ли текст (и как именно), и пришел ли в итоге ответ от клиента. Humanloop автоматизирует сбор этих сигналов, превращая их в обучающий материал для непрерывного совершенствования модели.

💻 Трансформация профессии программиста: от кодинга к управлению продуктом 9:44

Влияние генеративного ИИ на работу программистов будет развиваться по разным сценариям в краткосрочной и долгосрочной перспективах. На текущем этапе технологии выступают в роли мощного ускорителя. Самым успешным примером интеграции LLM в рабочий процесс спикер считает инструмент GitHub Copilot, создателям которого удалось нащупать идеальный пользовательский опыт (UX). Сейчас плагином пользуются около 100 миллионов разработчиков, и многие из них признаются, что нейросеть пишет значительную часть их кода.

Примечательно, что наибольшую выгоду от GitHub Copilot получают не начинающие специалисты, а опытные, senior-инженеры. По мнению Разы Хабиба, это связано с тем, что квалифицированные программисты обладают развитым навыком чтения и редактирования чужого кода, поэтому они способны моментально валидировать и внедрять автодополнения от ИИ.

В более отдаленном будущем характер профессии радикально изменится:

Инженеры сместятся на позицию продуктовых менеджеров, чьей основной обязанностью станет написание верхнеуровневых спецификаций и технической документации.
Всю рутинную работу по написанию шаблонного кода (boilerplate) и непосредственную реализацию логики полностью возьмут на себя алгоритмы.
Произойдет глубокая автоматизация индустрии, так как программирование целиком ограничено рамками текстового экрана. По иронии судьбы, именно разработчики, создающие ИИ, могут оказаться первыми, чьи рабочие места будут значительно сокращены при приближении к AGI.

🔮 Будущее технологий: расширение контекста и ИИ-агенты 11:39

Ближайшая дорожная карта развития больших языковых моделей во многом предопределена и понятна индустрии. Первым критически важным изменением, которого ждут разработчики, является радикальное расширение контекстного окна. Снятие текущих лимитов на объем информации, которую можно передать модели за один запрос, откроет принципиально новые сценарии автоматизации бизнеса.

Однако гораздо более многообещающим направлением спикер считает переход от простых текстовых интерфейсов к полноценным автономным ИИ-агентам, способным совершать действия в реальном мире. В качестве пионера этой парадигмы Хабиб выделяет стартап Adept AI.

В рамках агентского подхода большая языковая модель перестает быть просто генератором текста и начинает функционировать как центральный процессор, принимающий решения. Модель может самостоятельно сформировать команду «найти информацию в интернете», проанализировать полученный ответ, скорректировать свои дальнейшие шаги и повторять этот цикл до полного достижения поставленной пользователем цели.

🛡️ Безопасность и монополизация рынка: будет ли одна модель править миром? 12:31

Развитие ИИ-технологий создает целый комплекс этических и экзистенциальных рисков, требующих повышенного внимания со стороны человечества. Спикер разделяет эти угрозы на две категории: глобальные риски безопасности, о которых активно предупреждает исследователь Элиезер Юдковский (выдвигающий тезис о том, что главной целью безопасности должно быть предотвращение уничтожения человечества искусственным интеллектом), и краткосрочные социальные вызовы. К последним относятся массовые увольнения, социальная дестабилизация, а также предвзятость и дискриминация, которые ИИ неизбежно перенимает из обучающих данных и от команд разработчиков. Тем не менее, Хабиб считает, что колоссальные потенциальные выгоды технологии оправдывают продолжение работы, но двигаться вперед необходимо с максимальной осторожностью.

Что касается структуры рынка, сооснователь Humanloop не верит в сценарий монополизации ИИ одной гигантской моделью. По его мнению, ключевыми барьерами для входа в индустрию создания LLM остаются исключительно финансовый капитал (закупка GPU-мощностей) и привлечение редких талантов.

У крупных игроков вроде OpenAI или DeepMind нет фундаментального технологического «секретного соуса» — обе компании исторически открыто публикуют свои научные достижения и методологии в открытом доступе.

Раза Хабиб скептически относится к утверждению, что огромный поток пользовательских данных от тысяч работающих приложений создает для OpenAI непреодолимый сетевой эффект (flywheel). Причина заключается в специфике их бизнес-модели:

OpenAI вынуждена строить максимально общую, универсальную модель, которая обязана одинаково хорошо справляться со всеми задачами одновременно.
Они не могут позволить своему алгоритму ухудшить навыки написания кода ради того, чтобы сделать его лучше в какой-то узкой коммерческой нише.
Это оставляет огромный простор для независимых стартапов, которые могут создавать узкоспециализированные, кастомизированные под конкретные индустрии приложения, превосходящие универсальные решения по качеству и стоимости.

👽 Хроники AGI: когда прилетят «инопланетяне» и что делать стартапам 15:19

В экспертном сообществе сохраняется колоссальный уровень неопределенности относительно сроков появления общего искусственного интеллекта (AGI), способного сравняться с когнитивными возможностями человека или превзойти их. Даже среди сотрудников ведущих лабораторий мнения кардинально расходятся. По данным авторитетной платформы предсказаний Metaculus, медианный прогноз аналитиков указывает на 2040 год. Раза Хабиб подчеркивает, что это пугающе близкий срок для технологии, способной полностью перевернуть основы человеческого общества. Часть оптимистично настроенных исследователей допускает появление AGI уже к 2030 году, хотя существует и ненулевая вероятность того, что на это уйдут столетия.

Спикер соглашается с яркой аналогией профессора Стюарта Рассела: если бы человечеству стало достоверно известно, что через 50 лет на Землю приземлится корабль продвинутой инопланетной цивилизации, мировые правительства явно не сидели бы сложа руки. Появление AGI — это и есть прибытие «инопланетного разума».

Для технологических стартапов текущий момент является уникальным и невероятно захватывающим временем. Задачи, которые еще несколько лет назад требовали привлечения целой команды ученых со степенью PhD и казались неразрешимыми, теперь закрываются одним грамотным запросом к готовой модели. На рынке наблюдается настоящая кембрийская explosion новых компаний. На этом фоне Humanloop активно расширяет штат и ищет фулстек-разработчиков, готовых проектировать принципиально новые интерфейсы взаимодействия человека с искусственным интеллектом.