# Сэм Альтман о GPT-4o, будущем ИИ и корпоративных реформах

Источник: https://www.youtube.com/watch?v=fMtbrKhXMWc
Канал: The Logan Bartlett Show
Опубликовано: 14.05.2024

---

В новом выпуске подкаста *The Logan Bartlett Show* ведущий Логан Бартлетт обсудил с генеральным директором OpenAI Сэмом Альтманом перспективы развития искусственного интеллекта, запуск новой модели GPT-4o и долгосрочные изменения на технологическом рынке. В ходе беседы Альтман поделился своим видением глобальных экономических эффектов ИИ, неизбежности регулирования сверхразума и рассказал о личной адаптации к потере анонимности и управлению одной из самых влиятельных компаний современности.

## 🎭 Бремя публичности и запуск GPT-4o
[[JUMP:0:00]]

Управление компанией уровня OpenAI кардинально изменило повседневную жизнь её руководителя. Сэм Альтман признался, что самым странным и неожиданным последствием для него стала практическая невозможность оставаться анонимным в публичных пространствах. По его словам, этот образ жизни является странно изолирующим, и если бы он задумался об этом заранее, то отнёсся бы к подобным переменам серьёзнее. Начиная этот путь, Альтман понимал значимость компании, но не предполагал, что потеряет возможность просто поужинать в ресторане своего города.

Главным технологическим событием дня стал анонс мультимодальной модели GPT-4o (буква «о» означает «Omni»). Система работает одновременно с текстом, голосом и зрением. Глава OpenAI считает этот интерфейс невероятным шагом вперед в использовании компьютеров. Несмотря на то, что концепция голосового управления существовала давно (включая Siri и её аналоги), подобные системы никогда не казались естественными в использовании.

Причины ценности GPT-4o по мнению Альтмана:

* Интеграция нескольких модальностей: текста, звука и видео.
* Минимальная задержка и высокая скорость обработки информации.
* Естественность интонаций и способность модели менять темп или голос по прямой просьбе пользователя.

Сэм Альтман рассказал, что использует модель около недели и нашёл неожиданный сценарий применения: он кладёт телефон на стол во время глубокой сфокусированной работы за компьютером. Вместо того чтобы переключать вкладки и искать информацию в Google, он просто задаёт вопрос голосом и мгновенно получает ответ, не отвлекаясь от основного экрана. 

Этот прорыв стал результатом многолетней интеграции аудио- и видеомоделей, а также оптимизации процессов обучения, а не единовременным открытием какого-то одного «секретного механизма». Для обработки видео в реальном времени сетевые задержки могут стать препятствием, однако текущие 200–300 миллисекунд задержки для голоса уже кажутся Альтману более быстрой реакцией, чем ответ живого собеседника.

## 🧠 Стратегия релизов и «дешёвый» интеллект
[[JUMP:4:53]]

В индустрии активно обсуждается подход OpenAI к выпуску моделей. Логан Бартлетт отметил, что компания выбирает более итеративный путь вместо резких крупных запусков вроде гипотетической GPT-5. Альтман согласился, что искусственный интеллект и фактор внезапности плохо сочетаются друг с другом. По его мнению, традиционные методы запуска продуктов ИТ-компаний здесь неприменимы, хотя название GPT-5 всё ещё может быть использовано в будущем. Пользователю зачастую неважно, сколько именно моделей находится «под капотом» единого виртуального мозга.

Глава OpenAI убеждён, что индустрия всегда будет использовать весь доступный объём вычислительных мощностей. Тем не менее, эффективность алгоритмов стремительно растёт. Самым важным достижением релиза GPT-4o Альтман считает то, что модель удалось сделать настолько экономически эффективной, что компания смогла предоставить лучший ИИ в мире бесплатным пользователям ChatGPT.

Экономический эффект технологии пока не поддаётся стандартным измерениям:

* Влияние на макроэкономические показатели: Альтман признал, что запуск ChatGPT пока невозможно зафиксировать на графиках мирового ВВП.
* Локальные успехи: явный рост производительности заметен в клиентской поддержке и написании кода.
* Долгосрочная перспектива: Сэм Альтман считает, что только через пару десятилетий, взглянув на исторические графики, общество сможет чётко определить точку перелома.

В горизонте ближайших 12 месяцев самым многообещающим направлением применения ИИ Альтман назвал программирование.

## 🗺️ Генерализация против специализации и будущее робототехники
[[JUMP:7:43]]

В контексте дискуссий о «горьком уроке» (The Bitter Lesson) компьютерных наук Альтман однозначно ставит на обобщённые модели (generalized models), способные к истинному логическому мышлению, а не на узкоспециализированные системы. По его мнению, если модель обладает сильной способностью к рассуждению, ей можно просто предоставить новые специализированные данные, и она во всём разберется. Обратный подход не работает: невозможно собрать работающий аналог обобщённого разума из множества узких моделей.

Приоритетные направления интерфейсов взаимодействия человека и ИИ:

1.  Естественный язык: Сэм Альтман считает его оптимальным каналом коммуникации на ближайшие два года.
2.  Гуманоидная робототехника: спикер выразил глубокий интерес к этой сфере, отметив, что физический мир полностью спроектирован под человека. Он не хочет перестраивать инфраструктуру под другие негуманоидные формы роботов.

Глава OpenAI допускает, что в будущем ИИ-модели могут стать коммодитизированным (общедоступным и стандартизированным) ресурсом. В этом сценарии ключевую роль начнёт играть глубокая персонализация систем под каждого конкретного пользователя. Альтман считает, что на ИИ-рынке продолжат действовать классические законы бизнеса, включая сетевые эффекты и удобство интерфейсов. К росту популярности моделей с открытым исходным кодом (open-source) он относится положительно, полагая, что на рынке найдётся место как для открытых, так и для коммерческих хостинговых систем.

## 🏗️ Инфраструктурный голод и выживание стартапов
[[JUMP:11:11]]

Мировая технологическая индустрия, включая TSMC и NVIDIA, агрессивно наращивает мощности, однако Альтман настаивает на том, что планете требуется «гораздо больше» ИИ-инфраструктуры. По его прогнозам, падение стоимости вычислений вызовет лавинообразный рост спроса, а создание более масштабных систем сформирует новые рынки.

> **Сэм Альтман, CEO OpenAI:** «Мы должны стремиться к миру, в котором интеллект будет настолько дешёвым, что его учёт потеряет смысл (too cheap to meter). Он должен стать повсеместным ресурсом, чтобы людям не приходилось выбирать между автоматизацией рутины вроде чтения писем и поиском лекарства от рака».

Комментируя появление персональных физических ИИ-ассистентов (таких как Humane AI Pin или Limitless), Альтман отметил, что они появились слишком рано, но движутся в правильном направлении. Он сравнил текущий этап с временами своей учебы в колледже, когда он пользовался планшетом Compaq TC1000 и смартфоном Palm Treo. Эти устройства были бесконечно далеки от современных iPad и iPhone, но задали верный вектор эволюции гаджетов.

Для основателей стартапов Альтман сформулировал жёсткое правило выживания: бизнес-модель не должна строиться на предположении, что следующая базовая модель ИИ останется несовершенной.

Основные тезисы Альтмана для ИИ-предпринимателей:

* Если стартап тратит огромные усилия на решение узкой задачи, с которой плохо справляется GPT-4, он будет мгновенно уничтожен (steamrolled) выходом GPT-5, которая сделает это автоматически.
* Продукты должны выигрывать от улучшения базовых моделей («прилив, поднимающий все лодки»).
* ИИ — это технология, а не сам бизнес. В качестве примера Альтман привёл Uber, который стал возможен благодаря смартфонам, но построил уникальную долгосрочную ценность.

По оценке Альтмана, даже в таких сложных сферах, как создание «ИИ-врача» или цифрового диагноста, победу одержат абсолютно новые технологические стартапы, а не действующие медицинские гиганты вроде Mayo Clinic. Главный совет руководителям — исходить из того, что «интеллект как услуга» (intelligence as a service) будет дешеветь и улучшаться с каждым годом.

## 📈 Капитализация OpenAI, структура компании и непрерывный путь к AGI
[[JUMP:17:43]]

Последняя оценка OpenAI в рамках публичных тендерных предложений достигла отметки в районе 90 миллиардов долларов. По словам Альтмана, подписочная модель ChatGPT показала себя неожиданно успешной, превзойдя его собственные первоначальные ожидания. Касательно несовершенства текущей некоммерческой и коммерческой структуры OpenAI, вызвавшей кризис осенью прошлого года, Альтман заявил, что компания близка к финализации новой структуры и планирует представить её до конца текущего календарного года.

Самым контринтуитивным открытием последних лет для главы OpenAI стало распределение автоматизации труда. Ранее считалось, что ИИ сначала заменит физический труд, затем беловоротничковый и лишь в последнюю очередь — творческий. На практике всё оказалось с точностью до наоборот. Альтман признался, что не ожидал столь быстрых и качественных успехов ИИ в юридической сфере.

Глава OpenAI предлагает отказаться от термина AGI (общий искусственный интеллект) как от какой-то фиксированной точки во времени. Первоначально он сам придерживался наивного представления о том, что переход к AGI будет резким тектоническим сдвигом.

> **Сэм Альтман, CEO OpenAI:** «Сейчас я вижу этот процесс как непрерывную экспоненциальную кривую, где ключевое значение имеет темп ежегодного прогресса. Мы с вами вряд ли сойдёмся во мнении относительно конкретного месяца или даже года, когда AGI будет достигнут».

Модель GPT-4 явно не пересекла этот порог, и следующая крупная модель тоже его не пересечёт. Однако Альтман считает, что индустрию отделяет от принципиально нового качества систем всего несколько свежих исследовательских идей и дополнительное масштабирование. Главным тестом на достижение AGI он назвал способность ИИ проводить научные исследования в области ИИ лучше, чем вся команда исследователей OpenAI вместе взятая.

## ⚖️ Риски, регулирование и нелинейность научных открытий
[[JUMP:22:18]]

Основным препятствием на пути к созданию полноценного AGI Альтман считает необходимость новых фундаментальных исследований. Научный поиск, в отличие от инженерной разработки, не поддаётся линейному планированию: он может затягиваться на десятилетия, а может совершать колоссальные рывки. В качестве примера нелинейности науки Альтман привёл историю открытия нейтрона в начале XX века, которая уже в 1940-х годах привела к созданию атомной бомбы и полностью перевернула интуитивные представления о физике. Аналогичный пример зафиксирован в авиации, когда братья Райт в 1906 году прогнозировали полет человека через 50 лет, а совершили его уже в 1908 году.

В вопросах безопасности ИИ Сэм Альтман придерживается прагматичного подхода:

* Текущие модели: Альтман считает ошибкой попытки жесткого регулирования систем с текущим уровнем возможностей.
* Катастрофические риски: при достижении порогов, угрожающих глобальной безопасности, международный надзор необходим по аналогии с ядерным оружием.
* Философия безопасности: безопасность не бинарна. Общество пользуется авиакомпаниями не потому, что самолёты никогда не падают, а потому, что уровень риска признан приемлемым. То же самое применимо и к медицине.

Для управления этими процессами в OpenAI внедрена система Preparedness Framework («система готовности»), которая чётко регламентирует действия компании при достижении моделями определённых уровней опасности. Альтман не исключает сценарий «быстрого взлёта» (fast takeoff), при котором архитектурные модификации могут резко снизить потребность в инфраструктуре, но считает более вероятным плавное, хотя и ускоренное изменение общества в течение десятилетия.

## 🥤 Личная мотивация и безумные дни ноябрьского кризиса
[[JUMP:31:00]]

Сэм Альтман спокойно относится к частым вопросам о его финансовой мотивации и отсутствии прямой доли в капитале компании. Он отметил, что готов идти на жизненные компромиссы и жертвы ради работы над самым важным и захватывающим проектом в истории человечества.

Вспоминая ноябрьские события 2023 года, когда совет директоров временно отстранил его от должности, Альтман описал это состояние как глубокий сюрреализм. В разгар кризиса он получил десятки сообщений от действующих президентов и премьер-министров крупных государств. Удивительно, но в тот момент это казалось ему абсолютно нормальным из-за запредельного уровня адреналина, отсутствия сна и еды.

Осознание реальности пришло к нему только в среду перед Днем благодарения, когда ситуация разрешилась. Альтман вместе со своим партнёром ехал на машине в Напу. Они остановились у придорожного дайнера Got's, где Сэм, не евший несколько дней, заказал сразу четыре тяжелых блюда во фритюре и два молочных коктейля. Именно там, когда ему снова пришло сообщение от одного из глав государств, Альтман внезапно осознал всю фантасмагоричность произошедшего. Этот опыт показал ему, насколько сильна человеческая психологическая адаптивность к любым экстремальным условиям.

## 🎓 Культура OpenAI, персональные ассистенты и реформа образования
[[JUMP:37:40]]

Внутренняя культура OpenAI имеет свою специфику: исследователи (researchers) радикально отличаются по своему менталитету от продуктовых инженеров. Руководство компании предпочитает развивать внутренние кадры, хотя периодически привлекает топ-менеджеров извне во избежание формирования культурного однообразия. 

Исторически важнейшим решением OpenAI Альтман назвал отказ от концепции создания AGI в секретной лаборатории. Стратегия итеративного развертывания (iterative deployment) — выпуска моделей в мир по мере их готовности — полностью себя оправдала, несмотря на то, что изначально противоречила общепринятой логике коллег по цеху. Саму же ставку на языковые модели на этапе зарождения проекта активно продвигал Илья Суцкевер.

Взгляд Альтмана на будущее персонального ИИ включает чёткое разделение сущностей:

* ИИ как отдельный ассистент: Альтман хочет видеть в ИИ продвинутого коллегу или помощника, с которым можно взаимодействовать через условный барьер.
* Отказ от цифровых клонов: он против концепции, в которой ИИ становится неотличимым «цифровым призраком» или прямым расширением личности человека, самостоятельно отвечающим на сообщения от его имени.

Говоря о реформе образования для поколений 2030-х годов, Альтман призвал вузы не запрещать, а обязывать студентов использовать ИИ-инструменты. Он сравнил это с калькуляторами на уроках математики: базовые принципы понимать нужно, но в реальной жизни специалист обязан уметь пользоваться современным инструментарием, иначе его эффективность будет критически низкой. В финале беседы Альтман резюмировал, что технологическое будущее позволит одному человеку управлять процессами, эквивалентными труду тысяч скоординированных сотрудников, что откроет принципиально новые возможности для мировой науки.