# Сэм Альтман о будущем ИИ: почему GPT-5 может не получить своего названия

Источник: https://www.youtube.com/watch?v=vSW0lPSCTMs
Канал: Wes Roth
Опубликовано: 10.05.2024

---

В ближайшее время компания OpenAI планирует представить обновления, которые могут коренным образом изменить взаимодействие человека с искусственным интеллектом. Основатель канала Wes Roth анализирует последние утечки о новой модели под кодовым названием «GPT-4 Auto» и обсуждает программные заявления Сэма Альтмана о будущем ИИ-агентов, безусловном базовом доходе и пути к сильному ИИ (AGI).

## 🎙️ Прорыв в голосовых интерфейсах: «GPT-4 Auto» и возвращение к идеям фильма «Она»
[[JUMP:0:00]]

Накануне официального стрима OpenAI, запланированного на понедельник, в сети появились данные о новой разработке [0:13]. Сэм Альтман уже уточнил, что это не долгожданная GPT-5 и не поисковая система, хотя работа над поисковиком, по мнению аналитиков, действительно ведётся [0:26]. Утечки кода указывают на название «GPT-4 Auto» [0:39].

Ключевые особенности новой модели, согласно имеющейся информации:

*   **Мультимодальность «из коробки»:** В отличие от предыдущих итераций, где распознавание речи (transcription) и синтез голоса (text-to-speech) были отдельными процессами, новая модель объединяет аудио- и визуальные функции [2:20].
*   **Скорость и понимание контекста:** Прямая интеграция позволяет ИИ лучше понимать интонации и визуальные данные с камеры в реальном времени, что делает взаимодействие почти мгновенным [2:33].
*   **Эффект фильма «Она»:** Эксперты сравнивают будущую модель с виртуальным помощником из фильма Спайка Джонза, способным быть репетитором для детей или продвинутым агентом поддержки [1:29].
*   **Облачные вычисления:** На начальном этапе технология будет работать через облако, так как модель слишком велика для локального запуска на смартфонах [2:45].

Также Wes Roth упоминает о возможной интеграции технологий OpenAI в устройства Apple и введении нового тарифного плана с 50-процентной скидкой для пользователей, оплачивающих сервис авансом [3:11].

## 🚀 Эволюция вместо революции: Когда ждать GPT-5?
[[JUMP:3:24]]

В недавнем выпуске All-In Podcast Сэм Альтман поделился видением развития модельного ряда OpenAI. По его мнению, индустрия может отойти от привычной нумерации версий (1, 2, 3, 4, 5) [3:36].

Основные тезисы Альтмана по этому вопросу:

1.  **Непрерывное улучшение:** Пользователи уже заметили, как сильно GPT-4 выросла за последние месяцы. Альтман считает, что будущее за системами, которые становятся лучше постоянно и плавно, а не рывками от версии к версии [3:49].
2.  **Адаптация общества:** Постепенное внедрение новых возможностей легче воспринимается социумом, чем резкие технологические скачки [4:03].
3.  **Природа интеллекта:** Альтман высказал философскую мысль, назвав интеллект «эмерджентным (возникающим) свойством материи», что он сравнил с неким фундаментальным законом физики [4:30].

Что касается полноценной GPT-5, по данным источников Wes Roth, её релиз всё же ожидается, но, скорее всего, ближе к концу текущего года [2:58].

## 📱 Будущее устройств: Голос как основной интерфейс
[[JUMP:4:42]]

Обсуждая форм-факторы вычислительных устройств, Сэм Альтман признался в своей любви к iPhone, назвав его «величайшим технологическим продуктом в истории человечества» [5:22]. Однако он полагает, что мы стоим на пороге смены парадигмы.

По мнению главы OpenAI, идеальный ИИ-помощник должен обладать следующими характеристиками:

*   **Минимальное трение:** Устройство должно быть «всегда включено» и требовать минимум усилий для взаимодействия [5:47].
*   **Голосовой приоритет:** Качественное голосовое взаимодействие ощущается Альтманом как принципиально иной способ использования компьютера [5:35].
*   **Глубокий контекст:** Система должна знать о пользователе как можно больше, чтобы эффективно помогать в течение дня [5:47].

Альтман выразил интерес к поиску новых физических воплощений для ИИ (wearables), которые могли бы дополнить или заменить привычный смартфон в специфических задачах [4:56].

## 🤖 Агенты нового поколения: «Старший сотрудник» вместо послушного исполнителя
[[JUMP:5:59]]

Один из самых интересных моментов дискуссии — различие между ИИ как расширением личности («альтер-эго») и ИИ как отдельной сущностью. Альтман склоняется ко второму варианту [6:14].

Концепция «Executive Agent» (исполнительного агента) в видении Альтмана:

*   **Модель «старшего сотрудника»:** Сэм предпочитает видеть в ИИ не просто бота, бездумно выполняющего команды, а компетентного коллегу [6:41].
*   **Способность возражать:** Идеальный агент должен уметь «давать отпор», указывать на возможные ошибки в логике пользователя и предлагать альтернативные сценарии («Я могу это сделать, но вот к каким последствиям это приведёт») [6:54].
*   **Рассуждение вместо копирования:** Агент должен обладать способностью к глубокому рассуждению (reasoning), а не просто быть «сикофантом» (льстецом, во всём соглашающимся с хозяином) [7:07].

## 💰 От безусловного дохода к «безусловному компьютингу»
[[JUMP:7:20]]

Затрагивая тему влияния ИИ на рынок труда, Альтман упомянул о завершении масштабного пятилетнего исследования Y Combinator, посвященного безусловному базовому доходу (UBI) [7:33]. Результаты исследования должны быть опубликованы в ближайшее время.

Однако Сэм Альтман предложил альтернативную, более футуристическую концепцию — **Universal Basic Compute** (Универсальный базовый вычислительный ресурс) [8:25].

Суть идеи:

*   Вместо распределения денежных знаков, каждому гражданину выделяется определенная «доля продуктивности» будущих моделей (например, GPT-7) [8:38].
*   Эту долю вычислений человек может использовать сам, перепродать, или пожертвовать на общественно значимые цели, например, на исследования в области лечения рака [8:38].
*   Это владение «слайсом продуктивности» может стать новой основой социального контракта в мире, где ИИ генерирует основную часть стоимости [8:49].

## 🧠 Универсальное рассуждение: Главный ключ к AGI
[[JUMP:8:50]]

В завершение беседы была затронута тема архитектуры будущих систем. Будет ли это сеть специализированных моделей или одна гигантская система? У Альтмана есть интуитивное предположение, что ключом является «генерализованное рассуждение» [9:29].

По его мнению, если инженерам удастся взломать код универсального рассуждения, подключение этого «ядра» к любым специализированным областям данных станет лишь вопросом техники. Это позволит ИИ осваивать новые домены так же быстро, как это делают люди с высоким интеллектом, что станет «быстрым разблокированием» (fast unlock) на пути к полноценному AGI [9:56].