Интервью генерального директора OpenAI Сэма Альтмана президенту Y Combinator Гэри Тану (Gary Tan) стало отправной точкой для обсуждения будущего систем искусственного интеллекта. В беседе были затронуты темы от «безлюдного» научного прогресса до рисков взлома всей мировой финансовой системы. На основе этого материала автор канала Уэс Рот проанализировал текущий статус развития нейросетей и близость достижения AGI.
📈 Путь OpenAI: от «безумной» идеи до мирового лидерства 0:00
История OpenAI началась с амбициозного прогноза Сэма Альтмана о том, что «суперинтеллект» может появиться уже через тысячи дней . На заре компании многие эксперты в индустрии скептически относились к её целям, называя команду «безответственными детьми», которые не понимают, во что ввязываются . Основная претензия заключалась в том, что OpenAI сфокусировалась исключительно на создании AGI (сильного искусственного интеллекта), в то время как отрасль занималась простыми задачами классификации изображений .
Ключевые факторы успеха компании, по мнению автора видео:
- Непоколебимая убежденность: Альтман и его команда придерживались выбранного курса, даже когда их подход считали тупиковым .
- Ставка на масштаб (Scaling): В то время как другие диверсифицировали подход, OpenAI вложила все ресурсы в глубокое обучение и огромные вычислительные мощности .
- Доступ к ресурсам: Уэс Рот отмечает, что стартапы тех лет могли только мечтать о таком объеме вычислительной мощности, который удалось аккумулировать Альтману .
Этот подход напоминает стратегию Джеффри Хинтона, «крестного отца ИИ», который десятилетиями верил в нейронные сети, когда научное сообщество считало их неэффективными .
🧠 Прорыв «нейрона настроений» и скрытое обучение 5:30
Интересным фактом из истории компании является то, что изначально OpenAI не рассматривала большие языковые модели (LLM) как прямой путь к AGI. Они ставили эксперименты в робототехнике и игровом ИИ . Поворотным моментом стало открытие исследователя Алека Рэдфорда (Alec Radford).
Играя с отзывами на Amazon, Рэдфорд обнаружил так называемый «неуправляемый нейрон настроений» (unsupervised sentiment neuron) . Нейросеть самостоятельно, без явных указаний со стороны программистов, научилась определять, является ли отзыв положительным или отрицательным .
Это пример неявного обучения (implicit learning). Автор видео сравнивает это с развитием ребенка: вы можете давать ему прямые инструкции (явное обучение), но ребенок также постоянно делает выводы о мире, просто наблюдая за поведением окружающих . Именно этот «случайный» успех в понимании контекста и эмоций лег в основу архитектуры серии GPT .
🚀 Пять уровней ИИ: мы на пороге четвертого 8:32
Сэм Альтман и OpenAI используют классификацию из пяти уровней развития ИИ, чтобы оценить прогресс на пути к AGI:
- Level 1 — Базовый ИИ: Простые чат-боты и системы классификации.
- Level 2 — Рассуждающие системы: ИИ, способный решать логические задачи и понимать концепции (текущий статус GPT-4) .
- Level 3 — Агенты: Системы, способные действовать независимо и выполнять долгосрочные задачи. Пример — модель o1, которая «обдумывает» задачу перед действием .
- Level 4 — Инноваторы: ИИ, способный совершать новые научные открытия и предлагать изобретения, выходящие за рамки существующих человеческих знаний .
- Level 5 — Организации: ИИ, способный управлять целой компанией или сложной структурой на уровне управленца-человека .
По мнению Альтмана, переход к четвертому уровню случится гораздо быстрее, чем ожидает большинство скептиков .
🛠 Доказательства прогресса: хакатон Y Combinator 10:46
На недавнем хакатоне OpenAI и Y Combinator были представлены проекты, демонстрирующие возможности ИИ уровня «прото-инноватора»:
- Дизайн крыла самолета: Одна из команд использовала GPT-4 для проектирования аэродинамического профиля (air foil). Нейросеть итеративно улучшала конструкцию, создав эффективную рабочую модель крыла, что обычно требует лет инженерного опыта .
- Новая криптография: Группа разработчиков применила модели OpenAI для создания алгоритма шифрования, который опытные криптографы не смогли взломать. Алгоритм был настолько необычным, что эксперты оказались в тупике .
- Прогноз лесных пожаров: Система анализировала спутниковые снимки, скорость ветра и растительность, предсказывая распространение огня с точностью, превосходящей человеческих аналитиков .
⚠️ Угроза кибербезопасности и «проблема тормозов» 15:49
Уэс Рот выражает опасение: если ИИ может создавать невзламываемое шифрование, он может найти и «короткие пути» для взлома существующих систем. Современная криптография строится на том, что с добавлением каждого нового символа в пароль сложность его подбора растет экспоненциально (перебор 7 символов занимает миллисекунды, а 12 символов — века) .
Существует теоретическая проблема «P против NP»: что, если ИИ найдет «математический трюк», позволяющий обходить этот перебор? . По мнению автора, это мгновенно сделает прозрачными все банковские счета и системы национальной безопасности, к чему мир совершенно не готов .
В то же время эксперты по безопасности, такие как Майлз Брандейдж (Miles Brundage), покидают OpenAI, призывая «установить тормоза» раньше, чем машина разгонится до опасных скоростей . Они считают, что сейчас индустрия больше движима рыночными стимулами, чем вопросами безопасности .
📉 Замедление прогресса или информационный шум? 20:13
Недавняя статья в The Information утверждает, что темпы обучения новых моделей OpenAI начинают замедляться, а прирост производительности становится инкрементальным, а не экспоненциальным . В ответ на это скептики обвиняют Сэма Альтмана в создании излишнего «хайпа» для привлечения инвестиций.
Однако Уэс Рот указывает на важный контраргумент: даже те исследователи, которые уходят из OpenAI из-за разногласий, не говорят о замедлении прогресса . Напротив, они утверждают, что технологии развиваются слишком быстро. Косвенным подтверждением масштабных планов служит и то, что Microsoft инвестирует в перезапуск старой атомной электростанции на острове Три-Майл-Айленд специально для обеспечения энергией дата-центров под нужды ИИ .