Уэс Рот и экс-директора Google: как самообучение ИИ без участия человека изменит индустрию

Wes Roth 59,6 тыс. 39 мин 5 мин 13.05.2025
Главное

В новом выпуске своего канала Уэс Рот (Wes Roth) встретился с бывшими топ-менеджерами и инженерами крупнейших технологических корпораций, чтобы обсудить то, что обычно остается за рамками соглашений о неразглашении (NDA). В дискуссии приняли участие Иордан Тибидо (Jordan Tibido), работавший в Google и Salesforce, и Джо Терновски (Joe Ternowski), бывший директор по инженерии в Google и Facebook. Эксперты разобрали внутреннюю кухню Кремниевой долины: от предупреждений Питера Тиля Сэму Альтману до технического тупика в интерпретируемости нейросетей.

🎙️ От маркетинга к ИИ-революции: путь Уэса Рота 3:29

История Уэса Рота как автора одного из самых популярных ИИ-каналов началась задолго до эпохи больших языковых моделей. В 2013 году он переехал из Калифорнии в Техас, став третьим сотрудником в e-commerce стартапе . За первый год компания масштабировалась с нуля до выручки более 20 млн долларов . Работая под руководством маркетолога, тратившего по 1 млн долларов в месяц на рекламу, Уэс Рот освоил методы сплит-тестирования и глубокой аналитики, которые позже применил к развитию своего YouTube-канала.

Переломный момент наступил в конце 2022 года с выходом ChatGPT. Уэс Рот признается, что поначалу видел в ИИ лишь инструмент для автоматизации клиентской службы в e-commerce . Однако после публикации статьи «Sparks of AGI» (Искры сильного ИИ) от Microsoft, посвященной GPT-4, он осознал масштаб грядущих перемен .

По словам Уэса Рота, секрет успеха его канала заключается в понимании алгоритмов YouTube:

🧪 Биология вместо инженерии: как «растёт» ИИ 14:00

Участники дискуссии сошлись во мнении, что современная разработка ИИ всё меньше напоминает классическую инженерию. По мнению Уэса Рота, мы больше не «строим» ИИ, как автомобиль, где каждая деталь подогнана к другой . Процесс скорее напоминает садоводство или выращивание бактерий в чашке Петри: разработчики создают среду, закладывают данные и «надеются, что вырастет что-то полезное» .

Джо Терновски подтверждает этот тезис, указывая на проблему интерпретируемости:

  1. Инженеры могут разобрать модель на части и собрать заново, но всё равно не понимать, как она выдает конкретный результат .
  2. Даже внутри Microsoft старшие инженеры, отвечающие за запуск моделей OpenAI в дата-центрах, не до конца понимают механику их работы .
  3. По словам Дарио Амодеи (CEO Anthropic), прогресс в понимании того, как работают кластеры нейронов, идет слишком медленно и не успевает за скоростью обучения самих моделей .

🎭 Три лагеря Кремниевой долины: Думеры, Отрицатели и Мечтатели 19:36

Иордан Тибидо выделил три основные группы людей, которые сегодня формируют информационную повестку вокруг ИИ :

💻 RL-революция и конец эпохи человеческих данных 29:03

Ключевой технический тренд, обсуждаемый экспертами — переход от обучения на человеческих текстах к обучению через подкрепление (Reinforcement Learning, RL) и самообучение (self-play).

По словам Уэса Рота, обучение на данных, созданных людьми (Supervised Fine-Tuning), — это фактически «зубрежка» или подражание . Настоящий прорыв происходит тогда, когда ИИ начинает играть сам с собой или решать задачи в изолированной среде. Он приводит в пример AlphaGo: модель, обучавшаяся на играх людей, победила Ли Седоля, но следующая версия (AlphaZero), обучавшаяся только против самой себя, разгромила первую со счетом 100:0 .

Технологический стек будущего, по мнению участников:

Джо Терновски отмечает удивительный побочный эффект: когда модель тренируют исключительно на написании кода через RL, она внезапно начинает лучше решать математические задачи, хотя их не было в обучающей выборке . Это ставит вопрос о том, не является ли кодинг ключом к «общему рассуждению» (generic reasoning) .

🏢 Корпоративный хайп против реальности: кейс Klarna и Salesforce 35:55

Иордан Тибидо скептически относится к заявлениям корпоративных лидеров о немедленной замене сотрудников ИИ-агентами. Он приводит в пример CEO компании Klarna, который заявлял об отказе от Workday и Salesforce в пользу ИИ-агентов .

Аргументы Тибидо против «мгновенной замены»:

🛡️ Геополитика и «Джингоизм» Кремниевой долины 38:43

В финале дискуссии участники затронули резкую смену настроений в Кремниевой долине: от космополитизма и идей мира к жесткому патриотизму и противостоянию с Китаем.

Уэс Рот отмечает, что такие фигуры, как Дарио Амодеи и руководство DeepMind, всё чаще говорят о необходимости защиты технологий и опасностях со стороны Китая . Иордан Тибидо связывает это с регуляторным давлением: попытки принять законы (как в Калифорнии), требующие сторонней проверки кода перед запуском ИИ, могут замедлить «американское ИИ-чудо» и дать преимущество Китаю .

💬 Цитаты

«Мы не столько строим ИИ, сколько выращиваем его. Это похоже на создание среды в чашке Петри.»

«Обучение с учителем — это заучивание. Обучение с подкреплением — это обобщение.»

«Инженеры разобрали эту штуку на части и собрали обратно, но мы всё равно не знаем, как она работает.»

Джо Терновски 18:10
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
RL (Reinforcement Learning)
Метод машинного обучения, при котором система обучается, получая вознаграждение за правильные действия.
Interpretability
Способность человека понять и объяснить причины, по которым ИИ принял то или иное решение.
AGI
Искусственный интеллект общего уровня, способный выполнить любую интеллектуальную задачу, доступную человеку.
M&A
Слияния и поглощения — процесс объединения компаний или покупки одной компании другой.
📊 Цифры
🗓 Хронология
  1. 2013 Уэс Рот начинает карьеру в e-commerce стартапе.
  2. 2020 Инженер Google Блейк Лемойн заявляет о наличии сознания у модели LaMDA.
  3. Конец 2022 Релиз ChatGPT, начало массового интереса к LLM.
  4. Март 2023 Публикация статьи «Sparks of AGI» о возможностях GPT-4.
  5. 2024 OpenAI приобретает Windsurf (команду/технологию) для улучшения кодинг-моделей.
⚖️ Другая сторона
Технологии и IT Wes Roth Google OpenAI Reinforcement Learning AGI