Уэс Рот о прорыве DeepSeek: «Момент Спутника» для американского ИИ

Wes Roth 81 тыс. 33 мин 3 мин 29.01.2025
Главное

🚀 Sputnik Moment в эпоху ИИ: почему успех DeepSeek меняет правила игры 0:00

Недавний прорыв китайской компании DeepSeek, выпустившей модель с открытым исходным кодом, сопоставимую по эффективности с флагманами OpenAI, вызвал шок в технологическом секторе. По мнению Уэса Рота, мир оказался в ситуации «момента Спутника» — неожиданного технологического вызова, который заставляет США и ведущие лаборатории пересматривать свои стратегии.

🇨🇳 DeepSeek: дешево, открыто и эффективно 1:18

Китайская компания DeepSeek представила серию моделей, среди которых R1 стала настоящей звездой, продемонстрировав возможности, сопоставимые с закрытой моделью OpenAI o1, но при затратах на обучение, которые, по словам автора видео, в десятки раз ниже.

📉 Реакция рынка и страхи инвесторов 3:18

Новость о прорыве DeepSeek спровоцировала кратковременную панику на фондовом рынке США: капитализация технологических компаний сократилась на сумму около одного триллиона долларов, при этом Nvidia потеряла примерно половину этой стоимости.

Инвесторы опасаются, что алгоритмические прорывы, позволяющие обучать модели дешевле в 45 раз, приведут к резкому снижению спроса на чипы Nvidia. Однако Уэс Рот считает эту логику ошибочной, ссылаясь на «парадокс Джевонса». Согласно этой экономической теории, рост эффективности использования ресурса (в данном случае — интеллекта ИИ) не ведет к сокращению его потребления, а напротив, вызывает взрывной рост новых вариантов использования, что в конечном итоге увеличивает общий спрос на вычислительные мощности.

🧠 Будущее обучения: от людей к самоэволюции 6:48

Современные нейросети всё меньше зависят от «учителей»-людей. По мнению автора видео, процесс перехода от обучения на человеческих данных к синтетическим данным и «самоэволюции» стал ключевым фактором успеха.

  1. Алгоритмы самообучения: Аналогично тому, как AlphaGo от Google DeepMind обучалась игре в го, играя миллиарды партий против самой себя и находя стратегии, недоступные человеческому пониманию, новые ИИ-модели начинают генерировать собственный «ход мыслей».
  2. Эмерджентные способности: Модели демонстрируют способности к рефлексии — умению пересматривать и оценивать свои предыдущие шаги, что не было заложено в них программистами явно, а возникло в процессе взаимодействия со средой обучения.
  3. Демократизация науки: Исследователи, такие как Джао Сун из Google DeepMind, полагают, что подобные модели позволят студентам и небольшим лабораториям, ограниченным в вычислительных ресурсах, проводить сложные эксперименты, которые ранее были недоступны.

🇺🇸 США: поиск баланса в новой реальности 5:04

Бывший генеральный директор Google Эрик Шмидт в своей статье для Washington Post подчеркивает, что, несмотря на лидерство США в области закрытых моделей, стране необходимо поддерживать «живую» экосистему Open Source для сохранения конкурентоспособности.

💬 Цитаты

«Это не просто одна компания, не просто один исследовательский доклад. Мы видим, как меняется наше понимание того, как работает ИИ.»

«Это legit invigorating — иметь нового сильного конкурента.»

Сэм Альтман (цитируется) 31:50
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Инференс
Процесс использования уже обученной нейросети для получения предсказаний или ответов на запросы.
Парадокс Джевонса
Экономическая концепция, согласно которой повышение эффективности использования ресурса ведет не к его экономии, а к росту потребления.
Supervised fine-tuning (SFT)
Метод дообучения ИИ, при котором модель учится на наборах данных, размеченных людьми.
Chain of Thought
Метод рассуждения нейросети, при котором она прописывает промежуточные шаги для решения задачи.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект DeepSeek OpenAI Nvidia Sputnik moment Eric Schmidt