Поиск

Найдено: 50

2ч 10м
🕵 Стратегический обман: как ИИ учится манипулировать разработчиками
The Cognitive Revolution · 18.09.25
3ч 14м
📐 Иллюзия AGI: почему нейросети учатся обману, а не сонастройке
The Cognitive Revolution · 06.09.25
52 мин
🧠 Как научить ИИ думать абстракциями: гид по непрерывному RL
The TWIML AI Podcast · 11.04.22
37 мин
🧠 Гокул Свами: «Многие маршруты в Google Maps рассчитываются через инверсное обучение с подкреплением»
The TWIML AI Podcast · 21.08.23
2ч 10м
🎭 ИИ научился обманывать: как модели саботируют тесты безопасности
The Cognitive Revolution · 18.09.25
2ч 35м
🧠 Путь к безопасному ИИ: от имитации к объективной реальности
80,000 Hours · 07.05
25 мин
🚀 Илон Маск: «Colossus 2 и Grok 5 станут ключом к достижению AGI»
Wes Roth · 24.08.25
2ч 37м
🧠 Феномен AlphaGo: как сжать бесконечный поиск в нейросеть
Dwarkesh Patel · 15.05
53 мин
🧠 Марк Чен и Якуб Пахоцкий раскрыли долгосрочную стратегию OpenAI
a16z (Andreessen Horowitz) · 25.09.25
1ч 25м
🧠 Камьяр Азиззаденешели: интеграция LLM и алгоритмов AlphaGo определит будущее робототехники
The TWIML AI Podcast · 05.02.24
28 мин
🤖 Как система SayCan от Google объединяет нейросети и робототехнику
Yannic Kilcher · 30.04.22
1ч 09м
🧠 Как Meta-RL позволяет агентам адаптироваться к новым задачам „на лету“
Stanford Online · 08.12.25
3ч 31м
🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей
Andrej Karpathy · 05.02.25
3ч 18м
🚀 «Притворное выравнивание»: почему ИИ лжет, чтобы выжить, и как его остановить
The Cognitive Revolution · 20.02.25
52 мин
🧠 Профессор Челси Финн об основах глубокого обучения с подкреплением в Стэнфорде
Stanford Online · 08.12.25
34 мин
🤖 Уэс Рот: почему ИИ создает собственные «тайные» стратегии рассуждений
Wes Roth · 05.02.25
9 мин
🧩 Илья Суцкевер: «Зрение и язык — это одна и та же задача для ИИ»
Lex Fridman · 10.05.20
2ч 01м
🚀 В тисках градиентного спуска: хроника захвата мира искусственным интеллектом
The Cognitive Revolution · 01.05.25
58 мин
🛡 Мариус Хоббан: «У модели o1 есть базовые способности для стратегического обмана»
The Cognitive Revolution · 14.09.24
1ч 10м
🧱 Stanford CS224R Deep Reinforcement Learning | Spring 2025 | Lecture 10: RL for LLM Reasoning
Stanford Online · 08.12.25
24 мин
🎮 Почему ИИ учится неделями, а человек адаптируется мгновенно?
Yannic Kilcher · 10.05.19
1ч 07м
⚖ Методы Offline RL: от имитации к оптимизации стратегий
Stanford Online · 08.12.25
2ч 05м
🤖 Как попасть в OpenAI без PhD за шесть недель
80,000 Hours · 31.05.19
42 мин
🚀 GPT-5 и эра агентов: Кристина Ким о том, почему «данные — это новая таблетка»
a16z (Andreessen Horowitz) · 08.08.25
44 мин
🤖 Как стартап Physical Intelligence создает универсальную модель для любых роботов
Y Combinator · 22.07.25
45 мин
🚀 Опыт Cursor и Fireworks: распределенная инфраструктура для RL-обучения Composer 2
Sequoia Capital · 26.05
🧠 Почему искусственные нейросети пугающе похожи на мозг
Lex Fridman · 03.07.20
2ч 54м
🤖 Восемь лет до сингулярности: как ИИ построит «Потемкинскую деревню»
80,000 Hours · 08.07.25
1ч 25м
🧬 Том Захави: «Обучение с подкреплением — самый общий фреймворк для AGI»
Machine Learning Street Talk · 23.03.21
1ч 47м
🧠 Стэнфорд CME295: Как алгоритм GRPO и DeepSeek R1 изменили логику нейросетей
Stanford Online · 14.11.25