Поиск

Найдено: 30

2ч 45м
👁 Цифровой кокон: как ИИ переписывает общественный договор
PowerfulJRE · 05.05
5ч 29м
🛡 Изнанка ИИ-гонки: почему инженеры боятся собственного сверхразума
80,000 Hours · 12.05.24
2ч 29м
💡 От блефа к доверию: как ИИ учится договариваться с людьми
Lex Fridman · 06.12.22
45 мин
🧠 Как стать исследователем выравнивания ИИ: подробный гид Яна Лейке
80,000 Hours · 16.09.18
46 мин
🐱 Джефф Бек: почему современные языковые модели лишены настоящего понимания мира
Machine Learning Street Talk · 10.04.25
1ч 05м
📉 Как молодым специалистам выжить в эпоху бесконечных ИИ-стажеров
The Cognitive Revolution · 03.05.24
38 мин
🔄 Дев Риши: «Миру не нужен ИИ, читающий стихи в кассовом аппарате»
The Cognitive Revolution · 16.07.25
1ч 13м
🧠 Иллюзия выбора: почему физик Сабина Хоссенфельдер не верит в свободу воли
Brian Keating · 13.08.25
29 мин
🧱 Питер Шраммель из Diffblue: программисты тратят 35% времени на тесты, но ИИ готов взять эту рутину на себя
Eye on AI · 08.09.22
1ч 01м
🧪 Periodic Labs: Как выходцы из OpenAI и DeepMind обучают ИИ-физиков в автоматизированных лабораториях
The Cognitive Revolution · 02.10.25
30 мин
🤖 Уэс Рот: «Роботы эволюционируют в симуляции, а OpenAI теряет кадры»
Wes Roth · 05.05.24
1ч 37м
🧠 Почему роботы бьют посуду и как ИИ обретает здравый смысл
Lex Fridman · 14.07.20
1ч 19м
🎓 Кэл Ньюпорт: почему пятиминутный тайм-менеджмент больше не работает
Deep Questions with Cal Newport · 14.04.25
1ч 10м
🧠 Джефф Бек: «Байесовский мозг эффективнее градиентного спуска»
Machine Learning Street Talk · 13.10.23
1ч 23м
🏗 Как победить в Minecraft RL: команда Kairos о сочетании обучения и инженерного подхода
Yannic Kilcher · 11.01.22
51 мин
🏋 Создатель ChatGPT строит ИИ-физика: как Periodic Labs планирует открыть новые материалы
a16z (Andreessen Horowitz) · 30.09.25
24 мин
👁 Джек Кларк: «Мы имеем дело с реальным и таинственным существом»
Wes Roth · 14.10.25
1ч 18м
🎓 Как аналитический метод DPO изменил выравнивание LLM и столкнулся со взломом наград
Stanford Online · 30.10.24
1ч 20м
Методы оценки политики: Монте-Карло против Temporal Difference
Stanford Online · 30.10.24
53 мин
🔄 Янник Кильчер разобрал метод Reinforced Self-Training от Google DeepMind
Yannic Kilcher · 03.09.23
1ч 13м
🔄 Подход Model-Based RL: как Стэнфорд обучает сложных роботов за четыре часа
Stanford Online · 08.12.25
1ч 47м
🛠 Тюнинг LLM: как методы PPO и DPO превращают нейросети из автодополнителей в полезных помощников
Stanford Online · 14.11.25
1ч 47м
🎯 Стэнфорд: «Ваша языковая модель — это на самом деле скрытая модель вознаграждения»
Stanford Online · 14.11.25
1ч 13м
🧩 Stanford CS234 Reinforcement Learning I Tabular MDP Planning I 2024 I Lecture 2
Stanford Online · 30.10.24
13 мин
🔄 Дэвид Сильвер о Deep RL: «В нейросетях с миллиардом параметров нет локальных минимумов»
Lex Fridman · 06.05.20
1ч 13м
Теория игр: Minimax, Alpha-Beta и поиск оптимальной стратегии
Stanford Online · 09.03
1ч 18м
🧠 Эмма Бранскилл о DQN: «Реплей-буфер — ключ к прогрессу»
Stanford Online · 30.10.24
58 мин
🤖 Как Google SayCan объединяет языковые модели и робототехнику
Yannic Kilcher · 02.05.22
26 мин
🔄 Шмидхубер выворачивает ИИ наизнанку: детальный разбор концепции Upside-Down RL
Yannic Kilcher · 11.12.19
2ч 38м
🚀 Как Anthropic защищает нейросети от государственного шпионажа
The Cognitive Revolution · 25.09.24