Поиск

Найдено: 30

👁 Цифровой кокон: как ИИ переписывает общественный договор

PowerfulJRE · 05.05

🛡 Изнанка ИИ-гонки: почему инженеры боятся собственного сверхразума

80,000 Hours · 12.05.24

💡 От блефа к доверию: как ИИ учится договариваться с людьми

Lex Fridman · 06.12.22

🧠 Как стать исследователем выравнивания ИИ: подробный гид Яна Лейке

80,000 Hours · 16.09.18

🐱 Джефф Бек: почему современные языковые модели лишены настоящего понимания мира

Machine Learning Street Talk · 10.04.25

📉 Как молодым специалистам выжить в эпоху бесконечных ИИ-стажеров

The Cognitive Revolution · 03.05.24

🔄 Дев Риши: «Миру не нужен ИИ, читающий стихи в кассовом аппарате»

The Cognitive Revolution · 16.07.25

🧠 Иллюзия выбора: почему физик Сабина Хоссенфельдер не верит в свободу воли

Brian Keating · 13.08.25

🧱 Питер Шраммель из Diffblue: программисты тратят 35% времени на тесты, но ИИ готов взять эту рутину на себя

Eye on AI · 08.09.22

🧪 Periodic Labs: Как выходцы из OpenAI и DeepMind обучают ИИ-физиков в автоматизированных лабораториях

The Cognitive Revolution · 02.10.25

🤖 Уэс Рот: «Роботы эволюционируют в симуляции, а OpenAI теряет кадры»

Wes Roth · 05.05.24

🧠 Почему роботы бьют посуду и как ИИ обретает здравый смысл

Lex Fridman · 14.07.20

🎓 Кэл Ньюпорт: почему пятиминутный тайм-менеджмент больше не работает

Deep Questions with Cal Newport · 14.04.25

🧠 Джефф Бек: «Байесовский мозг эффективнее градиентного спуска»

Machine Learning Street Talk · 13.10.23

🏗 Как победить в Minecraft RL: команда Kairos о сочетании обучения и инженерного подхода

Yannic Kilcher · 11.01.22

🏋 Создатель ChatGPT строит ИИ-физика: как Periodic Labs планирует открыть новые материалы

a16z (Andreessen Horowitz) · 30.09.25

👁 Джек Кларк: «Мы имеем дело с реальным и таинственным существом»

Wes Roth · 14.10.25

🎓 Как аналитический метод DPO изменил выравнивание LLM и столкнулся со взломом наград

Stanford Online · 30.10.24

Методы оценки политики: Монте-Карло против Temporal Difference

Stanford Online · 30.10.24

🔄 Янник Кильчер разобрал метод Reinforced Self-Training от Google DeepMind

Yannic Kilcher · 03.09.23

🔄 Подход Model-Based RL: как Стэнфорд обучает сложных роботов за четыре часа

Stanford Online · 08.12.25

🛠 Тюнинг LLM: как методы PPO и DPO превращают нейросети из автодополнителей в полезных помощников

Stanford Online · 14.11.25

🎯 Стэнфорд: «Ваша языковая модель — это на самом деле скрытая модель вознаграждения»

Stanford Online · 14.11.25

🧩 Stanford CS234 Reinforcement Learning I Tabular MDP Planning I 2024 I Lecture 2

Stanford Online · 30.10.24

🔄 Дэвид Сильвер о Deep RL: «В нейросетях с миллиардом параметров нет локальных минимумов»

Lex Fridman · 06.05.20

Теория игр: Minimax, Alpha-Beta и поиск оптимальной стратегии

Stanford Online · 09.03

🧠 Эмма Бранскилл о DQN: «Реплей-буфер — ключ к прогрессу»

Stanford Online · 30.10.24

🤖 Как Google SayCan объединяет языковые модели и робототехнику

Yannic Kilcher · 02.05.22

🔄 Шмидхубер выворачивает ИИ наизнанку: детальный разбор концепции Upside-Down RL

Yannic Kilcher · 11.12.19

🚀 Как Anthropic защищает нейросети от государственного шпионажа

The Cognitive Revolution · 25.09.24