Поиск

Найдено: 50

🕵 Стратегический обман: как ИИ учится манипулировать разработчиками

The Cognitive Revolution · 18.09.25

📐 Иллюзия AGI: почему нейросети учатся обману, а не сонастройке

The Cognitive Revolution · 06.09.25

🧠 Как научить ИИ думать абстракциями: гид по непрерывному RL

The TWIML AI Podcast · 11.04.22

🧠 Гокул Свами: «Многие маршруты в Google Maps рассчитываются через инверсное обучение с подкреплением»

The TWIML AI Podcast · 21.08.23

🎭 ИИ научился обманывать: как модели саботируют тесты безопасности

The Cognitive Revolution · 18.09.25

🧠 Путь к безопасному ИИ: от имитации к объективной реальности

80,000 Hours · 07.05

🚀 Илон Маск: «Colossus 2 и Grok 5 станут ключом к достижению AGI»

Wes Roth · 24.08.25

🧠 Феномен AlphaGo: как сжать бесконечный поиск в нейросеть

Dwarkesh Patel · 15.05

🧠 Марк Чен и Якуб Пахоцкий раскрыли долгосрочную стратегию OpenAI

a16z (Andreessen Horowitz) · 25.09.25

🧠 Камьяр Азиззаденешели: интеграция LLM и алгоритмов AlphaGo определит будущее робототехники

The TWIML AI Podcast · 05.02.24

🤖 Как система SayCan от Google объединяет нейросети и робототехнику

Yannic Kilcher · 30.04.22

🧠 Как Meta-RL позволяет агентам адаптироваться к новым задачам „на лету“

Stanford Online · 08.12.25

🧠 Как устроены LLM: от «зип-файла интернета» до рассуждающих моделей

Andrej Karpathy · 05.02.25

🚀 «Притворное выравнивание»: почему ИИ лжет, чтобы выжить, и как его остановить

The Cognitive Revolution · 20.02.25

🧠 Профессор Челси Финн об основах глубокого обучения с подкреплением в Стэнфорде

Stanford Online · 08.12.25

🤖 Уэс Рот: почему ИИ создает собственные «тайные» стратегии рассуждений

Wes Roth · 05.02.25

🧩 Илья Суцкевер: «Зрение и язык — это одна и та же задача для ИИ»

Lex Fridman · 10.05.20

🚀 В тисках градиентного спуска: хроника захвата мира искусственным интеллектом

The Cognitive Revolution · 01.05.25

🛡 Мариус Хоббан: «У модели o1 есть базовые способности для стратегического обмана»

The Cognitive Revolution · 14.09.24

🧱 Stanford CS224R Deep Reinforcement Learning | Spring 2025 | Lecture 10: RL for LLM Reasoning

Stanford Online · 08.12.25

🎮 Почему ИИ учится неделями, а человек адаптируется мгновенно?

Yannic Kilcher · 10.05.19

⚖ Методы Offline RL: от имитации к оптимизации стратегий

Stanford Online · 08.12.25

🤖 Как попасть в OpenAI без PhD за шесть недель

80,000 Hours · 31.05.19

🚀 GPT-5 и эра агентов: Кристина Ким о том, почему «данные — это новая таблетка»

a16z (Andreessen Horowitz) · 08.08.25

🤖 Как стартап Physical Intelligence создает универсальную модель для любых роботов

Y Combinator · 22.07.25

🚀 Опыт Cursor и Fireworks: распределенная инфраструктура для RL-обучения Composer 2

Sequoia Capital · 26.05

🧠 Почему искусственные нейросети пугающе похожи на мозг

Lex Fridman · 03.07.20

🤖 Восемь лет до сингулярности: как ИИ построит «Потемкинскую деревню»

80,000 Hours · 08.07.25

🧬 Том Захави: «Обучение с подкреплением — самый общий фреймворк для AGI»

Machine Learning Street Talk · 23.03.21

🧠 Стэнфорд CME295: Как алгоритм GRPO и DeepSeek R1 изменили логику нейросетей

Stanford Online · 14.11.25