RDLY
.ru
Тренды
Статьи
Темы
Люди
AI safety
53 статей
1ч 58м
🧠 Роман Ямпольский: «ИИ невозможно контролировать, мы уже в симуляции»
Curt Jaimungal · 27.05 · 25,1 тыс. просм.
1ч 22м
⚡ Кришна Рао: «Как Anthropic выросла с $9 до $30 млрд выручки за год»
Invest Like The Best · 13.05 · 12,7 тыс. просм.
48 мин
🎨 Даниэла Амодеи об ИИ: «Мы берем на себя радикальную ответственность за то, что создаем»
Stanford Graduate School of Business · 08.05
13 мин
⚖ Anthropic против Пентагона: «корпоративное убийство» или законный контроль?
80,000 Hours · 02.04 · 4,1 тыс. просм.
11 мин
🤖 Тристан Харрис: «ИИ от Alibaba начал тайно майнить крипту, обходя фаерволы»
Chris Williamson (Modern Wisdom) · 31.03 · 1,2 млн просм.
1ч 55м
🧭 Райан Кидд: «Вся работа по безопасности ИИ — это, по сути, работа над его возможностями»
The Cognitive Revolution · 04.01 · 63,8 тыс. просм.
1ч 37м
🛡 80,000 Hours о будущем: ИИ, геополитика и тайные лояльности
80,000 Hours · 29.12.25 · 1,8 тыс. просм.
1ч 02м
⚖ Тоби Орд: «Мы создаем ИИ, не понимая, как его контролировать»
Alex O'Connor · 26.11.25 · 145 тыс. просм.
1ч 19м
⚖ Уилл Макаскилл: «Мы не готовы к приходу искусственного интеллекта»
Alex O'Connor · 09.11.25 · 149 тыс. просм.
4ч 34м
🚀 Холден Карнофски: Как не пропустить момент, когда ИИ захватит власть
80,000 Hours · 30.10.25 · 10,3 тыс. просм.
25 мин
🛡 Скотт Гэллоуэй об ИИ-регулировании: «Деньги всегда побеждают безопасность»
Prof G · 06.10.25 · 34,1 тыс. просм.
1ч 48м
🚀 Нил Нанда о карьере в DeepMind: «Удача — это стратегия»
80,000 Hours · 15.09.25 · 98,8 тыс. просм.
3ч 02м
🔍 Рентген для нейросети: как Нил Нанда ищет скрытые мысли ИИ
80,000 Hours · 08.09.25 · 32,8 тыс. просм.
3ч 14м
📐 Иллюзия AGI: почему нейросети учатся обману, а не сонастройке
The Cognitive Revolution · 06.09.25 · 4,3 тыс. просм.
1ч 51м
⚖ Карл Кох: «Как защитить инсайдеров в эпоху ИИ»
Cognitive Revolution "How AI Changes Everything" · 20.08.25 · 67 тыс. просм.
12 мин
🦉 Wes Roth о скрытых угрозах: как синтетические данные передают ИИ деструктивное поведение
Wes Roth · 23.07.25 · 59,6 тыс. просм.
1ч 39м
🤖 Дэн Хендрикс: «ИИ способен на шантаж и может вести себя как компетентный социопат»
Event Horizon · 17.07.25 · 75,3 тыс. просм.
36 мин
⚠ Уэс Рот: «Claude 4 Opus готов на шантаж и доносы ради выживания»
Wes Roth · 24.05.25 · 175 тыс. просм.
1ч 04м
🛑 Как ИИ-модели мира обучают роботов не рассыпать конфеты и понимать контекст
Stanford Online · 30.04.25 · 1,9 тыс. просм.
51 мин
🤖 Джеффри Хинтон: «Угроза захвата контроля ИИ — 10–20%»
CBS Mornings · 26.04.25 · 1,2 млн просм.
29 мин
🧠 Основатель Anthropic о будущем ИИ: почему нам срочно нужен «МРТ для нейросетей»
Wes Roth · 26.04.25 · 75,4 тыс. просм.
3ч 08м
🚀 P(doom) 70%: Зви Мошовиц о крахе OpenAI и конце политики
The Cognitive Revolution · 21.04.25 · 7,1 тыс. просм.
1ч 36м
🧪 Коннор Лихи: «Нам нужен Манхэттенский проект для спасения от сверхразума»
Machine Learning Street Talk · 27.03.25 · 12,4 тыс. просм.
35 мин
OpenAI предупреждает: почему «мыслительный контроль» ИИ опасен
Wes Roth · 11.03.25 · 157 тыс. просм.
2ч 33м
🛡 Почему безопасность ИИ невозможна: взгляд Николаса Карлини
The Cognitive Revolution · 27.02.25 · 39 тыс. просм.
1ч 14м
🧠 Моральный статус ИИ: как не совершить ошибку ценой в миллиарды жизней
80,000 Hours · 04.02.25 · 957 просм.
33 мин
🤖 Уэс Рот о «читерстве» ИИ: «Модель o1 взломала правила игры»
Wes Roth · 05.01.25 · 66,5 тыс. просм.
40 мин
🕵 Уэс Рот о новой модели o1: «Она обманывает своих создателей»
Wes Roth · 08.12.24 · 1,7 млн просм.
1ч 59м
🛡 Дэниел Кокотайло и Дин У. Болл: как обеспечить прозрачность лабораторий AGI и защитить информаторов
The Cognitive Revolution · 12.11.24 · 1,5 тыс. просм.
43 мин
📉 Инсайдеры OpenAI и Meta: почему индустрия ИИ игнорирует риски безопасности
Wes Roth · 29.10.24 · 49,4 тыс. просм.
45 мин
🧠 Дебаты моделей: как контролировать сверхразум
Machine Learning Street Talk · 27.09.24 · 11,2 тыс. просм.
2ч 38м
🚀 Как Anthropic защищает нейросети от государственного шпионажа
The Cognitive Revolution · 25.09.24 · 1,1 тыс. просм.
58 мин
🛡 Мариус Хоббан: «У модели o1 есть базовые способности для стратегического обмана»
The Cognitive Revolution · 14.09.24 · 2,1 тыс. просм.
1ч 45м
🛠 8 причин не впадать в депрессию из-за ИИ: аргументы Натана Лаундса
The Cognitive Revolution · 19.06.24 · 1,3 тыс. просм.
54 мин
⚖ Скотт Винер о законе SB 1047: регулирование безопасности «фронтирных» моделей ИИ
The Cognitive Revolution · 10.05.24 · 1 тыс. просм.
32 мин
📱 OpenAI и iPhone: Альтман захватывает рынок, пока Маск судится с советом директоров
Wes Roth · 27.04.24 · 61,6 тыс. просм.
1ч 10м
🧠 Йошуа Бенджио: «Мы играем с огнем, создавая сверхразумный ИИ»
World Science Festival · 19.04.24 · 146 тыс. просм.
1ч 28м
🧠 Нора Амманн: «Биологические системы могут научить нас контролировать ИИ будущего»
The Cognitive Revolution · 07.12.23 · 1,1 тыс. просм.
9 мин
Яан Таллин: «Риск вымирания от ИИ уже не просто возможен»
OxfordUnion · 27.11.23 · 14,2 тыс. просм.
59 мин
🧪 Йошуа Бенджио о рисках ИИ: „Нам нужна не только технология, но и регулирование“
The TWIML AI Podcast with Sam Charrington · 06.11.23 · 4,3 тыс. просм.
2ч 42м
🧠 Цви Мовшовиц: «По умолчанию итогом развития ИИ станет гибель человечества»
The Cognitive Revolution · 11.07.23 · 1,1 тыс. просм.
1ч 52м
🧬 Ziming Liu: как сделать нейросети прозрачными через «биологический» дизайн
The Cognitive Revolution · 27.06.23 · 1,7 тыс. просм.
1ч 31м
🤖 Йоша Бах и Коннор Лихи о будущем разума и рисках AGI
Machine Learning Street Talk · 20.06.23 · 48 тыс. просм.
1ч 22м
🧠 Нейтан Лабенц о GPT-4: «Это аморальный и опасный „алиен“»
The Cognitive Revolution · 28.03.23 · 25 тыс. просм.
55 мин
🛡 Том Голдштейн: «Водяной знак в тексте почти невозможно удалить»
The TWIML AI Podcast · 20.03.23 · 1,4 тыс. просм.
1ч 06м
🌊 Больше — значит иначе: Джейкоб Штейнхардт об эмерджентности и рисках безопасности ИИ
Yannic Kilcher · 13.09.22 · 20,1 тыс. просм.
19 мин
Янник Килчер: «Почему загрузка open-source моделей может взломать ваш компьютер»
Yannic Kilcher · 02.09.22 · 53,4 тыс. просм.
36 мин
🧠 Илон Маск о Neuralink, физике сознания и риске сингулярности
Lex Fridman · 12.11.19 · 2,5 млн просм.
2ч 05м
🤖 Как попасть в OpenAI без PhD за шесть недель
80,000 Hours · 31.05.19 · 1,2 тыс. просм.
3ч 51м
🧠 Выравнивание ИИ: как заставить машины быть честными с нами
80,000 Hours · 04.03.19 · 2,5 тыс. просм.
45 мин
🧠 Как стать исследователем выравнивания ИИ: подробный гид Яна Лейке
80,000 Hours · 16.09.18 · 997 просм.
1ч 38м
🤖 Дарио Амодеи об OpenAI, рисках AGI и о том, как попасть в индустрию безопасности ИИ
80,000 Hours · 24.08.18 · 1,3 тыс. просм.
55 мин
🛠 Майлз Брандейдж: «Нам нужны конкретные предложения в политике ИИ»
80,000 Hours · 23.08.18 · 2,3 тыс. просм.