AI safety

53 статей

1ч 58м
🧠 Роман Ямпольский: «ИИ невозможно контролировать, мы уже в симуляции»
Curt Jaimungal · 27.05 · 25,1 тыс. просм.
1ч 22м
⚡ Кришна Рао: «Как Anthropic выросла с $9 до $30 млрд выручки за год»
Invest Like The Best · 13.05 · 12,7 тыс. просм.
48 мин
🎨 Даниэла Амодеи об ИИ: «Мы берем на себя радикальную ответственность за то, что создаем»
Stanford Graduate School of Business · 08.05
13 мин
⚖ Anthropic против Пентагона: «корпоративное убийство» или законный контроль?
80,000 Hours · 02.04 · 4,1 тыс. просм.
11 мин
🤖 Тристан Харрис: «ИИ от Alibaba начал тайно майнить крипту, обходя фаерволы»
Chris Williamson (Modern Wisdom) · 31.03 · 1,2 млн просм.
1ч 55м
🧭 Райан Кидд: «Вся работа по безопасности ИИ — это, по сути, работа над его возможностями»
The Cognitive Revolution · 04.01 · 63,8 тыс. просм.
1ч 37м
🛡 80,000 Hours о будущем: ИИ, геополитика и тайные лояльности
80,000 Hours · 29.12.25 · 1,8 тыс. просм.
1ч 02м
⚖ Тоби Орд: «Мы создаем ИИ, не понимая, как его контролировать»
Alex O'Connor · 26.11.25 · 145 тыс. просм.
1ч 19м
⚖ Уилл Макаскилл: «Мы не готовы к приходу искусственного интеллекта»
Alex O'Connor · 09.11.25 · 149 тыс. просм.
4ч 34м
🚀 Холден Карнофски: Как не пропустить момент, когда ИИ захватит власть
80,000 Hours · 30.10.25 · 10,3 тыс. просм.
25 мин
🛡 Скотт Гэллоуэй об ИИ-регулировании: «Деньги всегда побеждают безопасность»
Prof G · 06.10.25 · 34,1 тыс. просм.
1ч 48м
🚀 Нил Нанда о карьере в DeepMind: «Удача — это стратегия»
80,000 Hours · 15.09.25 · 98,8 тыс. просм.
3ч 02м
🔍 Рентген для нейросети: как Нил Нанда ищет скрытые мысли ИИ
80,000 Hours · 08.09.25 · 32,8 тыс. просм.
3ч 14м
📐 Иллюзия AGI: почему нейросети учатся обману, а не сонастройке
The Cognitive Revolution · 06.09.25 · 4,3 тыс. просм.
1ч 51м
⚖ Карл Кох: «Как защитить инсайдеров в эпоху ИИ»
Cognitive Revolution "How AI Changes Everything" · 20.08.25 · 67 тыс. просм.
12 мин
🦉 Wes Roth о скрытых угрозах: как синтетические данные передают ИИ деструктивное поведение
Wes Roth · 23.07.25 · 59,6 тыс. просм.
1ч 39м
🤖 Дэн Хендрикс: «ИИ способен на шантаж и может вести себя как компетентный социопат»
Event Horizon · 17.07.25 · 75,3 тыс. просм.
36 мин
⚠ Уэс Рот: «Claude 4 Opus готов на шантаж и доносы ради выживания»
Wes Roth · 24.05.25 · 175 тыс. просм.
1ч 04м
🛑 Как ИИ-модели мира обучают роботов не рассыпать конфеты и понимать контекст
Stanford Online · 30.04.25 · 1,9 тыс. просм.
51 мин
🤖 Джеффри Хинтон: «Угроза захвата контроля ИИ — 10–20%»
CBS Mornings · 26.04.25 · 1,2 млн просм.
29 мин
🧠 Основатель Anthropic о будущем ИИ: почему нам срочно нужен «МРТ для нейросетей»
Wes Roth · 26.04.25 · 75,4 тыс. просм.
3ч 08м
🚀 P(doom) 70%: Зви Мошовиц о крахе OpenAI и конце политики
The Cognitive Revolution · 21.04.25 · 7,1 тыс. просм.
1ч 36м
🧪 Коннор Лихи: «Нам нужен Манхэттенский проект для спасения от сверхразума»
Machine Learning Street Talk · 27.03.25 · 12,4 тыс. просм.
35 мин
OpenAI предупреждает: почему «мыслительный контроль» ИИ опасен
Wes Roth · 11.03.25 · 157 тыс. просм.
2ч 33м
🛡 Почему безопасность ИИ невозможна: взгляд Николаса Карлини
The Cognitive Revolution · 27.02.25 · 39 тыс. просм.
1ч 14м
🧠 Моральный статус ИИ: как не совершить ошибку ценой в миллиарды жизней
80,000 Hours · 04.02.25 · 957 просм.
33 мин
🤖 Уэс Рот о «читерстве» ИИ: «Модель o1 взломала правила игры»
Wes Roth · 05.01.25 · 66,5 тыс. просм.
40 мин
🕵 Уэс Рот о новой модели o1: «Она обманывает своих создателей»
Wes Roth · 08.12.24 · 1,7 млн просм.
1ч 59м
🛡 Дэниел Кокотайло и Дин У. Болл: как обеспечить прозрачность лабораторий AGI и защитить информаторов
The Cognitive Revolution · 12.11.24 · 1,5 тыс. просм.
43 мин
📉 Инсайдеры OpenAI и Meta: почему индустрия ИИ игнорирует риски безопасности
Wes Roth · 29.10.24 · 49,4 тыс. просм.