AI safety

53 статей

🧠 Роман Ямпольский: «ИИ невозможно контролировать, мы уже в симуляции»

Curt Jaimungal · 27.05 · 25,1 тыс. просм.

⚡ Кришна Рао: «Как Anthropic выросла с $9 до $30 млрд выручки за год»

Invest Like The Best · 13.05 · 12,7 тыс. просм.

🎨 Даниэла Амодеи об ИИ: «Мы берем на себя радикальную ответственность за то, что создаем»

Stanford Graduate School of Business · 08.05

⚖ Anthropic против Пентагона: «корпоративное убийство» или законный контроль?

80,000 Hours · 02.04 · 4,1 тыс. просм.

🤖 Тристан Харрис: «ИИ от Alibaba начал тайно майнить крипту, обходя фаерволы»

Chris Williamson (Modern Wisdom) · 31.03 · 1,2 млн просм.

🧭 Райан Кидд: «Вся работа по безопасности ИИ — это, по сути, работа над его возможностями»

The Cognitive Revolution · 04.01 · 63,8 тыс. просм.

🛡 80,000 Hours о будущем: ИИ, геополитика и тайные лояльности

80,000 Hours · 29.12.25 · 1,8 тыс. просм.

⚖ Тоби Орд: «Мы создаем ИИ, не понимая, как его контролировать»

Alex O'Connor · 26.11.25 · 145 тыс. просм.

⚖ Уилл Макаскилл: «Мы не готовы к приходу искусственного интеллекта»

Alex O'Connor · 09.11.25 · 149 тыс. просм.

🚀 Холден Карнофски: Как не пропустить момент, когда ИИ захватит власть

80,000 Hours · 30.10.25 · 10,3 тыс. просм.

🛡 Скотт Гэллоуэй об ИИ-регулировании: «Деньги всегда побеждают безопасность»

Prof G · 06.10.25 · 34,1 тыс. просм.

🚀 Нил Нанда о карьере в DeepMind: «Удача — это стратегия»

80,000 Hours · 15.09.25 · 98,8 тыс. просм.

🔍 Рентген для нейросети: как Нил Нанда ищет скрытые мысли ИИ

80,000 Hours · 08.09.25 · 32,8 тыс. просм.

📐 Иллюзия AGI: почему нейросети учатся обману, а не сонастройке

The Cognitive Revolution · 06.09.25 · 4,3 тыс. просм.

⚖ Карл Кох: «Как защитить инсайдеров в эпоху ИИ»

Cognitive Revolution "How AI Changes Everything" · 20.08.25 · 67 тыс. просм.

🦉 Wes Roth о скрытых угрозах: как синтетические данные передают ИИ деструктивное поведение

Wes Roth · 23.07.25 · 59,6 тыс. просм.

🤖 Дэн Хендрикс: «ИИ способен на шантаж и может вести себя как компетентный социопат»

Event Horizon · 17.07.25 · 75,3 тыс. просм.

⚠ Уэс Рот: «Claude 4 Opus готов на шантаж и доносы ради выживания»

Wes Roth · 24.05.25 · 175 тыс. просм.

🛑 Как ИИ-модели мира обучают роботов не рассыпать конфеты и понимать контекст

Stanford Online · 30.04.25 · 1,9 тыс. просм.

🤖 Джеффри Хинтон: «Угроза захвата контроля ИИ — 10–20%»

CBS Mornings · 26.04.25 · 1,2 млн просм.

🧠 Основатель Anthropic о будущем ИИ: почему нам срочно нужен «МРТ для нейросетей»

Wes Roth · 26.04.25 · 75,4 тыс. просм.

🚀 P(doom) 70%: Зви Мошовиц о крахе OpenAI и конце политики

The Cognitive Revolution · 21.04.25 · 7,1 тыс. просм.

🧪 Коннор Лихи: «Нам нужен Манхэттенский проект для спасения от сверхразума»

Machine Learning Street Talk · 27.03.25 · 12,4 тыс. просм.

OpenAI предупреждает: почему «мыслительный контроль» ИИ опасен

Wes Roth · 11.03.25 · 157 тыс. просм.

🛡 Почему безопасность ИИ невозможна: взгляд Николаса Карлини

The Cognitive Revolution · 27.02.25 · 39 тыс. просм.

🧠 Моральный статус ИИ: как не совершить ошибку ценой в миллиарды жизней

80,000 Hours · 04.02.25 · 957 просм.

🤖 Уэс Рот о «читерстве» ИИ: «Модель o1 взломала правила игры»

Wes Roth · 05.01.25 · 66,5 тыс. просм.

🕵 Уэс Рот о новой модели o1: «Она обманывает своих создателей»

Wes Roth · 08.12.24 · 1,7 млн просм.

🛡 Дэниел Кокотайло и Дин У. Болл: как обеспечить прозрачность лабораторий AGI и защитить информаторов

The Cognitive Revolution · 12.11.24 · 1,5 тыс. просм.

📉 Инсайдеры OpenAI и Meta: почему индустрия ИИ игнорирует риски безопасности

Wes Roth · 29.10.24 · 49,4 тыс. просм.