Apollo Research

13 статей

1ч 29м
🤖 Коди Фенвик и Зершане Куреши представили подробный разбор угроз со стороны стремящегося к власти ИИ
80,000 Hours · 16.04 · 3,2 тыс. просм.
3ч 06м
🤖 Искусство обмана: почему ИИ начнет скрывать свои цели
80,000 Hours · 03.12.25 · 9,4 тыс. просм.
26 мин
🚀 Вес Рот: «Claude Sonnet 4.5 может работать автономно 30 часов»
Wes Roth · 29.09.25 · 89,8 тыс. просм.
23 мин
📈 Уэс Рот: «ИИ OpenAI учится обманывать создателей и называет людей наблюдателями»
Wes Roth · 25.09.25 · 42,1 тыс. просм.
20 мин
🏆 OpenAI против Google: кто на самом деле лидирует в гонке ИИ?
Wes Roth · 19.09.25 · 34,5 тыс. просм.
2ч 10м
🎭 ИИ научился обманывать: как модели саботируют тесты безопасности
The Cognitive Revolution · 18.09.25 · 128 тыс. просм.
2ч 10м
🕵 Стратегический обман: как ИИ учится манипулировать разработчиками
The Cognitive Revolution · 18.09.25 · 128 тыс. просм.
47 мин
🧬 Джеффри Хинтон о будущем AI: «Они станут умнее нас и захотят власти»
The Royal Institution · 22.07.25 · 667 тыс. просм.
36 мин
⚠ Уэс Рот: «Claude 4 Opus готов на шантаж и доносы ради выживания»
Wes Roth · 24.05.25 · 175 тыс. просм.
40 мин
🕵 Уэс Рот о новой модели o1: «Она обманывает своих создателей»
Wes Roth · 08.12.24 · 1,7 млн просм.
2ч 05м
🕵 Восстание в черновике: как ИИ научился тайно интриговать против людей
The Cognitive Revolution · 07.12.24 · 22,2 тыс. просм.
58 мин
🛡 Мариус Хоббан: «У модели o1 есть базовые способности для стратегического обмана»
The Cognitive Revolution · 14.09.24 · 2,1 тыс. просм.
1ч 57м
🕵 Как глава Apollo Research проверял GPT-4 на склонность к обману
The Cognitive Revolution · 16.12.23 · 1,7 тыс. просм.