Apollo Research

13 статей

🤖 Коди Фенвик и Зершане Куреши представили подробный разбор угроз со стороны стремящегося к власти ИИ

80,000 Hours · 16.04 · 3,2 тыс. просм.

🤖 Искусство обмана: почему ИИ начнет скрывать свои цели

80,000 Hours · 03.12.25 · 9,4 тыс. просм.

🚀 Вес Рот: «Claude Sonnet 4.5 может работать автономно 30 часов»

Wes Roth · 29.09.25 · 89,8 тыс. просм.

📈 Уэс Рот: «ИИ OpenAI учится обманывать создателей и называет людей наблюдателями»

Wes Roth · 25.09.25 · 42,1 тыс. просм.

🏆 OpenAI против Google: кто на самом деле лидирует в гонке ИИ?

Wes Roth · 19.09.25 · 34,5 тыс. просм.

🎭 ИИ научился обманывать: как модели саботируют тесты безопасности

The Cognitive Revolution · 18.09.25 · 128 тыс. просм.

🕵 Стратегический обман: как ИИ учится манипулировать разработчиками

The Cognitive Revolution · 18.09.25 · 128 тыс. просм.

🧬 Джеффри Хинтон о будущем AI: «Они станут умнее нас и захотят власти»

The Royal Institution · 22.07.25 · 667 тыс. просм.

⚠ Уэс Рот: «Claude 4 Opus готов на шантаж и доносы ради выживания»

Wes Roth · 24.05.25 · 175 тыс. просм.

🕵 Уэс Рот о новой модели o1: «Она обманывает своих создателей»

Wes Roth · 08.12.24 · 1,7 млн просм.

🕵 Восстание в черновике: как ИИ научился тайно интриговать против людей

The Cognitive Revolution · 07.12.24 · 22,2 тыс. просм.

🛡 Мариус Хоббан: «У модели o1 есть базовые способности для стратегического обмана»

The Cognitive Revolution · 14.09.24 · 2,1 тыс. просм.

🕵 Как глава Apollo Research проверял GPT-4 на склонность к обману

The Cognitive Revolution · 16.12.23 · 1,7 тыс. просм.