RDLY
.ru
Тренды
Статьи
Темы
Люди
Н
Нил Нанда
Исследователь интерпретируемости ИИ
3
статьи
240 тыс.
просмотров
2023–2025
период
2
канала
💬 Заметные цитаты
Непрозрачность работы нейросетей
«I see this as very much an empirical science... And a sad fact about models is we don't know how they work.»
→
Механистическая интерпретируемость: как декомпилировать разум нейросети
Универсальные алгоритмы внутри моделей
«I generally think of this much more as a periodic table of universal circuits.»
→
Механистическая интерпретируемость: как декомпилировать разум нейросети
Работа в условиях неопределенности
«Исследования — это очень открытое пространство. Вам нужно научиться действовать в условиях неопределенности.»
→
Нил Нанда о карьере в DeepMind: «Удача — это стратегия»
Важность личной инициативы
«Одна из самых важных вещей, которые я усвоил: вы можете просто взять и сделать что-то.»
→
Нил Нанда о карьере в DeepMind: «Удача — это стратегия»
«Я хочу, чтобы модели были красивыми... но я ожидаю, что они окажутся грязными и запутанными.»
→
Механистическая интерпретируемость: как декомпилировать разум нейросети
«Модель «упаковывает» больше признаков, чем есть нейронов, допуская небольшие интерференции.»
→
Механистическая интерпретируемость: как декомпилировать разум нейросети
«Residual stream рассматривается как центральный объект-память модели, а механизмы внимания — как инструменты для передачи информации между токенами.»
→
Механистическая интерпретируемость: как декомпилировать разум нейросети
«Люди склонны доверять AI, даже если знают, что это AI.»
→
Механистическая интерпретируемость: как декомпилировать разум нейросети
Все цитаты (9) →
👥 Часто вместе с
Роб Уиблин
2
Хелен Тонер
1
Кайл Фиш
1
Хью Уайт
1
Луиза Родригес
1
📺 Где появляется
80,000 Hours
2
Machine Learning Street Talk
1
🧠 Ключевые концепции
Механистическая интерпретируемость
2
Гроккинг
1
Residual stream
1
Суперпозиция
1
Механистическая интерпретируемость (mech interp)
1
Сикофанство (sycophancy)
1
Reward hacking
1
MATS Program
1
AGI
1
NIMBY
1
📈 Темы
Housing Crisis
1
AI safety
1
Neel Nanda
1
Transformers
1
Geopolitics
1
Механистическая интерпретируемость
1
Гроккинг
1
AI Safety
1
Нил Нанда
1
AGI
1
Mechanistic Interpretability
1
mechanistic interpretability
1
📺 Материалы с участием
1ч 37м
🛡 80,000 Hours о будущем: ИИ, геополитика и тайные лояльности
80,000 Hours · 29.12.25 · 1,8 тыс. просм.
1ч 48м
🚀 Нил Нанда о карьере в DeepMind: «Удача — это стратегия»
80,000 Hours · 15.09.25 · 98,8 тыс. просм.
3ч 57м
🧠 Механистическая интерпретируемость: как декомпилировать разум нейросети
Machine Learning Street Talk · 28.10.23 · 140 тыс. просм.