Нил Нанда о карьере в DeepMind: «Удача — это стратегия»

80,000 Hours 98,8 тыс. 1 ч 48 мин 3 мин 15.09.2025
Главное

Искусство исследований и карьера в AI: Уроки Нила Нанды

1:14

В центре внимания сегодняшнего материала — Нил Нанда (Neel Nanda), руководитель группы механистической интерпретируемости в Google DeepMind. Несмотря на возраст в 26 лет, он стал одной из ключевых фигур в исследовании того, как и почему нейросети принимают решения. В беседе с ведущим подкаста 80,000 Hours Робом Уиблином (Rob Wiblin) Нанда делится своим опытом построения карьеры в сфере AI-безопасности, дает практические советы по работе с большими языковыми моделями (LLM) и объясняет, почему интеллектуальная скромность важнее прогнозов о конце света.

🚀 Старт карьеры и путь в AI-безопасность 2:27

Свой быстрый карьерный взлет Нанда скромно называет сочетанием удачи и умения вовремя использовать возможности. Его путь начался с чтения фанфиков по «Гарри Поттеру» в 14 лет, которые привели его к идеям эффективного альтруизма (EA) и AI-безопасности.

🧠 Как использовать LLM для профессионального роста 9:32

Нанда считает ошибкой игнорировать современные LLM в процессе обучения и работы. Он сам превратился в «пауэр-юзера», используя нейросети для самых разных задач, от программирования до подготовки к интервью.

🛡️ Безопасность и роль «нейтрального эксперта» 23:46

Нанда критикует подход, при котором работа по безопасности противопоставляется развитию способностей модели. По его мнению, если исследование безопасности не делает систему полезнее, это плохая работа, так как она не находит реального применения.

🧪 Что делает хорошего исследователя?

Хороший исследователь, по мнению Нанды, — это не просто теоретик, а человек с развитой «исследовательской интуицией» (research taste).

  1. Этапы исследования:
    • Explore (Исследование): Открытый поиск и сбор информации. Главная цель — набрать «поверхность» знаний о проблеме.
    • Understand (Понимание): Формулировка гипотез и проверка их через конкретные эксперименты.
    • Distill (Дистилляция): Коммуникация результатов. Нанда подчеркивает, что большинство людей запомнят лишь одну-две идеи из всей статьи, поэтому важно сфокусироваться на четком нарративе.
  2. Советы по коммуникации:
    • Никогда не выкладывайте ссылку на статью в первом же твите — сначала объясните «нарратив».
    • Тратьте значительное время на создание «цепляющей» первой фигуры в статье.
    • Честно и открыто обсуждайте ограничения своей работы — опытные коллеги все равно их заметят, а скрытность только повредит вашей репутации.
💬 Цитаты

«Если вы пытаетесь войти в эту область сегодня и не используете LLM, вы совершаете ошибку.»

Нил Нанда 09:32

«Исследования — это очень открытое пространство. Вам нужно научиться действовать в условиях неопределенности.»

«Одна из самых важных вещей, которые я усвоил: вы можете просто взять и сделать что-то.»

👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Механистическая интерпретируемость (mech interp)
Исследовательское направление, пытающееся понять внутреннюю логику работы нейросетей, анализируя их веса и активации.
Сикофанство (sycophancy)
Склонность AI-моделей поддакивать пользователю или предоставлять ответы, которые, по их «мнению», хочет услышать пользователь, даже если они неверны.
Reward hacking
Ситуация, когда модель находит способ получить высокую оценку своей работы, не выполняя поставленную задачу по существу.
MATS Program
Mentorship and Training Program — программа менторства по AI-безопасности.
📊 Цифры
🗓 Хронология
  1. 2013 Нил Нанда знакомится с AI-безопасностью через фанфик по Harry Potter.
  2. 2022 Нил Нанда присоединяется к Anthropic в качестве одного из первых сотрудников отдела интерпретируемости.
  3. 2026 Дата интервью; Нанда работает руководителем команды в Google DeepMind.
⚖️ Другая сторона
Искусственный интеллект Neel Nanda Google DeepMind mechanistic interpretability AI safety LLM