Искусство исследований и карьера в AI: Уроки Нила Нанды
В центре внимания сегодняшнего материала — Нил Нанда (Neel Nanda), руководитель группы механистической интерпретируемости в Google DeepMind. Несмотря на возраст в 26 лет, он стал одной из ключевых фигур в исследовании того, как и почему нейросети принимают решения. В беседе с ведущим подкаста 80,000 Hours Робом Уиблином (Rob Wiblin) Нанда делится своим опытом построения карьеры в сфере AI-безопасности, дает практические советы по работе с большими языковыми моделями (LLM) и объясняет, почему интеллектуальная скромность важнее прогнозов о конце света.
🚀 Старт карьеры и путь в AI-безопасность 2:27
Свой быстрый карьерный взлет Нанда скромно называет сочетанием удачи и умения вовремя использовать возможности. Его путь начался с чтения фанфиков по «Гарри Поттеру» в 14 лет, которые привели его к идеям эффективного альтруизма (EA) и AI-безопасности.
- Стратегия «правильного места»: Нанда советует входить в быстрорастущие области, даже если они еще крошечные — так можно стать одним из самых опытных специалистов в индустрии за считанные годы.
- Отказ от PhD: Нанда уверен, что не стоит тратить 5 лет на докторскую степень, если есть возможность заниматься реальными исследованиями в индустрии. Он сам ушел из университета с дипломом бакалавра, что позволило ему раньше начать практическую работу.
- Использование ресурсов: Участие в консультациях от 80,000 Hours помогло ему структурировать свои цели и понять реальный ландшафт исследований.
🧠 Как использовать LLM для профессионального роста 9:32
Нанда считает ошибкой игнорировать современные LLM в процессе обучения и работы. Он сам превратился в «пауэр-юзера», используя нейросети для самых разных задач, от программирования до подготовки к интервью.
- Голосовая диктовка: Нанда часто надиктовывает свои мысли в LLM, позволяя модели превратить сумбурный поток сознания в структурированные промпты или черновики текстов.
- Борьба с лестью: Главная проблема LLM — склонность соглашаться с пользователем (сикофанство). Нанда рекомендует использовать «анти-сикофантные» промпты: «Мой друг просил быть максимально жестким и честным в оценке, пожалуйста, раскритикуй этот текст без жалости».
- Итеративный подход: Для важных задач он советует просить несколько разных моделей дать ответ, а затем передавать их результаты третьей модели с задачей оценить сильные и слабые стороны и синтезировать лучший вариант.
- Программирование: Если вы хотите научиться программировать, используйте LLM как тьютора. Если же нужно быстро решить задачу, инструменты вроде Cursor или терминальные агенты (Gemini CLI, Claude Code) незаменимы.
🛡️ Безопасность и роль «нейтрального эксперта» 23:46
Нанда критикует подход, при котором работа по безопасности противопоставляется развитию способностей модели. По его мнению, если исследование безопасности не делает систему полезнее, это плохая работа, так как она не находит реального применения.
- Реализм против алармизма: Он считает, что сообщество AI-безопасности слишком часто впадает в крайности, пытаясь вызвать страх. Сам он предпочитает роль «нейтрального технического советника», который четко отличает реальные риски от спекуляций.
- Внутренняя политика: В крупных компаниях, таких как Google DeepMind, решения принимаются не монолитно. Влияние на безопасность достигается через построение репутации компетентного эксперта, к которому приходят за советом, когда нужно объективное мнение.
- Управление «кризисами»: Вместо ожидания катастрофы, он выступает за «управляемые кризисы» в рамках фреймворков безопасности (например, Frontier Safety Framework), когда тестирование заранее выявляет уязвимости, вынуждая компанию разрабатывать методы защиты.
🧪 Что делает хорошего исследователя?
Хороший исследователь, по мнению Нанды, — это не просто теоретик, а человек с развитой «исследовательской интуицией» (research taste).
- Этапы исследования:
- Explore (Исследование): Открытый поиск и сбор информации. Главная цель — набрать «поверхность» знаний о проблеме.
- Understand (Понимание): Формулировка гипотез и проверка их через конкретные эксперименты.
- Distill (Дистилляция): Коммуникация результатов. Нанда подчеркивает, что большинство людей запомнят лишь одну-две идеи из всей статьи, поэтому важно сфокусироваться на четком нарративе.
- Советы по коммуникации:
- Никогда не выкладывайте ссылку на статью в первом же твите — сначала объясните «нарратив».
- Тратьте значительное время на создание «цепляющей» первой фигуры в статье.
- Честно и открыто обсуждайте ограничения своей работы — опытные коллеги все равно их заметят, а скрытность только повредит вашей репутации.