Нейросети как эластичное оригами: Профессор Рэндалл Балестриеро о геометрии ИИ и гроккинге

Machine Learning Street Talk 15,4 тыс. 1 ч 17 мин 4 мин 08.02.2025
Главное

В новом выпуске Machine Learning Street Talk приглашенный профессор Брауновского университета Рэндалл Балестриеро (Randall Balestriero) объясняет, как теория сплайнов превращает «черные ящики» нейросетей в прозрачные геометрические объекты. В центре дискуссии — феномен «гроккинга» (внезапного озарения моделей), причины хрупкости систем перед лицом хакерских атак и способы сделать ИИ по-настоящему надежным без бесконечного увеличения вычислительных мощностей.

🧠 Нейросети как «эластичное оригами»: Суть сплайновой теории 7:01

Профессор Балестриеро, стоявший у истоков современной сплайновой теории нейронных сетей, предложил элегантную метафору для понимания работы глубокого обучения. По его мнению, нейросеть (особенно с активацией ReLU) — это не магический вычислитель, а сложная геометрическая конструкция .

Ведущий Тим Скарф проводит параллель с хеш-таблицами, чувствительными к локальности, однако Балестриеро уточняет: в отличие от простых методов вроде K-средних, нейросети умеют экстраполировать скрытые правила из одной части пространства в другую, что и создает иллюзию «интеллекта» .

📉 Адверсариальный гроккинг: Почему долгое обучение — ключ к надежности 12:00

Одним из центральных обсуждаемых вопросов стала статья Randall Balestriero и Emtiyaz Khan «Deep Networks Always Grok». Гроккинг — это явление, при котором точность на тестовых данных внезапно возрастает спустя долгое время после того, как точность на обучающей выборке вышла на плато .

Балестриеро утверждает, что гроккинг — это не редкость, а универсальное свойство нейросетей, если смотреть на него через призму «адверсариальной устойчивости» (сопротивляемости атакам) .

  1. Первая стадия (запоминание): Сеть агрессивно концентрирует множество мелких регионов вокруг обучающих точек. Она учится «узнавать» примеры, но остается крайне хрупкой: малейшее изменение пикселя (шум) перебрасывает пример в соседний «лоскут» с другим прогнозом .
  2. Вторая стадия (озарение/гроккинг): Если продолжать обучение в десятки раз дольше обычного, происходит миграция регионов. Они уходят от тренировочных точек и скапливаются у границы принятия решения .
  3. Результат: Вокруг самих данных образуются обширные «пустые» зоны с простой линейной логикой. Сеть становится устойчивой к атакам естественным образом, без специального «адверсариального обучения» .

По мнению профессора, это «скрытое решение» часто не достигается в индустрии, так как разработчики останавливают обучение слишком рано, ориентируясь только на стандартную точность .

🏗️ Проектирование «умных флопсов» и новые регуляризаторы 28:44

Обсуждение затронуло проблему вычислительных ресурсов. Балестриеро считает, что нынешний акцент на гигантские модели («больше compute = больше возможностей») ошибочен.

🖼️ Реконструкция против восприятия: Ошибка автоэнкодеров 44:30

Вторая важная тема — критика обучения через реконструкцию (MSE loss в автоэнкодерах). Балестриеро утверждает, что попытка заставить нейросеть просто восстановить картинку пиксель-в-пиксель мешает ей понимать суть объектов .

🧪 Геометрия LLM: Как ломаются языковые модели 54:36

Применив теорию сплайнов к большим языковым моделям (LLM), команда Балестриеро обнаружила, что геометрия активаций внутри MLP-блоков позволяет детектировать токсичность текста гораздо эффективнее специализированных классификаторов.

🔭 Будущее: От черных ящиков к доказуемому ИИ 1:10:33

Рэндалл Балестриеро, недавно присоединившийся к Brown University, планирует посвятить следующие годы созданию теории «доказуемых гарантий» . Он критикует современный подход «попробуй другой гиперпараметр и вернись через два дня» и призывает к созданию математически обоснованных инструментов, доступных не только математикам, но и инженерам-практикам .

В качестве примера альтернативных подходов упоминаются KAN (Kolmogorov-Arnold Networks), которые фактически «хардкодят» сплайновые функции в архитектуру, что позволяет им эффективно работать на малых выборках в специфических областях науки .

💬 Цитаты

«Нейросети делают эластичное оригами: они берут пространство ввода, превращают его в некое искривленное пространство и проводят прямую линию отреза.»

Рэндалл Балестриеро 01:52

«Адверсариальный гроккинг происходит в большинстве настроек... это следствие очень долгого обучения и появления разреженных решений.»

Рэндалл Балестриеро 13:41
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Сплайн (Spline)
Функция, состоящая из нескольких полиномиальных кусков, плавно соединенных между собой.
ReLU
Функция активации нейронов, которая обнуляет отрицательные значения и оставляет положительные неизменными.
Гроккинг (Grokking)
Феномен в машинном обучении, когда модель внезапно переходит от простого запоминания к обобщению после долгой фазы плато.
Аффинное отображение
Геометрическое преобразование, которое сохраняет параллельность прямых (включает перенос, поворот и масштабирование).
📊 Цифры
🗓 Хронология
  1. 2018 Балестриеро и коллеги начали формализацию сплайновой теории применительно к нейросетям.
  2. 2024 Публикация работы о повсеместности гроккинга (Deep Networks Always Grok).
⚖️ Другая сторона
Искусственный интеллект Randall Balestriero Grokking Spline Theory Llama 2 Adversarial Robustness