Зепп Хохрайтер о будущем AI: от xLSTM до промышленных симуляций

Machine Learning Street Talk 27,2 тыс. 1 ч 6 мин 2 мин 11.02.2025
Главное

Новая надежда LSTM: Как Зепп Хохрайтер перезапускает индустрию AI 🚀 0:00

Будущее искусственного интеллекта может лежать не в бесконечном масштабировании языковых моделей (LLM), а в возвращении к фундаментальным принципам нейронных сетей с памятью. Профессор Зепп Хохрайтер (Sepp Hochreiter), соавтор легендарной архитектуры LSTM, в интервью каналу Machine Learning Street Talk поделился взглядом на то, почему нынешние LLM — это скорее «базы данных», чем полноценный интеллект, и представил свою новую разработку — xLSTM.

🧠 Почему LLM — это «базы данных» 0:33

По мнению Хохрайтера, текущая парадигма «больше данных, больше параметров» зашла в тупик. Основные аргументы профессора против современных систем:

Ведущий отметил, что появление моделей типа O1, которые выполняют поиск в пространстве программ во время генерации, несколько меняет картину, так как они позволяют «собирать» логику из примитивов. Однако Хохрайтер настаивает: для долгосрочного прогресса требуются новые архитектурные решения.

🧬 Возрождение: Что такое xLSTM? 13:30

После доминирования трансформеров, которые вытеснили LSTM в 2017 году благодаря своей параллельности, Хохрайтер и его команда решили переосмыслить старую архитектуру. Так появился xLSTM, который призван исправить три главных недостатка оригинальной LSTM:

  1. Параллелизация: Новая архитектура адаптирована для эффективной работы на GPU так же, как трансформеры.
  2. Гибкость памяти: Оригинальные LSTM не могли пересматривать свои решения. xLSTM использует «экспоненциальное гейтирование» (exponential gating), позволяющее системе динамически удалять старую информацию, если нашлась более релевантная.
  3. Матричная память: Вместо скалярной ячейки памяти, xLSTM использует целый Hopfield-сеть, что дает модели гораздо больший объем памяти.

По словам профессора, xLSTM показывает удивительные результаты, превосходя FlashAttention как в скорости обучения, так и в инференсе.

🤖 Путь в индустрию и симуляции 39:58

Компания Хохрайтера NX AI фокусируется не столько на языке, сколько на промышленном применении, где критичны скорость, энергоэффективность и предсказуемость.

🤝 Нейросимволический синтез 45:56

Хохрайтер убежден, что будущее AI лежит в гибридных системах. Он развивает проект стоимостью €40 млн в Австрии, объединяющий нейросетевой подход (subsymbolic) с формальной логикой (symbolic). Это необходимо для обеспечения надежности промышленных процессов, где «галлюцинации» недопустимы. По его мнению, нейросети должны быть «окружены» символическими системами, которые служат своего рода щитом или верификатором правильности решений.

💬 Цитаты

«Large language models are not our way to advance AI on the long term. It's a good database technology.»

Зепп Хохрайтер 3:07

«We put more training data, make it larger but not smarter. Something is missing.»

Зепп Хохрайтер 0:33

«If you find something better, you should stray away or throw away what you already have stored.»

Зепп Хохрайтер 27:17
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
xLSTM
Улучшенная архитектура LSTM, поддерживающая параллелизацию, экспоненциальное гейтирование и матричную память.
Экспоненциальное гейтирование
Механизм, позволяющий модели динамически «забывать» старую информацию при получении более важной.
Нейросимволический AI
Подход, объединяющий глубокое обучение (нейросети) с формальными правилами логики для повышения надежности систем.
FlashAttention
Оптимизированный алгоритм внимания для трансформеров, использующий аппаратные особенности GPU для ускорения.
Hopfield-сеть
Тип ассоциативной памяти, используемый в xLSTM для эффективного хранения больших объемов структурированных данных.
📊 Цифры
🗓 Хронология
  1. 1990-е Разработка оригинальной архитектуры LSTM и первые эксперименты с быстрыми весами.
  2. 2017 Публикация статьи «Attention Is All You Need», ознаменовавшая переход индустрии к трансформерам.
  3. 2026 Обсуждение перспектив xLSTM как альтернативы трансформерам в индустриальном секторе.
⚖️ Другая сторона
Искусственный интеллект Sepp Hochreiter xLSTM NX AI Hopfield network Neurosymbolic AI