Натан Ламберт о Mamba: «Это начало эпохи бесконечного контекста»

The Cognitive Revolution 1 тыс. 1 ч 20 мин 2 мин 30.03.2024
Главное

Новая эра Mamba: от медицинских изображений до синтеза биологии 🧬 2:42

Индустрия ИИ переживает стремительную эволюцию: всего за 90 дней с момента выхода оригинальной статьи о Mamba, архитектура, основанная на селективных моделях пространства состояний (SSM), вышла далеко за пределы обработки текстов. В подкасте «The Cognitive Revolution» ведущий Натан Ламберт и исследователь Джейсон Мо проанализировали десятки новых работ, которые демонстрируют применение Mamba в компьютерном зрении, анализе графов и биологии. Участники дискуссии сходятся во мнении: способность этих моделей обрабатывать сверхдлинные контексты при линейных затратах вычислительных мощностей делает их серьезным вызовом для доминирующих сегодня трансформеров.

👁️ Революция в анализе изображений: от диагностики к «Виртуальному окрашиванию» 2:42

Хотя оригинальная модель Mamba не была предназначена для визуальных задач, большинство текущих исследований сфокусировано именно на обработке изображений. Исследователи адаптируют архитектуру под специфику пиксельных данных, превращая их в последовательности.

🧬 «ДНК — это всё, что вам нужно»: прорыв в биологии 58:32

Одним из ключевых событий стал запуск модели Evo от Arc Institute. Эта нейросеть обучена на последовательностях ДНК длиной до 131 000 токенов.

Джейсон Мо утверждает, что модель начинает демонстрировать признаки «понимания» биологических процессов, которые выходят за рамки простого прогнозирования следующего нуклеотида. Поскольку взаимодействие компонентов клетки часто не зависит от их физической близости в геноме, способность Mamba работать с длинными зависимостями позволяет ей моделировать биологические системы на новом уровне глубины.

Эксперты отмечают, что это может стать «режимом смены правил игры» (game changer) в поиске новых лекарств. Вместо «слепого поиска» в лаборатории (метод проб и ошибок), ИИ-модели позволяют сузить пространство поиска на порядки, повышая вероятность успеха экспериментов.

🧠 Проблема «памяти» и вопрос биологического износа 44:09

Обсуждая долгосрочные перспективы, участники затронули вопрос деградации (rot) ИИ-систем при попытках бесконечного расширения контекста.

В финале дискуссии эксперты признали: несмотря на успех Mamba, трансформеры остаются крайне конкурентоспособными благодаря постоянным оптимизациям, таким как «кольцевое внимание» (ring attention) и сжатие контекста через «memory tokens». Будущее, вероятно, будет принадлежать гибридным системам, где преимущества линейного масштабирования SSM встретятся с мощью механизмов внимания трансформеров.

💬 Цитаты

«Это безусловно урок об экспоненциальном росте.»

Джейсон Мо 01:23

«Для работы с длинными контекстами нам понадобится механизм, который эффективно вычищает старый накопленный мусор.»

Натан Ламберт 57:41
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
SSM (State Space Model)
Математическая модель, которая эффективно обрабатывает последовательности, сохраняя скрытое состояние.
UNet
Архитектура нейронных сетей, широко используемая для сегментации изображений.
Needle in a Haystack
Тест для оценки способности модели находить конкретную информацию внутри большого массива текста.
Virtual Staining
Использование ИИ для визуализации тканей без процесса химического окрашивания.
Perplexity
Метрика оценки качества языковой модели; чем ниже показатель, тем лучше модель предсказывает данные.
📊 Цифры
🗓 Хронология
  1. Декабрь 2025 Выход первого эпизода подкаста, посвященного Mamba.
  2. Январь 2026 Начало активных исследований Mamba в области биомедицинской сегментации.
  3. Февраль 2026 Публикация статьи Mamba ND с обзором многоканальных сканирований.
⚖️ Другая сторона
Искусственный интеллект Mamba SSM Arc Institute Evo model Transformer