Мэттью Берман о будущем Open Source: «Вам нужно попробовать эти 12 ИИ-проектов прямо сейчас»

Matthew Berman 61,5 тыс. 15 мин 4 мин 24.06.2026
Главное

В динамичном мире искусственного интеллекта проекты с открытым исходным кодом становятся локомотивом инноваций, предлагая инструменты, которые часто превосходят коммерческие аналоги по гибкости и прозрачности. Ведущий канала Мэттью Берман представил подборку из 12 наиболее перспективных Open Source проектов, способных радикально изменить процесс разработки, видеопроизводства и кибербезопасности.

🎬 Видеопроизводство на автопилоте: OpenMontage 0:06

OpenMontage позиционируется как полноценная студия видеопроизводства, управляемая ИИ-агентом. По словам Мэттью Бермана, проект уже собрал почти 15 000 звезд на GitHub и позволяет превратить текстовое описание в готовый ролик .

Система берет на себя весь цикл продакшена:

Особенностью OpenMontage является возможность использовать существующие видео в качестве референсов — агент анализирует стиль и структуру ролика и создает нечто похожее, позволяя вносить любые правки . Инструмент поддерживает 12 различных производственных конвейеров: от документальных фильмов и подкастов до кинематографичных трейлеров и локализации контента .

🧠 Долгосрочное планирование с Deer Flow 1:22

Разработка компании ByteDance под названием Deer Flow (аббревиатура от Deep Exploration and Efficient Research Flow) представляет собой каркас для «суперагентов» . Основное преимущество Deer Flow — работа с задачами «длинного горизонта».

Мэттью Берман утверждает, что этот инструмент идеально подходит для процессов, которые могут длиться часами или даже днями без участия человека . Система использует субагентов для дробления сложных задач, имеет собственные песочницы для безопасного исполнения кода и развитую систему памяти. Deer Flow находит применение в автоматизации контент-планов, создании информационных панелей и построении сложных конвейеров данных .

🛡️ Кибербезопасность от Anthropic и NVIDIA 2:30

Сразу два проекта посвящены безопасности ИИ-агентов. Набор навыков Anthropic Cybersecurity Skills расширяет возможности таких моделей как Claude или Gemini, превращая их в экспертов по защите кода .

В систему внедрены шесть реальных фреймворков кибербезопасности, включая MITRE ATT&CK и NIST . Интерес представляет интеграция MITRE Fight Fraud Framework, в разработке которого участвовали такие гиганты, как JP Morgan Chase, Citigroup и CrowdStrike . Установка навыка происходит простым копированием URL в интерфейс агента .

С другой стороны, проект SkillSpector от NVIDIA служит «сканером безопасности» для самих ИИ-навыков . Мэттью Берман настоятельно рекомендует использовать этот инструмент перед установкой любых сторонних навыков .

💻 Программирование: навыки Мэтта Покока и Гарри Тана 7:26

Для разработчиков представлены репозитории, кодифицирующие опыт признанных экспертов индустрии.

  1. Skills от Мэтта Покока (143 000 звезд): Автор образовательных программ по TypeScript перенес свои методы работы в набор навыков для агентов . Это позволяет ИИ не просто «писать по ощущениям» (vibe coding), а проводить глубокую проработку архитектуры, уточнять терминологию и обновлять документацию (ADR) прямо в процессе написания кода .
  2. GStack от Гарри Тана (114 000 звезд): Президент Y Combinator представил систему, которая превращает одиночного агента в полноценную инженерную команду . GStack — это прежде всего процесс, включающий стадии: мышление, планирование, разработка, ревью, тестирование и деплой . В него включены специализированные команды, такие как /office-hours для получения фидбека по бизнес-задачам в стиле YC .

⚡ Инструменты для эффективности: Hyperframes и Codebase Memory 3:48

Для тех, кто занимается визуализацией и оптимизацией, Берман выделил следующие решения:

📑 Распознавание документов и работа с голосом 10:13

Компания Baidu выпустила модель Unlimited-OCR с открытыми весами объемом всего 6.5 ГБ . Проект решает сложную задачу не просто распознавания текста, но и понимания точного пространственного расположения элементов на странице, что наглядно демонстрируется на примере автоматического выделения текста в научных PDF-файлах в реальном времени .

В области работы с аудио лидером подборки стал проект Voicebox от Джейми Пайна .

🤖 Альтернативный интеллект: Palmier Pro и Hermes 12:05

Завершают обзор инструменты, расширяющие пользовательский опыт работы с ИИ. Palmier Pro представляет собой нативный ИИ-видеоредактор для macOS с открытым кодом, который может управляться через MCP-сервер внешними агентами, такими как Claude .

Проект Hermes от Nous Research преодолел отметку в 200 000 звезд на GitHub и стал мощной альтернативой OpenClaw . Ведущий отмечает функцию «самоисцеления»: если какой-то навык дает сбой, Hermes автоматически исправляет ошибку и улучшает алгоритм для следующего запуска .


💬 Цитаты

«Deer Flow создан для задач длительного горизонта — вы даете задачу агенту, и он уходит работать на часы или даже дни.»

Мэттью Берман 01:45

«Codebase Memory MCP индексирует всё ядро Linux, а это 28 миллионов строк, всего за 3 минуты.»

Мэттью Берман 06:51

«Любой раз, когда вы собираетесь установить навык, сначала используйте SkillSpector для проверки на безопасность.»

Мэттью Берман 12:05
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
MCP (Model Context Protocol)
Протокол, позволяющий ИИ-моделям безопасно взаимодействовать с внешними данными и инструментами.
OCR (Optical Character Recognition)
Технология оптического распознавания символов, преобразующая изображения текста в машиночитаемый формат.
Long-horizon tasks
Сложные задачи, требующие от ИИ-агента длительного планирования и выполнения множества последовательных шагов.
📊 Цифры
🗓 Хронология
  1. Июнь 2026 Выход видеообзора о 12 прорывных Open Source проектах.
⚖️ Другая сторона
Искусственный интеллект Matthew Berman Open Source AI Deer Flow Hermes NVIDIA SkillSpector