Дэвид Ондрей: «Как дообучить ИИ на своем компьютере»

David Ondrej 20,9 тыс. 32 мин 2 мин 28.05.2026
Главное

Локальное дообучение ИИ: как стать экспертом с Unsloth Studio 0:00

Дообучение (fine-tuning) позволяет превратить компактные языковые модели в высокоэффективные инструменты, способные превосходить по качеству решения в сто раз крупнее. Дэвид Ондрей в своем видео подробно объясняет, как сделать этот процесс доступным для любого пользователя, используя бесплатный проект с открытым кодом Unsloth Studio. Главный сюжет видео — пошаговое руководство по созданию собственной нейросети прямо на локальном компьютере, от подбора модели до подготовки уникального набора данных.

🚀 Установка и подготовка среды 0:39

Unsloth Studio — это инструмент, упрощающий дообучение LLM, который работает полностью автономно на вашем устройстве. По словам автора, его создали бывшие инженеры Nvidia, специализирующиеся на исправлении ошибок в популярных архитектурах, таких как Llama и Qwen.

Помимо обучения, Unsloth Studio позволяет общаться с загруженными моделями локально, выступая в роли полноценного конкурента Ollama и LM Studio.

🛠 Процесс дообучения: выбор модели и данных 4:24

Для качественного обучения критически важно выбрать правильную модель и данные. Дэвид Ондрей рекомендует использовать ресурс Artificial Analysis для оценки характеристик локальных моделей.

  1. Модель: рекомендуется выбирать «чистые» версии safe_tensors (без MLX или GGUF). Вариант Qwen 3.6 27B автор считает одной из самых мощных моделей для запуска на пользовательском железе (требуется от 24–32 ГБ видеопамяти/RAM).
  2. Форматы: автор поясняет разницу: GGUF — это сжатый формат для быстрого запуска (инференса), а для обучения (fine-tuning) необходимы полные, несжатые веса.
  3. Датасеты: на платформе Hugging Face доступны более миллиона наборов данных. Для демонстрации автор выбрал «Finance Alpaca», который обучает модель отвечать на вопросы по инвестициям и доходам.

После загрузки модели и датасета, в настройках обучения можно задать длину контекста (например, 1024) и параметры гипертунинга, такие как размер пакета (batch size).

📝 Создание собственных рецептов и датасетов 20:06

Наибольшую ценность представляет создание уникального датасета на основе ваших собственных материалов, будь то документы компании или история переписки. Вкладка «Recipes» в Unsloth Studio автоматизирует этот процесс через создание «рецептов».

Автор подчеркивает: создание собственной модели на основе личных или корпоративных данных — это навык, который выделяет владельца среди 99,9% пользователей ИИ.

💬 Цитаты

«Это навсегда изменит вашу работу: создание собственных датасетов и собственных моделей — это конкурентное преимущество, о котором большинство даже не догадывается.»

Дэвид Ондрей 3:33

«Наблюдение — это хорошо, обучение — это хорошо, но важно — начать действовать.»

Дэвид Ондрей 32:20
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Fine-tuning (дообучение)
Процесс адаптации предобученной нейросети под конкретную задачу или домен с помощью дотренировки на специфическом наборе данных.
GGUF
Формат сжатия файлов нейросетей, оптимизированный для эффективного запуска на обычном потребительском оборудовании.
Дистилляция
Метод обучения небольшой модели на ответах более крупной и мощной модели для передачи её интеллектуальных способностей.
safe_tensors
Безопасный формат хранения весов модели, используемый для обучения, в отличие от сжатых форматов для запуска.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Unsloth Studio LLM Fine-tuning Hugging Face