Дэвид Ондрей: «Как дообучить ИИ на своем компьютере»

Локальное дообучение ИИ: как стать экспертом с Unsloth Studio 0:00

Дообучение (fine-tuning) позволяет превратить компактные языковые модели в высокоэффективные инструменты, способные превосходить по качеству решения в сто раз крупнее. Дэвид Ондрей в своем видео подробно объясняет, как сделать этот процесс доступным для любого пользователя, используя бесплатный проект с открытым кодом Unsloth Studio. Главный сюжет видео — пошаговое руководство по созданию собственной нейросети прямо на локальном компьютере, от подбора модели до подготовки уникального набора данных.

🚀 Установка и подготовка среды 0:39

Unsloth Studio — это инструмент, упрощающий дообучение LLM, который работает полностью автономно на вашем устройстве. По словам автора, его создали бывшие инженеры Nvidia, специализирующиеся на исправлении ошибок в популярных архитектурах, таких как Llama и Qwen.

Начало работы: необходимо перейти в раздел документации, выбрать «Quick start» и скопировать команду установки для своей ОС.
Локальный сервер: после запуска в терминале интерфейс доступен по адресу localhost:8888.
Безопасность: при первом входе система требует задать пароль, чтобы предотвратить несанкционированный доступ к локальному серверу со стороны других устройств в той же Wi-Fi сети.

Помимо обучения, Unsloth Studio позволяет общаться с загруженными моделями локально, выступая в роли полноценного конкурента Ollama и LM Studio.

🛠 Процесс дообучения: выбор модели и данных 4:24

Для качественного обучения критически важно выбрать правильную модель и данные. Дэвид Ондрей рекомендует использовать ресурс Artificial Analysis для оценки характеристик локальных моделей.

Модель: рекомендуется выбирать «чистые» версии safe_tensors (без MLX или GGUF). Вариант Qwen 3.6 27B автор считает одной из самых мощных моделей для запуска на пользовательском железе (требуется от 24–32 ГБ видеопамяти/RAM).
Форматы: автор поясняет разницу: GGUF — это сжатый формат для быстрого запуска (инференса), а для обучения (fine-tuning) необходимы полные, несжатые веса.
Датасеты: на платформе Hugging Face доступны более миллиона наборов данных. Для демонстрации автор выбрал «Finance Alpaca», который обучает модель отвечать на вопросы по инвестициям и доходам.

После загрузки модели и датасета, в настройках обучения можно задать длину контекста (например, 1024) и параметры гипертунинга, такие как размер пакета (batch size).

📝 Создание собственных рецептов и датасетов 20:06

Наибольшую ценность представляет создание уникального датасета на основе ваших собственных материалов, будь то документы компании или история переписки. Вкладка «Recipes» в Unsloth Studio автоматизирует этот процесс через создание «рецептов».

PDF Document QA: один из самых эффективных шаблонов. Вы загружаете PDF (например, годовой финансовый отчет), а ИИ-модель через API генерирует на его основе пары «вопрос-ответ».
Использование API: для дистилляции знаний (обучения маленькой модели на ответах большой) автор рекомендует сервисы типа OpenRouter.
Выбор «учителя»: Дэвид Ондрей советует использовать модели вроде DeepSeek V4 Pro, называя их наиболее эффективными по соотношению цены и качества при создании больших обучающих выборок.

Автор подчеркивает: создание собственной модели на основе личных или корпоративных данных — это навык, который выделяет владельца среди 99,9% пользователей ИИ.