# Дэвид Ондрей: «Как дообучить ИИ на своем компьютере»

Источник: https://www.youtube.com/watch?v=BFH9D05UFvM
Канал: David Ondrej
Опубликовано: 28.05.2026

---

## Локальное дообучение ИИ: как стать экспертом с Unsloth Studio
[[JUMP:0:00]]

Дообучение (fine-tuning) позволяет превратить компактные языковые модели в высокоэффективные инструменты, способные превосходить по качеству решения в сто раз крупнее. Дэвид Ондрей в своем видео подробно объясняет, как сделать этот процесс доступным для любого пользователя, используя бесплатный проект с открытым кодом Unsloth Studio. Главный сюжет видео — пошаговое руководство по созданию собственной нейросети прямо на локальном компьютере, от подбора модели до подготовки уникального набора данных.

### 🚀 Установка и подготовка среды
[[JUMP:0:39]]

Unsloth Studio — это инструмент, упрощающий дообучение LLM, который работает полностью автономно на вашем устройстве. По словам автора, его создали бывшие инженеры Nvidia, специализирующиеся на исправлении ошибок в популярных архитектурах, таких как Llama и Qwen.

* **Начало работы:** необходимо перейти в раздел документации, выбрать «Quick start» и скопировать команду установки для своей ОС.
* **Локальный сервер:** после запуска в терминале интерфейс доступен по адресу `localhost:8888`.
* **Безопасность:** при первом входе система требует задать пароль, чтобы предотвратить несанкционированный доступ к локальному серверу со стороны других устройств в той же Wi-Fi сети.

Помимо обучения, Unsloth Studio позволяет общаться с загруженными моделями локально, выступая в роли полноценного конкурента Ollama и LM Studio.

### 🛠 Процесс дообучения: выбор модели и данных
[[JUMP:4:24]]

Для качественного обучения критически важно выбрать правильную модель и данные. Дэвид Ондрей рекомендует использовать ресурс Artificial Analysis для оценки характеристик локальных моделей.

1.  **Модель:** рекомендуется выбирать «чистые» версии `safe_tensors` (без MLX или GGUF). Вариант Qwen 3.6 27B автор считает одной из самых мощных моделей для запуска на пользовательском железе (требуется от 24–32 ГБ видеопамяти/RAM).
2.  **Форматы:** автор поясняет разницу: GGUF — это сжатый формат для быстрого запуска (инференса), а для обучения (fine-tuning) необходимы полные, несжатые веса.
3.  **Датасеты:** на платформе Hugging Face доступны более миллиона наборов данных. Для демонстрации автор выбрал «Finance Alpaca», который обучает модель отвечать на вопросы по инвестициям и доходам.

После загрузки модели и датасета, в настройках обучения можно задать длину контекста (например, 1024) и параметры гипертунинга, такие как размер пакета (batch size).

### 📝 Создание собственных рецептов и датасетов
[[JUMP:20:06]]

Наибольшую ценность представляет создание уникального датасета на основе ваших собственных материалов, будь то документы компании или история переписки. Вкладка «Recipes» в Unsloth Studio автоматизирует этот процесс через создание «рецептов».

* **PDF Document QA:** один из самых эффективных шаблонов. Вы загружаете PDF (например, годовой финансовый отчет), а ИИ-модель через API генерирует на его основе пары «вопрос-ответ».
* **Использование API:** для дистилляции знаний (обучения маленькой модели на ответах большой) автор рекомендует сервисы типа OpenRouter.
* **Выбор «учителя»:** Дэвид Ондрей советует использовать модели вроде DeepSeek V4 Pro, называя их наиболее эффективными по соотношению цены и качества при создании больших обучающих выборок.

Автор подчеркивает: создание собственной модели на основе личных или корпоративных данных — это навык, который выделяет владельца среди 99,9% пользователей ИИ.