Янник Кильчер (Yannic Kilcher) представил первые рабочие модели OpenAssistant — амбициозного проекта по созданию полностью открытой альтернативы ChatGPT. В этом обзоре автор демонстрирует возможности нейросети, объясняет сложности с лицензированием проприетарных весов и благодарит мировое сообщество за беспрецедентный вклад в сбор обучающих данных.
📅 Долгожданный релиз и сила сообщества 0:00
Янник Кильчер объявил, что проект OpenAssistant переходит в стадию публикации первых результатов . Главной гордостью проекта стал огромный массив данных, собранный благодаря добровольцам. По мнению ведущего, «человеческие данные — это нечто потрясающее», и любой желающий может убедиться в этом, пролистав вкладку сообщений на сайте проекта, где виден креатив и усилия людей, обучающих систему быть хорошим помощником .
Официальная дата полномасштабного релиза назначена на 15 апреля . В этот день планируется опубликовать:
- Сами модели.
- Полные наборы данных (datasets).
- Вспомогательный софт и документацию.
На текущий момент представлены модели, прошедшие этап SFT (Supervised Fine-Tuning) — это первая ступень в пайплайне разработки, за которой последуют более сложные итерации .
🤝 Команда, спонсоры и ресурсы 1:05
Проект OpenAssistant — это результат работы большой группы контрибьюторов. Кильчер подчеркнул, что на сайте появилась страница команды, где перечислены основные участники. Он призвал работодателей обратить внимание на этих специалистов, назвав их «абсолютно потрясающими» .
Проект также получил поддержку от технологических спонсоров:
- Redmond — предоставили вычислительные мощности для обучения моделей.
- Talking Face — выделили кредиты на инференс (запуск моделей).
- Weights & Biases — предоставили командную лицензию для отслеживания экспериментов .
Ведущий отметил, что проект остро нуждается в видеокартах уровня NVIDIA A100. Если у кого-то из зрителей есть свободные мощности, команда готова принять их для расширения пропускной способности интерфейса .
🧪 Демонстрация возможностей: от Хогвартса до кошачьей дипломатии 2:36
В ходе видео Янник Кильчер показал несколько примеров работы модели Llama 30B, дообученной на данных OpenAssistant.
- Креативное письмо: Модель успешно составила жалобное письмо в Хогвартс от лица мага, которого не приняли в школу, упомянув почтовую службу сов и отсутствие прогресса в магии .
- Сложные сценарии: В примере с «дипломатическим решением» конфликта между котом и мышами, нейросеть предложила создать в доме «зоны, свободные от котов» и наладить каналы коммуникации для мирного сосуществования .
- Ролевые игры: Модель вошла в образ основателя «Религии Святого Ногтя», предлагая скидки на педикюр и духовное руководство. Кильчер иронично заметил, что ИИ точно уловил суть подобных культов — быстро превращаться в коммерческую структуру .
- Политическая сатира: По запросу модель написала речь президента США о дефиците туалетной бумаги, используя характерную риторику с обвинениями оппозиции и призывами «осушить болото» .
Автор признал, что у моделей есть проблемы с долгосрочной связностью (coherence) из-за короткого контекстного окна, на котором проводилось обучение . В одном из тестов рецепт бургера, переписанный как математическое доказательство, постепенно превратился в бессвязный набор символов .
🌍 Мультиязычность и вклад испанского сообщества 9:50
Особую благодарность Янник Кильчер выразил блогеру под ником dot CSV (Карлос). Благодаря его призыву к своей аудитории, количество вкладов на испанском языке в базу OpenAssistant сравнялось с английским сегментом . Это позволило модели выдавать качественные ответы на испанском, несмотря на то что основной претрейнинг был смещен в сторону английского языка.
🛠️ Техническая база: Llama, Pythia и вопросы лицензирования 12:57
Текущая модель в чат-интерфейсе базируется на архитектуре Llama от Meta (30 млрд параметров) . Однако здесь возникает юридическая коллизия: лицензия Llama запрещает свободное распространение весов.
В связи с этим организация LAION и команда OpenAssistant выбрали следующую стратегию:
- Для Llama-моделей: Будут выпущены «diff-веса» (разница между оригинальной моделью и дообученной) и скрипты для воспроизведения. Это позволит пользователям легально собрать модель у себя .
- Для Pythia-моделей: Эти модели от EleutherAI полностью открыты и доступны на Hugging Face Hub. Их можно использовать в коммерческих целях без ограничений, хотя они пока немного уступают Llama в качестве .
Янник выразил надежду, что вскоре появятся новые, полностью свободные базовые модели, сравнимые по мощности с Llama .
🖥️ Инструкция по использованию интерфейса 14:30
Для тех, кто хочет протестировать OpenAssistant лично, Кильчер привел краткий туториал:
- Адрес: Перейдите по ссылке
open-assistant.io/chat. На данный момент навигация через боковую панель может не работать, поэтому нужно вводить/chatвручную в адресной строке . - Авторизация: Если интерфейс ведет себя странно, рекомендуется принудительно обновить страницу, выйти из аккаунта и войти снова .
- Настройки: В интерфейсе можно менять параметры сэмплинга (sampling parameters) и выбирать пресеты ответов .
- Ограничения: Из-за огромного наплыва пользователей и ограниченных вычислительных мощностей система может работать медленно или выдавать ошибки тайм-аута. Кильчер призвал к терпению и пригласил разработчиков помогать с кодом через Pull Requests на GitHub .
В заключение Янник Кильчер еще раз поблагодарил всех волонтеров, отметив, что без их времени и усилий создание открытого ассистента такого уровня было бы невозможно .