Open-Source против OpenAI: Янник Кильчер представил первые модели OpenAssistant

Yannic Kilcher 72,3 тыс. 16 мин 4 мин 06.04.2023
Главное

Янник Кильчер (Yannic Kilcher) представил первые рабочие модели OpenAssistant — амбициозного проекта по созданию полностью открытой альтернативы ChatGPT. В этом обзоре автор демонстрирует возможности нейросети, объясняет сложности с лицензированием проприетарных весов и благодарит мировое сообщество за беспрецедентный вклад в сбор обучающих данных.

📅 Долгожданный релиз и сила сообщества 0:00

Янник Кильчер объявил, что проект OpenAssistant переходит в стадию публикации первых результатов . Главной гордостью проекта стал огромный массив данных, собранный благодаря добровольцам. По мнению ведущего, «человеческие данные — это нечто потрясающее», и любой желающий может убедиться в этом, пролистав вкладку сообщений на сайте проекта, где виден креатив и усилия людей, обучающих систему быть хорошим помощником .

Официальная дата полномасштабного релиза назначена на 15 апреля . В этот день планируется опубликовать:

На текущий момент представлены модели, прошедшие этап SFT (Supervised Fine-Tuning) — это первая ступень в пайплайне разработки, за которой последуют более сложные итерации .

🤝 Команда, спонсоры и ресурсы 1:05

Проект OpenAssistant — это результат работы большой группы контрибьюторов. Кильчер подчеркнул, что на сайте появилась страница команды, где перечислены основные участники. Он призвал работодателей обратить внимание на этих специалистов, назвав их «абсолютно потрясающими» .

Проект также получил поддержку от технологических спонсоров:

Ведущий отметил, что проект остро нуждается в видеокартах уровня NVIDIA A100. Если у кого-то из зрителей есть свободные мощности, команда готова принять их для расширения пропускной способности интерфейса .

🧪 Демонстрация возможностей: от Хогвартса до кошачьей дипломатии 2:36

В ходе видео Янник Кильчер показал несколько примеров работы модели Llama 30B, дообученной на данных OpenAssistant.

  1. Креативное письмо: Модель успешно составила жалобное письмо в Хогвартс от лица мага, которого не приняли в школу, упомянув почтовую службу сов и отсутствие прогресса в магии .
  2. Сложные сценарии: В примере с «дипломатическим решением» конфликта между котом и мышами, нейросеть предложила создать в доме «зоны, свободные от котов» и наладить каналы коммуникации для мирного сосуществования .
  3. Ролевые игры: Модель вошла в образ основателя «Религии Святого Ногтя», предлагая скидки на педикюр и духовное руководство. Кильчер иронично заметил, что ИИ точно уловил суть подобных культов — быстро превращаться в коммерческую структуру .
  4. Политическая сатира: По запросу модель написала речь президента США о дефиците туалетной бумаги, используя характерную риторику с обвинениями оппозиции и призывами «осушить болото» .

Автор признал, что у моделей есть проблемы с долгосрочной связностью (coherence) из-за короткого контекстного окна, на котором проводилось обучение . В одном из тестов рецепт бургера, переписанный как математическое доказательство, постепенно превратился в бессвязный набор символов .

🌍 Мультиязычность и вклад испанского сообщества 9:50

Особую благодарность Янник Кильчер выразил блогеру под ником dot CSV (Карлос). Благодаря его призыву к своей аудитории, количество вкладов на испанском языке в базу OpenAssistant сравнялось с английским сегментом . Это позволило модели выдавать качественные ответы на испанском, несмотря на то что основной претрейнинг был смещен в сторону английского языка.

🛠️ Техническая база: Llama, Pythia и вопросы лицензирования 12:57

Текущая модель в чат-интерфейсе базируется на архитектуре Llama от Meta (30 млрд параметров) . Однако здесь возникает юридическая коллизия: лицензия Llama запрещает свободное распространение весов.

В связи с этим организация LAION и команда OpenAssistant выбрали следующую стратегию:

Янник выразил надежду, что вскоре появятся новые, полностью свободные базовые модели, сравнимые по мощности с Llama .

🖥️ Инструкция по использованию интерфейса 14:30

Для тех, кто хочет протестировать OpenAssistant лично, Кильчер привел краткий туториал:

  1. Адрес: Перейдите по ссылке open-assistant.io/chat. На данный момент навигация через боковую панель может не работать, поэтому нужно вводить /chat вручную в адресной строке .
  2. Авторизация: Если интерфейс ведет себя странно, рекомендуется принудительно обновить страницу, выйти из аккаунта и войти снова .
  3. Настройки: В интерфейсе можно менять параметры сэмплинга (sampling parameters) и выбирать пресеты ответов .
  4. Ограничения: Из-за огромного наплыва пользователей и ограниченных вычислительных мощностей система может работать медленно или выдавать ошибки тайм-аута. Кильчер призвал к терпению и пригласил разработчиков помогать с кодом через Pull Requests на GitHub .

В заключение Янник Кильчер еще раз поблагодарил всех волонтеров, отметив, что без их времени и усилий создание открытого ассистента такого уровня было бы невозможно .

💬 Цитаты

«Человеческие данные — это нечто потрясающее. Мы собрали тонны данных благодаря вам.»

Янник Кильчер 0:27

«Модель отзеркалила тенденцию таких культов становиться просто экономическими инструментами.»

Янник Кильчер 6:57

«Мы делаем всё возможное, чтобы предоставить вам наработки, соблюдая юридические ограничения.»

Янник Кильчер 13:53
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
SFT (Supervised Fine-Tuning)
Метод дообучения нейросети на парах 'вопрос-ответ', подготовленных людьми.
Llama
Семейство больших языковых моделей от компании Meta.
Diff weights
Файлы, содержащие только изменения в параметрах модели относительно оригинала, используемые для обхода лицензионных ограничений.
Inference
Процесс работы уже обученной модели при генерации ответов на запросы пользователей.
📊 Цифры
🗓 Хронология
  1. Март 2023 Сбор данных сообществом и обучение первых SFT-моделей.
  2. Апрель 2023 Демонстрация работы чат-интерфейса и моделей Llama 30B.
  3. 15 апреля 2023 Запланированный открытый релиз всех наработок проекта.
⚖️ Другая сторона
Искусственный интеллект OpenAssistant Yannic Kilcher Llama LAION Hugging Face