Янник Кильчер: «Открытый ИИ — это единственный путь»

Machine Learning Street Talk 48,2 тыс. 59 мин 3 мин 19.04.2023
Главное

OpenAssistant против ChatGPT: Революция открытых моделей 0:00

Мир больших языковых моделей (LLM) стремительно меняется, и в центре этой трансформации оказался проект OpenAssistant — амбициозная попытка создать полностью открытую альтернативу закрытым системам вроде ChatGPT. В интервью для канала Machine Learning Street Talk исследователь и ведущий Янник Кильчер обсуждает, как сообщество энтузиастов смогло собрать качественный датасет, превосходящий по разнообразию многие закрытые аналоги, и почему «открытость» технологий является единственным верным путем для развития искусственного интеллекта.

🛠 Философия создания открытого ассистента 0:00

Янник Кильчер отмечает, что успех ChatGPT стал неожиданностью не столько с точки зрения технических возможностей, сколько с точки зрения популярности формата диалогового общения. По мнению эксперта, утверждение о том, что любой разработчик мог создать аналог ChatGPT, используя API компании OpenAI, является неверным: OpenAI сознательно ограничивала доступ к «открытым» (нефильтрованным) приложениям.

Основной целью OpenAssistant стало создание платформы для коллективного сбора данных. Вместо простого «скрейпинга» (автоматического сбора данных) из Reddit или Quora, команда сфокусировалась на разнообразии, считая, что именно человеческий вклад формирует «личность» ассистента.

🧠 Споры о «сущности» интеллекта и «Эффекте Валуиджи» 18:18

Одним из дискуссионных вопросов стал так называемый «Эффект Валуиджи» (Waluigi effect). Существует гипотеза, что из-за особенностей обучения на данных с контрастными персонажами, модели склонны «переключаться» на анти-агентов (грубиянов, токсичных личностей) после нескольких провокационных сообщений пользователя.

Янник Кильчер считает эту теорию «чепухой». С его точки зрения, деградация модели — это не мистический феномен, а статистически ожидаемая реакция:

  1. Если долго оскорблять человека, он в конечном итоге ответит грубостью.
  2. Модели ведут себя подобно людям, так как статистически отражают человеческое поведение.
  3. Наличие «темной стороны» в знаниях модели необходимо для её компетентности. По мнению Кильчера, чтобы быть эффективным помощником, модель должна понимать, что такое злость или предрассудки, иначе она будет наивной и бесполезной в реальных ситуациях.

⚖️ Оценка, этика и доступность 31:19

Вопрос конфиденциальности данных стоит в центре стратегии OpenAssistant. Кильчер подчеркивает, что все взаимодействие с их платформой является прозрачным, а текущая работа ведется над тем, чтобы дать пользователям возможность легко удалять свои чаты или отказываться от их использования в обучении.

В дискуссии с критиками (включая упоминание Джереми Ховарда) Кильчер признает, что сравнение моделей — сложная задача. Его команда провела исследование пользовательских предпочтений, в котором OpenAssistant показал себя на равных с бесплатной версией ChatGPT. При этом эксперт признает, что ChatGPT часто прибегает к «самоцензуре» (отказывается отвечать на вопросы, которые считает опасными), в то время как OpenAssistant делает это реже.

💬 Цитаты

«Если долго оскорблять человека, он в конечном итоге ответит грубостью. Модели ведут себя подобно людям, так как статистически отражают человеческое поведение.»

Янник Кильчер 22:34

«Чтобы быть эффективным помощником, модель должна понимать, что такое злость или предрассудки, иначе она будет наивной и бесполезной.»

Янник Кильчер 25:40
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
LLM (Большая языковая модель)
Тип ИИ, обученный на огромных массивах текста для понимания и генерации естественного языка.
RLHF
Обучение с подкреплением на основе отзывов людей, используемое для настройки моделей под предпочтения пользователей.
Инференс
Процесс использования уже обученной модели для получения предсказаний или ответов.
Токенизация
Метод разбиения текста на смысловые единицы (токены), с которыми работает модель.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект OpenAssistant ChatGPT Yannic Kilcher Machine Learning