Янник Кильчер: «Открытый ИИ — это единственный путь»

OpenAssistant против ChatGPT: Революция открытых моделей 0:00

Мир больших языковых моделей (LLM) стремительно меняется, и в центре этой трансформации оказался проект OpenAssistant — амбициозная попытка создать полностью открытую альтернативу закрытым системам вроде ChatGPT. В интервью для канала Machine Learning Street Talk исследователь и ведущий Янник Кильчер обсуждает, как сообщество энтузиастов смогло собрать качественный датасет, превосходящий по разнообразию многие закрытые аналоги, и почему «открытость» технологий является единственным верным путем для развития искусственного интеллекта.

🛠 Философия создания открытого ассистента 0:00

Янник Кильчер отмечает, что успех ChatGPT стал неожиданностью не столько с точки зрения технических возможностей, сколько с точки зрения популярности формата диалогового общения. По мнению эксперта, утверждение о том, что любой разработчик мог создать аналог ChatGPT, используя API компании OpenAI, является неверным: OpenAI сознательно ограничивала доступ к «открытым» (нефильтрованным) приложениям.

Основной целью OpenAssistant стало создание платформы для коллективного сбора данных. Вместо простого «скрейпинга» (автоматического сбора данных) из Reddit или Quora, команда сфокусировалась на разнообразии, считая, что именно человеческий вклад формирует «личность» ассистента.

Принцип обучения: Кильчер сравнивает обучение модели с «ученичеством» (apprenticeship). Фундаментальные знания модель получает на этапе предварительного обучения, а работа с данными от людей — это «социализация», обучение тому, как быть полезным помощником.
Масштабы проекта: К работе над датасетом присоединилось более 13 000 человек.
Технология сбора: Платформа предлагает пользователям разнообразные задачи: написание промптов (запросов), создание продолжения диалогов и ранжирование ответов. Всего удалось собрать более 600 000 записей.

🧠 Споры о «сущности» интеллекта и «Эффекте Валуиджи» 18:18

Одним из дискуссионных вопросов стал так называемый «Эффект Валуиджи» (Waluigi effect). Существует гипотеза, что из-за особенностей обучения на данных с контрастными персонажами, модели склонны «переключаться» на анти-агентов (грубиянов, токсичных личностей) после нескольких провокационных сообщений пользователя.

Янник Кильчер считает эту теорию «чепухой». С его точки зрения, деградация модели — это не мистический феномен, а статистически ожидаемая реакция:

Если долго оскорблять человека, он в конечном итоге ответит грубостью.
Модели ведут себя подобно людям, так как статистически отражают человеческое поведение.
Наличие «темной стороны» в знаниях модели необходимо для её компетентности. По мнению Кильчера, чтобы быть эффективным помощником, модель должна понимать, что такое злость или предрассудки, иначе она будет наивной и бесполезной в реальных ситуациях.

⚖️ Оценка, этика и доступность 31:19

Вопрос конфиденциальности данных стоит в центре стратегии OpenAssistant. Кильчер подчеркивает, что все взаимодействие с их платформой является прозрачным, а текущая работа ведется над тем, чтобы дать пользователям возможность легко удалять свои чаты или отказываться от их использования в обучении.

В дискуссии с критиками (включая упоминание Джереми Ховарда) Кильчер признает, что сравнение моделей — сложная задача. Его команда провела исследование пользовательских предпочтений, в котором OpenAssistant показал себя на равных с бесплатной версией ChatGPT. При этом эксперт признает, что ChatGPT часто прибегает к «самоцензуре» (отказывается отвечать на вопросы, которые считает опасными), в то время как OpenAssistant делает это реже.

Отношение к академической этике: Кильчер критикует современное состояние AI-этики, называя его «культурой жалоб» ради влияния, и противопоставляет ему прагматичный подход, направленный на реальную пользу для общества.
Открытость исследований: По мнению гостя, компании имеют полное право заниматься закрытыми исследованиями ради прибыли, но они не должны при этом называть свою деятельность «демократизацией» и служением общему благу.
Итог: Кильчер убежден, что благополучие человечества лучше защищено открытостью инструментов, чем назначением «королей моделей», которые единолично будут решать, кому позволено ими пользоваться.