Янник Килчер: «Станет ли Stability AI копией OpenAI?»

Стартап Stability AI, получивший широкую известность благодаря финансированию и продвижению открытой модели генерации изображений Stable Diffusion, за последние недели оказался в центре серии крупных корпоративных и репутационных скандалов. Ведущий Янник Килчер подробно разбирает четыре инцидента, которые ставят под вопрос приверженность компании идеалам свободного программного обеспечения. Главным сюжетом расследования становится вопрос о том, рискует ли молодая организация повторить путь OpenAI, пройдя трансформацию от открытого децентрализованного проекта до закрытого коммерческого поставщика API.

🏢 Захват контроля над сообществами Reddit и Discord 2:38

Развитие ситуации началось с публикации постов бывших модераторов на платформе Reddit. По их заявлениям, неофициальные площадки, созданные фанатами на ранних этапах развития Stable Diffusion, были принудительно переведены под контроль корпоративных структур Stability AI. Один из создателей субреддита утверждал, что его обманом заставили передать права владения, после чего вся первоначальная команда модераторов была удалена и заблокирована.

Параллельно развивался конфликт вокруг сервера в Discord, который изначально управлялся независимыми волонтерами. По мере роста популярности нейросети представители стартапа предложили сделать этот сервер официальным. Переломным моментом стал запуск бета-программы Stable Diffusion, из-за чего количество участников платформы резко выросло до 50 тысяч человек. После этого сервер получил статус верифицированного сообщества.

Владелец сервера столкнулся с давлением со стороны PR-отдела Stability AI, представители которого не хотели, чтобы ключевую позицию занимал человек, не являющийся официальным сотрудником компании. Из-за технических ограничений Discord автоматическая передача прав верифицированного сервера была затруднена, однако вскоре создатель площадки обнаружил, что доступ у него забрали без какого-либо согласования со стороны администрации мессенджера.

Позже, после публичного резонанса на Reddit, представитель Stability AI под псевдонимом cyberbully вернул права создателю сообщества в пассивно-агрессивной форме, заявив, что тот «раздул из мухи слона». Представители Discord официально признали ошибку в процедуре передачи прав.

Конфликт на Reddit разрешился только после того, как Дэвид Ха (David Ha) занял пост директора по стратегии (Head of Strategy) в Stability AI. На второй день своей работы он публично извинился перед сообществом, признав неопытность молодой компании в ведении социальных сетей, и объявил о полном отказе стартапа от административных привилегий на субреддите. Контроль над сервером Discord при этом остался за корпорацией, так как он официально представляет бренд.

По мнению Янника Килчера, данные события представляют собой «болезни роста» молодой компании. Ведущий считает, что децентрализованная культура стартапа дала слишком много свободы отдельным неопытным сотрудникам, которые начали принимать радикальные и необдуманные решения, не отражающие глобальную стратегию руководства.

💻 Конфликт вокруг интерфейса Automatic1111 и утечки NovelAI 14:41

Разработчик под псевдонимом automatic1111 создал самый популярный альтернативный веб-интерфейс для запуска Stable Diffusion, превосходящий по функционалу официальное решение Dream Studio от Stability AI. Данный софт распространялся бесплатно на GitHub, хотя изначально и не имел четкой лицензии.

Проблема возникла из-за хакерской атаки на компанию NovelAI, которая тесно связана со Stability AI и получает от нее вычислительные мощности. В результате взлома в открытый доступ на имиджборде 4chan утекли проприетарные модели и исходный код NovelAI. Разработчик automatic1111 оперативно обновил свой интерфейс, чтобы сделать его совместимым с утекшими файлами.

После этого представитель Stability AI под ником ether обвинил разработчика в краже интеллектуальной собственности, заявив, что его последние коммиты содержат фрагменты кода, которые можно было написать только на основе анализа украденных данных NovelAI. На основе этих обвинений automatic1111 был заблокирован на официальном сервере Stable Diffusion.

Разработчик отверг обвинения, заявив, что весь код интеграции VAE-компонентов и гипертекстовых сетей был написан им с нуля на основе общедоступных математических принципов. В ходе последующего разбирательства участники сообщества выяснили, что спорный код изначально являлся открытым программным обеспечением (open-source), которое появилось раньше реализации NovelAI.

Более того, выяснилось, что сама NovelAI использовала код из репозитория automatic1111 без соблюдения авторских прав. Руководство NovelAI попыталось переложить вину на стажера, однако под пулл-реквестом на GitHub стояла подпись их ведущего программиста.

Позже на GitHub появился аккаунт e_stability с официальными извинениями перед разработчиком, однако сам automatic1111 назвал это фейком и шуткой. По словам Янника Килчера, глава компании Имад Мустак в личных разговорах подтверждал подлинность этих извинений. В итоге ссылки на проект automatic1111 были возвращены в закрепленные руководства сообщества.

🛑 Блокировка релиза Stable Diffusion 1.5 и спор с Runway ML 24:49

Новая итерация нейросети — Stable Diffusion 1.5 — была опубликована на платформе Hugging Face не самой Stability AI, а сторонней компанией Runway ML, занимающейся созданием ИИ-инструментов для редактирования видео.

Технологическая основа Stable Diffusion является результатом совместной работы исследователей Патрика Эссера (Patrick Esser) из Runway ML и Робина Ромбаха (Robin Rombach) из Мюнхенского университета Людвига-Максимилиана (LMU Munich). Роль Stability AI в данном проекте, как утверждают участники разработки, заключалась преимущественно в предоставлении гранта на вычислительные мощности (compute donation) для обучения модели.

Поскольку Stability AI планировала отложить релиз версии 1.5 до завершения разработки собственных коммерческих продуктов, Runway ML приняла решение опубликовать модель самостоятельно под открытой лицензией Creative ML OpenRAIL-M. В ответ на это юридический отдел Stability AI направил жалобу в администрацию Hugging Face с требованием заблокировать репозиторий, охарактеризовав публикацию как незаконную утечку интеллектуальной собственности (IP).

Генеральный директор Runway ML Крис Валенсуэла (Chris Valenzuela) выступил с официальным заявлением, подчеркнув следующие факты:

Разработка является прямым продолжением их собственного научного труда по латентным диффузионным моделям.
Вся кодовая база изначально была открытой.
Предоставление спонсорских вычислительных мощностей со стороны Stability AI не дает стартапу автоматических прав на единоличное владение интеллектуальной собственностью.

Спустя короткое время юридическая служба Stability AI отозвала свою претензию, и ветка обсуждения на Hugging Face была закрыта, а модель осталась в свободном доступе. По мнению Янника Килчера, этот инцидент демонстрирует полную непрозрачность реального вклада Stability AI в создание алгоритмов, а также юридическую неопределенность вокруг прав на названия и торговые марки в сфере ИИ.

⚠️ Новая политика безопасности: по стопам OpenAI? 31:19

Наибольшую тревогу у независимого ИИ-сообщества и ведущего канала вызвал публичный манифест директора по информационным технологиям (CIO) Stability AI Дэниела Джеффриса (Daniel Jeffries). В своей статье топ-менеджер попытался оправдать попытку блокировки релиза версии 1.5 требованиями регуляторов и заботой о безопасности пользователей.

Джеффрис утверждал, что компания обязана сосредоточиться на жестком контроле безопасности, чтобы предотвратить использование Stable Diffusion в противоправных целях или для нанесения вреда людям. В тексте содержались обвинения в адрес «сторонних групп», которые якобы организовали преждевременную утечку модели ради сиюминутного пиара, проигнорировав вопросы корпоративной ответственности.

Янник Килчер подверг эту позицию жесткой критике, назвав ее проявлением патернализма и элитарного мышления, полностью копирующего риторику OpenAI. Ведущий убежден, что любой эффективный инструмент двойного назначения невозможно сделать абсолютно безопасным, не уничтожив его полезные функции.

Килчер подчеркивает, что подобный подход неизбежно ведет к отказу от концепции Open Source. Единственным способом реализации такой политики является создание закрытого API с тотальной фильтрацией запросов и результатов, что превращает технологию в стерильную и бесполезную систему. В качестве исторического прецедента ведущий напоминает ситуацию с языковой моделью GPT-2 от OpenAI, релиз которой в свое время искусственно задерживали под предлогом мифических угроз общественной безопасности.