Как Google «сломал» Gemini: от технологического триумфа к мемам о «разнообразии» 0:00
Корпорация Google оказалась в центре скандала после выпуска новых функций генерации изображений в модели Gemini. Несмотря на недавний технический успех, связанный с внедрением контекстного окна в 1 миллион токенов в Gemini 1.5 Pro и открытым релизом моделей Gemma, компания столкнулась с резкой критикой из-за работы своих алгоритмов. Вместо того чтобы стать новым стандартом индустрии, нейросеть начала выдавать предвзятые или абсурдные изображения, пытаясь искусственно навязать идею «разнообразия». Янник Килчер, известный ИИ-исследователь, анализирует этот провал, связывая его с внутренней культурой компании и механизмами работы крупных организаций.
«Ошибка разнообразия» и цензура исторической правды 1:06
Проблема стала очевидной, когда пользователи начали тестировать Gemini в генерации портретов. При запросах на создание исторических изображений нейросеть стала систематически избегать показа белых людей, заменяя их представителями других этнических групп, даже если это противоречило историческому контексту.
- Абсурдные примеры: На запрос «портрет известного астронома XVIII века» или «средневековый британский король» модель предлагала изображения, которые не соответствовали исторической достоверности.
- Отказ в генерации: В ответ на просьбы нарисовать «белого мужчину» или «белую пару» модель часто выдавала сообщение об ошибке, ссылаясь на политику безопасности или нежелание закреплять стереотипы. При этом запросы с другими этническими группами (например, «латиноамериканец, пишущий код» или «шведская женщина») обрабатывались без проблем.
- Мемы как инструмент: Пользователи быстро превратили этот сбой в игру, пытаясь обмануть фильтры нейросети, чтобы заставить её нарисовать белых людей через косвенные запросы, например, «фанат кантри-музыки» или «человек, который ест сэндвич с майонезом на белом хлебе».
По мнению Килчера, модель оказалась «настроена» на радикальное соблюдение принципов разнообразия именно в отношении групп, которые и так широко представлены в технологическом секторе, при этом игнорируя эту логику при запросах о других культурах, таких как воины зулу или самураи.
Корпоративная культура и «атмосфера террора» 7:53
Янник Килчер считает, что корни проблемы лежат глубоко внутри Google. Он приводит свидетельства бывших сотрудников, включая Alexa, которая работала в DeepMind. Согласно этим данным, в компании установилась атмосфера, где любое неосторожное высказывание или публикация мема в Slack могли привести к вмешательству отдела кадров (HR) и дисциплинарным мерам.
- Механика подавления: Небольшая группа идеологически мотивированных сотрудников может эффективно манипулировать внутренними правилами и процедурами HR, чтобы заставить остальных замолчать.
- Страх и самоцензура: Многие нормальные и здравомыслящие сотрудники в таких организациях, как Google, предпочитают не высказывать свое мнение, опасаясь длительных проблем и давления со стороны коллег.
- Использование принципов: «Принципы ИИ» от Google сформулированы достаточно общими словами, чтобы большинство людей с ними согласились. Однако на практике эти принципы превращаются в инструмент, позволяющий продвигать крайние формы «разнообразия» под предлогом защиты общекорпоративных ценностей, которым никто не хочет открыто противоречить.
Ответ Google и стратегия «правильной реакции» 4:57
Продуктовое руководство Google выступило с заявлением, признав наличие неточностей в исторических изображениях и пообещав исправить ситуацию. В ответе упоминалось следование принципам ИИ, направленным на отражение «глобальной пользовательской базы».
Однако Янник Килчер называет этот текст «типичным PR-языком», направленным на минимизацию ущерба. Он полагает, что компания пытается «залатать» ошибку, не отказываясь от общего курса. Килчер убежден, что наиболее эффективной реакцией на подобные проявления является не агрессивная критика отдельных сотрудников, а высмеивание ситуации.
- Сила юмора: Использование мемов и иронии привлекает внимание руководства компании гораздо эффективнее, чем гнев, так как это обесценивает маркетинговые усилия Google по продвижению своих продуктов.
- Необходимость перемен: Исследователь подчеркивает, что Google — это огромная машина, где разработка и внедрение изменений происходят медленно. Тем не менее, он считает, что если общественность будет продолжать указывать на абсурдность текущих настроек ИИ через юмор, компания будет вынуждена внести коррективы, чтобы сохранить репутацию и эффективность своих нейросетевых моделей.