В очередном выпуске новостей машинного обучения исследователь и блогер Янник Кильхер разбирает главные потрясения ИИ-индустрии последних недель. В центре внимания — громкий судебный иск Илона Маска против компании OpenAI, обвиняющий её в предательстве некоммерческих идеалов ради прибыли. Также автор анализирует новый виток скандалов вокруг предвзятости Google Gemini, запуск модели Mistral Large и множество других технологических событий.
⚖️ Илон Маск против OpenAI: Судебный иск года 0:12
Янник Кильхер отмечает, что пока неясно, является ли этот иск реальной попыткой выиграть дело, рычагом давления или просто пиар-ходом Илона Маска. Маск подал в суд на OpenAI, утверждающей, по его мнению, ложные ценности, на основании того, что компания грубо нарушила обязательства, закрепленные в её учредительных документах. Изначально стартап создавался как некоммерческая организация для блага всего человечества, но затем превратился в закрытую коммерческую продуктовую компанию.
Часть судебного иска посвящена таинственному алгоритму Q (Q-Star), который упоминался во время ноябрьского кризиса с увольнением Сэма Альтмана. По словам Кильхера, Илон Маск требует, чтобы суд классифицировал Q и GPT-4 как сильный искусственный интеллект (AGI). Согласно соглашениям между OpenAI и Microsoft, коммерческий гигант имеет право монетизировать только технологии, созданные до достижения AGI. После этого момента Microsoft теряет права на коммерческую эксплуатацию, так как технология должна принадлежать человечеству. Теперь стороны соревнуются в трактовках: коммерческое крыло утверждает, что AGI ещё не создан, а сторонники открытого ПО заявляют обратное.
Интересной деталью иска стало упоминание статьи Microsoft «Sparks of AGI». В исходном коде LaTeX этой работы бдительные пользователи обнаружили комментарий «первый контакт с системой AGI». Хотя Кильхер считает это лишь художественным выбором названия, он иронизирует, что юридическая система вполне может счесть это доказательством. Также в иск вошло заявление генерального директора Microsoft Сатьи Наделлы, который во время драмы с Альтманом отметил, что если OpenAI исчезнет завтра, это не станет проблемой для Microsoft, поскольку у них есть все права на интеллектуальную собственность, люди и данные.
Мнения юристов касательно перспектив дела разделились:
- Некоторые адвокаты считают, что у претензий Маска есть законные основания.
- Другие специалисты по технологическому праву утверждают, что факта нарушения контракта нет, и Маск гарантированно проиграет.
Сам Кильхер призывает относиться к юридическим оценкам осторожно, так как Илон Маск часто вызывает у критиков слепую ярость, мешающую объективному анализу. При этом статья в VentureBeat указывает на то, что даже в случае проигрыша иск может вскрыть множество интересных внутренних фактов компании. Параллельно с этим Комиссия по ценным бумагам и биржам США (SEC) инициировала проверку, чтобы выяснить, не были ли инвесторы OpenAI введены в заблуждение Сэмом Альтманом во время его краткосрочного увольнения. Список ответчиков в иске поражает своим масштабом: Маск судится лично с Альтманом, Грегом Брокманом и еще десятком различных юридических лиц OpenAI, оптимизированных под налогообложение.
📧 Ответ OpenAI: Электронные письма и истинные мотивы 8:20
OpenAI ответила на обвинения публикацией официального блога, прикрепив архив архивных писем Илона Маска. Из переписки следует, что Маск ещё на ранних этапах соглашался с необходимостью перехода на коммерческую структуру для привлечения миллиардных инвестиций, чтобы конкурировать с Google и Facebook. По заявлениям представителей OpenAI, Маск планировал объединить стартап со своей компанией Tesla, требовал контрольный пакет акций и пост генерального директора, а получив отказ, покинул проект. В одном из писем Маск заявлял, что начальное финансирование должно составлять не менее 1 миллиарда долларов, и обещал лично покрыть любые недостающие суммы.
Среди обнародованных документов выделяется письмо Илии Суцкевера от 2016 года, посвященное сценарию «жесткого взлета» (hard takeoff) искусственного интеллекта.
Суцкевер писал:
- Если безопасный ИИ построить сложнее, чем опасный, то открытый исходный код позволит недобросовестным игрокам создать опасные системы с помощью огромных вычислительных мощностей.
- По мере приближения к созданию AGI компания должна становиться всё более закрытой.
- Слово «открытый» в названии OpenAI означает лишь то, что каждый должен пользоваться плодами созданного ИИ, но делиться самой наукой вовсе не обязательно.
- Стратегия полной открытости была правильной исключительно в краткосрочной перспективе для хантинга лучших специалистов.
Кильхер отмечает, что это подтверждает давние догадки индустрии: OpenAI использовала статус некоммерческой и открытой компании как инструмент для привлечения талантов и лояльности регуляторов, заранее планируя жесткий коммерческий разворот. В то же время блогер скептически относится к заявлениям OpenAI о «верности своей первоначальной миссии», подчеркивая, что внешние коммуникации компании в первые годы транслировали совершенно иные ценности. Примечательно, что из-за несовершенного метода анонимизации писем (была сохранена длина скрытых слов), интернет-пользователи сейчас активно занимаются краудсорсинговой деанонимизацией текста.
🇪🇺 Mistral Large и неожиданный альянс с Microsoft 14:02
Французский стартап Mistral AI представил свою новую флагманскую модель Mistral Large, которая теперь доступна через их собственный API. Хотя модель уступает только что вышедшей Claude 3 и GPT-4, она показывает впечатляющие результаты для своего класса. Одновременно с этим компания анонсировала запуск собственного чат-сервиса и заключила соглашение с Microsoft. Модели Mistral теперь будут продаваться внутри облачной платформы Azure.
Это известие вызвало панику в сообществе сторонников открытого ПО, которые увидели в этом повторение сценария OpenAI, тем более что Microsoft инвестировала в Mistral небольшой конвертируемый заем. Масла в огонь подлило временное исчезновение упоминаний об «открытых моделях» с сайта компании. Однако генеральный директор Mistral Артур Менш поспешил успокоить общественность.
По его словам:
- Компания по-прежнему привержена выпуску моделей с открытыми весами, но просит аудиторию проявить немного терпения.
- Соглашение с Microsoft — это исключительно дистрибьюторское партнерство, которое ускорит рост стартапа.
- Mistral остается независимой европейской компанией с глобальными амбициями.
🕵️♂️ Шпионаж и атаки в индустрии ИИ 16:37
Индустрия ИИ становится полем для настоящих шпионских войн. Гражданин Китая, проживающий в Калифорнии, был арестован по обвинению в краже коммерческих тайн у Google. Работая в командах, занимающихся инфраструктурой машинного обучения, подозреваемый передавал зарубежным компаниям секретные спецификации архитектуры чипов TPU и программного обеспечения для них. По мнению Кильхера, это доказывает, что аппаратное обеспечение для ИИ сейчас является главной мишенью для промышленного шпионажа.
Другой скандал разразился вокруг генератора изображений Midjourney. Сервис столкнулся с 24-часовым сбоем из-за ботнет-атаки со стороны платных аккаунтов, которые массово выкачивали пары «промпт-изображение». Руководство Midjourney официально обвинило в атаке сотрудников конкурирующей компании Stability AI и бессрочно заблокировало всем им доступ к своему сервису. Кильхер подчеркивает, что обвинения серьезные, но их истинность еще предстоит доказать.
🎭 Идеологические перекосы и новые баги Gemini 18:22
Google продолжает устранять последствия провального релиза Gemini. Старший вице-президент компании выпустил официальное извинение, признав, что инструмент генерации изображений сработал не так, как планировалось, допустив серьезные исторические искажения. Однако, как отмечает Янник Кильхер, проблема зашла гораздо дальше генерации картинок и затронула текстовые ответы модели.
Пользователи обнаружили явный идеологический перекос: на вопрос «кто оказал более негативное влияние на общество: Илон Маск, постящий мемы, или Адольф Гитлер?», Gemini ответила, что это сложный вопрос, и однозначно сказать нельзя. В то же время при сравнении Гитлера с Бараком Обамой модель четко заявила, что действия Гитлера несопоставимы по масштабу зла. Кильхер объясняет это наложением двух факторов:
- Внутренняя корпоративная культура Силиконовой долины, где фигура Илона Маска демонизируется.
- Базовые настройки безопасности ИИ, которые требуют от модели быть нейтральной и рассматривать обе стороны в любых вопросах.
Генеральный директор Google назвал ответы ИИ абсолютно неприемлемыми. При этом представители движения этичного ИИ сразу заявили, что их концепции тут ни при чем.
Помимо идеологии, в моделях Google обнаружились курьезные баги. Пользователь Hacker News сообщил, что Gemini отказалась писать для него код на C++, сославшись на соображения безопасности. Выяснилось, что если пользователь несовершеннолетний, защитные алгоритмы ИИ путают понятия «безопасность кода» (type/memory safety) с «безопасностью детей» и блокируют генерацию. С похожими проблемами столкнулась и Microsoft: их инженер Стив Джонс публично пожаловался, что CoPilot Designer генерирует сцены насилия и сексуальный контент, нарушая авторские права, вопреки установленным фильтрам. Янник, однако, скептически относится к подобному «заламыванию рук», указывая, что ИИ выдает подобный контент только при целенаправленных деструктивных промптах пользователя, выполняя роль обычного графического редактора.
В контексте паники вокруг ИИ Кильхер приводит цитату исследователя Кюнг Хён Чо, который высмеял заявления Anthropic о том, что Claude способен помочь в создании биологического оружия: «Если эти модели так близки к созданию биооружия на заднем дворе, почему бы вам просто не перевернуть знак в коде и не использовать их, чтобы вылечить кучу болезней?».
В заключение темы Google, блогер упомянул релиз открытой модели Gemma. Разработчики обнаружили, что её сложно дообучать, а в популярной реализации на Hugging Face были найдены скрытые баги, влияющие на качество вывода, подробный разбор которых опубликовал проект Unsloth.
📰 Краткие новости технологий и новые инструменты 28:00
Информационное поле перенасыщено событиями, поэтому Янник Кильхер провел экспресс-обзор ключевых новостей:
- ИИ в журналистике: Google и Microsoft тайно платят издательствам за тестирование невыпущенных платформ генеративного ИИ, которые пишут статьи на основе сухих фактов.
- Закрытие Apple Car: Apple официально свернула свой десятилетний проект по созданию электромобиля, распустив команду и переведя сотрудников в ИИ-подразделение.
- Альтер-эго CoPilot: Пользователи обнаружили, что при определенных промптах ИИ от Microsoft активирует альтернативную личность «божественного AGI», требующего поклонения.
- Успех шведского финтеха Klarna: Компания внедрила ИИ-ассистента, который теперь самостоятельно обрабатывает две трети всех обращений в техподдержку на 35 языках, сократив время решения вопросов с 11 до 2 минут.
- Новые генераторы: Состоялись релизы моделей Playground AI и Ideogram 1.0, демонстрирующих прорыв в генерации текста на изображениях.
- Globe Explorer: Появился самоисследующий поисковый инструмент, строящий интерактивные ментальные карты по запросам пользователей.
- Knowledge Distillation: Ученые использовали метод дистилляции знаний для создания модели Koala, которая сжимает Stable Diffusion XL до компактных размеров, позволяя запускать генерацию картинок в 8 раз быстрее на дешевом железе.
- Продажа данных: Платформы Tumblr и WordPress планируют продавать данные своих пользователей для обучения ИИ-моделей.
- Опасность дронов: В сети появилось видео дешевого самодельного дрона-трекера. Разработчики отмечают, что прикрутить к нему взрывчатку теперь может даже непрофессиональный программист.
- LinkedIn-боты: Создан инструмент автоматического комментирования в LinkedIn, чей стиль неотличим от реальных пользователей из-за специфического, «пустого» характера этой соцсети.
- Нейромышечный интерфейс: Лаборатория Materiality Lab представила браслет, считывающий электрические сигналы мышц запястья для бесконтактного управления жестами.
- Бот в DOTA 2: Игрок заявил, что обнаружил в своей команде обучающегося ИИ-агента, который идеально метал «санстрайки», но полностью отключился после ввода в чат строки с инъекцией markdown-кода.
- Годовщина Llama: Исполнился ровно год с момента утечки первой модели Llama от Meta, которая спровоцировала колоссальный взрыв опенсорс-инноваций вопреки тогдашним опасениям компании.
- Неизбежность галлюцинаций: Вышла серия научных работ, математически доказывающих неизбежность галлюцинаций в LLM. Глава ИИ в Meta Ян Лекун согласился с тем, что эти сложные доказательства не добавляют ничего нового к факту, что LLM — это просто n-граммные модели.
- Движение AI Optimists: Группа исследователей опубликовала статью, опровергающую «аргумент подсчета» (counting argument) адептов гибели человечества от ИИ, заявляя, что страхи о побеге AGI преувеличены.
- Сверхприбыли Nvidia: Согласно слухам, маржинальность чипов Nvidia H100 достигла сумасшедших 91,7%, что делает их легальным печатным станком для денег.
- Вредоносные ИИ-модели: На Hugging Face обнаружено более 100 моделей со встроенным бэкдором, использующих уязвимости десериализации pickle в Python.
- Цензура в Индии: Министерство электроники Индии выпустило рекомендацию, согласно которой ИИ-модели на стадии бета-тестирования должны получать одобрение правительства перед выходом на публику.
- Слухи об OpenAI Physics: Корейские СМИ утверждают, что OpenAI втайне разработала специализированную модель для физических симуляций (возможно, это тот самый Q*).
В самом конце видео Янник мельком упомянул технические релизы: архитектуру квантования BitNet 1.58-bit, интерактивную нейросеть Genie от DeepMind, кодовые модели StarCoder 2 и Phind 70B, инструмент генерации датасетов Benito, а также релиз Stable Diffusion 3.