OpenAI против Google и Meta: эпоха API, утечек LLaMA и чтения мыслей

Yannic Kilcher 74 тыс. 43 мин 4 мин 11.03.2023
Главное

В новом выпуске ML News Янник Килчер (Yannic Kilcher) анализирует агрессивную коммерциализацию OpenAI, утечку весов модели LLaMA от Meta и прорывные японские исследования в области реконструкции визуальных образов из человеческого мозга. Завершает выпуск эксклюзивное интервью с Брайаном Катанзаро, вице-президентом NVIDIA, о стратегии компании в эпоху господства трансформеров.

💰 Коммерческий поворот OpenAI: API для ChatGPT и Whisper 1:49

OpenAI переходит от стадии исследовательских превью к полноценному предоставлению ИИ-услуг для бизнеса. Главной новостью стало открытие API для ChatGPT и модели распознавания речи Whisper .

Ключевые параметры нового API:

Янник Килчер отмечает, что OpenAI радикально меняет политику конфиденциальности: теперь данные, передаваемые через API, не используются для обучения моделей по умолчанию, а срок хранения данных ограничен 30 днями . Также запущена платформа OpenAI Foundry, предлагающая выделенные вычислительные мощности для крупных корпораций. По слухам, годовой контракт на использование модели DaVinci с контекстным окном в 32 000 токенов может стоить около $1,5 млн .

🤝 Альянс с консалтингом и критика «закрытости» 6:12

OpenAI объявила о стратегическом партнерстве с консалтинговым гигантом Bain & Company. Первым крупным клиентом в рамках этого сотрудничества стала Coca-Cola, которая планирует использовать ChatGPT и DALL-E для создания гиперперсонализированной рекламы и улучшения потребительского опыта .

Янник Килчер критикует недавний манифест OpenAI «Planning for AGI and beyond», называя его «оправдательным документом» . По мнению ведущего, компания полностью отошла от своих истоков:

  1. Отказ от некоммерческой модели: Объясняется невозможностью привлечь достаточно средств для масштабирования .
  2. Смена курса на закрытость: OpenAI больше не публикует детали архитектуры, обучающих данных и механизмов фильтрации контента, мотивируя это требованиями безопасности .
  3. Мнение Янника: Ведущий считает «удобным» оправдывать сокрытие технологий и максимизацию прибыли заботой о безопасности перед лицом AGI, хотя признает, что в Кремниевой долине многие могут искренне верить в близость сверхразума .

🧬 Чтение мыслей и «умственные» способности моделей 15:46

Исследователи из Японии представили на конференции CVPR работу, которая буквально позволяет «читать мысли» . С помощью фМРТ-сканирования мозга человека, смотрящего на изображение, система реконструирует этот образ.

Технические детали эксперимента:

Янник Килчер делает из этого философский вывод: успех подобных интерфейсов доказывает, что современные ИИ-модели по структуре представления информации могут быть не так уж далеки от биологического мозга . По мнению автора, люди склонны переоценивать свою уникальность, в то время как человеческое мышление также может быть формой статистической интерполяции накопленного опыта .

🦙 Утечка LLaMA и неудачи робототехники Alphabet 13:31

В индустрии произошел курьезный случай: веса новой модели LLaMA от Meta, которые должны были выдаваться только исследователям по запросу, были опубликованы в виде торрент-ссылки прямо в Pull Request на GitHub . Сообщество встретило это с юмором, массово «одобряя» изменения в коде, содержащем нелегальную ссылку. Янник предупреждает, что скачивание весов из сторонних источников опасно из-за возможности встраивания исполняемого вредоносного кода в файлы моделей .

В то же время в аппаратном секторе наблюдаются трудности:

🎙️ Интервью с Брайаном Катанзаро (NVIDIA) 26:02

Янник Килчер побеседовал с Брайаном Катанзаро, определяющим вектор развития аппаратного обеспечения NVIDIA.

Зачем производителю чипов свои исследования?

Брайан утверждает, что NVIDIA — это не просто компания по производству видеокарт, а компания «ускоренных вычислений» . Исследования необходимы для понимания того, какие алгоритмы будут доминировать через 5–10 лет, чтобы заранее адаптировать под них архитектуру процессоров, компиляторов и сетевого оборудования. Катанзаро вспоминает, что в 2008 году он был единственным человеком в NVIDIA, занимавшимся ИИ .

Будущее трансформеров и AGI

По словам Катанзаро, трансформеры — это «невероятная удача» для индустрии . Он считает, что в ближайшие 5 лет они останутся доминирующей архитектурой, но станут гораздо сложнее:

Относительно страхов перед ИИ (AGI) Брайан придерживается умеренной позиции: интеллект многогранен, и появление машин, превосходящих человека в тестах, не лишает человеческую жизнь смысла . Он сравнивает ИИ-революцию с промышленной: как сельское хозяйство стало автоматизированным, позволив людям заняться наукой и искусством, так и ИИ автоматизирует интеллектуальный труд, делая цивилизацию продуктивнее .

💬 Цитаты

«OpenAI с их речами о демократизации и то, что они делают на самом деле, находятся в 180 градусах друг от друга.»

Янник Килчер 03:10

«Я сомневаюсь, что человек делает намного больше, чем просто статистически интерполирует свои тренировочные данные.»

Янник Килчер 18:35

«Миссия исследований в том, чтобы поднять фары компании и увидеть будущее чуть дальше.»

Брайан Катанзаро 30:03
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
фМРТ
Функциональная магнитно-резонансная томография, измеряющая изменения в токе крови в мозге для оценки активности зон.
Zero-shot reasoning
Способность модели решать задачи, примеры которых она не видела в процессе обучения.
Латентное пространство
Сжатое математическое представление данных внутри нейросети, где похожие объекты находятся рядом.
📊 Цифры
🗓 Хронология
  1. 2008 Брайан Катанзаро приходит в NVIDIA как единственный исследователь ИИ.
  2. 2017 Выход статьи «Attention is all you need», представившей архитектуру трансформера.
  3. Март 2023 OpenAI открывает доступ к API ChatGPT и Whisper.
⚖️ Другая сторона
Искусственный интеллект OpenAI Nvidia ChatGPT LLaMA Stable Diffusion