Презентации OpenAI и Google I/O: ИИ-ассистенты возвращаются в новом формате

The Vergecast 27,7 тыс. 1 ч 31 мин 7 мин 17.05.2024
Главное

В новом выпуске подкаста The Vergecast ведущие Нилай Патель, Алекс Кранц и Дэвид Пирс анализируют масштабное обострение конкуренции на рынке генеративного искусственного интеллекта. Главным событием недели стали весенняя презентация OpenAI и конференция Google I/O, ознаменовавшие полноценное возвращение ИИ-ассистентов в повседневную жизнь пользователей. Журналисты детально разбирают новые мультимодальные функции систем, риски массового внедрения ИИ-поиска для традиционных медиа, а также последние новинки из мира персональных компьютеров и мобильных операционных систем.

🎭 Большие игры OpenAI: попытка затмить Google I/O 3:22

Технологическая компания OpenAI в очередной раз продемонстрировала агрессивный стиль конкуренции, попытавшись перехватить информационную повестку у Google накануне ежегодной конференции Google I/O. Организаторы провели короткую прямую трансляцию под названием Spring Event, объявив о ней всего за 20 минут до начала. До последнего момента в индустрии циркулировали слухи о возможном релизе полноценной поисковой системы или новой модели GPT-5. Вместо этого разработчики представили GPT-4o, где буква «о» означает omni (всеобъемлющий), подчеркивая нативную мультимодальность новой модели.

По мнению Нилая Пателя, OpenAI продолжает вести себя как «группа амбициозных детей», хотя в реальности ей руководят одни из самых богатых и опытных топ-менеджеров в Кремниевой долине. Журналисты отмечают парадокс корпоративной культуры стартапа: с одной стороны, руководство искренне убеждено, что создает величайший продукт в истории человечества, а с другой — пытается разыгрывать роль скромных ученых-альтруистов. Среди сотрудников Google на конференции I/O преобладало мнение, что OpenAI сознательно скопировала и поспешила продемонстрировать именно те функции, которые готовился показать поисковый гигант, чтобы выставить действия конкурента вторичными.

Символичным завершением этого раунда борьбы стало официальное объявление об уходе шеф-ученого Ильи Суцкевера из OpenAI, сделанное ровно в день открытия Google I/O. Это событие подвело черту под затяжным корпоративным конфликтом, связанным с кратковременным увольнением Сэма Альтмана.

📱 Новые ИИ-ассистенты: флирт вместо эффективности 9:57

Ключевым изменением в экосистеме OpenAI стало обновление тарифной политики: модель GPT-4o стала доступна бесплатно для всех пользователей, включая функции, которые ранее требовали платной подписки за 20 долларов в месяц. Кроме того, компания выпустила официальное приложение для macOS. Нилай Патель назвал этот шаг изящной шпилькой в адрес Microsoft — главного инвестора OpenAI, поскольку разработчики мотивировали свое решение простой фразой: «Там находятся наши пользователи».

Однако наибольший резонанс вызвал новый голосовой интерфейс GPT-4o. По наблюдениям участников подкаста, голос ассистента демонстрирует беспрецедентный уровень эмоциональности, использует паузы, вздохи и манеру речи, поразительно напоминающую персонажа Скарлетт Йоханссон из фантастической драмы «Her». Несмотря на то, что технический директор Mira Murati публично опровергла намеренное копирование голоса актрисы, Сэм Альтман подогрел эти ассоциации, опублив лаконичный твит с названием фильма. Новый ассистент способен шутить, менять интонацию по требованию исследователей и даже делать сомнительные комплименты внешнему виду пользователя.

Алекс Кранц выразила скептический взгляд на подобную траекторию развития технологий, иронично заметив, что миллиардеры из Кремниевой долины слишком сильно поверили в желание обычных людей «переспать с iPad». По мнению Кранц, пользователям нужен компьютер, способный качественно посчитать налоги, а не имитировать дружелюбного бухгалтера. Дэвид Пирс добавил, что индустрия пытается навязать сценарии использования, которых не существует в реальности. Примером служат демонстрационные ролики, где люди ходят по комнатам и расспрашивают смартфоны об очевидных объектах вокруг, вроде Букингемского дворца. Тем не менее Пирс признает, что элемент развлечения и «очеловечивания» интерфейса заставляет массовую аудиторию прощать искусственному интеллекту множество фактологических ошибок.

🦖 Провал на демо-версиях: Project Astra и галлюцинации Google 28:43

Ответом Google на вызов конкурентов стал анонс проекта Project Astra — нативного мультимодального помощника, способного анализировать видеопоток в реальном времени и поддерживать диалог без задержек. Сильной стороной Google остается колоссальная инфраструктура, которая позволила снизить стоимость обработки сложных ИИ-запросов на 85% всего за один год. Главный исполнительный директор DeepMind Демис Хассабис выразил уверенность, что многолетние инвестиции в вычислительные мощности позволят Google сделать ИИ по-настоящему быстрым и экономически устойчивым.

Однако практическая демонстрация технологии обернулась курьезом. Нилай Патель протестировал Project Astra в закрытой кабине, используя игровой шлем и направленную на стол камеру. Ведущий разложил перед устройством пластиковую модель космического корабля, фигурку динозавра (плиозавра) и музыкальный маракас, попросив ИИ сочинить связную историю, в которой маракас окажется победителем. На середине фразы система полностью зависла, не сумев подобрать следующее слово в нестандартном контексте.

Как отмечает Дэвид Пирс, этот случай наглядно подтверждает общую проблему современных генеративных моделей: они становятся убедительными и похожими на человека гораздо быстрее, чем они становятся действительно надежными и безошибочными.

📸 Инструкции по поломке техники: спорный совет Сундара Пичаи 32:22

Внедрение мультимодального поиска затронет и сервис Google Lens, куда добавляется возможность искать информацию с помощью видеозаписи. В одном из официальных примеров ИИ успешно распознал модель проигрывателя виниловых пластинок Audio-Technica и объяснил проблему соскакивающего тонарма некорректным балансом противовеса. Однако, по мнению Пателя, ответ содержал слишком много технического жаргона, малопонятного для новичка, которому вместо текстовой инструкции требовался короткий видеоролик с наглядной демонстрацией действий.

Куда более серьезный инцидент произошел в демонстрационном видео, посвященном классическому пленочному зеркальному фотоаппарату, у которого заклинило рычаг взвода затвора. В качестве главного решения алгоритм Google предложил пользователю открыть заднюю крышку аппарата. Практикующие фотографы из редакции The Verge Becca и Vren резко раскритиковали эту рекомендацию, напомнив, что открытие крышки на свету мгновенно засветит и безвозвратно уничтожит всю отснятую дорогую пленку.

Нилай Патель напрямую задал вопрос о качестве работы системы генеральному директору Google Сундару Пичаи, поинтересовавшись, можно ли считать прорывом технологию, выдающую столь разрушительные советы. Пичаи встал на защиту разработчиков и привел следующие аргументы:

  1. Ответ ИИ предварительно проверялся пулом профильных экспертов, которые посчитали его допустимым в определенном контексте.
  2. Метод является технически рабочим, если пользователю важнее сохранить механику самой камеры, а ценность отснятых кадров для него минимальна.
  3. Подобные примеры стимулируют компанию продолжать работу над улучшением контекстуального понимания моделей.

🌐 Конец эпохи десяти синих ссылок: концепция «Google Zero» 1:01:55

Самым фундаментальным и тектоническим сдвигом для архитектуры интернета стал официальный запуск функции AI Overviews (ранее известной как SGE) для всей аудитории пользователей в США. Отныне поисковая система вместо привычного списка из десяти синих ссылок будет самостоятельно компилировать развернутый текстовый ответ, собирая информацию с различных сайтов. Более того, Google планирует генерировать кастомные веб-страницы под сложные запросы пользователей, например, подбирая лучшие рестораны для годовщины в конкретном городе.

Медиаиндустрия встретила это нововведение с крайней тревогой. Исполнительный директор ассоциации News Media Alliance охарактеризовал запуск AI Overviews как катастрофическое событие, лишающее новостные ресурсы законного трафика. Нилай Патель напомнил о своей давней теории «Google Zero» — неизбежном моменте, когда поисковый гигант полностью замкнет потребление контента внутри своей платформы.

Руководитель поискового направления Google Лиз Рейд и Сундар Пичаи утверждают обратное: по их заявлениям, ссылки внутри ИИ-блоков получают даже больше кликов, чем стандартная выдача. Однако Патель подчеркивает, что проверить подлинность этих слов невозможно, так как вся статистика закрыта внутри корпорации. Алекс Кранц считает, что Google переходит в опасную роль главного арбитра информации вместо простого проводника к ней. Ситуация усугубляется деградацией веб-пространства, где инвесторы массово скупают старые авторитетные домены (например, Sports Illustrated, Gizmodo или The Hairpin) для автоматического наполнения их низкокачественным ИИ-контентом ради заработка на рекламе.

⚡ Молниеносный раунд: Snapdragon против Apple, эмуляторы и застрявший iPad 1:14:09

В традиционном финальном блоке ведущие обсудили ключевые события недели из смежных технологических сфер.

Главные темы раунда:

💬 Цитаты

«ИИ становится убедительным быстрее, чем он становится по-настоящему хорошим.»

Дэвид Пирс 19:17

«Похоже, что Google потеряла понимание того, чем она должна заниматься.»

Алекс Кранц 46:06

«Пусть Google выполняет поиск за вас.»

👥 Спикеры
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Мультимодальность
Способность нейросети одновременно обрабатывать разные типы данных: текст, аудио, видео и изображения.
Галлюцинация
Феномен, при котором искусственный интеллект уверенно генерирует ложные или вымышленные факты.
SGE (Search Generative Experience)
Экспериментальный поисковый интерфейс Google, использующий ИИ для генерации ответов на запросы.
SEO (Search Engine Optimization)
Поисковая оптимизация, направленная на поднятие позиций сайта в результатах выдачи.
Эмулятор
Программа, позволяющая запускать на одном устройстве программное обеспечение, созданное для другой платформы или консоли.
📊 Цифры
🗓 Хронология
  1. Май 2024 года Компания OpenAI проводит презентацию Spring Event и анонсирует модель GPT-4o.
  2. Май 2024 года Google проводит конференцию I/O, объявляя о масштабном внедрении Gemini и запуске AI Overviews.
  3. Май 2024 года Илья Суцкевер официально объявляет о своем уходе из компании OpenAI.
⚖️ Другая сторона
Искусственный интеллект OpenAI Google I/O GPT-4o Project Astra Google Zero