Презентации OpenAI и Google I/O: ИИ-ассистенты возвращаются в новом формате

В новом выпуске подкаста The Vergecast ведущие Нилай Патель, Алекс Кранц и Дэвид Пирс анализируют масштабное обострение конкуренции на рынке генеративного искусственного интеллекта. Главным событием недели стали весенняя презентация OpenAI и конференция Google I/O, ознаменовавшие полноценное возвращение ИИ-ассистентов в повседневную жизнь пользователей. Журналисты детально разбирают новые мультимодальные функции систем, риски массового внедрения ИИ-поиска для традиционных медиа, а также последние новинки из мира персональных компьютеров и мобильных операционных систем.

🎭 Большие игры OpenAI: попытка затмить Google I/O 3:22

Технологическая компания OpenAI в очередной раз продемонстрировала агрессивный стиль конкуренции, попытавшись перехватить информационную повестку у Google накануне ежегодной конференции Google I/O. Организаторы провели короткую прямую трансляцию под названием Spring Event, объявив о ней всего за 20 минут до начала. До последнего момента в индустрии циркулировали слухи о возможном релизе полноценной поисковой системы или новой модели GPT-5. Вместо этого разработчики представили GPT-4o, где буква «о» означает omni (всеобъемлющий), подчеркивая нативную мультимодальность новой модели.

По мнению Нилая Пателя, OpenAI продолжает вести себя как «группа амбициозных детей», хотя в реальности ей руководят одни из самых богатых и опытных топ-менеджеров в Кремниевой долине. Журналисты отмечают парадокс корпоративной культуры стартапа: с одной стороны, руководство искренне убеждено, что создает величайший продукт в истории человечества, а с другой — пытается разыгрывать роль скромных ученых-альтруистов. Среди сотрудников Google на конференции I/O преобладало мнение, что OpenAI сознательно скопировала и поспешила продемонстрировать именно те функции, которые готовился показать поисковый гигант, чтобы выставить действия конкурента вторичными.

Символичным завершением этого раунда борьбы стало официальное объявление об уходе шеф-ученого Ильи Суцкевера из OpenAI, сделанное ровно в день открытия Google I/O. Это событие подвело черту под затяжным корпоративным конфликтом, связанным с кратковременным увольнением Сэма Альтмана.

📱 Новые ИИ-ассистенты: флирт вместо эффективности 9:57

Ключевым изменением в экосистеме OpenAI стало обновление тарифной политики: модель GPT-4o стала доступна бесплатно для всех пользователей, включая функции, которые ранее требовали платной подписки за 20 долларов в месяц. Кроме того, компания выпустила официальное приложение для macOS. Нилай Патель назвал этот шаг изящной шпилькой в адрес Microsoft — главного инвестора OpenAI, поскольку разработчики мотивировали свое решение простой фразой: «Там находятся наши пользователи».

Однако наибольший резонанс вызвал новый голосовой интерфейс GPT-4o. По наблюдениям участников подкаста, голос ассистента демонстрирует беспрецедентный уровень эмоциональности, использует паузы, вздохи и манеру речи, поразительно напоминающую персонажа Скарлетт Йоханссон из фантастической драмы «Her». Несмотря на то, что технический директор Mira Murati публично опровергла намеренное копирование голоса актрисы, Сэм Альтман подогрел эти ассоциации, опублив лаконичный твит с названием фильма. Новый ассистент способен шутить, менять интонацию по требованию исследователей и даже делать сомнительные комплименты внешнему виду пользователя.

Алекс Кранц выразила скептический взгляд на подобную траекторию развития технологий, иронично заметив, что миллиардеры из Кремниевой долины слишком сильно поверили в желание обычных людей «переспать с iPad». По мнению Кранц, пользователям нужен компьютер, способный качественно посчитать налоги, а не имитировать дружелюбного бухгалтера. Дэвид Пирс добавил, что индустрия пытается навязать сценарии использования, которых не существует в реальности. Примером служат демонстрационные ролики, где люди ходят по комнатам и расспрашивают смартфоны об очевидных объектах вокруг, вроде Букингемского дворца. Тем не менее Пирс признает, что элемент развлечения и «очеловечивания» интерфейса заставляет массовую аудиторию прощать искусственному интеллекту множество фактологических ошибок.

🦖 Провал на демо-версиях: Project Astra и галлюцинации Google 28:43

Ответом Google на вызов конкурентов стал анонс проекта Project Astra — нативного мультимодального помощника, способного анализировать видеопоток в реальном времени и поддерживать диалог без задержек. Сильной стороной Google остается колоссальная инфраструктура, которая позволила снизить стоимость обработки сложных ИИ-запросов на 85% всего за один год. Главный исполнительный директор DeepMind Демис Хассабис выразил уверенность, что многолетние инвестиции в вычислительные мощности позволят Google сделать ИИ по-настоящему быстрым и экономически устойчивым.

Однако практическая демонстрация технологии обернулась курьезом. Нилай Патель протестировал Project Astra в закрытой кабине, используя игровой шлем и направленную на стол камеру. Ведущий разложил перед устройством пластиковую модель космического корабля, фигурку динозавра (плиозавра) и музыкальный маракас, попросив ИИ сочинить связную историю, в которой маракас окажется победителем. На середине фразы система полностью зависла, не сумев подобрать следующее слово в нестандартном контексте.

Как отмечает Дэвид Пирс, этот случай наглядно подтверждает общую проблему современных генеративных моделей: они становятся убедительными и похожими на человека гораздо быстрее, чем они становятся действительно надежными и безошибочными.

📸 Инструкции по поломке техники: спорный совет Сундара Пичаи 32:22

Внедрение мультимодального поиска затронет и сервис Google Lens, куда добавляется возможность искать информацию с помощью видеозаписи. В одном из официальных примеров ИИ успешно распознал модель проигрывателя виниловых пластинок Audio-Technica и объяснил проблему соскакивающего тонарма некорректным балансом противовеса. Однако, по мнению Пателя, ответ содержал слишком много технического жаргона, малопонятного для новичка, которому вместо текстовой инструкции требовался короткий видеоролик с наглядной демонстрацией действий.

Куда более серьезный инцидент произошел в демонстрационном видео, посвященном классическому пленочному зеркальному фотоаппарату, у которого заклинило рычаг взвода затвора. В качестве главного решения алгоритм Google предложил пользователю открыть заднюю крышку аппарата. Практикующие фотографы из редакции The Verge Becca и Vren резко раскритиковали эту рекомендацию, напомнив, что открытие крышки на свету мгновенно засветит и безвозвратно уничтожит всю отснятую дорогую пленку.

Нилай Патель напрямую задал вопрос о качестве работы системы генеральному директору Google Сундару Пичаи, поинтересовавшись, можно ли считать прорывом технологию, выдающую столь разрушительные советы. Пичаи встал на защиту разработчиков и привел следующие аргументы:

Ответ ИИ предварительно проверялся пулом профильных экспертов, которые посчитали его допустимым в определенном контексте.
Метод является технически рабочим, если пользователю важнее сохранить механику самой камеры, а ценность отснятых кадров для него минимальна.
Подобные примеры стимулируют компанию продолжать работу над улучшением контекстуального понимания моделей.

🌐 Конец эпохи десяти синих ссылок: концепция «Google Zero» 1:01:55

Самым фундаментальным и тектоническим сдвигом для архитектуры интернета стал официальный запуск функции AI Overviews (ранее известной как SGE) для всей аудитории пользователей в США. Отныне поисковая система вместо привычного списка из десяти синих ссылок будет самостоятельно компилировать развернутый текстовый ответ, собирая информацию с различных сайтов. Более того, Google планирует генерировать кастомные веб-страницы под сложные запросы пользователей, например, подбирая лучшие рестораны для годовщины в конкретном городе.

Медиаиндустрия встретила это нововведение с крайней тревогой. Исполнительный директор ассоциации News Media Alliance охарактеризовал запуск AI Overviews как катастрофическое событие, лишающее новостные ресурсы законного трафика. Нилай Патель напомнил о своей давней теории «Google Zero» — неизбежном моменте, когда поисковый гигант полностью замкнет потребление контента внутри своей платформы.

Руководитель поискового направления Google Лиз Рейд и Сундар Пичаи утверждают обратное: по их заявлениям, ссылки внутри ИИ-блоков получают даже больше кликов, чем стандартная выдача. Однако Патель подчеркивает, что проверить подлинность этих слов невозможно, так как вся статистика закрыта внутри корпорации. Алекс Кранц считает, что Google переходит в опасную роль главного арбитра информации вместо простого проводника к ней. Ситуация усугубляется деградацией веб-пространства, где инвесторы массово скупают старые авторитетные домены (например, Sports Illustrated, Gizmodo или The Hairpin) для автоматического наполнения их низкокачественным ИИ-контентом ради заработка на рекламе.

⚡ Молниеносный раунд: Snapdragon против Apple, эмуляторы и застрявший iPad 1:14:09

В традиционном финальном блоке ведущие обсудили ключевые события недели из смежных технологических сфер.

Главные темы раунда:

Аппаратная война ПК и Mac: Накануне специального мероприятия Microsoft Surface произошла масштабная утечка 311-страничного внутреннего документа компании Dell. Из него стали известны революционные спецификации ноутбука XPS 13 на базе процессоров Qualcomm Snapdragon. Маркетинговые материалы обещают до 12–13 часов реальной автономной работы и рекордные 29 часов локального воспроизведения видео, что выводит архитектуру ARM на ПК на уровень чипов Apple M-серии. По мнению Пирса, именно страх перед этим релизом заставил Apple экстренно показать новый процессор M4 в iPad неделей ранее.
Регуляторный прорыв в iOS: Благодаря антимонопольному давлению на Apple, в официальном магазине App Store появились полноценные игровые эмуляторы, такие как PPSSPP (для консоли PSP) и мультиплатформенный RetroArch. Последний получил нативную поддержку Apple TV, превращая телевизионную приставку в ретро-консоль. Алекс Кранц отметила, что появление этих приложений вызвало небывалый всплеск энтузиазма среди пользователей, доказав пагубность избыточных ограничений закрытой экосистемы Apple.
Кризис идентичности iPad Pro: Обсуждая первые обзоры ультратонкого iPad Pro с экраном OLED и чипом M4, Дэвид Пирс и Нилай Патель пришли к выводу, что устройство остается заложником жесткой бизнес-модели Apple. Мощнейшее железо искусственно ограничено операционной системой iPadOS. В частности, Apple категорически запрещает запуск полноценных десктопных версий браузеров Safari и Chrome. По мнению Пателя, это продиктовано страхом разрушить монополию App Store: если веб-приложения получат полную свободу на iPad, пользователи перестанут покупать софт через магазин Apple, превратив планшет в дорогой аналог Chromebook.