OpenAI и Google вступили в новую фазу войны ИИ-ассистентов, превращая чат-ботов в мультимодальных «агентов», способных видеть, слышать и даже флиртовать с пользователем. В новом выпуске The Vergecast Нилай Патель, Алекс Кранц и Дэвид Пирс анализируют итоги конференций Google I/O и весеннего мероприятия OpenAI, обсуждая, действительно ли технологии стали умнее или они просто научились убедительнее имитировать человеческое поведение.
🤖 Битва за «Омни»: OpenAI пытается перехватить инициативу 3:22
В индустрии технологий началась агрессивная гонка за создание «компьютера из Star Trek» — идеального голосового помощника, который понимает мир в реальном времени. По мнению Дэвида Пирса, долгое время это было лишь мечтой, но сейчас лидеры рынка почувствовали, что финишная прямая уже близка. OpenAI, несмотря на статус стартапа, ведет себя как опытный и крайне агрессивный игрок. Компания анонсировала свой «весенний ивент» буквально за 20 минут до начала, явно пытаясь затмить Google I/O.
Главным анонсом стала модель GPT-4o (где «o» означает «omni»). Ключевые особенности новой модели:
- Нативная мультимодальность: Модель обрабатывает голос, видео и текст напрямую, без промежуточной конвертации в текст, что значительно снижает задержку (latency).
- Эмоциональность: ИИ теперь может менять интонацию, добавлять смешки, паузы и даже имитировать флирт.
- Доступность: Интеллект уровня GPT-4 теперь предоставляется бесплатно для всех пользователей.
- Десктопное приложение для Mac: OpenAI выпустила клиент для macOS раньше, чем для Windows, объяснив это тем, что «там находятся их пользователи» — Нилай Патель назвал это «самым жестким троллингом» Microsoft, крупнейшего инвестора компании.
Однако участники подкаста отнеслись к демонстрациям скептически. Алекс Кранц считает, что OpenAI эксплуатирует веру миллиардеров Кремниевой долины в то, что люди «хотят переспать с iPad». По ее мнению, демо-версии, где ИИ делает комплименты толстовке пользователя, выглядят как представление гиков о том, как должен выглядеть флирт.
🏰 Google наносит ответный удар: Инфраструктура и Project Astra 26:21
Если OpenAI берет харизмой продукта, то Google делает ставку на масштаб и интеграцию. Сундар Пичаи заявил, что стоимость обработки запросов снизилась на 85% за последний год. Это позволяет Google внедрять ИИ во все свои продукты, которыми пользуются миллиарды людей.
Центральным элементом презентации стал Project Astra — ответ Google на GPT-4o. Это мультимодальный ассистент, который может «видеть» через камеру смартфона и отвечать на вопросы о вещах в кадре. Однако Нилай Патель, лично тестировавший Astra, столкнулся с проблемами: в одной из попыток заставить ИИ придумать историю о пластиковом динозавре и маракасе, система просто зависла, не сумев предсказать следующее слово.
Другие важные анонсы Google:
- Ask Photos: Поиск по фотографиям с помощью естественного языка. Теперь можно спросить: «Какой номер у моей машины?», и ИИ найдет нужное фото и извлечет текст.
- AI в Workspace: Возможность задавать вопросы к своей почте, например: «Во сколько открываются двери на концерт в моих билетах?».
- Gemini 1.5 Flash: Новая сверхбыстрая и экономичная модель для разработчиков.
- Veo и Imagen 3: Ответы Google на генераторы видео Sora от OpenAI и качественную генерацию изображений.
Дэвид Пирс отмечает, что Google планомерно объединяет команды Android и Pixel под руководством Рика Остерло, чтобы сделать ИИ ядром операционной системы и попытаться опередить Apple в вопросе пользовательского интерфейса.
🧪 Галлюцинации и «интеллект» против «убедительности» 39:44
Одной из самых горячих тем обсуждения стала ошибка в официальном демо-ролике Google. В видео пользователь наводит камеру на пленочный фотоаппарат, у которого заклинило рычаг перемотки, и ИИ советует «просто открыть заднюю крышку». С точки зрения любого фотографа, это катастрофический совет: открытие крышки на свету мгновенно уничтожит все отснятые кадры.
Нилай Патель обсудил этот случай с Сундаром Пичаи, спросив, является ли владение языком тем же самым, что и интеллект. Пичаи ответил, что в определенных контекстах, если вы готовы пожертвовать пленкой ради спасения камеры, это может быть приемлемым решением.
Основные выводы собеседников о качестве современного ИИ:
- Убедительность растет быстрее качества: По мнению Дэвида Пирса, ИИ становится более человечным в общении, но не делает меньше фактических ошибок.
- Проблема ответственности: Если друг посоветует вам открыть камеру и испортит фото, вы будете на него злиться. С ИИ у пользователя нет механизмов привлечения к ответственности.
- Искажение поиска: Алекс Кранц считает, что Google теряет свою суть: вместо того чтобы быть проводником к информации, компания пытается стать ее единоличным арбитром, навязывая свои ответы через ИИ.
🌐 «Google Zero» и конец эпохи открытого интернета 1:01:55
Google официально запускает AI Overviews (ранее SGE) для всех пользователей в США. Теперь вместо списка ссылок пользователь видит сгенерированный ИИ ответ в верхней части страницы. Нилай Патель называет это моментом «Google Zero» — ситуацией, когда трафик издателей и сайтов может упасть до нуля, так как пользователю больше не нужно переходить по ссылкам.
Руководство Google, включая Лиз Рид, утверждает, что ссылки внутри ИИ-ответов получают больше кликов, чем обычные результаты поиска. Однако, как отмечает Нилай, проверить это утверждение невозможно, так как Google не предоставляет необходимых данных в своих инструментах аналитики. Участники дискуссии сошлись во мнении, что медиаиндустрию ждут «безумные 18 месяцев», а издательские группы, вероятно, ответят на эти изменения массовыми судебными исками.
⚡ Молниеносный раунд: iPad, эмуляторы и Qualcomm 1:14:09
В завершение выпуска ведущие обсудили другие важные новости недели:
- Прорыв Windows на ARM: Утечка 311-страничного документа Dell раскрыла детали нового XPS 13 на процессоре Snapdragon Elite. Обещают до 29 часов автономной работы при проигрывании видео, что может составить реальную конкуренцию Apple Silicon.
- Трагедия iPad Pro: Дэвид Пирс и Нилай Патель считают, что Apple намеренно сдерживает iPad OS, чтобы защитить бизнес-модель App Store. Несмотря на мощнейший процессор M4, планшет остается «кастрированным» из-за отсутствия десктопного браузера и полноценной многозадачности.
- Ренессанс эмуляторов: Благодаря регуляторному давлению в ЕС, в App Store появились легендарные эмуляторы RetroArch и PPSSPP (для PSP). Алекс Кранц в восторге от возможности превратить Apple TV в ретро-консоль, хотя само приложение RetroArch она назвала «чудовищно уродливым».