Почему смартфоны и наушники оказались эффективнее ИИ-гаджетов

The Vergecast 20,3 тыс. 1 ч 10 мин 8 мин 30.04.2024
Главное

Смартфоны остаются главными устройствами эпохи искусственного интеллекта, несмотря на попытки стартапов создать специализированное AI-железо. В новом выпуске подкаста The Vergecast ведущий Дэвид Пирс вместе с журналистами Эллисон Джонсон, Алексом Хитом и Нилаем Пателом обсуждают крах концепции отдельных ИИ-гаджетов, масштабную экспансию Meta в сферу открытых моделей и новые антимонопольные риски Microsoft. Эксперты сходятся во мнении, что будущее ИИ лежит в интеграции с привычными аксессуарами — наушниками, часами и очками.

📱 Эксперимент с «носимым» смартфонами и почему ИИ-гаджеты проигрывают 1:58

Ведущий подкаста The Vergecast Дэвид Пирс в последние недели активно тестировал новые ИИ-устройства, включая Humane AI Pin, Rabbit R1, умные очки Meta Ray-Ban и диктофон Plod. Главный вопрос, который возникает ко всем подобным гаджетам: почему это не может быть просто приложением на смартфоне? Журналист издания The Verge Эллисон Джонсон решила проверить эту гипотезу на практике и провела эксперимент, попытавшись воссоздать функции носимого ИИ-ассистента с помощью обычного телефона. Она использовала складной смартфон Motorola Razr Plus, закрепив его на воротнике рубашки внешним экраном наружу, чтобы задействовать фронтальную камеру для Google Lens и общаться с Google Assistant.

Эксперимент выявил серьезные технические ограничения современных мобильных операционных систем:

По мнению Джонсон, около 80% её скепсиса в отношении новых гаджетов продиктовано реализмом: смартфоны уже решили ключевые проблемы, с которыми сталкиваются стартапы, такие как перегрев ИИ-устройств, постоянное подключение к интернету, качество камер и время автономной работы. Она проводит аналогию с рынком компактных цифровых камер прошлых лет: история показала, что если человек может носить с собой одно устройство вместо двух, он выберет одно.

Дэвид Пирс добавляет, что пользователи успели забыть, насколько неудобно постоянно доставать телефон из кармана или сумки, разблокировать его и открывать приложения, особенно когда руки заняты. Однако решением этой проблемы, как считают оба собеседника, станут не новые гаджеты вроде Humane Pin, а обычные беспроводные наушники. Наушники с качественным режимом прозрачности уже социально одобрены обществом, и через них можно вызывать умного ассистента, оставляя телефон в кармане.

В ходе эксперимента Джонсон обнаружила по-настоящему полезный сценарий использования ИИ: она сфотографировала рецепт на кухне и затем через наушники засыпала Gemini вопросами в процессе готовки («сколько запекать рыбу?», «как порезать овощи?»). По словам Эллисон, ассистент ни разу не ошибся, избавив её от необходимости бегать к экрану с грязными руками. В то же время она призывает контролировать ИИ, поскольку ассистенты всё еще склонны путать факты: например, отвечая на вопрос о ремонте моста в её районе, Gemini заявил, что он открыт, но открывается завтра.


🥕 Очарование и провал Rabbit R1 18:13

Обсуждая специализированные устройства, Эллисон Джонсон поделилась опытом тестирования Rabbit R1. По её оценке, автономность устройства оказалась ужасной — гаджет приходится держать выключенным в сумке, чтобы батарея не разрядилась до того, как он понадобится.

Тем не менее Джонсон отмечает несколько удачных находок разработчиков Rabbit:

Дэвид Пирс отмечает, что крупные ИИ-ассистенты (Siri, Gemini) из-за прошлых скандалов намеренно лишены индивидуальности и ведут себя подчеркнуто сухо. Попытка Rabbit сделать интерфейс эмоциональным выглядит очаровательно, но, как считает Джонсон, милота помогает лишь до определенной степени, когда пользователю приходится в очередной раз искать зарядку.

Главным барьером для превращения сторонних приложений вроде ChatGPT в полноценных ассистентов на смартфонах остается закрытость операционных систем. Сторонний ИИ не имеет права менять настройки телефона или добавлять события в календарь. Пирс полагает, что эта стена рухнет только под давлением регуляторов, поскольку для Apple и Google разрешить ChatGPT управлять телефоном эквивалентно дозволению установить чужую ОС поверх своей.

В итоге Джонсон признается, что стала зависима от смарт-часов, которые преодолели барьер полезности и оправдывают необходимость ежедневной зарядки. Пирс резюмирует, что будущее ИИ-гаджетов — это концепция смартфона в кармане как «сотового модема», к которому подключаются носимые аксессуары (наушники, часы, очки), а не изобретение громоздких отдельных девайсов.


♾️ Стратегия Meta: превращение в новую Microsoft и лицензирование Horizon OS 29:22

Вторая часть дискуссии с участием редактора Алексиса Хита была посвящена корпорации Meta, которая стремительно превращается в тяжеловеса в сфере ИИ. Компания внедрила мультимодальный ИИ в свои умные очки Ray-Ban, запустила конкурентоспособную модель Llama 3 и добавила ИИ-помощника Meta AI практически во все свои сервисы, включая Instagram, WhatsApp и Facebook.

Одним из главных событий стало объявление о переименовании операционной системы для гарнитур Quest в Horizon OS и открытии её для сторонних производителей железа (OEM). На текущий момент подтверждено сотрудничество с Lenovo и Asus, а также анонсирована специальная версия Quest в стилистике Xbox.

По анализу Хита, Meta полностью копирует стратегию Android от Google на рынке смартфонов, стремясь стать создателем универсальной платформы для гарнитур, пока сторонние компании разрабатывают нишевые устройства для работы, игр или строительства. К настоящему моменту Meta продала чуть более 20 миллионов устройств семейства Quest.

Ключевые особенности платформы Meta:

Хит утверждает, что Марк Цукерберг видит своим бизнес-кумиром и ментором Билла Гейтса и сознательно превращает Meta в аналог Microsoft образца 1990-х годов. Цукерберг ориентируется на классическую формулу Гейтса: настоящая платформа создана тогда, когда общая ценность построенных поверх неё продуктов превышает ценность самой платформы.

Этим же объясняется и решение Meta инвестировать миллиарды долларов в вычислительные мощности для обучения моделей Llama, а затем бесплатно отдавать их в open-source. У Meta нет собственного облачного бизнеса (как у Amazon или Microsoft), её бизнес — это социальные продукты. Распространяя Llama 3 бесплатно, компания привязывает разработчиков к своим фреймворкам.

Кроме того, как заявил Цукерберг в одном из подкастов, если комьюнити поможет оптимизировать стоимость инференса (запуска моделей), это полностью окупит для Meta затраты на обучение всех будущих версий Llama. Хит и Пирс иронизируют, что в текущих реалиях Meta ведет себя как «OpenAI», в то время как сама компания OpenAI стала максимально закрытой структурой.


🤖 Антиутопия в ленте новостей и тайная сделка с Google 45:24

Интеграция ИИ во все продукты Meta происходит агрессивно. Компания в одночасье заменила привычную строку поиска в Instagram на интерфейс Meta AI, что вызвало резкое недовольство Дэвида Пирса, который хотел просто искать видео, а не общаться с ботом. Алекс Хит поясняет, что обычно Meta проводит долгое А/В-тестирование изменений на отдельных рынках, но в данном случае Цукерберг лично принял авторитарное решение включить функцию для всех сразу, поставив на карту всё.

Видение Цукерберга относительно будущего соцсетей выглядит необычно: он считает, что вскоре в лентах и мессенджерах появятся миллионы ИИ-персон, неотличимых от реальных людей. Например, селебрити вроде Кайли Дженнер будут создавать официальных ИИ-клонов для общения с миллионами фанатов.

Meta уже тестирует технологии искусственного удержания внимания:

Интересной деталью расследования Алекса Хита стала интеграция поисковых результатов Google и Bing в Meta AI. На вопрос Хита о финансовых условиях Цукерберг признался, что Meta платит Google за доступ к поисковой выдаче в реальном времени, хотя сумма, по его словам, не то чтобы огромная (в масштабах миллиардеров). Это важный прецедент: ранее Google сохраняла эксклюзивность актуального поиска для своего бота Gemini, но теперь выстраивает B2B-модель продажи данных для ИИ-платформ.

При этом Meta не отказывается от метавселенной. По прогнозам компании, к концу 2030-х годов AR-очки с дисплеями приблизятся по популярности к смартфонам. Хит поделился инсайдом: в следующем году Meta планирует выпустить новые очки Ray-Ban с полноценным экраном и нейроинтерфейсным браслетом EMG, который позволит управлять интерфейсом буквально силой мысли, считывая электрические импульсы мышц.


⚖️ Горячая линия: почему регуляторы не могут остановить Microsoft 59:06

В финальной части программы главный редактор The Verge Нилай Пател ответил на вопрос слушателя Джоша из Денвера. Слушатель поинтересовался, почему Microsoft безнаказанно повторяет свои антиконкурентные практики из 1990-х годов, агрессивно навязывая браузер Edge внутри Windows и игнорируя выбор пользователя.

Нилай Пател объясняет пассивность властей феноменом тотального доминирования Google Chrome, которое никто не может пошатнуть уже больше десятилетия. По его словам, антимонопольные органы США и Европы видят, что агрессивные уведомления Microsoft вызывают лишь раздражение пользователей и не помогают Edge нарастить долю. Глава антимонопольного крыла Минюста США Джонатан Кантор использует фреймворк HIPS (High Impact Programmatically Significant — высокая значимость и влияние), и кейс Edge под него не подходит, так как у браузера ничтожная рыночная доля.

Тем не менее в ряде сегментов Microsoft всё же получает жесткий отпор:

В игровом секторе позиции Windows сильны, однако бренд Xbox не является монополистом рынка, что признает даже его глава Фил Спенсер, поэтому регуляторы не смогли заблокировать сделку по покупке Activision Blizzard. Основной бизнес Microsoft сегодня сосредоточен в enterprise-сегменте и облачной инфраструктуре Azure, где присутствует здоровая конкуренция.

Пател прогнозирует, что реальное антимонопольное расследование ждет Microsoft не из-за Windows, а из-за её непрозрачного эксклюзивного альянса с OpenAI, который выглядит как скрытое поглощение стартапа без официального одобрения властей. При этом регуляторы продолжают полностью игнорировать видеохостинг YouTube, который Пател называет «океаном» — вечно меняющимся, неуязвимым и находящимся вне зоны видимости антимонопольного законодательства.

💬 Цитаты

«Если вы можете носить с собой одну вещь вместо двух, вы будете носить одну вещь.»

Эллисон Джонсон 06:21

«У Meta нет собственного облачного бизнеса. Их бизнес — создание потребительских социальных продуктов, которые монетизируют внимание.»

Алекс Хит 41:52

«YouTube — это просто слепая зона для всех. Мы относимся к нему как к океану: вечно меняется и всегда один и тот же.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Инференс
Процесс работы уже обученной нейросети, когда она принимает новые данные и выдает ответ пользователю.
Бандлирование
Продажа нескольких товаров или услуг в одном пакете, часто используемая монополиями для вытеснения конкурентов.
Open-source
Программное обеспечение, код которого открыт для публичного просмотра, изменения и бесплатного использования кем угодно.
📊 Цифры
⚖️ Другая сторона
Технологии и IT The Vergecast Rabbit R1 Horizon OS Llama 3 Microsoft Edge