Google против ИИ-мусора: зачем поисковик покупает данные Reddit

The Vergecast 24,4 тыс. 1 ч 22 мин 13 мин 23.02.2024
Главное

В свежем выпуске флагманского подкаста The Vergecast ведущие Нилай Патель, Дэвид Пирс и редактор Алекс Кранц обсуждают, почему индустрия искусственного интеллекта и потребительских технологий стремительно теряет контроль над собственными продуктами. В центре внимания — многомиллионная сделка Google и Reddit по продаже пользовательских данных, скандал вокруг расового разнообразия в генераторе изображений Gemini и неожиданный сбой ChatGPT, перешедшего на бессвязную тарабарщину. Кроме того, эксперты анализируют масштабные сдвиги на рынке рекламы, проблемы «умного дома» и резкое охлаждение спроса на дорогие электромобили.

🤝 Дата-сделка века: зачем Google покупает «корпус» Reddit 1:43

В эпоху, когда открытый интернет стремительно заполняется мусорным контентом, сгенерированным нейросетями, качественные данные реальных людей становятся самым дефицитным ресурсом. Ярким подтверждением этого тренда стало официальное объявление о партнерстве между Reddit и технологическим гигантом Google. В рамках соглашения Google получает легальный доступ к обучению своих моделей искусственного интеллекта на материалах платформы, которую генеральный директор Reddit Стив Хаффман настойчиво именует «корпусом Reddit».

Для Reddit, который уже около трех лет находится в процессе подготовки к выходу на биржу и планирует подать форму S1 в ближайшие дни, эта сделка имеет экзистенциальное финансовое значение. Сумма контракта составляет $60 млн в год. Учитывая, что среднегодовая выручка Reddit в последние годы колебалась в районе $450 млн, одно это соглашение обеспечивает платформе колоссальный скачок в доходах практически без изменения структуры самого бизнеса. По мнению Пирса, Reddit теперь находится в выигрышной позиции и может потребовать аналогичные условия от других игроков, таких как OpenAI и Anthropic. Ведь если Google получит эксклюзивный доступ к этим данным, конкуренты окажутся в уязвимом положении. В перспективе, как прогнозирует Пирс, до половины всех доходов Reddit может поступать от подобных ИИ-лицензий.

Однако Нилай Патель считает, что сумма в $60 млн в год — это ничтожно мало для Google, фактически «размер одного чиха». Патель обращает внимание на то, что эта цифра составляет лишь крошечный процент от сумм, которые Google ежегодно выплачивает Apple только за право оставаться поисковой системой по умолчанию. Поскольку Reddit сегодня остается едва ли не единственным местом в сети, где живые люди дают осмысленные ответы на вопросы, поисковая система Google критически зависит от его контента. Обычной практикой для пользователей стало добавление слова "Reddit" к поисковым запросам, чтобы обойти рекламный и SEO-мусор. Патель утверждает, что Google своими алгоритмами превратил остальной веб в e-commerce и контент-маркетинг для стоматологических клиник. Из-за этого стимулы создавать качественные независимые сайты упали до нуля.

Дэвид Пирс выдвигает контраргумент: Reddit — возможно, единственная компания на рынке, обладающая реальным рычагом давления на Google. Google прекрасно осознает значимость платформы для своего основного бизнеса, тем более что внутренний поиск самого Reddit работает плохо, заставляя людей искать обсуждения через Google. В рамках нового соглашения Reddit предоставляет Google программный доступ (API) к метаданным в реальном времени, включая динамику комментариев и количество постов. В ответ Google интегрирует свою систему Vertex AI для улучшения внутреннего поиска Reddit.

Собеседники сошлись во мнении, что эта интеграция порождает опасную зависимость. Раньше трафик в интернете четко делился на поисковый (Google) и социальный (Facebook). Попытки медиаплатформ оптимизироваться исключительно под социальные сети приводили к безумным результатам — Патель приводит в пример компанию BuzzFeed, которая на пике хайпа вокруг Facebook-трафика оценивалась более чем в $1 млрд, создавая абсурдный вирусный контент. Теперь же поисковые и социальные механизмы сливаются воедино. Google становится заложником социальных платформ в своей попытке очистить выдачу от ИИ-мусора и вернуть в центр внимания человеческое общение.

🎨 Нацисты из Gemini и кризис аутентичности ИИ-арта 17:09

Пока Google пытается скупить остатки человеческого контента, его собственные генеративные инструменты демонстрируют пугающие и одновременно комичные сбои. На уходящей неделе компания оказалась в эпицентре масштабного скандала из-за работы своей флагманской модели Gemini, генерирующей изображения. Желая избежать традиционных расовых стереотипов и предвзятости, свойственных ранним нейросетям, разработчики Google перенастроили алгоритмы в сторону максимального расового разнообразия (diversity). Результат оказался гротескным: при запросах на создание исторических образов, таких как немецкие солдаты 1943 года или американские сенаторы XIX века, ИИ выдавал изображения темнокожих женщин в нацистской форме и азиатов среди отцов-основателей США.

Дэвид Пирс отмечает, что попытка исправить системные перекосы привела к полному хаосу. Нейросеть дошла до того, что наотрез отказывалась генерировать изображения белых людей, даже когда этого требовал исторический контекст, но охотно создавала цветные версии персонажей. Ситуация мгновенно спровоцировала ожесточенную «культурную войну» в американских медиа. В итоге Google была вынуждена выпустить официальные извинения за то, что «промахнулась мимо цели», и временно заблокировала функцию генерации людей в Gemini.

Нилай Патель видит в этом инциденте глубокий философский кризис всей индустрии генеративного ИИ. Сегодня венчурные капиталисты уверяют публику, что в будущем традиционное кино исчезнет, а зрители будут просто давать ИИ команды вроде: «Создай мне новых Мстителей с Робертом Дауни-младшим». Патель считает этот подход тупиковым, поскольку нейросети способны лишь статистически усреднять данные из прошлого, и они принципиально не могут создать ничего по-настоящему нового. Настоящее искусство обязано вызывать подлинные эмоции, тогда как корпоративные ИИ-инструменты пытаются выхолостить контент, чтобы он никого не задел.

Ведущие сравнивают генерацию ИИ с популярным элементом интерьерного дизайна в американских домах — табличками с надписями вроде "Family" или "Live, Laugh, Love". Патель иронизирует, что такие надписи на кухне — это отчаянная, но суррогатная попытка заставить человека почувствовать эмоцию прямой командой, когда не хватает художественных средств. Точно так же работает и ИИ-арт: пользователь вводит текстовый запрос, надеясь пробудить чувства, но зритель подсознательно чувствует фальшь. Алекс Кранц добавляет, что в сообществах фанатов и авторов уже звучат призывы бойкотировать ИИ-арт, поскольку он лишен подлинности и человеческого опыта. Индустрия слишком быстро превратила потенциально революционный творческий инструмент в сухой коммерческий продукт крупных корпораций вроде Microsoft и Google, из-за чего художники инстинктивно отвергают его.

В качестве контраргумента Патель приводит пример знаменитого бродвейского мюзикла «Гамильтон» (Hamilton), где отцов-основателей США намеренно и очень успешно сыграли темнокожие актеры, общающиеся в формате рэп-батлов. Однако «Гамильтон» — это осознанное художественное высказывание, требующее контекста. Когда же пользователь обращается к поисковой системе Google, он ожидает получить исторический факт, а не субверсивный арт-объект. Попытка скрестить поиск фактов с фабрикацией несуществующих сущностей — фундаментальная ошибка позиционирования ИИ-сервисов со стороны Google.

🗣️ АБВГД-солянка: языковой сбой ChatGPT и хаос в нейминге Google 28:33

Проблемы с адекватностью ИИ затронули не только Google. Главный конкурент компании, OpenAI, на этой неделе пережил необъяснимый восьмичасовой сбой, во время которого чат-бот ChatGPT начал генерировать абсолютно бессмысленную текстовую «тарабарщину». Компания до сих пор не предоставила детальных технических объяснений, сославшись лишь на непрепредвиденную ошибку при внутреннем тестировании обновлений.

Патель зачитывает фрагмент из реального лога ChatGPT, где пользователь просил составить биографию музыкальной семьи Джексонов. Текст, начинавшийся вполне логично, к концу превратился в лингвистический кошмар: «misus unkissed Michael Janet Germaine number one a Pandoras of global stoes and prolific Shipyard premacy Swit andly...». По шутливому замечанию Пателя, это напоминает «вогонскую поэзию» из «Автостопом по галактике». Этот инцидент, по мнению участников дискуссии, лишний раз доказывает, что даже сами создатели больших языковых моделей не до конца понимают внутренние механизмы их работы, выпуская потенциально нестабильные системы в дикую природу.

Параллельно с техническими сбоями Google демонстрирует, как считают ведущие, полную катастрофу в маркетинговом позиционировании и нейминге. Компания запустила открытую легкую модель под названием Gemma, что вызвало резкую критику со стороны Алекс Кранц. Кранц напоминает о преодолении эпохи «гендерных» голосовых ассистентов (Siri, Alexa, Cortana), которые критиковались за навязывание женских стереотипов покорности. Индустрия вроде бы пришла к нейтральным названиям продуктов (ChatGPT, Copilot, Bard). Возврат Google к женскому имени Gemma для «бесплатной и менее мощной» версии выглядит как шаг назад.

Более того, разобраться в текущей линейке моделей Google стало невозможно даже для ИТ-журналистов. Дэвид Пирс пытается перечислить все актуальные версии ИИ от Google, что превращается в комичную скороговорку:

Патель иронизирует, что заучивание этой «солянки из букв» вытесняет из его памяти полезные воспоминания, уступая место лишь ностальгическим техническим характеристикам смартфонов HTC из 1990-х и процессоров Intel Atom с частотой 1.3 ГГц из эпохи нетбуков.

📺 Телевизоры как рекламные щиты: Walmart поглощает Vizio 37:22

В сегменте традиционных технологий также происходят тектонические сдвиги, завязанные на монетизацию данных. Крупнейший американский ритейлер Walmart официально объявил о приобретении производителя бюджетных телевизоров Vizio за колоссальные $2.3 млрд. Стороны открыто признают, что сделка совершается исключительно ради рекламных технологий (ad-tech) и платформы SmartCast.

Нилай Патель объясняет глобальный контекст происходящего: традиционно главными монополистами интернет-рекламы считаются Google и Meta. Однако сегодня их главными и наиболее агрессивными конкурентами становятся розничные рекламные сети (Retail Media Networks), развиваемые Amazon, Walmart, Target и Best Buy. Когда пользователь заходит на сайт Walmart или Amazon, большая часть выдачи — это таргетированная реклама. Amazon уже выстроил гигантскую систему, которая отслеживает путь пользователя от показа рекламы до покупки на собственной платформе, подкрепив это покупкой сети супермаркетов Whole Foods.

Walmart стремится повторить этот успех. Покупая Vizio — бренд телевизоров, который ритейлер продает в самых больших объемах, — компания получает прямой доступ в гостиные американцев. По словам Пателя, теперь Walmart может продавать брендам комплексные пакеты: реклама подгузников будет показываться пользователю не только на сайте магазина, но и на экране его телевизора, с глубоким сквозным отслеживанием конверсии. Пространство подключенного ТВ (Connected TV, CTV) превращается в цифровой рекламный щит прямо внутри дома.

Алекс Кранц и Нилай Патель отмечают печальную эволюцию Vizio. Когда-то компания пыталась конкурировать на рынках ноутбуков и премиальных смартфонов, но в итоге превратилась в поставщика дешевых экранов для сбора данных. Патель сравнивает Vizio с Google и Meta: ИТ-гиганты направляют избыточную рекламную прибыль на инновации — создание беспилотных автомобилей (Waymo), смартфонов Pixel или метаверс-технологий (Reality Labs). В то же время Vizio, собирая миллионы на скрытом отслеживании пользователей, не улучшала продукты, а делала свои телевизоры только хуже и медленнее, оптимизируя их под показ баннеров. Аналогичный путь деградации интерфейсов ради рекламы сейчас проходят платформы Roku и Prime TV от Amazon. Единственный надежный способ защититься от этого для обычного потребителя, по шутливому совету Пателя — физически выдернуть интернет-кабель из телевизора.

🏠 Битва за умный дом: экосистема Matter, эхо-хабы и кошмар Frame TV 47:16

Рекламный прессинг и неудачные программные обновления разрушают и концепцию «умного дома». Нилай Патель делится своей личной технологической драмой, связанной с дизайнерским телевизором Samsung Frame TV, который он приобрел для своего нового дома. Патель называет Frame TV важнейшим культурным продуктом Samsung, который компания создала с нуля и заставила потребителей страстно желать. По сути, это дешевая и старая ЖК-панель с матовым покрытием и красивой рамкой, продающаяся с огромной наценкой ради эстетики «картины на стене».

Однако программное обеспечение Tizen превратило использование устройства в кошмар. В моделях начиная с 2022 года Samsung полностью удалила открытый API для управления так называемым «арт-режимом» (Art Mode). Патель, использующий систему автоматизации Homebridge на базе Raspberry Pi, потерял возможность удаленно переводить телевизор в режим сна. Ситуация усугубилась бытовыми факторами: супруга Пателя регулярно смотрит на ночь тяжелые психологические шоу на канале Showtime и выключает телевизор «неправильно» с точки зрения автоматики. В результате каждое утро в 8:30, когда датчик движения термостата в спальне фиксирует пробуждение, телевизор автоматически включается и начинает на полной громкости транслировать шоу «Терапия для пар» (Couples Therapy).

Поиски решения этой проблемы в «субкорпусе Reddit», посвященном Frame TV, открыли ведущим шокирующие масштабы пользовательского недовольства. Оказалось, что из-за отсутствия программного API люди идут на экстремальные аппаратные ухищрения. Поскольку внешние кастомные рамки закрывают встроенные датчики освещения телевизора, пользователи покупают оптоволоконные кабели, высверливают отверстия в рамах и собирают внутри миниатюрные конструкции из зеркал (напоминающие диско-шары), чтобы перенаправить свет к датчикам.

На этом фоне более удачным примером выглядит новый настенный планшет Amazon Echo Hub, обзор которого подготовила журналистка The Verge Джен Ту. Дэвид Пирс считает этот продукт признанием важного факта: приложения для смартфонов и голосовые ассистенты полностью провалились как интерфейсы управления умным домом. Потребителям по-прежнему нужны физические кнопки на стенах, пусть даже и сенсорные.

Пирс приводит в пример историю своей сестры, которой приходится заучивать точные синтаксические имена ламп в доме (например, разницу между «лампой в гостиной» и «большой лампой в гостиной»), чтобы голосовой помощник Alexa не устраивал световой хаос. Настенный хаб решает эту проблему, предлагая понятный интерфейс для всей семьи. Основной проблемой Echo Hub, по мнению авторов, остается незрелость единого индустриального стандарта Matter. Стандарт продвигается медленно, вынуждая пользователей оставаться внутри закрытых экосистем (Apple HomeKit или Amazon Alexa) вместо бесшовной интеграции.

🎰 Тим Кук — ваш новый букмекер? Спортивное приложение Apple и квантовая защита 1:00:05

Компания Apple на этой неделе удивила экспертов неожиданным софтверным релизом, запустив бесплатное приложение Apple Sports для отслеживания спортивных результатов. На первый взгляд приложение выглядит сырым и поспешным: в нем отсутствуют многие виды спорта, а составы команд отображаются некорректно. Дэвид Пирс предполагает, что за этим проектом скрывается долгосрочная стратегия Apple по выходу на сверхприбыльный рынок спортивных ставок. По умолчанию в интерфейсе Apple Sports отображаются букмекерские коэффициенты, поставляемые платформой DraftKings.

Пирс отмечает, что за последние годы «окно Овертона» в отношении азартных игр в США сдвинулось до полной легализации и мейнстрима. Столкнувшись с падением продаж аппаратного обеспечения, Apple отчаянно ищет новые источники для роста своего подразделения Services (сервисы). Спортивный тотализатор — это идеальный бизнес по прямой экстракции денег у населения. Нилай Патель иронизирует над этой трансформацией, представляя главу Apple Тима Кука в роли зловещего мафиозного букмекера, который отправляет громил выбивать долги у пользователей, не рассчитавших ставки в приложении. При этом Apple сохраняет двойные стандарты: в магазине App Store по-прежнему жестко запрещены классические «цифровые слоты» (казино), но при этом процветают механики лутбоксов в играх вроде Monopoly Go, которые Патель называет тем же самым гемблингом, но без возможности реального выигрыша.

Другим важным, но гораздо более абстрактным анонсом Apple стало внедрение постквантового шифрования в мессенджер iMessage. Компания объявила, что ее протокол PQ3 обеспечивает уровень защиты «Level 3», что якобы превосходит аналогичную защиту мессенджера Signal (оцененную Apple в «Level 2»). Ведущие с иронией комментируют эту новость, отмечая любовь Apple к демонстрации «неразмеченных графиков», где их показатели всегда уходят высоко вверх без объяснения конкретных метрик. Впрочем, в долгосрочной перспективе (через 10-20 лет) появление коммерческих квантовых компьютеров действительно сделает всю современную криптографию уязвимой для взлома методом грубой силы, так что превентивные меры выглядят оправданными.

🚗 Кризис электромобилей: сокращения в Rivian и ценовые войны 1:11:13

В финальной части подкаста участники обсуждают резкое замедление темпов роста рынка электромобилей (EV). Стартап Rivian объявил об увольнении 10% своего штата, а автомобильный гигант Ford пошел на радикальное снижение цен на электрический кроссовер Mustang Mach-E. На рынке разворачивается вторая волна жестких ценовых войн, спровоцированная действиями Илона Маска и Tesla.

Нилай Патель считает, что производители стали жертвами ложных выводов из пандемического бума 2020-2024 годов. Ажиотажный спрос на Tesla Model 3 и Model Y создал у топ-менеджеров иллюзию, что весь мир готов немедленно пересесть на электрокары, что привело к колоссальному перепроизводству. В реальности рынок быстро уперся в потолок платежеспособного спроса. Например, Rivian выпускает отличные с технической точки зрения внедорожники R1S и пикапы R1T, однако их стоимость в топовых комплектациях достигает $100 000. Прослойка людей, готовых тратить такие суммы на электрические грузовики, оказалась крайне ограниченной, особенно в условиях высоких процентных ставок по кредитам.

Генеральный директор Rivian Арджей Скариндж в квартальном отчете задал показательный вопрос: «Как нам заставить оставшиеся 93% рынка, не покупающие EV, заинтересоваться продуктом?». Ситуация осложняется тем, что традиционные автоконцерны скопировали у Tesla всё, кроме качественного программного обеспечения. Единственным исключением на рынке Патель называет корейский альянс Hyundai-Kia. Их модели Ioniq 5 и трехрядный кроссовер EV9 успешно продаются, поскольку компания изначально нацелилась на массовые сегменты с конкурентоспособными ценами, а не на создание «супергрузовиков за 100 тысяч долларов».

Завершая технологический обзор, ведущие упоминают продолжающийся хаос в сфере спортивного стриминга — сервис Fubo подал в суд на консорциум Fox, Disney и Warner Bros. из-за их планов запустить единую платформу, которую в прессе уже заочно окрестили нелепым словом "Spu" или "Sports Hulu". По мнению Пателя, отказ использовать легендарный бренд ESPN для нового глобального сервиса станет колоссальной маркетинговой ошибкой корпораций.

💬 Цитаты

«Для Google это размер одного чиха, но для Reddit это колоссальный скачок в доходах.»

Нилай Патель 03:45

«Если вы хотите получить нормальную человеческую информацию в поиске, вы добавляете слово Reddit.»

Дэвид Пирс 02:51
👥 Спикеры
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Connected TV (CTV)
Телевизоры с возможностью подключения к интернету и поддержкой приложений, используемые как цифровая рекламная площадка.
Retail Media Networks
Рекламные платформы крупных розничных сетей (ритейлеров), продающие таргетированную рекламу на основе данных о покупках клиентов.
Постквантовая криптография
Алгоритмы шифрования, устойчивые к попыткам взлома с использованием будущих квантовых компьютеров.
Matter
Единый индустриальный стандарт межплатформенного взаимодействия устройств для умного дома.
📊 Цифры
⚖️ Другая сторона
Технологии и IT Нилай Патель Reddit Corpus Google Gemini Vizio SmartCast Apple Sports