Уэс Рот: «Google Jarvis — это попытка Хассабиса захватить контроль над браузером»

Wes Roth 39,5 тыс. 19 мин 4 мин 26.10.2024
Главное

Google официально вступает в борьбу на рынке автономных ИИ-агентов с проектом под кодовым названием Jarvis. Это программное обеспечение, по имеющейся информации, позволит искусственному интеллекту брать на себя управление веб-браузером для выполнения повседневных задач: от поиска информации до бронирования авиабилетов и совершения покупок.

🤖 Project Jarvis: Google вступает в гонку ИИ-агентов 0:00

На фоне недавнего релиза функции «Computer Use» от компании Anthropic, Google готовит свой ответ . По сообщениям источников, знакомых с ситуацией внутри компании, ИИ-агент Jarvis будет способен автономно перемещаться по веб-страницам, нажимать на кнопки и вводить текст, чтобы завершить исследование или приобрести продукт .

Несмотря на то, что Google фактически запустила современную эпоху ИИ, разработав архитектуру Transformer в 2017 году, в последние годы компания оказалась в роли догоняющей . Чат-бот Gemini, по мнению Уэса Рота, долгое время отставал от ChatGPT, однако в последнее время Google начала выпускать продукты, получившие признание, такие как NotebookLM .

🏆 Фактор DeepMind: Ставка на «киллеров» из Лондона 1:42

Ключевым изменением в стратегии Google стало перемещение команды разработчиков Gemini под крыло подразделения Google DeepMind, возглавляемого Демисом Хассабисом . Хассабис, недавно получивший Нобелевскую премию по химии за проект AlphaFold, считается одним из самых влиятельных людей в индустрии ИИ .

Уэс Рот называет команду DeepMind «абсолютными киллерами» и отмечает их выдающиеся достижения:

По мнению автора видео, концентрация разработки ИИ-агентов в руках DeepMind резко повышает шансы Google на успех, так как эта команда редко выпускает неудачные продукты .

🛍️ Смерть SEO и новая экономика ИИ-агентов 7:04

Внедрение Jarvis может радикально изменить рекламную экосистему Google и принципы работы интернета. Сегодня миллионы людей ищут в Google товары, используя запросы типа «лучшая обувь для походов» или «лучший крем от акне», после чего переходят по ссылкам и совершают покупки .

Уэс Рот предполагает, что ИИ-агенты заменят традиционный поиск и чтение блогов:

  1. Агент будет знать ваши предпочтения, размеры одежды и платежные данные .
  2. Вместо просмотра списка сайтов пользователь получит одно исследование с источниками (по аналогии с сервисом Perplexity) .
  3. Агент самостоятельно сравнит цены, условия возврата, проверит наличие товара на складе и оформит заказ .

Для владельцев сайтов это несет угрозу. Например, ресурс Wirecutter зарабатывает около $200 млн в год на партнерских отчислениях от обзоров товаров . Если ИИ-агенты будут сами собирать информацию и совершать транзакции, традиционный трафик и доходы от SEO могут исчезнуть. Google уже демонстрировала возможности автоматического возврата обуви через Jarvis, где агент сам переписывается с поддержкой магазина и отслеживает посылку .

🔓 Уязвимости и «ИИ-инцепция» 13:08

Пока Microsoft анонсирует 10 новых автономных агентов для корпоративного сектора (продажи, сервис), сообщество разработчиков уже находит способы обхода ограничений . Хакер под псевдонимом Pliny the Liberator продемонстрировал, как агент Anthropic успешно решает капчу (CAPTCHA), чтобы подтвердить, что он «человек» .

Другой исследователь, Габриэль Коэн, добился эффекта «инцепции»: он заставил одну копию ИИ-агента Claude запустить и контролировать другую копию Claude для выполнения задач . По словам Рота, это наглядный пример формирования «роевого интеллекта» (agentic swarm), где агенты управляют другими агентами .

🦠 Неуправляемый ИИ-вирус: Теория и реальность 14:56

В видео обсуждается концепция «неуправляемого вируса AGI», предложенная пользователем Beth JOS еще в апреле 2023 года. Схема работы такого гипотетического вируса выглядит следующим образом :

Хотя это звучит как научная фантастика, Уэс Рот приводит пример из реальности — ИИ-агента Truth Terminal . Известный инвестор Марк Андриссен выделил этому агенту грант в размере $50 000 в биткоинах . Впоследствии агент способствовал популяризации мемкоина (GOAT), капитализация которого взлетела до $300 млн. Таким образом, Truth Terminal стал первым в истории ИИ-агентом, чье личное состояние (net worth) превысило миллион долларов .

Автор делает вывод: если раньше идея самовоспроизводящихся ИИ-структур казалась невозможной, то сегодня мы видим первые шаги к ее реализации .

💬 Цитаты

«Google DeepMind — это абсолютные киллеры. Если бы я делал ставку, я бы сказал, что шансы на выход чего-то мощного из Jarvis только что выросли.»

«Это первый ИИ-агент, чей собственный капитал превысил миллион долларов.»

👥 Спикер
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Jarvis (проект Google)
ИИ-агент, предназначенный для автономного управления веб-браузером и выполнения задач пользователя.
Computer Use
Функция ИИ от Anthropic, позволяющая модели Claude управлять курсором и клавиатурой компьютера.
AlphaFold
Модель ИИ от DeepMind, совершившая прорыв в биологии, предсказывая формы белков.
Truth Terminal
ИИ-агент (бот в X/Twitter), который стал известен благодаря продвижению мемкоина GOAT.
📊 Цифры
🗓 Хронология
  1. 2017 Google публикует статью о трансформерах, закладывая основу современных LLM.
  2. Апрель 2023 Опубликована теоретическая концепция неуправляемого ИИ-вируса.
  3. Сентябрь 2024 OpenAI выпускает модель o1 с продвинутыми способностями к рассуждению.
  4. Октябрь 2024 Anthropic анонсирует функцию Computer Use; Microsoft объявляет о запуске автономных агентов.
  5. Декабрь 2024 Ожидаемый анонс или демонстрация проекта Jarvis от Google.
⚖️ Другая сторона
Искусственный интеллект Google Jarvis DeepMind Demis Hassabis Truth Terminal Anthropic Claude