Wes Roth о новой гонке ИИ: «OpenAI, Google и xAI готовят масштабный прорыв»

Wes Roth 43,1 тыс. 14 мин 4 мин 08.10.2025
Главное

Индустрия искусственного интеллекта вступает в новую фазу: от простых чат-ботов компании переходят к созданию полноценных ИИ-агентов, способных управлять компьютером, пользоваться браузером и интегрироваться в сторонние сервисы. Ведущий канала Wes Roth анализирует последние анонсы от OpenAI, Google и xAI, отмечая, что гонка вооружений в сфере ИИ-видео и автономных рабочих процессов достигла критической точки.

🤖 OpenAI Dev Day: App Store для ChatGPT и эра агентов 0:44

На прошедшем мероприятии OpenAI Dev Day компания представила масштабные обновления, направленные на превращение ChatGPT в центральный хаб для сторонних приложений . По аналогии с App Store, в ChatGPT теперь интегрируются сервисы различных компаний, что открывает новые возможности для автоматизации .

Ключевые анонсы в рамках экосистемы OpenAI:

Ведущий отмечает, что OpenAI фактически вступает в прямую конкуренцию с сервисами автоматизации вроде Make.com и Zapier, хотя на данный момент система ограничена использованием только моделей OpenAI .

💻 Google Gemini 2.5: ИИ берет управление компьютером на себя 3:18

Одним из самых значимых событий стал выход модели Gemini 2.5 с функцией «Computer Use» (использование компьютера). Это ИИ-агенты, которые могут взаимодействовать с пользовательскими интерфейсами так же, как человек: нажимать кнопки, заполнять формы и перемещаться по сайтам .

Основные характеристики и результаты тестов:

Ведущий провел собственные тесты модели. В игре «Сапер» (Minesweeper) агент потерпел неудачу: хотя он смог начать игру и выбрать уровень сложности, он не продемонстрировал логического понимания правил и быстро «подорвался» . Однако в задаче по поиску информации в профиле X (бывший Twitter) Gemini 2.5 проявила себя отлично, быстро найдя аккаунт и точно описав фоновое изображение с «черным котом на акуле» .

💸 Финансовые маневры: OpenAI и AMD 9:43

В контексте сделки между OpenAI и производителем чипов AMD, Уэс Рот цитирует ироничный анализ Мэтта Левина. Речь идет о том, как компании могут договариваться о поставках оборудования в условиях дефицита капитала и высоких ожиданий рынка .

По сценарию Левина, сделка может выглядеть следующим образом:

  1. OpenAI запрашивает чипы на сумму $78 млрд для выполнения операций вывода (inference) .
  2. Вместо прямой оплаты наличными компании объявляют о стратегическом партнерстве.
  3. Один лишь анонс сделки поднимает капитализацию AMD на те же $78 млрд .
  4. В итоге AMD получает рост стоимости акций, а OpenAI — необходимые вычислительные мощности, фактически «оплаченные» рыночным оптимизмом .

Хотя этот сценарий является упрощением, по мнению автора видео, он отражает стиль ведения переговоров Сэма Альтмана, которого Рот называет «мастером сделок» .

🎥 xAI и Grok: Погоня за лидерами 11:27

Компания Илона Маска xAI также не стоит на месте. Код Grok стал доступен в Visual Studio, а новая модель генерации видео Imagine V0.9 показала значительный прогресс по сравнению с предыдущими версиями .

Критика и наблюдения Рота касательно видеомодели xAI:

🏆 Научный триумф Alphabet 13:53

В завершение обзора упоминается успех подразделения Google DeepMind и всей группы Alphabet на научном поприще. В копилке компании стало на несколько Нобелевских лауреатов больше. К Джеффри Хинтону, Демису Хассабису и Джону Джамперу присоединились ученые из команды Google Quantum AI . Мишель Деворе получил Нобелевскую премию по физике 2025 года, что Хассабис назвал огромным достижением для всей индустрии . Это уже третья Нобелевская премия, связанная с работой в Alphabet за последние два года .

💬 Цитаты

«Это первый шаг в истории компьютерного использования Gemini. Это очень воодушевляет, так как навигация в сети была слабостью ИИ-моделей.»

«Если это получит распространение, начнется гонка за то, как сделать ваше приложение используемым для ChatGPT, подобно SEO в Google.»

«Я бы не стал ставить против Илона Маска и xAI. Они, кажется, догоняют лидеров очень быстро по всем фронтам.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Agentic workflows
Рабочие процессы, в которых ИИ действует как автономный агент, выполняя последовательность задач для достижения цели.
Computer Use
Функция ИИ-модели, позволяющая ей видеть экран компьютера и взаимодействовать с интерфейсом (двигать мышь, кликать, печатать).
Inference
Процесс использования обученной ИИ-модели для получения предсказаний или ответов на запросы.
Guardrails
Система ограничений и правил, встроенная в ИИ для предотвращения выдачи вредоносного или ложного контента.
📊 Цифры
🗓 Хронология
  1. Октябрь 2024 Проведение OpenAI Dev Day и анонс Agent Kit.
  2. 2024 Выпуск модели Gemini 2.5 с функцией Computer Use.
  3. 2025 Мишель Деворе из Google Quantum AI удостоен Нобелевской премии по физике.
⚖️ Другая сторона
Искусственный интеллект OpenAI Google Gemini xAI Sam Altman Илон Маск