Гонка вооружений в сфере искусственного интеллекта перешла в стадию экстремального ускорения. Пока Google на конференции I/O 2024 развертывает полномасштабное наступление с помощью проекта Astra и новых моделей Gemini, OpenAI сталкивается с серьезной утечкой талантов: компанию покидают ключевые фигуры, отвечавшие за безопасность и саму суть развития технологий.
🌪️ Землетрясение в OpenAI: уход Ильи Суцкевера и кризис супервыравнивания 0:00
В индустрии ИИ произошло событие, которое многие называют концом целой эпохи. Илья Суцкевер (Ilya Sutskever), сооснователь и шеф-саентист OpenAI, официально объявил о своем уходе из компании . Суцкевер, которого ведущий канала Уэс Рот называет «одним из величайших умов нашего поколения» , сыграл решающую роль в создании GPT-4 и долгое время считался «душой» и главным идеологом безопасности в компании.
Ситуация осложняется уходом еще одной знаковой фигуры — Яна Лейке (Jan Leike), который руководил направлением «супервыравнивания» (superalignment) . Лейке подал в отставку, что вызвало волну слухов о внутреннем конфликте в OpenAI. По мнению автора канала, увольнения могут свидетельствовать о серьезных разногласиях в вопросе безопасности ИИ .
Ключевые назначения и изменения:
- Новый шеф-саентист: Место Суцкевера занял Якуб Пачоцки (Jakub Pachocki) . Ранее он занимал пост директора по исследованиям и руководил разработкой GPT-4 и OpenAI 5 (проекта, который в 2019 году обыграл профессионалов в Dota 2) .
- Будущее Суцкевера: Илья намекнул, что начинает проект, который «лично значим» для него, и обещал поделиться деталями позже . В сообществе обсуждают возможность объединения Суцкевера с Андреем Карпати (Andrej Karpathy) для создания новой, действительно открытой (Open) ИИ-компании .
- Реакция Сэма Альтмана: Глава OpenAI опубликовал формальное, но полное благодарности прощальное письмо, отметив, что «привержен выполнению миссии», которую они начали вместе с Ильей в 2015–2016 годах .
👁️ Ответный удар Google: Проект Astra и возвращение очков 9:06
Google не осталась в стороне и представила проект Astra — свое видение универсального ИИ-ассистента, способного видеть мир глазами пользователя . В ходе демонстрации женщина ходила по офису со смартфоном, задавая вопросы об объектах, на которые наведена камера. Ассистент мгновенно распознавал чертежи, предметы и даже цитировал Шекспира при виде черепа .
Однако реальность оказалась сложнее рекламных роликов. Сантьяго, один из экспертов, протестировавших Astra непосредственно на конференции, отметил, что опыт использования пока далек от идеала :
- Проблемы с вниманием: Ассистент часто прерывал выполнение задач, и его приходилось постоянно подгонять фразами «продолжай» или «допиши историю» .
- Задержки (latency): Хотя официальные видео показывают мгновенную реакцию, в реальности ассистент периодически «зависал» .
- Сравнение с OpenAI: По мнению Сантьяго, презентация OpenAI (модель GPT-4o) выглядела гораздо более плавной и готовой к использованию, хотя оба продукта пока остаются лишь демо-версиями .
Вместе с тем, Google намекнула на возвращение носимых устройств. Руководители компании полагают, что современные возможности ИИ создают идеальную почву для возрождения Google Glass . Очки с дополненной реальностью (AR) и ИИ-помощником могут стать более естественным интерфейсом для взаимодействия с Astra, чем смартфон.
🚀 Новые модели и сумасшедшие возможности Gemini 18:00
Google представила целый стек новых моделей, направленных на разные рыночные ниши:
- Gemini 1.5 Flash: Сверхбыстрая и дешевая модель. Ее цена составляет всего $0,35 за 1 млн входных токенов . Она оптимизирована для задач с высокой частотой запросов, где важна скорость и экономия.
- Окно контекста в 2 млн токенов: Сейчас эта возможность доступна в превью. Конечная цель Google — «бесконечный контекст» .
- Veo: Прямой конкурент Sora от OpenAI. Модель генерирует видео высокого качества по текстовому описанию . По мнению автора канала, Veo выглядит не хуже решений от Runway или Pika, хотя Sora все еще кажется более продвинутой .
- PaliGemma: Свободно распространяемая (open weights) визуально-языковая модель. Она идеально подходит для аннотирования изображений и ответов на вопросы по картинкам .
Последнее имеет огромный потенциал для систем безопасности и медицины. Например, ИИ может в реальном времени анализировать записи с камер в больницах, фиксируя время прихода медсестры или подавая сигнал тревоги, если пациенту стало плохо .
💼 ИИ-агенты: конец колл-центров и новая экономика 7:59
Одним из самых практичных применений ИИ стали автономные агенты для бизнеса. Уэс Рот цитирует кейс компании Klarna, чей ИИ-ассистент уже выполняет работу 700 сотрудников службы поддержки . По словам представителей бизнеса, клиенты зачастую предпочитают общаться с ИИ, так как он быстрее, качественнее и доступен 24/7 .
Google также интегрирует агентов во всю свою экосистему:
- Работа с почтой: Агент может автоматически собирать все чеки из входящих писем и структурировать их в таблицу Google Sheets, обновляя финансовую отчетность в реальном времени .
- Возврат покупок: Одной фотографии обуви и команды «верни это» достаточно, чтобы Gemini сам написал в техподдержку и оформил возврат .
- Автономный серфинг: Gemini теперь может нативно использовать браузер Chrome как инструмент для многоэтапных задач, вроде планирования сложной поездки .
🛠️ Будущее — это управление «фабрикой агентов» 23:41
В мире, где Android занимает 71% рынка мобильных ОС , интеграция ИИ-агентов от Google может стать повсеместной. Однако Уэс Рот подчеркивает, что истинная сила будет не в использовании стандартных функций, а в умении создавать собственных агентов под конкретные нужды .
Автор приводит интересную аналогию: управление бизнесом в будущем станет похожим на игру Factorio, где игрок строит сложную фабрику и оптимизирует связи между ее частями . В бизнесе такими деталями станут автономные ИИ-агенты, настроенные на выполнение узких задач.
Для обучения этим навыкам уже появляются новые курсы. Например, Эндрю Ын (Andrew Ng), один из самых авторитетных исследователей машинного обучения, совместно с разработчиками CrewAI запустил бесплатный курс по созданию мультиагентных систем . Это подчеркивает тренд: индустрия уходит от простых чат-ботов к сложным системам, где несколько ИИ взаимодействуют друг с другом для достижения цели .