Будущее робототехники: от «Dr Eureka» до ухода топ-менеджеров OpenAI 0:00
Технологический ландшафт стремительно меняется: роботы обучаются сложным навыкам в виртуальной среде и переносят их в реальность, а в высшем руководстве OpenAI происходят значительные кадровые перестановки. Ведущий Уэс Рот в своем обзоре анализирует последние достижения в области «embodied AI» (воплощенного ИИ), перспективы мультитокенового предсказания для LLM и дискуссионную эффективность ИИ-агентов, таких как Devin.
🤖 Роботы и обучение в симуляции: «Dr Eureka» 0:00
Робототехника переживает этап бурного развития, переходя от узкоспециализированных задач к универсальному обучению. Основатель Figure AI Бретт Адкок подчеркивает, что комбинация роботов и ИИ является следующим «великим рубежом».
- Dr Eureka: Это новый ИИ-агент, который автоматизирует процесс обучения роботов в симуляции и перенос навыков в реальный мир («sim-to-real»). По мнению Уэса Рота, этот процесс устраняет необходимость в ручной настройке параметров доменной рандомизации, что ранее было крайне трудоемким процессом для специалистов.
- Механизм работы: Система использует GPT-4 для написания кода, который определяет функции вознаграждения (reward functions) для роботов. Роботизированные руки в симуляции вроде NVIDIA Isaac Gym выполняют задачи в 10 000 раз быстрее реального времени, постоянно улучшая свои показатели через итерации.
- Результаты: В сложных задачах, таких как вращение ручки или балансировка на шаре, предложенные ИИ решения зачастую оказываются эффективнее и «новее» тех, что могут придумать люди.
📉 Кадровые изменения в OpenAI 11:58
В структуре OpenAI произошли заметные изменения: компанию покинули два высокопоставленных руководителя.
- Ушедшие сотрудники: Вице-президент по персоналу Дайан Юн и глава направления некоммерческих и стратегических инициатив Крис Кларк покинули свои посты.
- Контекст: Оба специалиста были одними из самых долгоживущих менеджеров в компании, чья капитализация недавно достигла $86 млрд. По мнению Уэса Рота, подобные уходы из компании с такой оценкой вызывают вопросы, однако он рекомендует следить за материалами издания The Information для понимания внутренних причин.
🧠 Будущее больших языковых моделей и авторское право 13:05
Дискуссии о правомерности использования данных для обучения ИИ остаются в центре юридической повестки.
- Авторское право: Существует фундаментальный спор о том, является ли процесс «чтения» данных моделью (обучение) нарушением авторских прав или же нарушение возникает только при создании воспроизводящих копий.
- Мультитокеновое предсказание: Новое исследование авторов проекта «Glockley» предлагает обучать модели предсказывать сразу несколько будущих токенов вместо одного. По утверждению исследователей, это повышает эффективность обучения и ускоряет инференс (генерацию ответов) до 3 раз. Модели, обученные таким образом, демонстрируют лучшие результаты в задачах по написанию кода и алгоритмическому мышлению.
💻 ИИ-агенты: Devin 2.0 и споры о функциональности 20:52
Вокруг ИИ-агентов, в частности Devin, сформировалось два лагеря: одни считают их «бесполезной вещью», другие — угрозой для рынка труда.
- Реальность: Уэс Рот полагает, что истина находится посередине: Devin выполняет сложные задачи, такие как создание сайтов или расширений для Chrome, но все еще сталкивается с ошибками.
- Пример использования: Эндрю Гал показал, как Devin строит веб-приложение для игры в шахматы и визуализации данных по Антарктиде, демонстрируя способность к долгосрочному планированию и автономной отладке кода. Автор отмечает, что скептицизм в отношении подобных инструментов преждевременен, так как технология все еще находится на стадии пре-релиза.
👓 Носимые устройства: Frame 25:58
В завершение обзора было представлено устройство Frame от компании Brilliant Labs — открытые ИИ-очки.
- Функциональность: Встроенный ИИ-ассистент «Noah» может «видеть» через камеры очков, анализировать окружение пользователя и генерировать изображения.
- Перспективы: Несмотря на скепсис в отношении носимых устройств, Уэс Рот считает, что подобные инструменты могут стать частью повседневной жизни, обеспечивая пользователям мгновенную помощь, от подбора одежды до поиска нужной информации.