В новом выпуске своего канала Уэс Рот (Wes Roth) анализирует стремительное ускорение «гонки вооружений» в сфере ИИ. Главными темами недели стали новые инструменты OpenAI для разработчиков, появление мощного конкурента в лице стартапа Reka, концепция ИИ-агентов с визуальным интерфейсом и обострение юридических споров вокруг авторских прав на данные для обучения моделей.
📉 OpenAI Batch API: Экономия и переход к асинхронным задачам 0:00
OpenAI представила Batch API — новый инструмент, позволяющий разработчикам выполнять задачи асинхронно с задержкой до 24 часов, но за половину стоимости стандартного API . Уэс Рот отмечает, что до сих пор взаимодействие с чат-ботами было преимущественно мгновенным, однако индустрия движется в сторону «агентурных рабочих процессов» (agentic workflows) .
По мнению ведущего, полноценные автономные ИИ-агенты будут выполнять поручения часами или даже днями, подобно реальным сотрудникам . В таком контексте моментальный ответ не требуется, что позволяет OpenAI оптимизировать нагрузку на сервера и предлагать более низкие цены .
🤖 Tascade и визуальное управление ИИ-агентами 1:20
На рынке ИИ-агентов появился новый заметный игрок — платформа Tascade, запустившая бета-тестирование мульти-агентных систем . Особенность сервиса заключается в визуальном интерфейсе (drag-and-drop), который позволяет связывать различных агентов в цепочки событий, аналогично сервису Zapier .
Пример рабочего процесса в Tascade:
- Триггер: добавление заголовка статьи в список.
- Действие 1: агент-исследователь проводит поиск ключевых слов.
- Действие 2: агент-райтер пишет текст статьи.
- Действие 3: автоматическая публикация готового материала на WordPress .
Уэс Рот признает, что такие инструменты могут породить волну спама и низкокачественного контента, из-за чего ценность автоматизированных статей в глазах пользователей упадет . Однако он видит огромный потенциал в использовании ИИ-агентов в качестве персональных фильтров . Вместо того чтобы полагаться на алгоритмы YouTube или X (Twitter), пользователь сможет создать собственного агента, который будет сканировать новости и присылать только самое важное напрямую в мессенджер .
По прогнозу Рота, тот, кто создаст лучший интерфейс для таких задач, «выиграет по-крупному» . Он утверждает, что готов платить $100 в месяц за персонального агента, который автоматизирует его повседневную рутину, и считает это выгодной сделкой .
🚀 Reka: Новый гигант из 20 человек 7:17
Стартап Reka представил серию мультимодальных моделей Reka Core, Flash и Edge, обученных «с нуля» . Согласно тестам компании, их флагманская модель Core приближается по показателям к GPT-4 Vision, а в ответах на вопросы по видео даже превосходит Gemini Ultra .
Reka Core обладает следующими характеристиками:
- Мультимодальность: принимает текст, изображения, видео и аудио .
- Функциональность: поддерживает вызовы функций (function calling), поиск в вебе и исполнение кода .
- Контекстное окно: 128 000 токенов в полной версии .
Уэс Рот обращает внимание на эффективность команды: модель уровня GPT-4 была создана коллективом всего из 20 человек . Один из основателей Reka, И-Тай (Yi Tay), ранее работавший в Google Brain, отметил, что команда сожгла тысячи графических процессоров NVIDIA H100 за последние месяцы, чтобы достичь этого результата . Ведущий видит в этом подтверждение слов Сэма Альтмана о возможности появления в будущем «компании из одного человека с капитализацией в миллиард долларов» .
🦾 Робототехника: Обучение в симуляции со скоростью 10 000x 11:25
В видео обсуждается прорыв в обучении роботов, достигнутый исследователями из ETH Zurich с использованием технологий NVIDIA . Робот на колесах, напоминающий гибрид гуманоида и автомобиля, обучался в виртуальной среде Isaac Gym, где физические процессы (гравитация, трение, инерция) могут быть ускорены в 10 000 раз .
Ключевые достижения этого метода:
- Робот самостоятельно научился координировать сложные движения конечностей и колес .
- Он успешно переносит навыки из симуляции в реальный мир .
- Система способна открывать двери и манипулировать объектами (коробками) с высокой точностью .
Уэс протестировал модель Reka Core на видео с этим роботом. ИИ смог распознать логотипы на стенах и одежде, а также в целом верно описал суть происходящего, хотя и допустил ошибки в деталях (например, принял робота за человека, толкающего коробку) .
🌏 Экспансия OpenAI в Японию 21:20
OpenAI объявила об открытии своего первого азиатского офиса в Токио и выпуске специальной модели GPT-4, оптимизированной для японского языка .
Уэс Рот полагает, что Япония является стратегически важным регионом из-за своей «дружелюбности к ИИ» на законодательном уровне . В то время как в ЕС и США усиливается регулирование и множатся иски, Япония может стать своего рода «тихой гаванью» для исследований, где вопросы использования данных для обучения трактуются менее жестко .
⚖️ Битва за копирайт: Закон Адама Шиффа и «Регуляторный захват» 24:12
В завершение Уэс Рот обсуждает инициативу конгрессмена Адама Шиффа, предложившего законопроект «О раскрытии авторских прав в генеративном ИИ» . Документ обязывает разработчиков ИИ подавать в федеральный реестр полные списки всех защищенных авторским правом данных, использованных для обучения моделей .
В статье приводится мнение Дэвида Сакса (David Sacks) из подкаста All-In, который критикует этот закон :
- Сакс считает, что Шифф действует в интересах крупных голливудских студий и музыкальных лейблов .
- По мнению Сакса, крупные технологические компании могут поддержать такие правила, так как они способны их выполнить, в отличие от мелких стартапов. Это явление называется «регуляторным захватом» (regulatory capture), когда правила используются для подавления конкуренции .
- Сакс утверждает, что вопрос использования данных должен решаться судами в рамках доктрины «добросовестного использования» (fair use), а не преждевременными законами .
Также упоминается расследование The Verge, согласно которому OpenAI использовала более миллиона часов транскриптов видео с YouTube для обучения GPT-4 . По мнению Сакса, если Google (владелец YouTube) не подает в суд на OpenAI, то претензии мелких правообладателей вряд ли будут иметь успех .