# ИИ-агенты, триумф Reka и закон Адама Шиффа: главные новости индустрии

Источник: https://www.youtube.com/watch?v=3OmLyV9ALBg
Канал: Wes Roth
Опубликовано: 15.04.2024

---

В новом выпуске своего канала Уэс Рот (Wes Roth) анализирует стремительное ускорение «гонки вооружений» в сфере ИИ. Главными темами недели стали новые инструменты OpenAI для разработчиков, появление мощного конкурента в лице стартапа Reka, концепция ИИ-агентов с визуальным интерфейсом и обострение юридических споров вокруг авторских прав на данные для обучения моделей.

## 📉 OpenAI Batch API: Экономия и переход к асинхронным задачам
[[JUMP:0:00]]

OpenAI представила Batch API — новый инструмент, позволяющий разработчикам выполнять задачи асинхронно с задержкой до 24 часов, но за половину стоимости стандартного API [0:00]. Уэс Рот отмечает, что до сих пор взаимодействие с чат-ботами было преимущественно мгновенным, однако индустрия движется в сторону «агентурных рабочих процессов» (agentic workflows) [0:28].

По мнению ведущего, полноценные автономные ИИ-агенты будут выполнять поручения часами или даже днями, подобно реальным сотрудникам [0:42]. В таком контексте моментальный ответ не требуется, что позволяет OpenAI оптимизировать нагрузку на сервера и предлагать более низкие цены [1:07].

## 🤖 Tascade и визуальное управление ИИ-агентами
[[JUMP:1:20]]

На рынке ИИ-агентов появился новый заметный игрок — платформа Tascade, запустившая бета-тестирование мульти-агентных систем [1:20]. Особенность сервиса заключается в визуальном интерфейсе (drag-and-drop), который позволяет связывать различных агентов в цепочки событий, аналогично сервису Zapier [2:00].

Пример рабочего процесса в Tascade:

*   Триггер: добавление заголовка статьи в список.
*   Действие 1: агент-исследователь проводит поиск ключевых слов.
*   Действие 2: агент-райтер пишет текст статьи.
*   Действие 3: автоматическая публикация готового материала на WordPress [2:38].

Уэс Рот признает, что такие инструменты могут породить волну спама и низкокачественного контента, из-за чего ценность автоматизированных статей в глазах пользователей упадет [3:18]. Однако он видит огромный потенциал в использовании ИИ-агентов в качестве персональных фильтров [4:12]. Вместо того чтобы полагаться на алгоритмы YouTube или X (Twitter), пользователь сможет создать собственного агента, который будет сканировать новости и присылать только самое важное напрямую в мессенджер [4:52].

По прогнозу Рота, тот, кто создаст лучший интерфейс для таких задач, «выиграет по-крупному» [5:59]. Он утверждает, что готов платить $100 в месяц за персонального агента, который автоматизирует его повседневную рутину, и считает это выгодной сделкой [6:39].

## 🚀 Reka: Новый гигант из 20 человек
[[JUMP:7:17]]

Стартап Reka представил серию мультимодальных моделей Reka Core, Flash и Edge, обученных «с нуля» [7:17]. Согласно тестам компании, их флагманская модель Core приближается по показателям к GPT-4 Vision, а в ответах на вопросы по видео даже превосходит Gemini Ultra [8:23].

Reka Core обладает следующими характеристиками:

*   Мультимодальность: принимает текст, изображения, видео и аудио [8:35].
*   Функциональность: поддерживает вызовы функций (function calling), поиск в вебе и исполнение кода [8:35].
*   Контекстное окно: 128 000 токенов в полной версии [19:35].

Уэс Рот обращает внимание на эффективность команды: модель уровня GPT-4 была создана коллективом всего из 20 человек [20:16]. Один из основателей Reka, И-Тай (Yi Tay), ранее работавший в Google Brain, отметил, что команда сожгла тысячи графических процессоров NVIDIA H100 за последние месяцы, чтобы достичь этого результата [20:16]. Ведущий видит в этом подтверждение слов Сэма Альтмана о возможности появления в будущем «компании из одного человека с капитализацией в миллиард долларов» [15:57].

## 🦾 Робототехника: Обучение в симуляции со скоростью 10 000x
[[JUMP:11:25]]

В видео обсуждается прорыв в обучении роботов, достигнутый исследователями из ETH Zurich с использованием технологий NVIDIA [12:03]. Робот на колесах, напоминающий гибрид гуманоида и автомобиля, обучался в виртуальной среде Isaac Gym, где физические процессы (гравитация, трение, инерция) могут быть ускорены в 10 000 раз [12:16].

Ключевые достижения этого метода:

*   Робот самостоятельно научился координировать сложные движения конечностей и колес [12:42].
*   Он успешно переносит навыки из симуляции в реальный мир [12:42].
*   Система способна открывать двери и манипулировать объектами (коробками) с высокой точностью [12:54].

Уэс протестировал модель Reka Core на видео с этим роботом. ИИ смог распознать логотипы на стенах и одежде, а также в целом верно описал суть происходящего, хотя и допустил ошибки в деталях (например, принял робота за человека, толкающего коробку) [15:01].

## 🌏 Экспансия OpenAI в Японию
[[JUMP:21:20]]

OpenAI объявила об открытии своего первого азиатского офиса в Токио и выпуске специальной модели GPT-4, оптимизированной для японского языка [21:20].

Уэс Рот полагает, что Япония является стратегически важным регионом из-за своей «дружелюбности к ИИ» на законодательном уровне [21:35]. В то время как в ЕС и США усиливается регулирование и множатся иски, Япония может стать своего рода «тихой гаванью» для исследований, где вопросы использования данных для обучения трактуются менее жестко [21:48].

## ⚖️ Битва за копирайт: Закон Адама Шиффа и «Регуляторный захват»
[[JUMP:24:12]]

В завершение Уэс Рот обсуждает инициативу конгрессмена Адама Шиффа, предложившего законопроект «О раскрытии авторских прав в генеративном ИИ» [24:12]. Документ обязывает разработчиков ИИ подавать в федеральный реестр полные списки всех защищенных авторским правом данных, использованных для обучения моделей [24:25].

В статье приводится мнение Дэвида Сакса (David Sacks) из подкаста All-In, который критикует этот закон [25:05]:

*   Сакс считает, что Шифф действует в интересах крупных голливудских студий и музыкальных лейблов [25:30].
*   По мнению Сакса, крупные технологические компании могут поддержать такие правила, так как они способны их выполнить, в отличие от мелких стартапов. Это явление называется «регуляторным захватом» (regulatory capture), когда правила используются для подавления конкуренции [25:57].
*   Сакс утверждает, что вопрос использования данных должен решаться судами в рамках доктрины «добросовестного использования» (fair use), а не преждевременными законами [24:52].

Также упоминается расследование The Verge, согласно которому OpenAI использовала более миллиона часов транскриптов видео с YouTube для обучения GPT-4 [26:10]. По мнению Сакса, если Google (владелец YouTube) не подает в суд на OpenAI, то претензии мелких правообладателей вряд ли будут иметь успех [26:23].