# Rabbit R1 в деталях: «Живая» презентация ИИ-переводчика и режима обучения от Джесси Лю

Источник: https://www.youtube.com/watch?v=iRkubxdrE8Q
Канал: Wes Roth
Опубликовано: 24.04.2024

---

Презентация Rabbit R1 стала одним из самых обсуждаемых технологических событий года. Основатель и генеральный директор стартапа Rabbit, Джесси Лю (Jesse Lyu), провел «живую» демонстрацию устройства, чтобы показать возможности гаджета, который позиционируется как первый в мире «ИИ-нативный» карманный компьютер, способный заменить привычные интерфейсы смартфонов.

## 📱 Дизайн и интерфейс Rabbit R1
[[JUMP:0:00]]

Джесси Лю начал презентацию с демонстрации физического устройства, подчеркнув, что реальный цвет Rabbit R1 превосходит ожидания, которые могли сложиться по видео в Discord [0:13]. Одной из ключевых особенностей гаджета является его необычная система управления, сочетающая современный ИИ и аналоговые элементы.

**Технические и дизайнерские решения:**

*   **Колесо прокрутки и настройки:** Для входа в меню настроек достаточно дважды встряхнуть устройство. Управление осуществляется с помощью аналогового колеса, которое имеет приятное сопротивление и тактильный отклик (щелчок) [0:40].
*   **Связь:** Устройство поддерживает как Wi-Fi, так и 4G LTE, что делает его полностью автономным от смартфона [0:53].
*   **Голосовая интеграция:** Rabbit R1 использует технологию стартапа 11 Labs для создания естественного голоса «кролика» [3:07].
*   **Терминальный режим:** По запросу сообщества был добавлен режим клавиатуры. При повороте устройства в горизонтальное положение появляется виртуальная клавиатура [6:50]. 
    *   Клавиатура по размеру не уступает клавиатурам iPhone и даже приближается к модели Pro Max [8:20].
    *   Колесо прокрутки в этом режиме используется для точного перемещения курсора по тексту [7:54].

Интересной деталью является чехол устройства, который одновременно служит подставкой, превращая R1 в миниатюрный «сайбердек» на рабочем столе [9:12]. По словам Джесси Лю, он часто использует R1 вместе с портативной Bluetooth-клавиатурой как выделенное ИИ-устройство, которое не отвлекает его от основного монитора [9:41].

## 🧠 От понимания языка (LLM) к пониманию действий (LAM)
[[JUMP:18:01]]

Центральным элементом Rabbit R1 является не просто языковая модель, а Large Action Model (LAM) — модель больших действий. Джесси Лю настаивает, что в отличие от обычных чат-ботов, LAM способна напрямую взаимодействовать с интерфейсами приложений [25:33].

**Ключевой функционал LAM на сегодняшний день:**

1.  **Музыка:** Прямое управление Spotify. Синхронизация происходит мгновенно: если запустить музыку на R1, она отобразится в приложении на компьютере или в системе CarPlay, и наоборот [19:35].
2.  **Заказ еды:** Интеграция с DoorDash позволяет заказывать конкретные блюда (например, из McDonald’s) голосом [21:08]. Лю признает, что скорость загрузки меню в DoorDash пока не идеальна из-за тяжелого интерфейса самого сервиса, но подчеркивает, что система работает без использования API или SDK [21:36].
3.  **Такси:** Заказ поездок через Uber. Устройство запрашивает четырехзначный PIN-код для подтверждения оплаты, обеспечивая безопасность финансовых транзакций [26:13].
4.  **Генерация изображений:** В R1 интегрирована модель Mid Journey. Пользователь может отправить промпт голосом, и ИИ через Discord-интерфейс сгенерирует изображение, которое будет выведено на экран гаджета [28:01].

Джесси Лю опроверг слухи о «утечке исходного кода», пояснив, что компания намеренно открыла часть интерфейса Rabbit Hole (облачного хаба) заранее, тогда как сама модель LAM находится на защищенных серверах компании [18:26].

## 👁️ Видение и продвинутая обработка данных
[[JUMP:3:22]]

Функция AI Vision превращает камеру устройства в своего рода «Покедекс» (Pokedex) из реальной жизни [3:22]. Камера способна не только распознавать объекты, но и анализировать сложные данные.

**Примеры работы камеры:**

*   **Распознавание окружения:** R1 может мгновенно (менее чем за 2 секунды) подсчитать количество людей в толпе или описать происходящее перед ним мероприятие [4:16].
*   **Работа с таблицами:** Джесси продемонстрировал уникальный кейс: он направил камеру на рукописную таблицу, попросил транскрибировать её, поменять местами столбцы и отправить результат на почту в формате Excel (.csv). Устройство выполнило задачу за несколько секунд [5:19].

Кроме того, была представлена функция **двустороннего перевода** [10:20]. В отличие от классических переводчиков, R1 автоматически определяет язык и позволяет вести свободный диалог без необходимости переключать направление перевода вручную [11:12].

## 🎤 Заметки и Rabbit Hole
[[JUMP:12:56]]

Все взаимодействия с устройством синхронизируются в Rabbit Hole — персональном облачном портале пользователя.

*   **Голосовые заметки:** Быстрые напоминания сохраняются и мгновенно становятся доступными для редактирования в вебе. Кнопка «Сохранить» отсутствует, так как изменения синхронизируются в реальном времени [13:50].
*   **ИИ-диктофон:** R1 может записывать длинные встречи и автоматически генерировать их краткое резюме (саммари) [15:23]. По мнению Лю, это заменяет специализированные гаджеты-диктофоны, которые часто стоят столько же, сколько сам R1 ($199), но требуют подписки [14:43].
*   **Конфиденциальность:** Джесси подчеркнул, что Rabbit OS позволяет скачивать несжатые аудиофайлы для личного использования (например, для создания сэмплов в музыке или в качестве доказательств) [16:54].

## 🚀 Будущее: Режим обучения и LAM 1.5
[[JUMP:32:13]]

Самая амбициозная часть проекта — **Teach Mode (Режим обучения)**. Это система, в которой пользователь может «научить» ИИ выполнять новые действия, просто показав их на экране компьютера [33:58].

**Планы по развитию Teach Mode:**

1.  **Закрытая альфа:** Сначала доступ получат избранные пользователи для тестирования безопасности [37:41].
2.  **Белый список:** Обучение будет разрешено только на проверенных, безопасных сервисах, чтобы избежать создания вредоносного ПО (малвари) [38:06]. Полный запуск планируется до конца 2024 года.

Джесси Лю также анонсировал **LAM 1.5**. По его утверждению, новая версия модели научится переходить от цифровых интерфейсов к физическим [39:22]. Идея заключается в том, чтобы с помощью компьютерного зрения идентифицировать аналоговый объект (например, термостат Nest) и через соответствующее приложение (Google Home) управлять им [40:55]. Таким образом, ИИ свяжет видимый физический мир с цифровым управлением.

В долгосрочной перспективе Rabbit планирует внедрить **Generative UI** — динамический пользовательский интерфейс, который будет создаваться «на лету» под конкретную задачу пользователя, вместо фиксированных кнопок мобильных приложений [43:34]. Также Rabbit Hole эволюционирует в полноценную десктопную операционную систему для решения серьезных задач, таких как анализ юридических документов или написание кода [45:20].