Презентация Rabbit R1 стала одним из самых обсуждаемых технологических событий года. Основатель и генеральный директор стартапа Rabbit, Джесси Лю (Jesse Lyu), провел «живую» демонстрацию устройства, чтобы показать возможности гаджета, который позиционируется как первый в мире «ИИ-нативный» карманный компьютер, способный заменить привычные интерфейсы смартфонов.
📱 Дизайн и интерфейс Rabbit R1 0:00
Джесси Лю начал презентацию с демонстрации физического устройства, подчеркнув, что реальный цвет Rabbit R1 превосходит ожидания, которые могли сложиться по видео в Discord . Одной из ключевых особенностей гаджета является его необычная система управления, сочетающая современный ИИ и аналоговые элементы.
Технические и дизайнерские решения:
- Колесо прокрутки и настройки: Для входа в меню настроек достаточно дважды встряхнуть устройство. Управление осуществляется с помощью аналогового колеса, которое имеет приятное сопротивление и тактильный отклик (щелчок) .
- Связь: Устройство поддерживает как Wi-Fi, так и 4G LTE, что делает его полностью автономным от смартфона .
- Голосовая интеграция: Rabbit R1 использует технологию стартапа 11 Labs для создания естественного голоса «кролика» .
- Терминальный режим: По запросу сообщества был добавлен режим клавиатуры. При повороте устройства в горизонтальное положение появляется виртуальная клавиатура .
Интересной деталью является чехол устройства, который одновременно служит подставкой, превращая R1 в миниатюрный «сайбердек» на рабочем столе . По словам Джесси Лю, он часто использует R1 вместе с портативной Bluetooth-клавиатурой как выделенное ИИ-устройство, которое не отвлекает его от основного монитора .
🧠 От понимания языка (LLM) к пониманию действий (LAM) 18:01
Центральным элементом Rabbit R1 является не просто языковая модель, а Large Action Model (LAM) — модель больших действий. Джесси Лю настаивает, что в отличие от обычных чат-ботов, LAM способна напрямую взаимодействовать с интерфейсами приложений .
Ключевой функционал LAM на сегодняшний день:
- Музыка: Прямое управление Spotify. Синхронизация происходит мгновенно: если запустить музыку на R1, она отобразится в приложении на компьютере или в системе CarPlay, и наоборот .
- Заказ еды: Интеграция с DoorDash позволяет заказывать конкретные блюда (например, из McDonald’s) голосом . Лю признает, что скорость загрузки меню в DoorDash пока не идеальна из-за тяжелого интерфейса самого сервиса, но подчеркивает, что система работает без использования API или SDK .
- Такси: Заказ поездок через Uber. Устройство запрашивает четырехзначный PIN-код для подтверждения оплаты, обеспечивая безопасность финансовых транзакций .
- Генерация изображений: В R1 интегрирована модель Mid Journey. Пользователь может отправить промпт голосом, и ИИ через Discord-интерфейс сгенерирует изображение, которое будет выведено на экран гаджета .
Джесси Лю опроверг слухи о «утечке исходного кода», пояснив, что компания намеренно открыла часть интерфейса Rabbit Hole (облачного хаба) заранее, тогда как сама модель LAM находится на защищенных серверах компании .
👁️ Видение и продвинутая обработка данных 3:22
Функция AI Vision превращает камеру устройства в своего рода «Покедекс» (Pokedex) из реальной жизни . Камера способна не только распознавать объекты, но и анализировать сложные данные.
Примеры работы камеры:
- Распознавание окружения: R1 может мгновенно (менее чем за 2 секунды) подсчитать количество людей в толпе или описать происходящее перед ним мероприятие .
- Работа с таблицами: Джесси продемонстрировал уникальный кейс: он направил камеру на рукописную таблицу, попросил транскрибировать её, поменять местами столбцы и отправить результат на почту в формате Excel (.csv). Устройство выполнило задачу за несколько секунд .
Кроме того, была представлена функция двустороннего перевода . В отличие от классических переводчиков, R1 автоматически определяет язык и позволяет вести свободный диалог без необходимости переключать направление перевода вручную .
🎤 Заметки и Rabbit Hole 12:56
Все взаимодействия с устройством синхронизируются в Rabbit Hole — персональном облачном портале пользователя.
- Голосовые заметки: Быстрые напоминания сохраняются и мгновенно становятся доступными для редактирования в вебе. Кнопка «Сохранить» отсутствует, так как изменения синхронизируются в реальном времени .
- ИИ-диктофон: R1 может записывать длинные встречи и автоматически генерировать их краткое резюме (саммари) . По мнению Лю, это заменяет специализированные гаджеты-диктофоны, которые часто стоят столько же, сколько сам R1 ($199), но требуют подписки .
- Конфиденциальность: Джесси подчеркнул, что Rabbit OS позволяет скачивать несжатые аудиофайлы для личного использования (например, для создания сэмплов в музыке или в качестве доказательств) .
🚀 Будущее: Режим обучения и LAM 1.5 32:13
Самая амбициозная часть проекта — Teach Mode (Режим обучения). Это система, в которой пользователь может «научить» ИИ выполнять новые действия, просто показав их на экране компьютера .
Планы по развитию Teach Mode:
- Закрытая альфа: Сначала доступ получат избранные пользователи для тестирования безопасности .
- Белый список: Обучение будет разрешено только на проверенных, безопасных сервисах, чтобы избежать создания вредоносного ПО (малвари) . Полный запуск планируется до конца 2024 года.
Джесси Лю также анонсировал LAM 1.5. По его утверждению, новая версия модели научится переходить от цифровых интерфейсов к физическим . Идея заключается в том, чтобы с помощью компьютерного зрения идентифицировать аналоговый объект (например, термостат Nest) и через соответствующее приложение (Google Home) управлять им . Таким образом, ИИ свяжет видимый физический мир с цифровым управлением.
В долгосрочной перспективе Rabbit планирует внедрить Generative UI — динамический пользовательский интерфейс, который будет создаваться «на лету» под конкретную задачу пользователя, вместо фиксированных кнопок мобильных приложений . Также Rabbit Hole эволюционирует в полноценную десктопную операционную систему для решения серьезных задач, таких как анализ юридических документов или написание кода .