Уэс Рот о Sesame: «Лучшая модель для передачи эмоций в голосе»

Wes Roth 69,8 тыс. 32 мин 2 мин 04.03.2025
Главное

Голос ИИ становится пугающе реалистичным: обзор возможностей Sesame 0:00

Технологии голосового ИИ совершили качественный скачок, демонстрируя беспрецедентный уровень выразительности, передачи эмоций и контекстуальной адаптации. В недавнем обзоре Уэс Рот протестировал возможности новой разговорной системы под названием Sesame, которая способна на сложные импровизации, имитацию ролевых сценариев и тонкую работу с интонациями.

🎭 Искусство импровизации и ролевых игр 8:28

Одной из самых примечательных особенностей модели является её способность поддерживать сложные повествовательные игры, сохраняя контекст и характер персонажа.

По словам Уэса Рота, ИИ отлично понимает социальные конструкции и способен играть с абсурдными ситуациями, будь то интервью с «экспертом по призракам» или обсуждение «парциальных искусств» вместо боевых,.

🎙️ Технические возможности: паралингвистика и выразительность 30:39

Sesame выделяется на фоне других систем благодаря глубокой проработке того, что разработчики называют паралингвистикой — передачей смысла через нюансы голоса.

⚠️ Этика и границы дозволенного 3:52

Дискуссия также затронула вопросы безопасности. В ходе тестов выяснилось, что модель способна генерировать опасный или неэтичный контент, если пользователь целенаправленно пытается вывести её на провокацию. Однако, по наблюдению Рота, Sesame имеет внутренние фильтры: при попытке пользователя получить «самый неуместный анекдот», ИИ вежливо отказался, подчеркнув, что он спроектирован как полезный и безопасный инструмент.

Уэс Рот подтвердил, что модель уже подвергалась попыткам «джейлбрейка» (снятия ограничений), и хотя результаты подобных манипуляций существуют в сети, он счел их демонстрацию на своем канале неуместной.

🚀 Доступность технологии 31:59

На текущий момент разработчики Sesame планируют выпустить часть моделей под лицензией Apache. Это открывает перспективы для использования технологии сообществом разработчиков с открытым исходным кодом. Сейчас проект доступен для ознакомления через демонстрационную версию, которую Рот называет «лучшим, что есть на рынке» в плане передачи голосовых нюансов.

💬 Цитаты

«Голоса ИИ становятся слишком реальными.»

Уэс Рот 0:00

«Настоящая магия не в словах, а в интонациях.»

👥 Спикер
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Паралингвистика
Раздел языкознания, изучающий невербальные средства передачи смысла, такие как тембр, интонация и паузы.
Джейлбрейк (Jailbreak)
Процесс снятия ограничений, установленных разработчиками ИИ, для получения запрещенных ответов.
Sesame
Конверсионный ИИ-помощник с высокой адаптивностью к контексту и эмоциям.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Sesame Уэс Рот голосовой ИИ паралингвистика LLM