Дэн Кокотов о будущем ИИ: «Программирование людей сложнее, чем написание кода»

Lex Fridman 74,6 тыс. 1 ч 28 мин 3 мин 04.01.2021
Главное

Дэн Кокотов: Будущее распознавания речи, ИИ и «уроки» в управлении командами

0:00

Дэн Кокотов, вице-президент по инженерии в Rev.ai, присоединился к Лексу Фридману, чтобы обсудить тонкости создания систем автоматического распознавания речи (ASR), философию управления технологическими командами и роль человеческого творчества в мире алгоритмов. В беседе, охватывающей темы от классической научной фантастики до будущего журналистики и открытых коммуникаций, собеседники исследуют, как технологии могут сделать общение между людьми более доступным и глубоким.

🧠 Технологии и «магия» создания продукта 1:18

Лекс Фридман отмечает, что в его работе существует набор инструментов, которые радикально упрощают жизнь, превращая рутину в «радость». В их число входят:

Rev.ai, по словам Фридмана, занял место в этом списке, предоставив бесшовное решение для транскрипции. Дэн Кокотов поясняет, что изначальный замысел компании заключался в улучшении модели рынка фриланса, подобной Upwork.

Кокотов подчеркивает, что их основной фокус — это специализация на языковых услугах, таких как транскрипция аудио и перевод, где задачу можно четко определить и стандартизировать, в отличие от разработки программного обеспечения.

📊 Мир ASR: Где заканчивается ИИ и начинается человек? 28:23

Автоматическое распознавание речи (ASR) — это сложная задача машинного обучения, требующая адаптации под конкретный домен. Кокотов проводит границу между такими системами, как Siri, где ограниченный словарь, и задачами Rev, работающими с неструктурированной речью.

Основные показатели и вызовы:

Кокотов отмечает, что компания изучает способы извлечения сигналов из того, как именно люди правят автоматические транскрипты, что может дать больше информации, чем просто финальный текст.

👥 Управление людьми и «менеджмент по исключению»

Переход от индивидуального программиста к управленцу стал для Кокотова испытанием. Он отмечает разницу в получении дофаминового отклика: у инженера — от кода, у менеджера — от успеха команды.

Философия управления в Rev опирается на принцип «менеджмента по исключению»:

В качестве ключевого источника мудрости по теме лидерства Кокотов рекомендует книгу «Сначала нарушьте все правила» (First, Break All the Rules).

📚 Культурный контекст и философия 3:28

Разговор неоднократно возвращался к философским вопросам и литературе.

💬 Цитаты

«Для нас это не «гиг-экономика». Это улучшение условий работы из дома на своих условиях.»

Дэн Кокотов 21:22

«Границы моего языка означают границы моего мира.»

Людвиг Витгенштейн (цитирует Лекс Фридман) 1:28:23
👥 Спикеры
📚 Упомянутые книги
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
ASR
Automatic Speech Recognition — технологии автоматического распознавания речи и перевода её в текст.
Word Error Rate (WER)
Метрика точности систем распознавания речи, рассчитывающая процент неправильно распознанных слов.
Flywheel
Бизнес-модель, в которой каждый успех (или действие пользователя) создает данные, улучшающие продукт для следующего шага.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Dan Kokotov Rev.ai ASR Lex Fridman Machine Learning