На конференции Amazon re:MARS 2019 известный эксперт в области искусственного интеллекта Эндрю Ын представил свое видение следующего этапа технологической революции. По его мнению, ИИ уже превратился в «новую электроэнергию», однако главный потенциал его роста сейчас лежит за пределами традиционной софтверной индустрии. Спикер подробно рассказал, как компаниям из реального сектора экономики находить эффективные сценарии применения ИИ и какие скрытые технологические тренды изменят мировой бизнес в ближайшие годы.
⚡ ИИ как новая электроэнергия: выход за рамки ИТ-сектора 0:00
Эндрю Ын уже четыре года сравнивает искусственный интеллект с электричеством, отмечая колоссальный прогресс и устойчивый импульс развития технологии. Согласно недавнему отчету AI Index, число рабочих мест в сфере глубокого обучения (deep learning) всего за два года увеличилось в 35 раз. Стремительно растет количество научных публикаций, расширяется исследовательское сообщество, а упоминания ИИ на звонках топ-менеджмента с инвесторами бьют рекорды.
При упоминании великих ИИ-компаний люди обычно думают о гигантах интернет-отрасли: Amazon, Google, Baidu, Facebook, Microsoft или Apple. Однако ключевой тезис выступления Эндрю Ына заключается в том, что сейчас пришло время делать ставку на внедрение ИИ вне софтверной индустрии — в компаниях, чей основной бизнес не связан с продажей программного обеспечения, поддержкой сайтов или мобильных приложений.
По оценкам консалтинговой компании McKinsey, к 2030 году ИИ создаст глобальную экономическую ценность в размере 13 триллионов долларов. По прогнозам аналитиков, большая часть этого прироста мирового ВВП придется на традиционные отрасли:
- Розничная торговля (retail)
- Транспорт и логистика
- Сельское хозяйство
Крупные и малые ИТ-компании уже прекрасно освоили эти технологии, но теперь технологическому сообществу необходимо перенести ИИ в остальную часть мировой экономики, которая по своим масштабам значительно превосходит софтверный рынок.
🛠️ Доступность ИИ: от суперкомпьютеров Google к проектам 12-летних детей 2:33
Долгое время главным двигателем ИИ оставались огромные массивы данных и вычислительные мощности. Эндрю Ын вспомнил времена, когда он руководил проектом Google Brain и строил инфраструктуру глубокого обучения для всей компании. Одним из первых их достижений стал знаменитый эксперимент «Google cat» («кошка Google»), в ходе которого нейросеть на базе 16 000 процессорных ядер (CPU) самостоятельно научилась распознавать кошек на видео из YouTube. Этот результат попал на главную страницу сайта The New York Times, хотя даже внутри Google получение такого количества компьютеров было огромной проблемой. Сегодня, как отмечает спикер, любой желающий может зайти в облако AWS, ввести номер кредитной карты и всего за 2000 долларов полностью воспроизвести тот же самый результат.
Однако доступность ИИ сегодня определяется не только «железом» и данными, но и развитием талантов, идей и доступных инструментов. Эндрю Ын поделился личным опытом: когда-то он обучал в Стэнфордском университете по 400 студентов в год, но после запуска его онлайн-курса по машинному обучению на платформе Coursera на него записалось более 2,5 миллионов человек. Университеты по всему миру расширяют ИТ-программы, а корпорации запускают внутреннее обучение для мотивированных сотрудников.
Взрывной рост наблюдается и в сфере научных идей. Спикер вспомнил, как 20 лет назад на Международной конференции по машинному обучению (ICML) публиковалось всего около 150 работ в год. Тогда он мог прийти домой и лично прочитать аннотацию абсолютно каждого доклада своей базы. Сегодня же, по данным Джеффа Дина, на сайте arXiv ежедневно публикуется более 100 статей по машинному обучению. Ни один человек физически не способен уследить за таким объемом информации.
Параллельно развиваются программные платформы, упрощающие применение алгоритмов. На выставке Maker Faire в Калифорнии Эндрю Ын встретил 12-летнего мальчика из Индии, который создал робота для фотографирования растений на поле и классификации их болезней с помощью машинного обучения. Спикер подчеркнул, что еще 5 лет назад аналогичный проект мог бы составить сильную главу докторской диссертации (PhD) в Стэнфорде. Благодаря открытому коду ИИ перестал быть прерогативой исключительно элитных технологических компаний и стал доступен каждому бизнесу.
📋 Как бизнесу найти правильные сценарии применения ИИ 6:24
Руководители компаний из не-софтверных отраслей часто жалуются, что не знают, с чего начать внедрение технологий, ведь готового универсального решения на рынке не существует. Эндрю Ын предложил три ключевые идеи для эффективного поиска сценариев внедрения технологий:
- Начинать с малых и быстрых проектов.
- Автоматизировать конкретные задачи, а не профессии целиком.
- Объединять технических специалистов с отраслевыми экспертами.
🔹 Начинайте с малого
Эндрю Ын убежден, что гораздо больше команд терпят неудачу из-за чрезмерно масштабных планов, нежели из-за слишком скромных проектов. Он привел пример из ранних дней Google Brain, когда внутри компании существовал сильный скептицизм по отношению к глубокому обучению. Первым внутренним клиентом команды Ына стала группа распознавания речи (Speech team). Это не был самый прибыльный или важный проект вроде веб-поиска или рекламы, но успешное повышение точности распознавания помогло завоевать доверие коллег.
Вторым клиентом стала команда Google Maps, где компьютерное зрение использовали для считывания номеров домов для геолокации. И только после этих двух успехов команда смогла начать конструктивный диалог с прибыльным подразделением Google Ads. Для любого традиционного бизнеса спикер рекомендует выбирать первый проект со сроком реализации от 3 до 6 месяцев, чтобы быстро получить результат и набрать импульс.
🔹 Автоматизируйте задачи, а не рабочие места полностью
В обществе активно обсуждается угроза массового увольнения людей из-за ИИ, и Эндрю Ын считает эту дискуссию важной. Однако для брейншторминга бизнес-кейсов он предлагает другой подход: разделять комплексную профессию на отдельные задачи и искать те, что поддаются автоматизации.
В качестве примера он привел врача-рентгенолога. Рентгенолог выполняет множество функций:
- Анализирует рентгеновские снимки
- Консультирует пациентов
- Планирует хирургические операции
- Обучает и менторит молодых врачей
Из всех этих задач именно чтение снимков идеально подходит для автоматизации с помощью ИИ, над чем сейчас и работают многие команды, включая команду самого спикера.
🔹 Объединяйте ИИ и отраслевую экспертизу
Эффективные проекты лежат на пересечении технических возможностей ИИ и реальной ценности для бизнеса. Проблема заключается в том, что специалисты по ИИ знают только техническую сторону, а отраслевые эксперты — специфику бизнеса. Эндрю Ын рекомендует создавать кросс-функциональные команды.
По его методике, команда должна устроить брейншторм и детально разобрать как минимум шесть потенциальных проектов, оценив их реализуемость и коммерческую выгоду, и только после этого выбрать один или два для инвестиций. Спикер добавил полезный совет: как показывает практика, самый первый проект, предложенный генеральным директором (CEO), чаще всего оказывается неподходящим для инвестиций.
🏭 «Племенное знание» против хаоса: опыт китайской фабрики 11:03
Специалисты из ИТ-индустрии часто забывают, в какой степени традиционный бизнес держится на интуиции, личном опыте и неформальных знаниях сотрудников. Эндрю Ын рассказал историю о своем визите на удаленный завод в Китае. В этом городе не было снега более 10 лет. Когда в последний раз выпал снег, пластиковые детали на конвейере начали плавиться и деформироваться из-за экстремального холода.
На вопрос спикера, что руководство будет делать, если снегопад повторится, ему ответили, что на заводе до сих пор работают трое рабочих, заставших то событие. В случае нового снегопада менеджмент просто сделает то, что скажут эти ветераны, ведь они знают процесс лучше всех. Внедрение машинного обучения, по мнению Эндрю Ына, позволяет систематизировать подобный уникальный опыт сотрудников (tribal knowledge). Это гарантирует, что даже после ухода опытных специалистов на пенсию фабрика сможет продолжать стабильную работу.
🚀 Три ИИ-тренда, которые изменят индустрию в будущем 12:36
В заключительной части выступления Эндрю Ын выделил три перспективные технологии и методологии, которые пока не имеют массового распространения, но окажут огромное влияние на продукты и бизнес в будущем.
🏛️ 1. Превращение ИИ в системную инженерную дисциплину
Спикер провел аналогию со строительством мостов в древности: тогда возведение сооружений опиралось на советы «мудрых старцев», подсказывавших, куда добавить балку, чтобы мост не рухнул. Потребовалось много времени, чтобы эти крупицы мудрости превратились в строгую науку — гражданское строительство (civil engineering). ИИ сейчас проходит аналогичный путь трансформации от «шаманства» отдельных экспертов к системной инженерной дисциплине.
Точно так же софтверная индустрия долго вырабатывала методологии вроде Agile, двухнедельных спринтов, код-ревью и контроля версий. В сфере ИИ процессы только нащупываются. Например, команды Эндрю Ына в Landing AI используют необычные «однодневные спринты»: днем инженеры пишут код, ночью запускается эксперимент, а утром команда оценивает результаты и меняет приоритеты.
📊 2. Переход от больших данных к малым (Small Data)
Развитие ИИ долгое время шло за счет интернет-гигантов, обладающих миллиардами пользователей и колоссальными массивами данных. Однако у компаний вне ИТ-сектора таких датасетов просто нет, поэтому ИИ должен научиться эффективно работать на малых данных. Эндрю Ын привел пример из своей практики визуального контроля дефектов на заводах по производству смартфонов. Чтобы обучить стандартную сверточную нейросеть (CNN) отличать поцарапанный телефон от хорошего, нужны миллионы фотографий брака. Но ни одна фабрика в мире не производила миллион бракованных смартфонов ради сбора данных — этот брак просто не существует.
Задача состоит в том, чтобы заставить нейросеть работать всего на 100 фотографиях дефектов. Благодаря методам обучения с несколькими примерами (few-shot learning), трансферного обучения (transfer learning) и аугментации данных (data augmentation), индустрия делает огромные успехи в области малых данных, что откроет дорогу ИИ в традиционный сектор.
🤖 3. Мета-обучение для обучения с подкреплением (Meta-RL)
По оценке Эндрю Ына, текущий хайп вокруг классического обучения с подкреплением (reinforcement learning) сильно преувеличен по сравнению с его реальным коммерческим эффектом на сегодняшний день. Однако технология мета-обучения (meta-learning) способна совершить прорыв в робототехнике, будь то сборка сложной электроники, деликатный сбор клубники на фермах или автономные космические миссии с высокой задержкой связи.
Спикер вспомнил свой опыт запуска автономных вертолетов в Стэнфорде: алгоритм обучали в виртуальном симуляторе, а затем переносили на реальный вертолет. Главная проблема — невозможно построить идеальный симулятор физического объекта. Технология мета-обучения предлагает строить не один симулятор, а портфолио из 5 или 100 различных симуляторов, где параметры слегка варьируются (один симулятор имитирует более тяжелый вертолет, другой — более легкий, третий — с сильным ветром).
Задача ИИ — научиться мгновенно адаптироваться к условиям любого из этих симуляторов. Исследователи из UC Berkeley, Google, OpenAI и DeepMind доказали, что обученный таким образом алгоритм намного лучше справляется со сложной динамикой реального физического робота.
⚖️ Этический вызов: лидерство и борьба с неравенством 19:12
Эндрю Ын завершил выступление важным напоминанием: в эпохи технологических потрясений лидерство приобретает первостепенное значение. Он признал, что софтверная индустрия, ведя мир через технологические волны, не всегда демонстрировала лучшее руководство. В частности, создание интернета принесло колоссальные богатства, но одновременно усугубило экономическое неравенство в обществе.
В эпоху бурного развития искусственного интеллекта технологическое сообщество обязано не меньше, а то и больше инвестировать в «противоядия» — образование, просвещение правительственных лидеров и разработку продуманного регулирования. Главная цель новой волны автоматизации — построить технологическое будущее, в которое ИТ-индустрия возьмет с собой абсолютно каждого человека.