Сундар Пичаи: «Мы переходим от Mobile-First к AI-First»

On with Kara Swisher 9,6 млн 12 мин 6 мин 17.05.2017
Главное

На ежегодной конференции Google I/O 2017 генеральный директор Google Сундар Пичаи объявил о фундаментальном изменении вектора развития технологического гиганта. В материале, опубликованном на канале «On with Kara Swisher», подробно описывается переход компании от концепции мобильного приоритета (Mobile-First) к тотальной интеграции искусственного интеллекта (AI-First). Этот сдвиг призван полностью перестроить пользовательский опыт, способы взаимодействия с техникой и подходы к обработке данных планетарного масштаба.

🌍 Масштаб экосистемы Google и новое прочтение миссии 0:13

Юбилейная конференция Google I/O собрала более 7 000 очных участников, а прямая трансляция велась на 400 сопутствующих мероприятиях в 85 странах мира. Открывая мероприятие, Сундар Пичаи с иронией вспомнил прошлый год, отметив, что в Википедии упоминались случаи сильных солнечных ожогов у посетителей, поэтому теперь компания бесплатно предоставляет солнцезащитный крем для каждого гостя. Однако за этой легкой атмосферой скрывались масштабные цифры: на протяжении 13 лет работы Пичаи в компании ее ключевая миссия остается неизменной — организация мировой информации и обеспечение удобного доступа к ней для каждого человека.

Для решения сложнейших повседневных задач Google применяет передовые методы компьютерных наук и глубокие технические инсайты. Такой подход позволил масштабировать сразу семь ключевых продуктов компании до отметки более чем в 1 миллиард активных пользователей ежемесячно для каждого.

Текущие показатели вовлеченности аудитории в экосистему Google:

🔄 Великий сдвиг: от эпохи Mobile-First к AI-First 2:59

По мнению Сундара Пичаи, современный IT-сектор переживает очередную важнейшую эволюцию — смену парадигмы Mobile-First на подход AI-First. В свое время мобильная революция заставила разработчиков полностью переосмыслить интерфейсы и модели взаимодействия, внедрив мультитач-жесты, геолокацию, цифровую идентичность и мобильные платежи. Сегодня аналогичная трансформация происходит под влиянием машинного обучения, которое планомерно интегрируется во все ключевые сервисы Google.

Примеры текущего использования машинного обучения в продуктах:

Алгоритмы Smart Reply способны самостоятельно анализировать контекст входящего письма и мгновенно предлагать естественные варианты ответов, обучаясь вести диалог в привычной для человека манере.

🗣️ Новые модальности: эволюция голоса и технология Neural Beam Forming 4:33

Глава Google подчеркивает, что с развитием платформ кардинально меняются и способы взаимодействия человека с вычислительной техникой. Если мобильный сдвиг принес мультитач-экраны взамен клавиатуры и мыши, то в мире победившего искусственного интеллекта ключевыми модальностями становятся голос и зрение. Люди начинают общаться с компьютерами более естественным и иммерсивным путем.

Точность распознавания речи компьютерами демонстрирует стремительный прогресс. Уровень ошибок (word error rate) непрерывно снижается даже при наличии сильного внешнего шума, что позволяет эффективно использовать Google Assistant на смартфонах и умных колонках Google Home.

Инженерам удалось совершить прорыв в аппаратном обеспечении за счет софта. Изначально команда разработчиков планировала встроить в корпус Google Home восемь микрофонов для точного определения направления звука. Однако благодаря внедрению глубокого обучения и специализированной технологии neural beam forming (нейронное формирование луча) инженерам удалось сократить количество физических микрофонов всего до двух без малейшей потери качества распознавания. Кроме того, внедрение ИИ позволило реализовать поддержку многопользовательского режима: устройство способно распознавать до шести разных голосов в одном доме, индивидуально настраивая ответы для каждого члена семьи.

👁️ Компьютерное зрение и запуск Google Lens 6:05

Параллельно с голосовыми интерфейсами тектонические сдвиги происходят в сфере компьютерного зрения. По заявлению Сундара Пичаи, современные системы распознавания изображений в определенных задачах уже превосходят по точности человека. В смартфонах Google Pixel возможности ИИ используются для автоматического устранения шумов на фотографиях, сделанных при слабом освещении. В ближайшем будущем компания обещает внедрить алгоритм автоматического удаления нежелательных препятствий с готовых снимков, например, сетчатого забора, мешающего разглядеть ребенка на бейсбольном матче.

Главным продуктовым анонсом в этой области стал запуск инициативы Google Lens. Это набор вычислительных возможностей на базе компьютерного зрения, который понимает, на что именно смотрит пользователь, и помогает мгновенно совершить целевое действие на основе этой информации. Первоначально инструмент появится в Google Assistant и Google Photos, а затем будет интегрирован в другие приложения.

Сценарии применения Google Lens, выделенные в презентации:

⚡ Вычислительная инфраструктура: Cloud TPU и суперкомпьютеры нового поколения 8:49

Успех Google в веб-поиске когда-то был обусловлен созданием уникальной архитектуры дата-центров, спроектированных под текстовые веб-страницы. Наступление эпохи ИИ потребовало от компании радикального пересмотра аппаратной инфраструктуры и создания дата-центров нового типа — AI-first data centers.

Годом ранее Google представила Tensor Processing Units (TPU) — кастомные процессоры, созданные специально для машинного обучения. Они оказались в 15–30 раз быстрее и в 30–80 раз энергоэффективнее стандартных центральных (CPU) и графических (GPU) процессоров того времени. Именно эти чипы обеспечили вычислительную мощность нейросети AlphaGo во время ее исторического матча против чемпиона Ли Седоля.

Пичаи пояснил, что машинное обучение состоит из двух ресурсоемких компонентов:

  1. Обучение (Training) — процесс создания и настройки нейросети, требующий колоссальных вычислительных мощностей. Например, для обучения одной модели машинного перевода требуется обработать более 3 миллиардов слов в течение недели на 100 графических процессорах.
  2. Вывод (Inference) — работа обученной сети в режиме реального времени (например, мгновенное распознавание кошки или собаки на фотографии).

Первое поколение TPU было оптимизировано исключительно под инференс. В рамках I/O 2017 Сундар Пичаи официально анонсировал второе поколение процессоров — Cloud TPU, которые эффективно справляются как с выводом, так и со сложнейшим обучением моделей.

Одна плата Cloud TPU содержит четыре чипа и способна выполнять 180 триллионов операций с плавающей запятой в секунду (FLOPS). Благодаря модульной архитектуре платы можно объединять в суперкомпьютерные кластеры — TPU Pods, состоящие из 64 плат. Суммарная мощность такого «пода» достигает 11,5 петафлопс, что является важнейшим прорывом для ИИ-инфраструктуры. С сегодняшнего дня Cloud TPU становятся доступны коммерческим клиентам через платформу Google Compute Engine в рамках Google Cloud, которая стремится стать лучшим облачным решением для машинного обучения, сочетая процессоры от Intel, графические ускорители от NVIDIA и собственные чипы Google.

💬 Цитаты

«В мире AI-first мы переосмысливаем все наши продукты и применяем машинное обучение для решения проблем пользователей.»

Сундар Пичаи 03:38

«Наши компьютерные системы для распознавания изображений теперь справляются с этой задачей даже лучше, чем люди.»

Сундар Пичаи 06:31
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Neural beam forming
Технология обработки звукового сигнала нейросетями для точной направленности на источник звука при минимальном количестве микрофонов.
Cloud TPU
Специализированные тензорные процессоры второго поколения от Google, оптимизированные для обучения и работы нейросетей в облаке.
Петафлопс
Единица измерения производительности компьютеров, равная одному квадриллиону операций с плавающей запятой в секунду.
Knowledge Graph
Семантическая база знаний Google, используемая для предоставления релевантных контекстных фактов об объектах и местах.
📊 Цифры
🗓 Хронология
  1. 2012 Запуск облачного хранилища Google Drive.
  2. 2015 Запуск сервиса Google Photos на базе алгоритмов машинного обучения.
  3. 2016 Анонс первого поколения процессоров Tensor Processing Unit (TPU), оптимизированных для инференса.
  4. Май 2017 Проведение конференции Google I/O 2017, официальный анонс Cloud TPU и Google Lens, преодоление отметки в 2 миллиарда устройств Android.
⚖️ Другая сторона
Искусственный интеллект Google Lens Cloud TPU Сундар Пичаи Android Google I/O