Джим Гуднайт: «Hadoop переоценен, будущее — за параллельными вычислениями»

DatanamiLive 8,2 тыс. 24 мин 2 мин 02.07.2012
Главное

Эволюция аналитики и аппаратных систем: взгляд Джима Гуднайта 0:23

Джим Гуднайт, сооснователь и генеральный директор SAS Institute, обсуждает с Николь Хемсот, редактором Datanami, трансформацию сферы анализа данных и роль высокопроизводительного оборудования. В беседе затрагиваются вопросы перехода на параллельные вычисления, критика популярных Big Data фреймворков и технологические барьеры в производстве современных микропроцессоров.

⚙️ Аппаратное обеспечение как фундамент аналитики 4:44

По мнению Гуднайта, аппаратное обеспечение является незаслуженно обделенной вниманием темой в дискуссиях о больших данных. Эффективность аналитики сегодня напрямую зависит от умения оптимизировать программное обеспечение под возможности современного «железа».

Ключевые тезисы о технологическом прогрессе:

🔄 Параллелизация и оптимизация алгоритмов 2:32

Главный вызов современной аналитики — адаптация алгоритмов, изначально написанных для последовательного выполнения на одном процессоре, к работе в параллельных системах.

Гуднайт приводит в пример кейс одного из банков в Сингапуре:

📉 Критика Big Data трендов и Hadoop 14:29

Гуднайт выражает скептицизм в отношении ряда популярных решений в сфере больших данных. В частности, он подчеркивает, что никогда не был сторонником реляционных БД (SQL) для аналитических задач, предпочитая собственные форматы файлов SAS.

Отношение к Hadoop:

🏥 Новые рынки: ритейл и медицина 8:42

SAS Institute активно развивает специализированные решения для разных вертикалей бизнеса. Несмотря на то, что 40% выручки компании приходится на финансовый сектор, наблюдается рост интереса со стороны ритейла и здравоохранения.

Примеры практического применения:

💬 Цитаты

«Большинство аналитических рутин были задуманы в расчете на последовательное выполнение на одном процессоре.»

Джим Гуднайт 02:44

«Hadoop — это файловая система, и если что-то происходит в этом файловом кабинете, ей абсолютно все равно, что внутри папки.»

Джим Гуднайт 18:43
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
MPI (Message Passing Interface)
Стандарт интерфейса для передачи сообщений в параллельных вычислительных системах.
MapReduce
Модель программирования для обработки больших объемов данных на кластерах компьютеров.
SKU (Stock Keeping Unit)
Идентификатор товарной позиции, единица учета запасов.
Литография
Процесс переноса геометрического рисунка на поверхность полупроводниковой пластины при создании чипов.
📊 Цифры
🗓 Хронология
  1. 1992 Дата изобретения интерфейса передачи сообщений (MPI).
  2. За 3 года до интервью Начало перехода SAS на массово-параллельные архитектуры.
⚖️ Другая сторона
Технологии и IT SAS Institute Jim Goodnight HPC Hadoop параллельные вычисления