Как концепция RISC и массивы RAID изменили компьютерную индустрию

Lex Fridman 279 тыс. 1 ч 49 мин 12 мин 27.06.2020
Главное

Разговор Лекса Фридмана с легендарным ученым Дэвидом Паттерсоном, лауреатом премии Тьюринга, охватывает полувековую историю компьютерных архитектур — от громоздких вычислительных залов до кремниевых чипов в современных смартфонах. В фокусе дискуссии находятся фундаментальные сдвиги в индустрии: триумф концепции RISC, изобретение массивов RAID, неизбежное замедление закона Мура и наступление эпохи специализированных ИИ-ускорителей. Сквозь призму философии науки и личного жизненного опыта собеседники исследуют, как простота архитектурных решений определяет технологическое будущее человечества.

🖥️ Эволюция микропроцессоров и закон Мура 3:22

За последние 50 лет компьютерные технологии претерпели тектонические изменения, главным драйвером которых стало изобретение микропроцессора. Машины, некогда занимавшие несколько комнат, уменьшились до размеров мобильного телефона, став при этом в миллион раз быстрее и значительно дешевле. Сегодня на планете проживает около 7,8 миллиарда человек, и как минимум половина из них владеет смартфонами. Очевидно, что количество микропроцессоров в мире уже давно превысило численность населения Земли.

Классическая архитектура ЭВМ неизменно состоит из пяти базовых элементов:

Два последних компонента в совокупности образуют процессор. Если он целиком умещается на одной микросхеме, его называют микропроцессором.

Принцип работы процессора напоминает калькулятор: он выполняет простейшие инструкции — сложение, вычитание, умножение и деление. Секрет вычислительного могущества кроется в том, что чип совершает миллиарды таких тривиальных операций в секунду. Программное обеспечение организует эти элементарные шаги в сложные алгоритмические цепочки, способные решать задачи эффективнее человека.

Этот феноменальный прогресс на протяжении полувека направлялся эмпирическим правилом, известным как закон Мура. В 1965 году выпускник Беркли Гордон Мур заметил, что количество транзисторов (миниатюрных кремниевых переключателей) на микросхеме удваивается каждый год. В 1975 году он скорректировал прогноз до удвоения каждые два года.

Мур поразительно точно предсказал последствия своей гипотезы: появление компьютеров в автомобилях и повседневных товарах. Для ученых этот закон стал дорожной картой. Тем не менее, выход технологий в тираж порой шокировал самих создателей. Символом тектонического сдвига в культуре стало появление первых интернет-ссылок (URL) на рекламных щитах в Сан-Франциско, которые обыватели поначалу воспринимали как инопланетные письмена.

🧱 Слои абстракции и открытая архитектура 10:02

Компьютерные системы чрезвычайно сложны. Единственный способ справиться с этой сложностью как в программном, так и в аппаратном обеспечении — использование слоев абстракции. Инженер временно абстрагируется от деталей нижних уровней, концентрируясь исключительно на интерфейсе текущего слоя.

В современном компьютере может насчитываться от 10 до 20 таких изолированных слоев, напоминающих структуру луковицы. Обучение компьютерным наукам строится на последовательном изучении этих уровней: от высокоуровневого программирования на Python к системному коду на C, а затем вниз — к аппаратным инструкциям и физике транзисторов.

На стыке софта и «железа» находится набор инструкций (Instruction Set Architecture, ISA) — фундаментальный словарь, с помощью которого программы общаются с процессором. Помимо базовой арифметики, этот словарь включает команды записи данных в память (store) и их извлечения (load).

Долгое время архитектурные словари оставались исключительно коммерческой тайной корпораций:

Однако в последние годы мировая ИТ-индустрия начала движение в сторону открытого аппаратного обеспечения, ломая устоявшуюся парадигму закрытых корпоративных стандартов.

⚔️ Противостояние философий: RISC против CISC 15:08

В 1980-х годах в академической и промышленной среде развернулась жесткая концептуальная война. Общепринятая на тот момент парадигма CISC (Complex Instruction Set Computer) утверждала, что архитектурный словарь должен состоять из сложных, многосложных команд (например, вычисление полиномов или сортировка списков прямо на уровне железа). Считалось, что это облегчит жизнь разработчикам ПО.

Группа радикально настроенных исследователей из Беркли, Стэнфорда (под руководством Джона Хеннесси) и IBM выдвинула противоположную гипотезу: микропроцессорам необходим сокращенный, максимально упрощенный набор инструкций — концепция RISC (Reduced Instruction Set Computer). Логика заключалась в том, что простые команды позволят аппаратному обеспечению работать значительно быстрее в условиях стремительного развития полупроводников. Обязанность по оптимизации и переводу сложного кода на язык простых инструкций перекладывалась на специальную программу — компилятор.

Оппоненты утверждали, что концепция RISC — это шаг назад, заставляющий программы выполнять больший объем работы. Технический компромисс выглядел следующим образом:

$$\text{Время выполнения программы} = \text{Количество инструкций} \times \frac{\text{Тактовые циклы}}{\text{Инструкция}} \times \text{Время тактового цикла}$$

В ходе экспериментов выяснилось, что процессоры RISC действительно выполняли примерно на 30–50% больше инструкций. Однако за счет простоты они тратили всего около 2 тактовых циклов на команду, в то время как чипы CISC из-за внутренней интерпретации сложных инструкций тратили около 10 циклов. В итоге архитектура RISC обеспечивала четырехкратное преимущество в скорости.

Важным катализатором победы RISC стало появление операционной системы UNIX. Она доказала, что даже такое сложное системное ПО можно писать на высокоуровневом языке C, а не вручную на ассемблере. Как только компиляторы взяли на себя генерацию кода, архитектурный словарь скрылся от глаз программистов. Более того, компиляторам было чрезвычайно трудно эффективно использовать перегруженные инструкции CISC, и они чаще всего их игнорировали.

В коммерческом секторе ситуация оказалась амбивалентной. Многие создатели CISC-систем обанкротились, но корпорация Intel проявила инженерную гибкость. Обладая ценнейшей экосистемой бинарно совместимого софта для ПК, Intel внедрила в свои чипы аппаратный транслятор. Процессоры x86 стали принимать сложные инструкции на входе и на лету преобразовывать их в простые RISC-команды внутри кристалла. Это позволило сохранить совместимость и использовать архитектурные находки конкурентов.

🚀 Рождение RISC-V и будущее открытого железа 28:21

В конце 1980-х годов Дэвид Паттерсон и Джон Хеннесси выпустили фундаментальный труд «Архитектура компьютера: количественный подход», внедрив строгие математические формулы и бенчмарки (наборы тестовых программ, такие как SPEC) вместо интуитивных догадок. За эти пионерские исследования авторы впоследствии были удостоены премии Тьюринга.

В 2010 году исследователи из Беркли запустили проект RISC-V — полностью открытый архитектурный стандарт. RISC-V представляет собой не физический чип, а открытую спецификацию (интерфейс). Сами же процессоры на базе этого стандарта описываются на специализированных языках (Verilog или VHDL) и выкладываются в открытый доступ, подобно исходному коду операционной системы Linux.

Рынок микропроцессоров четко сегментирован по трем направлениям:

По мнению Паттерсона, через 25 лет RISC-V имеет все шансы стать самой популярной архитектурой в мире благодаря своей открытости, отсутствию лицензионных отчислений и возможности свободной модификации. Проект поддерживается консорциумом RISC-V Foundation; посещаемость его ежегодных конференций выросла с 50 человек в 2015 году до 1700 участников в конце 2019 года.

Архитектурная эстетика RISC-V базируется на модульности. Базовый профиль включает всего около 40 инструкций, которых достаточно для запуска полноценной ОС. Все остальные расширения (например, для векторных или математических вычислений) являются строго опциональными. Закрытые коммерческие архитектуры с возрастом неизбежно «набирают вес», поскольку новые инструкции становятся обязательными для совместимости во всех будущих поколениях. RISC-V позволяет сохранять архитектурную «стройность», добавляя функции только тогда, когда это экономически оправдано.

Эффективность конечного устройства зависит не только от ISA, но и от конкретной микроархитектурной реализации. Ярким примером служит Apple: компания платит десятки миллионов долларов за право проектировать собственные ядра на базе инструкций ARM, в то время как большинство производителей Android-смартфонов покупают готовые шаблоны ядер у самой ARM. Наняв первоклассную команду инженеров, Apple создает уникальную топологию кремния, что обеспечивает их процессорам заметное превосходство по производительности в реальных задачах.

🧠 Эра ускорителей и «Золотой век» машинного обучения 58:12

Закон Мура неумолимо замедляется. Если в 1980–1990-х годах производительность процессоров удваивалась каждые 18 месяцев, заставляя пользователей регулярно менять устаревшие компьютеры, то сегодня этот период увеличился примерно до 20 лет. Современные ноутбуки меняют преимущественно из-за физических поломок, а не из-за нехватки вычислительной мощности общего назначения. При этом главным ограничивающим фактором проектирования чипов стало энергопотребление, а не плотность размещения транзисторов на кристалле.

Для преодоления этого тупика компьютерная архитектура переходит к использованию предметно-ориентированных ускорителей (Domain-Specific Accelerators). Этот тектонический сдвиг удачно совпал с революцией в сфере искусственного интеллекта. В многолетнем споре двух ИИ-школ — экспертных систем с жесткими правилами «сверху вниз» и систем машинного обучения на основе анализа данных — окончательную победу одержало машинное обучение.

С точки зрения кремния, глубинное обучение представляет собой колоссальные массивы операций матричного умножения. Инженеры умеют проектировать специализированные вычислительные блоки, выполняющие матричную алгебру в разы быстрее и энергоэффективнее, чем универсальные центральные процессоры. Так появились тензорные процессоры (TPU) и специализированные графические чипы (GPU). Формируется стек «Программирования 2.0», где разработчик оперирует гиперпараметрами и массивами данных, а компилятор и специализированное «железо» берут на себя генерацию исполняемого кода.

Однако создание специализированного чипа сопряжено с огромными рисками. Главная ошибка многих ИИ-стартапов, собравших миллиардные инвестиции, заключается в фокусе на самом железе при полном игнорировании софтверного стека и компиляторов. Для стандартизации этой хаотичной среды консорциум из 50 компаний и 10 университетов разработал независимый пакет бенчмарков MLPerf.

Индустрия жестко отреагировала на новые метрики:

Исторически аналогичный перелом произошел в компьютерном зрении. Прогресс буксовал, пока ученые Дэвид Мартин и Джитендра Малик не создали первые стандартизированные базы изображений для тестирования алгоритмов. Это заложило основу для появления ImageNet, победа в котором исследователей из Торонто ознаменовала взрывной рост современных нейросетей.

🌌 Квантовые вычисления и реальные границы кремния 1:16:35

Несмотря на медийный шум, квантовые вычисления не являются технологией ближайшего будущего. Два независимых экспертных доклада — Национальной инженерной академии США и Консорциума компьютерных исследований — подтверждают, что до появления коммерческих квантовых компьютеров с коррекцией ошибок пройдет не менее десятилетия. По мнению Паттерсона, эта технология станет коммерчески осязаемой ближе к 2030 году.

Квантовые вычисления фундаментально отличаются от классических:

На фоне замедления кремния возникают и другие дискуссии. В частности, известный инженер Джим Келлер публично заявляет, что закон Мура все еще жив и потенциал масштабирования транзисторов не исчерпан. Дэвид Паттерсон называет подобные заявления чистым маркетингом, призванным успокоить инвесторов. Из строгой математической метрики закон Мура превратился в инструмент манипуляций.

Факты беспристрастны: если проанализировать плотность транзисторов в чипах памяти DRAM или процессорах Intel за последние шесть лет, то вместо заложенного законом Мура восьмикратного увеличения мы увидим скромный, затухающий график. Более того, на новейших технологических процессах стоимость отдельного транзистора впервые в истории начала расти, а не снижаться. Стал очевиден застой и в росте тактовых частот.

💾 Проект RAID: Как спасти данные от неизбежных поломок 1:28:21

В 1988 году Дэвид Паттерсон совместно с Рэнди Катцем и аспирантом Гартом Гибсоном опубликовал историческую статью «Дело избыточного массива недорогих дисков (RAID)». В те годы на смену дискетам в персональных компьютерах начали приходить жесткие диски (HDD). Диски для мейнфреймов от доминирующей тогда IBM были размером с стиральную машину и стоили огромных денег, тогда как для ПК появились компактные накопители размером с книгу.

Ученые предложили революционную идею: объединить 40 дешевых компактных дисков в единый массив вместо покупки одного гигантского дорогого накопителя. Системная емкость возрастала, а стоимость снижалась. Однако бывший выпускник Беркли, работавший в IBM, указал на критический изъян: надежность такой системы из 40 компонентов потребительского класса будет катастрофической — массив будет выходить из строя каждые две недели вместо одного года.

Инженеры решили эту проблему введением избыточности (Redundancy):

«Мы поняли, что обязаны защитить данные. Добавив в массив небольшое количество дополнительных дисков для хранения контрольных сумм, мы добились того, что система могла безболезненно переносить физическую поломку нескольких накопителей, полностью сохраняя пользовательскую информацию».

Архитектура RAID завоевала мир. За прошедшие тридцать лет индустрия совершила масштабный переход от механических вращающихся дисков (напоминающих виниловые пластинки с иглами на 60 оборотов в секунду) к твердотельной полупроводниковой флэш-памяти (Flash SSD). Смартфоны, ноутбуки и встроенные системы полностью перешли на флэш-накопители, хотя в облачных дата-центрах из соображений экономической выгоды до сих пор активно используются магнитные жесткие диски.

При этом концепция RAID остается неизменно актуальной для любых типов носителей. Психологическая цена потери данных колоссальна: если ошибка в процессоре лишь заставит перезапустить программу, то поломка накопителя может навсегда уничтожить бесценную информацию, что делает избыточность систем хранения главным приоритетом цифровой цивилизации.

🤼 Философия жизни: Преподавание, борьба и девять магических слов 1:36:43

Вопреки стереотипам, глубокие научные исследования и качественное преподавание не конфликтуют, а усиливают друг друга. Профессорская элита Беркли наглядно подтверждает эту корреляцию. На одной из памятных фотографий кафедры запечатлены пять профессоров, получивших высшую университетскую награду за выдающееся преподавание (Distinguished Teaching Award): Мануэль Блюм, Ричард Карп, Рэнди Катц, Джон Оустерхаут и Дэвид Паттерсон. Все они стали членами Национальной инженерной академии, а Блюм, Карп и Паттерсон — лауреатами премии Тьюринга. Великие ученые оказываются великими педагогами.

Известный физик Ричард Фейнман в свое время справедливо критиковал Принстонский институт перспективных исследований за отсутствие студентов. Фейнман утверждал, что необходимость объяснять сложные концепции простыми словами в студенческой аудитории заставляет ученого глубже переосмысливать основы и находить неожиданные научные инсайты.

Помимо академической среды, огромную роль в формировании личности Паттерсона сыграл спорт. Будучи самым младшим и физически небольшим учеником в классе из-за особенностей даты рождения (1 декабря), он увлекся вольной борьбой в колледже Эль-Камино. Их скромная команда колледжа умудрилась победить на турнире сборную престижного Университета Калифорнии в Лос-Анджелесе (UCLA).

Спортивный ковер воспитал в будущем ученом два важнейших качества:

В финале беседы Лекс Фридман подводит итог к главному вопросу о метриках прожитой жизни. Ссылаясь на профессора Рэнди Катца, Паттерсон замечает, что истинным мерилом успеха на закате дней является не количество нулей на банковском счете, а количество строк в некрологе газеты The New York Times. Оглядываясь назад, ученый гордится не сотнями написанных статей, а своей семьей и долгосрочными человеческими отношениями.

Прожив более 50 лет в счастливом браке со своей школьной любовью, Паттерсон делится универсальным рецептом семейного долголетия, состоящим из девяти магических слов:

«Я был неправ. Ты была права. Я люблю тебя».

Произносить эти слова необходимо исключительно целиком, искренне признавая свои ошибки. Завершая эту вдумчивую беседу, Лекс Фридман цитирует классического американского мыслителя Генри Дэвида Торо: «Наша жизнь растрачивается по мелочам. Упрощайте, упрощайте». В эпоху избыточной сложности простота остается высшей формой гениальности — как в архитектуре кремниевых микросхем, так и в самой человеческой жизни.

💬 Цитаты

«Мы поняли, что обязаны защитить данные. Добавив в массив небольшое количество дополнительных дисков для хранения контрольных сумм, мы добились того, что система могла безболезненно переносить физическую поломку нескольких накопителей, полностью сохраняя пользовательскую информацию»

Дэвид Паттерсон 1:31:27

«Я был неправ. Ты была права. Я люблю тебя»

Дэвид Паттерсон 1:48:09
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
RISC
Архитектура процессора с сокращенным набором простых инструкций одинаковой длины, выполняемых за меньшее число тактов.
CISC
Архитектура процессора со сложным набором инструкций переменной длины, выполняющих комплексные операции на уровне железа.
RAID
Технология виртуализации данных, объединяющая несколько физических дисковых накопителей в единый логический модуль для повышения надежности.
Закон Мура
Эмпирическое наблюдение, согласно которому количество транзисторов на кристалле микросхемы удваивается каждые 24 месяца.
Бенчмарк
Эталонная тест-программа, используемая для сравнительного измерения производительности компьютерных систем или софта.
📊 Цифры
🗓 Хронология
  1. 1965 Гордон Мур публикует статью со своим знаменитым предсказанием об удвоении числа транзисторов.
  2. 1980-е Разворачиваются масштабные технологические дебаты между сторонниками концепций RISC и CISC.
  3. 1988 Паттерсон, Катц и Гибсон выпускают историческую работу, заложившую основы технологии RAID.
  4. 2010 В стенах Университета Беркли стартует разработка принципиально новой открытой архитектуры RISC-V.
  5. 2015 Основан консорциум RISC-V Foundation и проведена первая профильная конференция для инженеров.
⚖️ Другая сторона
Технологии и IT Дэвид Паттерсон RISC-V закон Мура архитектура ЭВМ RAID