# Джейн Хиллстон: «Мы строим нейросети, забывая об ограниченности ресурсов»

Источник: https://www.youtube.com/watch?v=JJzeZ_UZVoM
Канал: The Royal Institution
Опубликовано: 29.04.2025

---

Математическое моделирование — это не просто абстрактные формулы, а инструмент управления реальностью, позволяющий находить баланс между нашими желаниями и физическими ограничениями. В своей лекции в The Royal Institution эксперт по моделированию Джейн Хиллстон объясняет, как теория очередей и современные вычислительные методы помогают оптимизировать всё: от графиков движения поездов до биологических процессов в клетках и энергопотребления искусственного интеллекта.

## 🇬🇧 Феномен очередей: британская традиция или мировая неизбежность?
[[JUMP:00:19]]

Очереди часто воспринимаются как нечто специфически британское, однако, по словам Джейн Хиллстон, это универсальное явление, напрямую связанное с ограниченностью ресурсов [01:12]. Очередь — это видимое проявление дисбаланса между спросом на услугу и возможностями системы её предоставить. 

Единственный способ полностью избавиться от очередей — обладать «бесконечными ресурсами». В математических моделях это означает, что в момент вашего прихода в условное почтовое отделение мгновенно открывается новое окно обслуживания [02:07]. Однако для операторов систем (почты, железных дорог или аэропортов) это экономически невозможно. 

Ресурсы в системах могут быть как явными, так и скрытыми:

*   **Явные:** кассиры в банке, корзины на досмотре в аэропорту, сканеры безопасности [03:02].
*   **Скрытые:** участки железнодорожных путей. Например, поезд может остановиться на красный сигнал семафора не из-за поломки, а потому что следующий участок пути — это ресурс, который сейчас занят другим составом [03:28].

## 📊 Моделирование производительности: конфликт интересов
[[JUMP:04:22]]

Джейн Хиллстон определяет это направление как «моделирование производительности» (performance modeling). Основная задача здесь — найти «золотую середину» между требованиями пользователей и возможностями владельцев системы [08:53].

**Взгляд пользователя:**

*   **Время отклика (Response Time):** сумма времени ожидания в очереди и времени непосредственного обслуживания. В идеале оно должно равняться только времени обслуживания [06:23].
*   **Пропускная способность (Throughput):** количество выполненных задач за единицу времени [06:50].
*   **Вероятность блокировки (Blocking Probability):** риск того, что пользователь вообще не сможет войти в систему из-за её перегрузки [07:18].

**Взгляд оператора системы:**

*   **Коэффициент использования (Utilization):** процент времени, когда ресурс занят делом. Оператор не хочет платить 1000 сотрудников, если для работы достаточно 500 [07:31].
*   **Избегание хрупкости:** система, загруженная на 100%, становится крайне уязвимой к любым сбоям [08:53]. Математики ищут уровень загрузки, который был бы экономически эффективным, но оставлял бы «запас прочности».

## ☎️ От телефонисток начала века до Закона Литтла
[[JUMP:09:21]]

Основы этой науки заложил в начале XX века датский математик Агнер Эрланг, работавший в телефонной компании. В те времена соединения устанавливались вручную: телефонистка втыкала штекер в нужное гнездо на коммутаторе [09:48]. 

Эрланг разработал формулу (Erlang loss formula) для расчета вероятности того, что звонок будет сброшен из-за нехватки свободных слотов [10:30]. Ключевой параметр в его расчетах — **E (нагрузка в Эрлангах)**, которая является произведением частоты прибытия вызовов на среднюю длительность разговора [11:38]. Эта формула до сих пор применяется в современных кол-центрах [12:32].

Другим столпом теории стал **Закон Литтла**, сформулированный Джоном Литтлом в 1961 году [22:03]:

*   Он связывает среднее количество клиентов в системе, интенсивность их поступления и среднее время пребывания в системе.
*   Уникальность закона в том, что он работает для любой системы, независимо от того, как именно распределяются задачи и в каком порядке обслуживаются клиенты [21:48].

## 🎲 Роль случайности и Марковские цепи
[[JUMP:22:17]]

В детерминированных системах, где всё происходит по строгому расписанию (например, клиент приходит ровно раз в 2 минуты и обслуживается ровно 1 минуту), очередей не возникает, а загрузка составляет 50% [24:56]. Однако реальный мир хаотичен.

Джейн Хиллстон подчеркивает, что именно изменчивость (вариативность) создает очереди. Кто-то покупает одну марку, а кто-то оформляет паспорт — время обслуживания разное [23:23]. Для описания таких процессов математики используют:

1.  **Экспоненциальное распределение:** оно учитывает «тяжелый хвост» — редкие, но очень длительные задачи [24:01].
2.  **Марковские цепи:** математические модели, где состояние системы (например, количество людей в очереди) меняется во времени на основе вероятностей [27:58].

## 💻 Процессные алгебры и язык PEPA
[[JUMP:34:57]]

Классическая теория очередей хорошо работала для конвейерных линий и простых ЭВМ до 1980-х годов [31:04]. Но с появлением интернета системы стали распределенными. Например, сервис бронирования Expedia одновременно отправляет запросы десяткам авиакомпаний, ждет ответов и объединяет их [32:34].

Для моделирования таких сложных параллельных (конкурентных) систем Джейн Хиллстон и её коллеги разработали **PEPA (Performance Evaluation Process Algebra)** [36:55].

*   Это своего рода язык программирования, который не превращается в машинный код, а компилируется в математическую модель (Марковскую цепь) [37:21].
*   PEPA позволяет описывать компоненты системы (пользователей, серверы) и правила их взаимодействия.
*   Инструмент автоматически рассчитывает пропускную способность и время отклика, избавляя исследователя от ручного решения тысяч уравнений [42:46].

## 🌿 Где еще работают эти модели?
[[JUMP:43:00]]

Математика очередей нашла применение в самых неожиданных областях:

*   **Логистика:** оптимизация движения грузовых судов через каналы и шлюзы Бельгии [43:00].
*   **Робототехника:** расчет скорости движения манипулятора на конвейере для оптимальной производительности [43:27].
*   **Телекоммуникации:** расстановка вышек сотовой связи 3G/4G для минимизации потерь сигналов [44:18].
*   **Медицина:** расчет скорости поступления тревожных сигналов от датчиков в автомобиле или автобусе к водителю [44:44].
*   **Биология:** моделирование клеточного цикла [48:45]. Белки внутри клетки рассматриваются как ресурсы. Хиллстон приводит пример белка циклина, чья концентрация определяет циклы деления клетки. Сбой в «расписании» этой системы может привести к патологиям [50:35].

## 🤖 Вызов эпохи: ИИ и «бесконечные» ресурсы
[[JUMP:51:00]]

Одной из самых острых тем лекции стало обсуждение ресурсов, потребляемых современным ИИ. По мнению Джейн Хиллстон, разработчики больших языковых моделей (LLM) долгое время игнорировали вопрос эффективности, стремясь только к победам в рейтингах точности (accuracy benchmarks) [55:31].

**Шокирующие цифры потребления ресурсов:**

*   Один запрос в ChatGPT требует в **100 раз больше энергии**, чем поиск в Google [52:11].
*   Обучение модели Llama привело к выбросу **539 метрических тонн CO2** [52:39].
*   Компании вроде Google всерьез обсуждают строительство малых ядерных реакторов для питания своих дата-центров [51:42].

Хиллстон утверждает, что культура «лидербордов» (таблиц рекордов) приучила отрасль к мысли о неограниченности ресурсов: чтобы нейросеть стала умнее, нужно просто добавить больше данных и больше вычислительных мощностей [55:57].

### Кейс DeepSeek: эффективность от нужды
[[JUMP:59:06]]

В 2024 году китайская модель DeepSeek привлекла внимание мирового сообщества не только качеством работы, но и беспрецедентной эффективностью. 

*   **Позиция Хиллстон:** «Необходимость — мать изобретения». У разработчиков DeepSeek не было доступа к таким колоссальным вычислительным мощностям, как у американских технологических гигантов, из-за санкций и ограничений [59:19]. 
*   Это заставило их применить глубокое математическое проектирование и более грамотно использовать принципы параллелизма, добиваясь сопоставимых результатов при гораздо меньших затратах ресурсов [59:45].

Математическое моделирование сегодня — это не только способ ускорить работу компьютера, но и необходимый инструмент для выживания планеты в условиях экспоненциального роста цифрового потребления [1:00:53].