Джейн Хиллстон: «Мы строим нейросети, забывая об ограниченности ресурсов»

Математическое моделирование — это не просто абстрактные формулы, а инструмент управления реальностью, позволяющий находить баланс между нашими желаниями и физическими ограничениями. В своей лекции в The Royal Institution эксперт по моделированию Джейн Хиллстон объясняет, как теория очередей и современные вычислительные методы помогают оптимизировать всё: от графиков движения поездов до биологических процессов в клетках и энергопотребления искусственного интеллекта.

🇬🇧 Феномен очередей: британская традиция или мировая неизбежность? 0:19

Очереди часто воспринимаются как нечто специфически британское, однако, по словам Джейн Хиллстон, это универсальное явление, напрямую связанное с ограниченностью ресурсов . Очередь — это видимое проявление дисбаланса между спросом на услугу и возможностями системы её предоставить.

Единственный способ полностью избавиться от очередей — обладать «бесконечными ресурсами». В математических моделях это означает, что в момент вашего прихода в условное почтовое отделение мгновенно открывается новое окно обслуживания . Однако для операторов систем (почты, железных дорог или аэропортов) это экономически невозможно.

Ресурсы в системах могут быть как явными, так и скрытыми:

Явные: кассиры в банке, корзины на досмотре в аэропорту, сканеры безопасности .
Скрытые: участки железнодорожных путей. Например, поезд может остановиться на красный сигнал семафора не из-за поломки, а потому что следующий участок пути — это ресурс, который сейчас занят другим составом .

📊 Моделирование производительности: конфликт интересов 4:22

Джейн Хиллстон определяет это направление как «моделирование производительности» (performance modeling). Основная задача здесь — найти «золотую середину» между требованиями пользователей и возможностями владельцев системы .

Взгляд пользователя:

Время отклика (Response Time): сумма времени ожидания в очереди и времени непосредственного обслуживания. В идеале оно должно равняться только времени обслуживания .
Пропускная способность (Throughput): количество выполненных задач за единицу времени .
Вероятность блокировки (Blocking Probability): риск того, что пользователь вообще не сможет войти в систему из-за её перегрузки .

Взгляд оператора системы:

Коэффициент использования (Utilization): процент времени, когда ресурс занят делом. Оператор не хочет платить 1000 сотрудников, если для работы достаточно 500 .
Избегание хрупкости: система, загруженная на 100%, становится крайне уязвимой к любым сбоям . Математики ищут уровень загрузки, который был бы экономически эффективным, но оставлял бы «запас прочности».

☎️ От телефонисток начала века до Закона Литтла 9:21

Основы этой науки заложил в начале XX века датский математик Агнер Эрланг, работавший в телефонной компании. В те времена соединения устанавливались вручную: телефонистка втыкала штекер в нужное гнездо на коммутаторе .

Эрланг разработал формулу (Erlang loss formula) для расчета вероятности того, что звонок будет сброшен из-за нехватки свободных слотов . Ключевой параметр в его расчетах — E (нагрузка в Эрлангах), которая является произведением частоты прибытия вызовов на среднюю длительность разговора . Эта формула до сих пор применяется в современных кол-центрах .

Другим столпом теории стал Закон Литтла, сформулированный Джоном Литтлом в 1961 году :

Он связывает среднее количество клиентов в системе, интенсивность их поступления и среднее время пребывания в системе.
Уникальность закона в том, что он работает для любой системы, независимо от того, как именно распределяются задачи и в каком порядке обслуживаются клиенты .

🎲 Роль случайности и Марковские цепи 22:17

В детерминированных системах, где всё происходит по строгому расписанию (например, клиент приходит ровно раз в 2 минуты и обслуживается ровно 1 минуту), очередей не возникает, а загрузка составляет 50% . Однако реальный мир хаотичен.

Джейн Хиллстон подчеркивает, что именно изменчивость (вариативность) создает очереди. Кто-то покупает одну марку, а кто-то оформляет паспорт — время обслуживания разное . Для описания таких процессов математики используют:

Экспоненциальное распределение: оно учитывает «тяжелый хвост» — редкие, но очень длительные задачи .
Марковские цепи: математические модели, где состояние системы (например, количество людей в очереди) меняется во времени на основе вероятностей .

💻 Процессные алгебры и язык PEPA 34:57

Классическая теория очередей хорошо работала для конвейерных линий и простых ЭВМ до 1980-х годов . Но с появлением интернета системы стали распределенными. Например, сервис бронирования Expedia одновременно отправляет запросы десяткам авиакомпаний, ждет ответов и объединяет их .

Для моделирования таких сложных параллельных (конкурентных) систем Джейн Хиллстон и её коллеги разработали PEPA (Performance Evaluation Process Algebra) .

Это своего рода язык программирования, который не превращается в машинный код, а компилируется в математическую модель (Марковскую цепь) .
PEPA позволяет описывать компоненты системы (пользователей, серверы) и правила их взаимодействия.
Инструмент автоматически рассчитывает пропускную способность и время отклика, избавляя исследователя от ручного решения тысяч уравнений .

🌿 Где еще работают эти модели? 43:00

Математика очередей нашла применение в самых неожиданных областях:

Логистика: оптимизация движения грузовых судов через каналы и шлюзы Бельгии .
Робототехника: расчет скорости движения манипулятора на конвейере для оптимальной производительности .
Телекоммуникации: расстановка вышек сотовой связи 3G/4G для минимизации потерь сигналов .
Медицина: расчет скорости поступления тревожных сигналов от датчиков в автомобиле или автобусе к водителю .
Биология: моделирование клеточного цикла . Белки внутри клетки рассматриваются как ресурсы. Хиллстон приводит пример белка циклина, чья концентрация определяет циклы деления клетки. Сбой в «расписании» этой системы может привести к патологиям .

🤖 Вызов эпохи: ИИ и «бесконечные» ресурсы 51:00

Одной из самых острых тем лекции стало обсуждение ресурсов, потребляемых современным ИИ. По мнению Джейн Хиллстон, разработчики больших языковых моделей (LLM) долгое время игнорировали вопрос эффективности, стремясь только к победам в рейтингах точности (accuracy benchmarks) .

Шокирующие цифры потребления ресурсов:

Один запрос в ChatGPT требует в 100 раз больше энергии, чем поиск в Google .
Обучение модели Llama привело к выбросу 539 метрических тонн CO2 .
Компании вроде Google всерьез обсуждают строительство малых ядерных реакторов для питания своих дата-центров .

Хиллстон утверждает, что культура «лидербордов» (таблиц рекордов) приучила отрасль к мысли о неограниченности ресурсов: чтобы нейросеть стала умнее, нужно просто добавить больше данных и больше вычислительных мощностей .

Кейс DeepSeek: эффективность от нужды 59:06

В 2024 году китайская модель DeepSeek привлекла внимание мирового сообщества не только качеством работы, но и беспрецедентной эффективностью.

Позиция Хиллстон: «Необходимость — мать изобретения». У разработчиков DeepSeek не было доступа к таким колоссальным вычислительным мощностям, как у американских технологических гигантов, из-за санкций и ограничений .
Это заставило их применить глубокое математическое проектирование и более грамотно использовать принципы параллелизма, добиваясь сопоставимых результатов при гораздо меньших затратах ресурсов .

Математическое моделирование сегодня — это не только способ ускорить работу компьютера, но и необходимый инструмент для выживания планеты в условиях экспоненциального роста цифрового потребления .