Джейн Хиллстон: «Мы строим нейросети, забывая об ограниченности ресурсов»

The Royal Institution 26,1 тыс. 1 ч 1 мин 5 мин 29.04.2025
Главное

Математическое моделирование — это не просто абстрактные формулы, а инструмент управления реальностью, позволяющий находить баланс между нашими желаниями и физическими ограничениями. В своей лекции в The Royal Institution эксперт по моделированию Джейн Хиллстон объясняет, как теория очередей и современные вычислительные методы помогают оптимизировать всё: от графиков движения поездов до биологических процессов в клетках и энергопотребления искусственного интеллекта.

🇬🇧 Феномен очередей: британская традиция или мировая неизбежность? 0:19

Очереди часто воспринимаются как нечто специфически британское, однако, по словам Джейн Хиллстон, это универсальное явление, напрямую связанное с ограниченностью ресурсов . Очередь — это видимое проявление дисбаланса между спросом на услугу и возможностями системы её предоставить.

Единственный способ полностью избавиться от очередей — обладать «бесконечными ресурсами». В математических моделях это означает, что в момент вашего прихода в условное почтовое отделение мгновенно открывается новое окно обслуживания . Однако для операторов систем (почты, железных дорог или аэропортов) это экономически невозможно.

Ресурсы в системах могут быть как явными, так и скрытыми:

📊 Моделирование производительности: конфликт интересов 4:22

Джейн Хиллстон определяет это направление как «моделирование производительности» (performance modeling). Основная задача здесь — найти «золотую середину» между требованиями пользователей и возможностями владельцев системы .

Взгляд пользователя:

Взгляд оператора системы:

☎️ От телефонисток начала века до Закона Литтла 9:21

Основы этой науки заложил в начале XX века датский математик Агнер Эрланг, работавший в телефонной компании. В те времена соединения устанавливались вручную: телефонистка втыкала штекер в нужное гнездо на коммутаторе .

Эрланг разработал формулу (Erlang loss formula) для расчета вероятности того, что звонок будет сброшен из-за нехватки свободных слотов . Ключевой параметр в его расчетах — E (нагрузка в Эрлангах), которая является произведением частоты прибытия вызовов на среднюю длительность разговора . Эта формула до сих пор применяется в современных кол-центрах .

Другим столпом теории стал Закон Литтла, сформулированный Джоном Литтлом в 1961 году :

🎲 Роль случайности и Марковские цепи 22:17

В детерминированных системах, где всё происходит по строгому расписанию (например, клиент приходит ровно раз в 2 минуты и обслуживается ровно 1 минуту), очередей не возникает, а загрузка составляет 50% . Однако реальный мир хаотичен.

Джейн Хиллстон подчеркивает, что именно изменчивость (вариативность) создает очереди. Кто-то покупает одну марку, а кто-то оформляет паспорт — время обслуживания разное . Для описания таких процессов математики используют:

  1. Экспоненциальное распределение: оно учитывает «тяжелый хвост» — редкие, но очень длительные задачи .
  2. Марковские цепи: математические модели, где состояние системы (например, количество людей в очереди) меняется во времени на основе вероятностей .

💻 Процессные алгебры и язык PEPA 34:57

Классическая теория очередей хорошо работала для конвейерных линий и простых ЭВМ до 1980-х годов . Но с появлением интернета системы стали распределенными. Например, сервис бронирования Expedia одновременно отправляет запросы десяткам авиакомпаний, ждет ответов и объединяет их .

Для моделирования таких сложных параллельных (конкурентных) систем Джейн Хиллстон и её коллеги разработали PEPA (Performance Evaluation Process Algebra) .

🌿 Где еще работают эти модели? 43:00

Математика очередей нашла применение в самых неожиданных областях:

🤖 Вызов эпохи: ИИ и «бесконечные» ресурсы 51:00

Одной из самых острых тем лекции стало обсуждение ресурсов, потребляемых современным ИИ. По мнению Джейн Хиллстон, разработчики больших языковых моделей (LLM) долгое время игнорировали вопрос эффективности, стремясь только к победам в рейтингах точности (accuracy benchmarks) .

Шокирующие цифры потребления ресурсов:

Хиллстон утверждает, что культура «лидербордов» (таблиц рекордов) приучила отрасль к мысли о неограниченности ресурсов: чтобы нейросеть стала умнее, нужно просто добавить больше данных и больше вычислительных мощностей .

Кейс DeepSeek: эффективность от нужды 59:06

В 2024 году китайская модель DeepSeek привлекла внимание мирового сообщества не только качеством работы, но и беспрецедентной эффективностью.

Математическое моделирование сегодня — это не только способ ускорить работу компьютера, но и необходимый инструмент для выживания планеты в условиях экспоненциального роста цифрового потребления .

💬 Цитаты

«С точки зрения пользователя, идеальная система — это система с бесконечными ресурсами, где под каждого клиента мгновенно открывается новое окно обслуживания.»

Джейн Хиллстон 02:07

«Один запрос в ChatGPT потребляет в сто раз больше энергии, чем поиск в Google.»

Джейн Хиллстон 52:11

«Необходимость — мать изобретения: у DeepSeek не было таких мощностей, как у гигантов США, поэтому им пришлось проектировать эффективнее.»

Джейн Хиллстон 59:19
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Процессная алгебра (PEPA)
Математический язык для описания взаимодействия параллельных процессов в сложных системах.
Эрланг (единица)
Безразмерная единица измерения интенсивности нагрузки на ресурс, равная произведению интенсивности потока на время обслуживания.
Марковская цепь
Математическая модель системы, где будущее состояние зависит только от текущего состояния, а не от предыстории.
Время отклика (Response Time)
Общее время, которое задача проводит в системе: ожидание в очереди плюс время обработки.
📊 Цифры
🗓 Хронология
  1. Начало XX века Агнер Эрланг разрабатывает первые формулы теории очередей для телефонии.
  2. 1954 Первое упоминание закономерности, позже ставшей Законом Литтла.
  3. 1961 Джон Литтл публикует строгое доказательство своего закона.
  4. 1980-е Переход от классической теории очередей к моделированию сложных компьютерных сетей и интернета.
  5. 2018 Количество соединений в нейросетях превзошло размер мозга муравья.
  6. 2024 Появление DeepSeek и смещение фокуса на энергоэффективность ИИ.
⚖️ Другая сторона
Математика и физика Джейн Хиллстон PEPA Теория очередей DeepSeek Закон Литтла