В мире современного программирования и инженерии мы привыкли полагаться на матрицы и тензоры как на единственный язык описания реальности. Профессор Кембриджского университета Джоан Ласенби (Joan Lasenby) уверена, что это историческое заблуждение, и предлагает альтернативу — геометрическую алгебру, которая способна упростить решение сложнейших задач от навигации дронов до квантовой физики.
🛸 Дроны, линии и компьютерное зрение 0:00
Традиционное компьютерное зрение в основном полагается на работу с точками. Когда мы видим облако точек (point cloud) или технологию захвата движений (motion capture) с характерными «пинг-понговыми» шариками на костюмах актеров, мы имеем дело с набором координат отдельных точек . Однако Джоан Ласенби и её команда в Кембридже работают над проектом, который переносит фокус на линии .
Использование линий критически важно для анализа городской среды — зданий, дорог, инфраструктуры, где геометрия задается не точками, а контурами. С классической точки зрения компьютерного зрения работа с линиями гораздо сложнее, чем с точками. По словам Ласенби, именно геометрическая алгебра (GA) становится тем математическим каркасом, который делает эти вычисления интуитивно понятными и эффективными .
📚 Математический фундамент: от Грассмана до Клиффорда 1:18
История этого метода уходит корнями в XIX век. Всё началось с Германа Грассмана и его концепции «внешнего произведения» (outer product), которая позволяла перемножать векторы для получения новых геометрических сущностей . Позже Уильям Клиффорд расширил эти идеи, объединив внутреннее (скалярное) и внешнее произведения в один продукт — произведение Клиффорда .
Ключевые элементы системы:
- Скаляры: обычные числа.
- Векторы: объекты, имеющие величину и направление.
- Бивекторы: ориентированные плоскости. В отличие от обычного представления «плоскости», бивектор обладает знаком (направленностью), зависящим от порядка перемножения векторов (A ∧ B = -B ∧ A) .
- Тривекторы: ориентированные объемы.
Ласенби подчеркивает, что эта система позволяет оперировать точками, линиями, плоскостями и объемами как едиными объектами в рамках одной алгебры . Их можно складывать, умножать и, что самое важное, дифференцировать.
🛰️ Почему мы не учили это в школе? 9:28
Несмотря на мощь системы, она долгое время оставалась в тени. По мнению Ласенби, это произошло из-за ранней смерти Клиффорда в возрасте 34 лет . После него пришли Джозайя Гиббс и Оливер Хевисайд, которые упростили математику до привычного нам векторного анализа с его кросс-произведением (cross-product) .
Проблема кросс-произведения в том, что оно работает исключительно в трехмерном пространстве. Оно выдает вектор, перпендикулярный плоскости, но в четырех измерениях понятия «перпендикуляра к плоскости» в таком виде просто не существует . Геометрическая алгебра лишена этого недостатка: она одинаково эффективно работает в любом количестве измерений.
Ласенби отмечает, что академическая среда крайне инертна. Ученым, которые всю жизнь использовали матрицы и тензоры, сложно переключиться на новую систему, даже если она объективно лучше объясняет физические процессы .
🔄 Революция в ротациях: кватернионы vs матрицы 12:39
Одним из самых практических применений геометрической алгебры является управление вращениями. В инженерии традиционно используются матрицы вращения 3x3. Однако, по утверждению Ласенби, они неудобны: у матрицы девять компонентов, но всего три степени свободы, что создает избыточность и вычислительные сложности при накоплении ошибок .
В качестве альтернативы часто используют кватернионы, которые популярны в графике и управлении спутниками. Ласенби объясняет, что кватернионы, по сути, являются частью геометрической алгебры — это просто вращения в плоскостях бивекторов . GA обобщает этот подход, позволяя выполнять вращения в любой размерности без «шарнирного замка» (gimbal lock) и сложных матричных вычислений.
🧬 Конформная геометрия: сфера как один объект 23:46
Настоящий прорыв для компьютерного зрения и графики случился в 1999 году, когда Дэвид Хестенес представил конформную геометрическую алгебру (CGA). Это пятимерное пространство, в котором:
- Сферы, круги, линии и точки становятся базовыми объектами .
- Пересечение двух сфер вычисляется одной операцией, а не системой сложных уравнений .
- Вращения, трансляции (перемещения) и масштабирования описываются единым оператором — ротором (rotor) .
Для разработчиков это означает возможность писать код на более высоком уровне абстракции. Вместо того чтобы высчитывать координаты пересечения плоскостей через массивы чисел, программист оперирует объектами «плоскость» и «линия» напрямую.
🤖 Геометрическая алгебра и AI 29:43
Сегодня индустрия активно уходит от чистой геометрии в сторону глубокого обучения (Machine Learning). Ласенби признает, что для простых задач сегментации изображений геометрическая алгебра может быть не нужна . Однако там, где требуется понимание структуры движения — например, при работе с множеством движущихся камер или дронов — GA дает неоспоримое преимущество.
По мнению спикера, будущее за объединением этих подходов: использованием геометрических объектов в качестве параметров для обучения нейросетей . Это позволит ИИ не просто «угадывать» пиксели, а понимать физическую и геометрическую логику пространства.
🛠️ Как начать внедрение? 48:04
Основной барьер для стартапов и инженеров сегодня — отсутствие образования в этой области и сложности с инструментами. Ласенби упоминает следующие ресурсы для изучения:
- Книги: «Geometric Algebra for Physicists» (Крис Доран и Энтони Ласенби) и «Geometric Algebra for Computer Scientists» (Лео Дорст) .
- Софт: Пакет
cliffordдля Python, разработанный Алексом Арсеновичем .
Для тех, кто не хочет возиться с установкой библиотек и зависимостей, студенты Кембриджа разработали веб-версию инструментов на базе Jupyter Notebook, которая позволяет тестировать геометрические алгоритмы прямо в браузере .
В завершение Ласенби отмечает, что хотя геометрическая алгебра и требует преодоления «учебного горба» и отказа от некоторых школьных привычек, она дает инженерам мощнейшую интуицию. Это «единый язык природы», который позволяет видеть структуру там, где раньше были лишь нагромождения цифр в таблицах .