Теорема Балога — Семереди — Гоуэрса и проекции Бургена — Каца — Тао

В рамках курса от MIT OpenCourseWare представлена лекция, посвященная разбору одного из фундаментальных утверждений современной аддитивной комбинаторики — проекционной теореме Бургена — Каца — Тао. Преподаватель подробно воссоздает математический аппарат, связывающий геометрию проекций с аддитивной структурой множеств, и объясняет, как преодолеть так называемый «сценарий врага» с помощью мощного инструментария комбинаторной теории чисел. В центре внимания оказываются не только классические неравенства, но и глубокая взаимосвязь между размерами множеств сумм и аддитивной энергией.

📐 Проекции в конечных полях: Постановка задачи и теорема Бургена — Каца — Тао 0:11

В лекционном курсе для решения задач проекционной теории традиционно применяется три основных набора инструментов. Первым методом, подробно изученным в начале занятий, был двойной подсчет. Затем фокус сместился на методы Фурье-анализа. Третьим же ключевым блоком, изучение которого началось на предыдущей неделе, стали инструменты из комбинаторной теории чисел. Текущая лекция завершает данный цикл, полностью фокусируясь на проекционной теореме, сформулированной Жаном Бургеном, Нетсом Кацем и Теренсом Тао.

Главная особенность теоремы Бургена — Каца — Тао (BKT) заключается в том, что она работает над конечными полями и позволяет четко разграничить свойства, характерные для простых полей, и свойства, выполняющиеся для других полей. Ни один из ранее применявшихся методов не обладал подобной избирательностью. Формально теорема утверждает следующее: если $X$ является подмножеством пространства $F_p^2$ и имеет размер $P^{S_x}$, где величину $S_x$ можно содержательно интерпретировать как аналог размерности, то накладываются определенные ограничения. Показатель $S_x$ должен строго находиться в диапазоне от 0 до 2, то есть подмножество не должно быть ни слишком ничтожным, ни покрывать все пространство целиком.

Если также задано множество направлений $D$ в поле $F_p$ размера $P^{S_d}$, которое тоже не является чересчур малым, то при взятии максимума по всем направлениям от размера проекции в этом направлении мы получаем строгое ограничение. Размер такой проекции будет как минимум равен квадратному корню из размера $X$, умноженному на дополнительный фактор $P^{\epsilon}$. Лектор подчеркивает, что получить базовую оценку в виде квадратного корня не составляет большого труда, однако добавление положительного параметра $\epsilon$, зависящего от исходных размерностей, представляет собой качественный прорыв.

Значимость теоремы BKT подчеркивается тем фактом, что данное утверждение категорически неверно для других типов полей. Например, оно оказывается ложным в пространстве $F_q^2$, если $Q = P^2$. В качестве контрпримера лектор приводит ситуацию, когда $X$ выбирается как $F_p^2$, а множество направлений $D$ совпадает с $F_p$ — в этом случае результат всегда будет оставаться в пределах $F_p$. По ироничному замечанию лектора, явное вычисление эпсилон привело бы исследователей лишь к разочарованию из-за скромности числа. Тем не менее, качественно эта теорема дает фундаментальное улучшение. Данная теорема и ее вещественный аналог над полем $\mathbb{R}$ находят огромное количество практических приложений, и практически весь последующий материал учебного курса будет опираться именно на этот базис.

🖨️ «Сценарий врага» и границы применения предыдущих методов 3:11

На предыдущем занятии была введена комбинаторная теория чисел и теория сумм-произведений, а также доказана Теорема 1, продвигающая исследователей в нужном направлении. Она описывала специальный частный случай, когда подмножество $X$ представляет собой прямое произведение вида $A \times A$. Согласно Теореме 1, если множество $A$ содержится в простом поле $F_p$, его размер равен $P^{S_a}$, а $D$ — это множество направлений в $F_p$ размера $P^{S_d}$, то максимум по всем направлениям $T$ из множества $D$ от аддитивной комбинации $A + T \cdot A$ будет не меньше, чем размер множества $A$, умноженный на $P^{\epsilon_1}$. Этот параметр $\epsilon_1$ немного увеличивает оценку, и данное утверждение опять же ложно для полей, имеющих подполя, поскольку при выборе элементов из подполя вся структура останется запертой внутри него.

Основная цель текущей лекции — совершить переход от этого частного случая к общему утверждению. На первый взгляд, Теорема 1 кажется слишком специфической, однако лектор берется доказать, что это лишь небольшое ограничение. Для этого запускается попытка доказать теорему Бургена — Каца — Тао методом от противного. Предполагается, что значение $\epsilon$ является крайне малым и будет определено позже. В рамках антитезиса принимается, что для всех направлений $T$ из множества $D$ проекция $\pi_T(X)$ строго меньше, чем $|X|^{1/2} \cdot P^{\epsilon}$.

Без потери общности можно считать, что направления 0 и бесконечность (горизонтальная и вертикальная проекции) изначально включены в набор направлений $D$. Это допущение позволяет построить такое вспомогательное множество $A$, что произведение $A \times A$ гарантированно содержит $X$, причем $X$ составляет большую часть этого произведения. Множество $A$ определяется как объединение проекций $\pi_0(X)$ и $\pi_{\infty}(X)$, при этом размер $A$ ограничен величиной |$X|^{1/2} \cdot P^{\epsilon}$, а само множество $X$ вложено в $A \times A$. Поскольку $X$ оказывается крупным подмножеством произведения, к нему можно применить Теорема 1, которая гарантирует, что максимум проекций всего произведения $A \times A$ будет большим.

Однако этот шаг еще не приводит к искомой проекционной теореме, так как математикам требуется доказать большую величину проекции именно для исходного подмножества $X$, а не для искусственного произведения $A \times A$. Возникает серьезная проблема, обозначаемая как «сценарий врага»: проекция подмножества $X$ может оказаться значительно меньше проекции всего произведения $A \times A$, даже несмотря на то, что $X$ занимает огромную долю в $A \times A$. Лектор иллюстрирует эту угрозу графически, показывая, как при проецировании в определенном направлении синяя область (произведение множеств без $X$) может давать колоссальное количество точек, в то время как проекция самого $X$ останется сжатой и ничтожной.

Чтобы нащупать решение, преподаватель предлагает аудитории подумать над реальным примером, где такой сценарий возможен. Один из студентов выдвигает гипотезу: что если выбрать $X$ в качестве диагонали, состоящей из пар элементов $(a, a)$ в рамках $A \times A$? В таком случае проекция в направлении $-1$ даст чистый ноль, так как разность $a - a$ всегда обнуляется, что дает экстремально малый размер проекции. Однако лектор указывает на изъян этого примера: такая диагональ $X$ по определению слишком мала по сравнению со всем квадратом $A \times A$.

Для уточнения условий задачи вводятся жесткие параметры: пусть размер множества $A$ равен $N$, а подмножество $X$ в $A \times A$ действительно огромно — его размер превосходит $K^{-1} \cdot N^2$, где параметр $K$ имеет порядок $N^{1/1000}$. Может ли в такой ситуации проекция $X$ все еще оставаться драматически меньше проекции всего объема $A \times A$? Другой студент предлагает применить принцип Дирихле к слоям проекции, выбрав $X$ как объединение наибольших слоев. Лектор соглашается с этой логикой: в деструктивном сценарии слои проекции обязаны сильно отличаться друг от друга по размеру.

В качестве математической модели такого поведения рассматривается пример, где $X$ изначально строится как отрезок натурального ряда от 1 до $N$ в квадрате, а проекция $\pi_1(X)$ дает целые числа от 1 до $2N$, что весьма мало. Если затем искусственно «раздуть» множество $A$, добавив к нему случайное неструктурированное подмножество $\tilde{A}$ такого же размера $N$, то проекция всего нового произведения $A \times A$ резко вырастет за счет элементов $\tilde{A}$, в то время как проекция исходного $X$ останется на прежнем уровне. Возникнет колоссальный разрыв. Впрочем, для исходной стратегии этот пример не опасен, так как исследователи вольны изначально выбрать меньшее множество $A$, избавившись от случайного шума. Главным ключом к преодолению этой проблемы в доказательстве Бургена, Каца и Тао становится классическая комбинаторная теорема Балога — Семереди — Гоуэрса, которая утверждает, что описанный пример с «мусором» является фактически единственным способом получить сильное сжатие проекции подмножества.

🌉 Теорема Балога — Семереди — Гоуэрса как мост через пропасть 15:37

Теорема Балога — Семереди — Гоуэрса (BSG) представляет собой один из центральных инструментов в арсенале аддитивной комбинаторики. Она стоит в одном ряду со знаменитыми неравенствами Плюннекке — Ружи, которые разбирались на прошлом занятии. Формулировка теоремы звучит следующим образом: если множества $A$ и $B$ содержатся в абелевой группе, их размеры не превышают $N$, а $X$ является подмножеством их прямого произведения $A \times B$ и составляет его значительную фракцию, причем проекция этого подмножества в некотором направлении мала, то выполняются важные структурные следствия.

Для понимания масштабов лектор просит представить, что параметр $K$ намного меньше, чем $N$. Минимально возможный размер проекции в такой конфигурации колеблется в районе $N$, поскольку при фиксации одного элемента из $B$ для элемента из $A$ остается порядка $N$ вариантов. Таким образом, проекция подмножества почти настолько мала, насколько это вообще возможно. Главный вывод теоремы BSG заключается не в том, что проекция всего произведения $A \times B$ обязательно обязана быть малой (ведь пример с добавлением случайного шума это опровергает).

Суть в другом: всегда можно обнаружить достаточно крупные куски $A'$ и $B'$ внутри исходных множеств $A$ и $B$, проекция произведения которых окажется гарантированно малой. Математически это выражается в существовании подмножеств $A' \subset A$ и $B' \subset B$, для которых новое пересечение $X' = (A' \times B') \cap X$ все еще удерживает весомую долю от общего пространства (порядка $K^{-c} \cdot N^2$ для некоторой константы $c$). При этом проекция полного произведения этих выделенных кусков $\pi_T(A' \times B')$ остается малой и не превышает величину $K^c \cdot N$. В контексте ранее разобранного примера со случайным шумом, подмножество $A'$ как раз и представляет собой ту самую структурированную упорядоченную часть, очищенную от хаотических внешних элементов. Данный инструмент позволяет математикам изолировать структурное ядро множества и работать с ним напрямую.

💎 Симметрия решётки и лемма о покрытиях сдвигами 24:30

Для реализации доказательства проекционной теоремы формулируется вспомогательная лемма. Она описывает поведение произвольного подмножества $Y$, вложенного в произведение структурированных множеств $A' \times B'$. На множества $A'$ и $B'$ накладываются свойства, полученные на предыдущем этапе: аддитивная комбинация $A' + T_1 \cdot B'$ мала, а разность $A' - A'$ также имеет жестко ограниченный размер. Лемма утверждает, что для любого направления $T$, отличного от базового $T_1$ в простом поле $F_p$, размер проекции подмножества $\pi_T(Y)$ будет гарантированно снизу ограничен величиной, зависящей от соотношения размеров $Y$ и общего квадрата $N^2$, помноженного на проекцию полного произведения $A' \times A'$ в связанном угловом направлении.

Геометрическая интуиция, стоящая за этим формальным неравенством, призвана полностью исключить «сценарий врага». Лектор предлагает визуализировать произведение $A' \times B'$ как идеальную, высокосимметричную структуру — например, в виде регулярной кристаллической решётки. Если внутри такой решётки расположено крупное, пусть даже хаотичное подмножество $Y$, то невозможно представить ракурс, при котором проекция $Y$ сильно сожмется, а проекция всей решётки останется огромной. Из-за фундаментальной симметрии решётки её можно целиком покрыть всего лишь несколькими параллельными сдвигами подмножества $Y$. Если каждый из этих сдвигов под воздействием проекции сжимается, то и вся решётка под тем же углом неизбежно обязана сильно сжаться.

Математическое воплощение этой интуиции строится через рассмотрение семейства сдвигов вида $Y + (T_1, T_2)$. Компоненты сдвига $T_1$ выбираются из разностного множества $A' + A' - A'$, а $T_2$ — из специально подобранной структуры. Проводя строгий аудит, лектор доказывает, что для любых точек из произведения $A' \times A'$ и любой точки внутри $Y$ существует строго единственная пара трансляций $(T_1, T_2)$, осуществляющая перенос. Это уравнение легко разрешается аналитически.

В результате данные сдвиги покрывают целевой продукт $A' \times (-1/T_1 \cdot A')$ ровно $|Y|$ раз. Преподаватель обращает внимание на то, что технически было бы несколько проще покрыть абстрактное произведение $A'' \times B''$, однако выбранная схема с дилатация множества $A'$ гораздо выгоднее, поскольку она максимально приближает исследователей к условиям применения Теоремы 1. Поскольку объемы используемых для сдвига множеств жестко ограничены исходными гипотезами, это означает, что типичный сдвиг подмножества $Y$ чрезвычайно эффективно и плотно покрывает симметричную структуру. Итоговое неравенство изолирует проекцию $\pi_T(Y)$ и подготавливает финальный шаг всего доказательства.

🏁 Завершение доказательства и тонкий баланс эпсилонов 36:22

Финальный аккорд доказательства теоремы Бургена — Каца — Тао сводится к оценке максимума проекций исходного множества $X$ по всем доступным направлениям. Этот максимум заведомо не меньше максимума проекций для выделенного подмножества $X'$, полученного в ходе очистки множества Балогом, Семереде и Гоуэрсом. Применяя доказанную лемму о покрытиях к множеству $X'$, математики видят, что отношение $|X'| / N^2$ фактически нивелируется, так как размеры этих объектов практически идентичны. В сухом остатке возникает задача оценки проекций множества $A' \times A'$ в огромном количестве различных направлений, что в точности соответствует условиям Теоремы 1, доказанной ранее.

По Теореме 1 эта величина строго превосходит произведение $N \cdot P^{\epsilon_1}$. Возникает искомое противоречие с антитезисом, что и завершает строгое доказательство: по крайней мере одна из проекций обязана быть значительной и доминировать над уровнем $|X|^{1/2} \cdot P^{\epsilon_1}$. Резюмируя пройденный путь, лектор выделяет две фундаментальные крупицы мудрости, полученные в процессе преодоления деструктивного сценария:

Мудрость первая (из теоремы BSG): в критической ситуации подмножество $X$ локализуется внутри меньшего произведения, и их проекции становятся сопоставимыми.
Мудрость вторая (из леммы): если у продукта множеств есть хотя бы одна малая проекция, этот продукт приобретает глубокую внутреннюю симметрию, мешающую его крупным частям вести себя аномально при проецировании под другими углами.

Один из студентов задает важный технический вопрос: не зависит ли подмножество $A'$ от текущего направления $T$? Преподаватель разъясняет этот нюанс: множество $A'$ действительно жестко привязано к конкретному стартовому направлению $T_1$, для которого проекция была малой. Однако прелесть метода в том, что, зафиксировав $A'$ и $B'$ один раз с помощью $T_1$, исследователи больше не меняют их при переборе всех остальных углов $T$, а используют их перманентную внутреннюю симметрию. Другое важнейшее преимущество множества $A'$ перед исходным множеством $A$ заключается в том, что для $A'$ разность $A' - A'$ гарантированно мала, тогда как исходное $A$ могло содержать в себе огромные массивы неструктурированного аддитивного «мусора», разрушающего оценки.

Лектор отдельно останавливается на скрытом балансе параметров, указывая, что в формулах неявно присутствует фактор $P^{O(\epsilon)}$. Крайне важно осознавать качественную разницу между параметрами: $\epsilon_1$ пришел из Теоремы 1 и является фиксированной константой, в то время как $\epsilon$ из теоремы BKT должен быть существенно меньше. В ходе применения теоремы BSG и леммы происходят неизбежные потери точности — показатель ухудшается примерно в 10–20 раз, порождая множители вроде $P^{20\epsilon}$. Чтобы финальный выигрыш от Теоремы 1 смог гарантированно доминировать над всеми накопленными в процессе рассуждений потерями, параметр $\epsilon$ обязан выбираться примерно как $1/20$ от величины $\epsilon_1$. Математикам приходится совершать целую последовательность изощренных шагов, и на каждом этапе исходный параметр неизбежно тает.

Отвечая на вопрос о существовании гипотетического точного предела для максимально возможного эпсилон, преподаватель подтверждает наличие открытой проблемы. Существует строгая гипотеза, утверждающая, что наихудшим сценарием является чистая геометрическая решётка, а в качестве направлений выступают рациональные числа с малыми наклонами. Перевод этой конфигурации на язык теоремы BKT дает точную формулу для вычисления предельного значения параметра. На сегодняшний день над простыми полями $F_p$ данный вопрос остается полностью открытым, в то время как аналогичная версия над вещественным пространством $\mathbb{R}$ уже успешно доказана.

⚡ Аддитивная энергия против размера множества сумм 49:06

Переходя к более широкому контексту аддитивной комбинаторики, лектор вводит фундаментальную дихотомию между двумя методами измерения внутренней структуры объектов: размером множества сумм $A + B$ и так называемой аддитивной энергией. Аддитивная энергия по определению фиксирует количество совпадений при сложении элементов. Если множества $A$ и $B$ лежат в абелевой группе, то их аддитивная энергия $E(A, B)$ представляет собой точное число четверок элементов $(a_1, a_2, b_1, b_2)$, удовлетворяющих базовому уравнению $a_1 + b_1 = a_2 + b_2$. Альтернативный взгляд на эту величину предлагает функция представлений $R_{AB}(z)$, подсчитывающая, сколькими путями число $z$ раскладывается на сумму элементов из $A$ и $B$. Тогда аддитивная энергия эквивалентна сумме квадратов этих функций по всем возможным значениям $z$. Высокая энергия прямо свидетельствует о колоссальном количестве аддитивных совпадений.

Для калибровки понимания приводятся граничные ориентиры для множеств размера $N$:

Минимально возможная энергия равна $N^2$. Этот показатель достигается в абсолютно случайных или неструктурированных множествах, где существуют только тривиальные решения уравнения (когда $a_1 = a_2$ и $b_1 = b_2$).
Максимально возможная энергия имеет порядок $N^3$. Данный пик покоряется в том случае, если множества $A$ и $B$ совпадают и образуют подгруппу в группе целых чисел $\mathbb{Z}$, где для любых трех выбранных элементов четвертый всегда гарантированно найдется внутри этой же структуры.

Связь между малостью множества сумм и величиной аддитивной энергии строго доказывается с помощью классического неравенства Коши — Буняковского — Шварца. Проводя двойной подсчет суммы функций представлений, математики получают тождество, равное произведению размеров множеств $|A| \cdot |B|$. Применяя Коши — Шварца к элементам, входящим исключительно в подмножество сумм $A + B$, исследователи выводят фундаментальное неравенство: энергия $E(A, B)$ всегда не меньше, чем $|A|^2 \cdot |B|^2 / |A+B|$. Отсюда вытекает прямое следствие: если размер множества сумм близок к линейному значению $N$, то аддитивная энергия автоматически взлетает до своего теоретического максимума $N^3$. Малость суммы жестко гарантирует колоссальную внутреннюю структурированность.

Однако, как подчеркивает лектор, это движение работает только в одну сторону: огромная аддитивная энергия сама по себе вовсе не гарантирует, что множество сумм будет маленьким. Главной причиной этой асимметрии вновь становится аддитивный «мусор». Достаточно взять идеальную подгруппу или отрезок арифметической прогрессии размера $N$ и объединить их со случайным, хаотичным набором чисел аналогичного объема. Энергия такого гибридного множества останется колоссальной за счет структурированного ядра, однако хаотический хвост при сложении мгновенно раздует размер итогового множества сумм до огромных значений. С этой коварной особенностью математикам приходится сражаться на протяжении всей лекции.

🔄 Теорема об энергии и «заразная структура» 1:02:38

Контрапозитивная логика подсказывает: если аддитивная энергия множеств мала, то размер их суммы обязан быть большим. Но данный инструмент позволяет заявить гораздо более сильное утверждение, связывающее энергию с проекциями произвольных подмножеств. Сформулированная лемма постулирует, что квадрат размера подмножества $|X|^2$ никогда не превышает произведение размера его проекции $\pi_1(X)$ на полную аддитивную энергию вмещающего пространства $E(A, B)$. Доказательство опирается на аналогичный аппарат Коши — Шварца с ограничением суммирования только по тем элементам, которые реально задействованы в подмножестве $X$.

Этот факт приводит к выводу: требование малости аддитивной энергии является гораздо более мощным условием, нежели простое требование крупного размера множества сумм. Малая энергия автоматически гарантирует, что проекция абсолютно любого крупного подмножества $X$ внутри пространства $A \times B$ останется большой, что полностью ликвидирует саму возможность появления «сценарий врага». Это наблюдение подталкивает к формулировке Теоремы 2 — усиленной энергетической версии Теоремы 1. Вместо максимизации размера суммы $A + T \cdot A$ в ней утверждается минимизация аддитивной энергии между множеством $A$ и его растянутой копией $T \cdot A$ по всем доступным направлениям, которая падает значительно ниже максимального порога $P^{3S_a}$.

Энергетическая формулировка автоматически, без привлечения дополнительных надстроек, влечет за собой усиленную версию проекционной теоремы Бургена — Каца — Тао. Она гарантирует существование такого стабильного направления $T$, при котором проекция любого крупного подмножества будет оставаться стабильно большой. Лектор упоминает, что во время каникул его коллега Пабло особо акцентировал внимание на важности именно этой усиленной энергетической версии: подавляющее большинство практических и прикладных задач в современной математике опираются именно на стабильность энергетических оценок, а не на базовые кардинальные размеры множеств.

В финале лекции преподаватель предлагает концептуальный разбор: почему нельзя было упростить жизнь и оперировать аддитивной энергией с самого первого шага доказательства Теоремы 1? Причина кроется в фундаментальном свойстве, которое лектор называет «заразной структурой» (contagious structure). Базовые размеры множеств сумм обладают этим свойством благодаря неравенствам Плюннекке — Ружи: если суммы $A + T_1 \cdot A$ и $A + T_2 \cdot A$ малы, то комбинация с суммой направлений $A + (T_1 + T_2) \cdot A$ тоже гарантированно останется небольшой. Структура стремительно размножается при операциях, что в итоге позволяет применить двойной подсчет и получить противоречие.

Аддитивная энергия лишена свойства «заразительности». Высокая энергия означает лишь локальную дружелюбность определенных кусков множества. Один фрагмент множества $A$ может быть чрезвычайно дружелюбен к направлению $T_1$, а совершенно другой фрагмент — к направлению $T_2$. Но у них может не найтись ни одной общей точки соприкосновения, способной поддержать аддитивную связь с суммарным направлением $T_1 + T_2$. Лектор иллюстрирует это примером объединения трех изолированных прогрессий, умноженных на произвольные коэффициенты, где взаимная дружелюбность полностью испаряется на стыках.

Таким образом, математикам критически необходимо работать со множествами сумм на этапе накопления структуры, но затем переходить к энергиям для обеспечения стабильности подмножеств. Теорема Балога — Семереди — Гоуэрса служит идеальным шлюзом для этого трансфера, позволяя исследователям брать лучшее от обоих миров. В завершение лектор цитирует недавнее выступление Пабло на семинаре по анализу, где тот сделал провокационное заявление: проекционная теорема BKT, возможно, является одним из самых важных и часто используемых математических утверждений, доказанных за последние несколько десятилетий. И по мере углубления в предмет справедливость этих слов раскрывается со всей очевидностью.