Дерек Маллер: «Информация — это физическая реальность»

Почему разные языки звучат с разной скоростью и сколько байтов данных скрыто в человеческой ДНК? Дерек Маллер, автор научно-популярного канала Veritasium, в своем видео разбирает понятие информации как физической величины, объясняя, почему скорость нашего общения ограничена не языком, а возможностями мозга, и как информация буквально «впечатана» в окружающий мир.

🗣 Скорость речи и когнитивные ограничения 0:00

На первый взгляд кажется, что испанский язык звучит намного быстрее английского. Однако анализ показывает, что это лишь иллюзия: хотя в испанском языке произносится больше слогов в минуту, каждый отдельный слог несет меньше информации, чем в английском, из-за чего общая скорость передачи данных в обоих языках практически идентична.

Схожая ситуация наблюдается и с письменной речью:

Китайские иероглифы имеют более компактную форму, которая лучше вписывается в центральное поле зрения человека.
Английские читатели способны воспринимать до 7–8 букв за один взгляд, в то время как для китайских иероглифов этот показатель составляет около 2,6 символов.
Несмотря на разницу в восприятии, итоговая скорость чтения в обоих случаях эквивалентна примерно 380 словам в минуту.

Дерек Маллер делает вывод, что главным ограничителем скорости общения является не структура языка, а наши когнитивные способности — лимит скорости обработки информации мозгом.

💾 Что такое «бит» и как мы кодируем реальность 1:05

В основе количественного измерения информации лежит простейший выбор: ответ на вопрос «да или нет», результат подбрасывания монеты или выпадения грани кубика.

Бит: минимальная единица информации, которую можно представить как «1» или «0».
Сложные системы: для описания всех 6 граней игральной кости требуется 3 бита информации.
Текстовое кодирование: для представления 26 букв английского алфавита нужно 5 бит, а для полного набора из 95 символов (включая цифры и знаки препинания) — 7 бит.

Именно эти расчеты легли в основу стандарта ASCII, принятого в 1963 году. Позже компьютеры перешли на 8-битные единицы, названные байтами (byte) — Маллер отмечает, что замена «i» на «y» была сделана намеренно, чтобы избежать путаницы с «битом» (bit).

🧬 Информационная емкость человека 2:11

Если рассматривать человека с точки зрения данных, то его ДНК представляет собой последовательность из четырех молекул (A, T, G, C), где каждая может быть закодирована двумя битами.

В геноме человека содержится около 6 миллиардов букв генетического кода, что в пересчете составляет примерно 1,5 ГБ данных — этот объем легко помещается на стандартный DVD.
Однако, учитывая, что в теле человека около 40 триллионов клеток, каждая из которых несет копию ДНК, общий объем информации в теле достигает 60 зеттабайтов.
Для сравнения: весь объем цифровой информации в мире к 2020 году оценивался в 40 зеттабайтов.

Интересный факт: 99,9% генетической информации у всех людей одинаково. Это означает, что данные, делающие каждого из нас уникальной личностью, занимают менее одного мегабайта — такой объем поместится даже на старую дискету.

🌌 Информация как физическая реальность 3:59

Видеопоток — это пример того, как мы используем избыточность данных для сжатия. Хотя для воспроизведения HD-видео теоретически требуются огромные объемы данных, на YouTube мы видим лишь малую их часть, так как большинство кадров предсказуемы.

В финальной части дискуссии Дерек Маллер и его гость приходят к выводу, что информация — это не просто абстрактная концепция, а реальная физическая величина.

Слова, произнесенные вслух, — это физические колебания воздуха.
Они взаимодействуют с окружающим миром и не исчезают бесследно.
Теоретически, обладая исчерпывающими знаниями о положении каждой частицы во Вселенной, можно было бы вычислить и восстановить любую когда-либо произнесенную фразу или произошедшее событие.