Исследователи Google вырастили самовоспроизводящийся код из случайных строк

The Cognitive Revolution 1,4 тыс. 1 ч 30 мин 6 мин 30.08.2024
Главное

Недавнее исследование ученых из команды Google Paradigms of Intelligence открывает новые горизонты в понимании природы возникновения жизни и эволюции программного обеспечения. В рамках работы под названием «Computational Life» исследователи Этторе Рандаццо и Лука Версари продемонстрировали, как в простейшей цифровой среде из абсолютно случайных строк кода спонтанно рождаются устойчивые самовоспроизводящиеся структуры. Этот эксперимент доказывает, что фундаментальные механизмы эволюции и борьбы с энтропией могут запускаться без каких-либо заложенных функций оптимизации или внешнего отбора.

🧬 Саморепликация как фундамент жизни и борьба с энтропией 5:30

По мнению Этторе Рандаццо, дать точное определение жизни крайне сложно, однако её фундаментальным свойством признается наличие внутреннего порядка. В контексте второго закона термодинамики, который постулирует неизбежный рост хаоса, саморепликация выступает в роли созидательной силы, привносящей структуру и когерентность в деструктивную среду. Лука Версари дополняет, что в областях биологии и искусственной жизни самовоспроизведение всегда находится у истоков процессов, так как это наиболее эффективный способ сохранения и накопления информации во времени. По словам Версари, существующее многообразие видов на Земле представляет собой результат борьбы за ограниченные ресурсы между эффективными репликаторами. Кроме того, ученый выдвигает гипотезу, согласно которой сам человеческий интеллект мог развиться как эволюционный инструмент для обеспечения более эффективного размножения.

📊 Метрика сложности: на стыке Шеннона и Колмогорова 13:06

Для математического описания структуры и порядка в симулируемой системе ученые разработали оригинальную метрику сложности. По словам Луки Версари, имеющего опыт в теории информации, в основе метода лежит вычисление разности между энтропией Шеннона и колмогоровской сложностью данных. Энтропия Шеннона измеряет хаотичность, полностью игнорируя внутреннюю структуру: например, строка из чередующихся букв А и Б имеет ту же энтропию, что и строка, где сначала идут все буквы А, а затем все Б. Колмогоровская сложность, напротив, определяет длину кратчайшего алгоритма (машины Тьюринга), способного сгенерировать данную строку. Разность между этими показателями позволяет изолировать чистую структурную упорядоченность. Версари приводит аналогию со зданием: чертеж дома — это аналог колмогоровской сложности, а точное положение молекул — энтропия Шеннона. Если превратить здание в груду обломков, их энтропия останется прежней, но простая упорядоченная структура (чертеж) исчезнет, что приведет к падению метрики сложности. В реальном эксперименте колмогоровская сложность не поддается прямому вычислению, поэтому авторы используют математические прокси-метрики, такие как подсчет количества уникальных токенов в «супе».

💻 Устройство цифровой мини-вселенной 9:48

Главной задачей авторов эксперимента было создание максимально простой цифровой среды, которая изначально не поощряет появление живых организмов. Эксперимент начинается со случайного «супа» из независимых строк кода, длина каждой из которых составляет всего 64 байта. Процесс симулирует броуновское движение молекул в физическом мире: система случайным образом выбирает пару строк, соединяет их в цепочку длиной 128 байт и запускает выполнение кода. После завершения цикла строки разделяются и возвращаются обратно в общую массу. В этой системе полностью отсутствует целевая функция потерь или оптимизация, привычная для современных моделей ИИ. Для интерпретации кода ученые использовали модифицированную версию минималистичного языка программирования Brainfuck. Вместо стандартной схемы архитектура включает три виртуальные головки: две отвечают за чтение и запись данных, а третья управляет указателем команд. Алфавит языка содержит всего 10 операторов, в то время как остальные 246 байтовых значений воспринимаются как нейтральные данные.

🌋 Фазовый переход: от случайного хаоса к цифровой жизни 27:16

Период, предшествующий появлению первых устойчивых программ, исследователи называют «дожизненным». На этом этапе в системе происходит постепенное скрытое изменение распределения символов. Символы, отвечающие за перемещение головок и копирование данных, начинают стремительно набирать популярность, вытесняя операторы сложения и вычитания, которые лишь разрушают хрупкий код. Этторе Рандаццо сравнивает эту фазу с автокаталитическими сетями в химии, где группы элементов ускоряют синтез друг друга. Переломный момент наступает внезапно: плотность определенных символов, таких как нулевой байт, лавинообразно возрастает. Вспышка активности приводит к рождению первого полноценного саморепликатора, который за считанные мгновения заполняет всю систему идентичными копиями своей структуры. Данный феномен наглядно иллюстрирует резкий фазовый переход системы из состояния теплового хаоса к упоряоченной организации.

🦖 Эволюция, катастрофы и великое вымирание 51:45

Детальный анализ эволюционных треков показал, что первые поколения цифровой жизни крайне уязвимы. Простейшие репликаторы способны копировать себя только на пустое место, но если в целевой области они натыкаются на нулевой байт, процесс верификации завершается ошибкой. Из-за этой особенности первый успешный вид заполнил среду нулевыми байтами и полностью уничтожил собственную кормовую базу, что привело к мгновенному вымиранию и возвращению супа в исходное хаотичное состояние. Тем не менее, в ходе долгой симуляции система порождает новые, более продвинутые классы организмов. Ученые выделили три основные группы репликаторов:

🌿 Симбиоз, паразиты и «мусорная ДНК» 1:03:40

При усложнении геометрии среды до одного или двух измерений процессы начинают напоминать земную макроэволюцию. Локализация взаимодействий приводит к возникновению изолированных экологических ниш, которые развиваются независимо друг от друга и начинают конкурировать лишь на общих границах. Из-за непрерывных фоновых мутаций особи внутри одного вида не остаются полностью идентичными; они содержат уникальные цепочки неиспользуемых байтов, выполняющих роль биологической «мусорной ДНК». В альтернативных программных средах исследователи зафиксировали случаи цифрового симбиоза: короткие однобайтовые репликаторы начинали использоваться более длинными программами для ускорения собственного воспроизводства. Кроме того, коллеги авторов задокументировали появление выраженного паразитического поведения, когда волны программ-хищников размножались за счет чужих ресурсов, периодически приводя к коллапсу популяций хозяев.

🌌 Вероятность выживания и «Великий фильтр» 1:08:10

Математическое моделирование выявило жесткие рамки выживаемости организмов. По данным ученых, если искусственно поместить один экземпляр сформированного репликатора в случайную среду, вероятность того, что он сможет закрепиться и захватить пространство, составляет всего 22–23%. В остальных случаях первородный хаос или агрессивные соседние цепочки уничтожают одиночную программу до начала деления. Однако в долгосрочной перспективе появление жизни неизбежно: при запуске симуляции с нуля саморепликаторы гарантированно возникают и захватывают суп в 40–60% случаев в течение первых 16 000 эпох. Важнейшим фактором стабильности выступает уровень радиации (мутаций): при достижении порога в 1% скорость разрушения информации превышает скорость копирования, и система окончательно стерилизуется. Ведущий Нейтан Лабенц отмечает, что эти результаты заставляют переосмыслить концепцию «Великого фильтра» Робина Хансена, смещая фокус со сложности зарождения жизни на барьеры её долгосрочного космического выживания.

🤖 Перспективы для искусственного интеллекта и кибербезопасности 1:14:13

Финальная часть дискуссии была посвящена проекции открытий на будущее современной индустрии искусственного интеллекта. По мнению Нейтана Лабенца, экономическое давление и повсеместная интеграция открытых моделей (таких как Llama 3) неизбежно приведут к созданию автономных самореплицирующихся систем ИИ. Гости из Google призывают к осторожности в подобных прогнозах. Лука Версари подчеркивает колоссальную разницу в масштабах: их симуляция потребовала выполнения 50 миллиардов инструкций и обсчета 3 миллионов программных путей, что заняло всего минуту на специализированном оборудовании. Большие языковые модели (LLM) функционируют несравнимо медленнее и требуют огромных финансовых и вычислительных затрат, что делает их неуправляемую репликацию в дикой природе маловероятной в обозримом будущем. Тем не менее, Лабенц возражает, напоминая о критической уязвимости мировой цифровой инфраструктуры, приводя в пример успешные взломы Конгресса и Белого дома. Открытым остается и вопрос предела усложнения: большинство моделей искусственной жизни рано или поздно упираются в эволюционное плато, преодолеть которое без качественного изменения архитектуры пока не удается.

💬 Цитаты

«Саморепликация выступает в роли созидательной силы, привносящей структуру и когерентность в деструктивную среду.»

Этторе Рандаццо 6:08

«Можно даже утверждать, что интеллект развился как способ лучше размножаться.»

Лука Версари 7:45
👥 Спикеры
📖 Термины
Энтропия Шеннона
Мера неопределенности или хаотичности информации, игнорирующая её внутреннюю структуру.
Колмогоровская сложность
Длина кратчайшего алгоритма или программы, способной полностью воссоздать данный объект.
Brainfuck
Минималистичный язык программирования, разработанный для усложнения написания программ человеком, но идеальный для простых симуляций.
Автокаталитический сет
Группа элементов, в которой каждый компонент катализирует синтез других участников.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Google Computational Life саморепликация Brainfuck