# Программирование жизни: как модель ESM3 имитирует 500 миллионов лет эволюции

Источник: https://www.youtube.com/watch?v=aPCqzrscY4w
Канал: Wes Roth
Опубликовано: 25.06.2024

---

В новом выпуске блогер и обозреватель технологий ИИ Уэс Рот (Wes Roth) анализирует два масштабных технологических прорыва: выход биологической языковой модели ESM3 от стартапа Evolutionary Scale и анонс специализированного процессора Sohu от компании Etched. Главная тема обсуждения — переход от простого наблюдения за природными процессами к их полномасштабному проектированию и симуляции с помощью искусственного интеллекта.

## 🧬 ESM3: Языковая модель, которая пишет код жизни
[[JUMP:0:00]]

Белки являются фундаментальными строительными блоками жизни, выполняя роль «микроскопических фабрик», которые обеспечивают всё — от движения мышц до фотосинтеза и работы человеческого мозга [0:52]. По словам Уэса Рота, если человечество научится «читать и писать» на коде жизни, биология станет программируемой дисциплиной [1:47]. Это позволит заменить метод проб и ошибок в медицине строгой логикой, а дорогостоящие эксперименты — компьютерным моделированием [2:00].

В центре этого процесса стоит ESM3 — передовая языковая модель (Frontier Language Model), созданная специально для проектирования биологических систем с нуля [2:27]. В отличие от предыдущих итераций, подобных AlphaFold от Google DeepMind, которая произвела революцию в предсказании 3D-структуры белков [4:36], ESM3 работает как мультимодальная система. Она объединяет три фундаментальных свойства:

*   **Последовательность:** цепочка аминокислот, составляющая «текст» белка [4:21].
*   **Структура:** трехмерная форма, определяющая возможности молекулы [4:36].
*   **Функция:** конкретная задача, которую выполняет белок в организме [5:01].

## 🧪 Симуляция 500 миллионов лет эволюции
[[JUMP:03:05]]

В качестве доказательства возможностей модели разработчики представили ESM-GFP — новый вариант зеленого флуоресцентного белка (GFP), который заставляет медуз светиться [3:05]. Этот инструмент критически важен для биотехнологий, так как свечение позволяет ученым видеть работу белков внутри живых клеток [7:40].

Ключевые факты о создании ESM-GFP:

*   **Степень новизны:** последовательность нового белка совпадает с ближайшим природным аналогом лишь на 58% [3:29].
*   **Эволюционный скачок:** по оценкам авторов проекта, для возникновения такого белка в дикой природе естественным путем потребовалось бы более 500 миллионов лет эволюции [3:42].
*   **Метод генерации:** модель использовала подход Chain of Thought («цепочка рассуждений»), разбивая сложную задачу проектирования на последовательные шаги, аналогично тому, как ChatGPT решает математические задачи [9:12].

Уэс Рот отмечает, что вероятность случайного возникновения такого белка астрономически мала, так как количество возможных комбинаций аминокислот превышает число атомов в видимой Вселенной [9:39]. Тем не менее, ИИ смог сгенерировать жизнеспособные варианты, включая версию C10, которая по яркости не уступает природным образцам [10:31].

## 🌍 Открытая наука и «божественные» возможности
[[JUMP:10:55]]

Проект Evolutionary Scale придерживается принципов открытой науки. Команда выпустила в открытый доступ код и веса модели ESM3 с 1,4 миллиарда параметров [11:09]. Более крупная версия модели на 98 миллиардов параметров остается закрытой, но общая доступность даже компактной версии дает исследователям огромные возможности.

По мнению Уэса Рота, такие технологии вызывают двоякое чувство:

1.  **Надежда:** возможность радикально сократить страдания от болезней, замедлить старение или даже достичь «пренебрежимого старения», когда биологический возраст остается неизменным [11:49].
2.  **Тревога:** Рот признает, что фраза разработчиков «нам не терпится увидеть, что вы создадите» может пугать, учитывая потенциал модификации основ жизни [11:36].

Интересен и состав команды стартапа: он был сформирован бывшими сотрудниками группы FAIR (Fundamental AI Research) компании Meta [12:54]. Это создает забавный парадокс, на который указывает ведущий: Ян Лекун, глава ИИ в Meta, публично критикует архитектуру LLM, называя их «глупыми» и не ведущими к созданию сильного ИИ (AGI) [13:07]. Тем не менее, ESM3 — это именно LLM, и Лекун сам поздравил команду с успехом в области протеомики [12:41].

## ⚡ Etched и чип Sohu: вызов доминированию NVIDIA
[[JUMP:14:12]]

Вторая громкая новость выпуска — выход из скрытности компании Etched, которая представила специализированный чип Sohu для работы с нейросетями [14:12]. Разработчики утверждают, что это самый быстрый ИИ-процессор в мире, предназначенный исключительно для архитектуры Transformer [14:25].

Основные характеристики и заявления Etched:

*   **Производительность:** чип способен выдавать более 500 000 токенов в секунду на модели Llama (70B) [14:25]. По подсчетам Рота, это эквивалентно написанию всех книг о Гарри Поттере менее чем за 3 секунды [0:13].
*   **Эффективность:** по утверждению компании, один сервер на базе Sohu заменяет 160 ускорителей NVIDIA H100 [14:39].
*   **Узкая специализация:** Sohu является ASIC-чипом (специализированной интегральной схемой), который «умеет» только запускать Трансформеры и ничего больше [15:18]. Он не может обучать нейросети других типов, но в своей нише он, по словам разработчиков, в 10 раз быстрее перспективной архитектуры Blackwell от NVIDIA [15:45].

Уэс Рот резюмирует, что появление таких специализированных игроков, как Etched и Groq, создает реальную конкуренцию на рынке «железа», что неизбежно ускорит развитие технологий ИИ [15:58].