Программирование жизни: как модель ESM3 имитирует 500 миллионов лет эволюции

Wes Roth 166 тыс. 16 мин 3 мин 25.06.2024
Главное

В новом выпуске блогер и обозреватель технологий ИИ Уэс Рот (Wes Roth) анализирует два масштабных технологических прорыва: выход биологической языковой модели ESM3 от стартапа Evolutionary Scale и анонс специализированного процессора Sohu от компании Etched. Главная тема обсуждения — переход от простого наблюдения за природными процессами к их полномасштабному проектированию и симуляции с помощью искусственного интеллекта.

🧬 ESM3: Языковая модель, которая пишет код жизни 0:00

Белки являются фундаментальными строительными блоками жизни, выполняя роль «микроскопических фабрик», которые обеспечивают всё — от движения мышц до фотосинтеза и работы человеческого мозга . По словам Уэса Рота, если человечество научится «читать и писать» на коде жизни, биология станет программируемой дисциплиной . Это позволит заменить метод проб и ошибок в медицине строгой логикой, а дорогостоящие эксперименты — компьютерным моделированием .

В центре этого процесса стоит ESM3 — передовая языковая модель (Frontier Language Model), созданная специально для проектирования биологических систем с нуля . В отличие от предыдущих итераций, подобных AlphaFold от Google DeepMind, которая произвела революцию в предсказании 3D-структуры белков , ESM3 работает как мультимодальная система. Она объединяет три фундаментальных свойства:

🧪 Симуляция 500 миллионов лет эволюции 3:05

В качестве доказательства возможностей модели разработчики представили ESM-GFP — новый вариант зеленого флуоресцентного белка (GFP), который заставляет медуз светиться . Этот инструмент критически важен для биотехнологий, так как свечение позволяет ученым видеть работу белков внутри живых клеток .

Ключевые факты о создании ESM-GFP:

Уэс Рот отмечает, что вероятность случайного возникновения такого белка астрономически мала, так как количество возможных комбинаций аминокислот превышает число атомов в видимой Вселенной . Тем не менее, ИИ смог сгенерировать жизнеспособные варианты, включая версию C10, которая по яркости не уступает природным образцам .

🌍 Открытая наука и «божественные» возможности 10:55

Проект Evolutionary Scale придерживается принципов открытой науки. Команда выпустила в открытый доступ код и веса модели ESM3 с 1,4 миллиарда параметров . Более крупная версия модели на 98 миллиардов параметров остается закрытой, но общая доступность даже компактной версии дает исследователям огромные возможности.

По мнению Уэса Рота, такие технологии вызывают двоякое чувство:

  1. Надежда: возможность радикально сократить страдания от болезней, замедлить старение или даже достичь «пренебрежимого старения», когда биологический возраст остается неизменным .
  2. Тревога: Рот признает, что фраза разработчиков «нам не терпится увидеть, что вы создадите» может пугать, учитывая потенциал модификации основ жизни .

Интересен и состав команды стартапа: он был сформирован бывшими сотрудниками группы FAIR (Fundamental AI Research) компании Meta . Это создает забавный парадокс, на который указывает ведущий: Ян Лекун, глава ИИ в Meta, публично критикует архитектуру LLM, называя их «глупыми» и не ведущими к созданию сильного ИИ (AGI) . Тем не менее, ESM3 — это именно LLM, и Лекун сам поздравил команду с успехом в области протеомики .

⚡ Etched и чип Sohu: вызов доминированию NVIDIA 14:12

Вторая громкая новость выпуска — выход из скрытности компании Etched, которая представила специализированный чип Sohu для работы с нейросетями . Разработчики утверждают, что это самый быстрый ИИ-процессор в мире, предназначенный исключительно для архитектуры Transformer .

Основные характеристики и заявления Etched:

Уэс Рот резюмирует, что появление таких специализированных игроков, как Etched и Groq, создает реальную конкуренцию на рынке «железа», что неизбежно ускорит развитие технологий ИИ .

💬 Цитаты

«Если мы сможем научиться читать и писать на коде жизни, это сделает биологию программируемой.»

«ESM3 учится симулировать эволюцию, масштабируясь на миллиардах белков и параметров.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Протеомика
Область биологии, изучающая совокупность всех белков организма и их взаимодействия.
ASIC
Чип, созданный для решения одной конкретной задачи, что делает его намного эффективнее универсальных процессоров.
GFP
Зеленый флуоресцентный белок, широко используемый в науке как светящийся маркер.
Трансформер
Архитектура нейронных сетей, на которой основаны современные языковые модели вроде ChatGPT.
📊 Цифры
🗓 Хронология
  1. Июнь 2024 Выход стартапа Evolutionary Scale из скрытности и релиз модели ESM3.
  2. Июнь 2024 Анонс специализированного чипа Sohu от компании Etched.
⚖️ Другая сторона
Биология и медицина ESM3 Evolutionary Scale Etched Sohu белки