# Анна Мари Вагнер: «Биология — это программируемый физический мир»

Источник: https://www.youtube.com/watch?v=-9HwbnCwi-w
Канал: Eye on AI
Опубликовано: 27.02.2024

---

Искусственный интеллект и синтетическая биология сегодня переживают тектоническое сближение, способное радикально изменить медицину, сельское хозяйство и промышленность. Глава направления ИИ в компании Ginkgo Bioworks Анна Мари Вагнер в интервью для Eye on AI подробно рассказывает о том, как их роботизированная платформа Foundry и партнерство с Google на сумму почти 300 миллионов долларов позволяют программировать живую материю так же, как компьютерный код. В центре обсуждения — переход биологии от интуитивного искусства к точной инженерии, масштабные проекты вроде самоопыляющейся кукурузы и создание фундаментальных моделей для расшифровки «языка» ДНК, РНК и белков.

## 🧬 От кремния к углероду: как компьютерный подход меняет биологию
[[JUMP:02:37]]

История Ginkgo Bioworks началась 15 лет назад, когда пять соучредителей из Массачусетского технологического института (MIT) решили переосмыслить саму суть работы с живыми системами [02:51]. Четверо из них оканчивали аспирантуру по биоинженерии, а пятым был легендарный профессор электротехники Том Найт, отдавший MIT более 40 лет своей жизни [03:05]. В свое время Найт создавал первые полупроводники, проектировал Lisp-машины и написал первый в мире интерактивный отладчик в режиме реального времени [03:19]. 

В начале 1990-х годов Найт увлекся биологией по двум ключевым причинам:

*   **Предел закона Мура:** полупроводниковые технологии приближались к физическим ограничениям, и биологические структуры виделись идеальной основой для наноразмерной точности [03:31].
*   **Программируемость материи:** живая природа работает на коде ДНК (ACTG), который можно считывать с помощью секвенирования и перезаписывать посредством синтеза [03:58]. 

В возрасте сорока с лишним лет профессор Найт начал посещать лекции по биологии для первокурсников и построил полноценную лабораторную зону прямо на кафедре компьютерных наук MIT [04:24]. Он привлек инженеров из самых разных областей — механиков, химиков, электронщиков — чтобы превратить биологию из описательной науки в строгую инженерную дисциплину [04:37].

Найт сформулировал три фундаментальных принципа, легших в основу Ginkgo Bioworks:

1.  **Создание уровней абстракции:** в традиционной биологии ученый вынужден лично работать с пипеткой, настраивая базовые физические процессы. Это эквивалентно программированию компьютеров в 1960-х годах на уровне спайки транзисторов. Программисту биологического кода нужны высокоуровневые инструменты, абстрагированные от физической рутины [05:04].
2.  **Экономика масштаба:** биологическое проектирование должно опираться на автоматизацию и миниатюризацию, аналогично промышленному производству. Это продиктовало выбор горизонтальной платформенной бизнес-модели вместо создания одного конечного продукта [05:43].
3.  **Открытые библиотеки кода:** в фармацевтике и биотехе компании ревниво оберегают свою интеллектуальную собственность, постоянно изобретая велосипед. Ginkgo же изначально строилась на идее повторного использования отлаженных генетических элементов в самых разных отраслях [06:22].

Сегодня Ginkgo Bioworks располагает роботизированным лабораторным комплексом Foundry площадью около 300 000 квадратных футов (около 28 000 кв. м), который выполняет функции универсального конвейера для биологических разработок [07:29].

## 💰 Бизнес-модель: «AWS» и «App Store» для живых организмов
[[JUMP:07:29]]

Бизнес-модель Ginkgo сочетает в себе подходы двух ИТ-гигантов: Amazon Web Services (AWS) и Apple App Store [07:42]. От AWS компания унаследовала взимание платы за непосредственные вычислительные и лабораторные услуги (сервисный сбор). Подобно App Store, Ginkgo получает роялти или долю в прибыли, если разработанный на платформе продукт оказывается коммерчески успешным [07:55].

Исторически биотехнологии ассоциировались исключительно с медициной. Однако 15 лет назад молодая компания не могла конкурировать с гигантами вроде Pfizer на их поле [08:34]. Ginkgo начала с сегмента парфюмерии и пищевых ароматизаторов, сотрудничая с европейскими лидерами индустрии, такими как Robertet и Givaudan [08:47]. Постепенно компания поднималась по лестнице технологической сложности. 

Сегодня портфель Ginkgo Bioworks разделен примерно на три равные части:

*   **Биофармацевтика:** работа с лидерами рынка (Pfizer, Merck, Novo Nordisk, Biogen) по созданию новых терапевтических молекул, вакцин и оптимизации производственных штаммов [09:39].
*   **Специальная химия:** партнерство с Sumitomo и Solvay по разработке новых материалов и экологичных химических процессов [10:07].
*   **Сельское хозяйство:** совместные проекты с Bayer, Syngenta и Corteva в области улучшения свойств растений и создания полезных почвенных микроорганизмов [10:07].

По словам Анны Мари Вагнер, ключевое отличие платформы от классических контрактных исследовательских организаций (CRO) заключается в характере задач [21:52]. Традиционные CRO получают от заказчика готовую инструкцию: провести конкретный анализ на масс-спектрометре или запустить определенный процесс ферментации [22:05]. В Ginkgo клиент приходит с техническим заданием на конечный продукт, например: «Нам нужен фермент, катализирующий конкретную реакцию с эффективностью не ниже X% и стоимостью производства не выше Y» [22:19]. Всю исследовательскую программу ученые Ginkgo разрабатывают самостоятельно, задействуя гигантский массив накопленных данных [22:46].

## 🌾 Кейс: кукуруза без синтетических удобрений и биокатализ
[[JUMP:23:38]]

Один из наиболее амбициозных проектов, над которым Ginkgo работает совместно с агротехнологическим гигантом Bayer, нацелен на создание самоопыляющейся кукурузы [00:12], [24:43]. Производство азотных удобрений — это гигантская индустрия с оборотом около 70 миллиардов долларов в год [24:55]. Однако этот процесс крайне неэкологичен: на него приходится около 5% мирового потребления энергии и 5% глобальных выбросов парниковых газов [25:10].

Суть биологического решения состоит в следующем:

*   В природе бобовые растения (например, соя) не требуют азотных удобрений, поскольку вступают в симбиоз с клубеньковыми бактериями, которые поглощают азот из воздуха и переводят его в доступную для растения форму (природный аналог процесса Габера-Боша) [25:47].
*   Кукуруза, пшеница и рис лишены таких естественных помощников. Задача инженеров — взять микроорганизмы, которые уже умеют комфортно жить внутри корневой системы кукурузы, и перенести в них генетические механизмы фиксации азота от бактерий-симбионтов бобовых [25:35], [26:30].

Сложность проекта заключается в тонкой настройке метаболических путей. Процесс фиксации азота требует участия цепочки белков, катализирующих последовательные реакции [27:41]. Необходимо точно отрегулировать активность промоторов (некодирующих участков ДНК) [29:14]. Неправильная балансировка может привести к тому, что промежуточный продукт реакции начнет накапливаться в клетках бактерии и убьет ее еще до того, как синтезируется аммиак [29:52].

Другим примером успешной работы служит проект по биокатализу для фармацевтической компании Merck [12:09]. Производство многих лекарственных препаратов включает сложные, дорогие и экологически грязные этапы химического синтеза. Ginkgo помогает заменять эти этапы ферментативными реакциями. Ученые проектируют специальный белок-фермент, который проводит реакцию быстрее, чище и при комнатной температуре [12:21].

## 🤖 Искусственный интеллект как «Scale AI» для биологических данных
[[JUMP:12:47]]

Первые 14 лет своей истории Ginkgo часто подвергалась критике со стороны академического сообщества за «грубую силу» — компания просто автоматизировала миллионы параллельных экспериментов [13:00]. Однако именно этот подход позволил накопить уникальный актив: базу данных, где зафиксированы не только редкие успехи, но и 99% неудачных экспериментов [13:29]. 

> «Для обучения качественной модели вам, безусловно, нужны примеры того, как выглядит успех. Но вам также требуется колоссальное количество примеров неудач. На ошибках алгоритмы учатся даже лучше», — поясняет Анна Мари Вагнер [13:55].

В сфере биологического ИИ компания Ginkgo занимает нишу, аналогичную роли Scale AI в сегменте больших языковых моделей (LLM) — она выступает главным генератором качественных размеченных данных для обучения [20:28].

Собственная метагеномная база данных Ginkgo, собранная из природных источников по всему миру, примерно в 10 раз превосходит по объему все публичные базы данных вместе взятые [14:59]. Это дает колоссальное преимущество при проектировании белков и ДНК. Алгоритмы машинного обучения сначала выполняют интеллектуальный поиск по гигантской библиотеке природных вариантов, отбирая перспективные стартовые точки [16:41]. Затем генеративные модели создают новые варианты белков на основе природных «каркасов» (scaffolds) [17:34], сохраняя их стабильность и жизнеспособность [17:49].

На следующем этапе ИИ оптимизирует сразу несколько параметров: селективность (минимизацию побочных реакций) [18:03], растворимость белков и их термостабильность. В конечном итоге конечный дизайн высокоэффективного белка может не иметь ничего общего с тем вариантом, с которого клиент начинал проект [23:23].

## ☁️ Стратегический альянс с Google на $300 миллионов
[[JUMP:46:50]]

Для обучения масштабных моделей Ginkgo заключила пятилетнее стратегическое партнерство с Google Cloud стоимостью около 300 миллионов долларов [01:46], [46:50]. В рамках этого соглашения Google не только предоставляет свои облачные мощности и процессоры TPU, но и напрямую выделяет около 50 миллионов долларов на финансирование внутренних исследований и разработок Ginkgo в области ИИ [47:43].

Интерес Google к этому альянсу носит стратегический характер. По мнению Анны Мари Вагнер, если Google подпишет стандартный контракт с отдельной фармкомпанией, это даст ей лишь одного клиента и красивый логотип в презентации [47:03]. Сотрудничество с Ginkgo как с горизонтальной платформой позволяет создать фундаментальные модели для ДНК, РНК и белков, которые привлекут в облако Google всю биотехнологическую отрасль [47:29].

На вопрос о том, почему Ginkgo строит собственные модели, а не просто использует готовые решения от Google DeepMind, Анна Мари Вагнер отвечает, что в биологии, в отличие от человеческого языка, данные не лежат в открытом доступе [50:55], [51:48]. Для создания прорывных моделей требуются три компонента:

*   Вычислительные мощности (деньги);
*   Инженерный талант;
*   Качественные специализированные данные [51:08].

Если вычислительные ресурсы сегодня можно купить, а архитектуру трансформеров адаптировать из открытых источников [51:21], то проприетарные данные Ginkgo остаются уникальным и незаменимым ресурсом [52:53]. Компания активно взаимодействует с ведущими разработчиками архитектур из Google DeepMind и академических лабораторий, выступая ключевым партнером по поставке данных для обучения [52:28].

## 🛡️ Биобезопасность, биопластики и будущее без рутины
[[JUMP:32:32]]

Автоматизация лабораторий уже позволила Ginkgo отделить интеллектуальный труд ученого от рутинных манипуляций [44:50]. В обычных исследовательских центрах высококлассные PhD тратят до 95% своего рабочего времени на ручной перенос прозрачных жидкостей из одной пробирки в другую [44:35]. В Ginkgo эту работу выполняют роботы [44:50]. Более того, компания внедряет технологии анализа пулов (pooling): миллионы вариантов дизайна ДНК кодируются уникальными молекулярными штрихкодами и тестируются в одной лабораторной лунке, после чего результаты считываются с помощью высокопроизводительного секвенирования [45:29], [46:10].

Развитие синтетической биологии неизбежно вызывает опасения общественности по поводу биобезопасности. Анна Мари Вагнер успокаивает: в реальных условиях модифицированные в лаборатории организмы обычно оказываются крайне слабыми [33:35]. Они тратят слишком много энергии на производство нужного человеку целевого вещества в ущерб собственному размножению, поэтому мгновенно проигрывают конкурентную борьбу диким штаммам [33:35]. 

Тем не менее, Ginkgo активно сотрудничает с оборонным агентством DARPA и разведывательным управлением IARPA [36:06]. Компания разрабатывает алгоритмы, способные по фрагментам ДНК определять, имеет ли патоген естественное происхождение или был создан человеком [36:06], а также предсказывать его свойства [36:19]. По мнению Вагнер, человечеству необходим глобальный «биологический радар» — аналог метеорологических систем, который в режиме реального времени отслеживал бы патогены в школах, аэропортах и общественных пространствах [34:39], что позволило бы предотвратить пандемии вроде COVID-19 на самых ранних стадиях [34:51].

Еще одно перспективное направление — создание биоразлагаемых материалов и пластиков [36:44]. Пластик, производимый сегодня из ископаемой нефти, по сути является продуктом древней, переработанной миллионами лет биологии [38:03]. Биологически синтезировать аналогичные полимеры не представляет сложности, однако главным препятствием остается экономика [38:32]. Современные производители нефти не включают в стоимость сырья экологические издержки его добычи и утилизации [38:32]. 

Кроме того, классическая ферментация требует сахара в качестве корма для бактерий [39:10]. Если сахар стоит дороже нефти, биопластик никогда не станет дешевле традиционного [39:24]. Сейчас Ginkgo и ее партнеры работают над созданием микроорганизмов, способных напрямую усваивать углекислый газ вместо дорогого сахара [39:37]. Успех на этом направлении ознаменует переломный момент в истории производства материалов [40:02].