Анна Мари Вагнер: «Биология — это программируемый физический мир»

Eye on AI 3,1 тыс. 54 мин 8 мин 27.02.2024
Главное

Искусственный интеллект и синтетическая биология сегодня переживают тектоническое сближение, способное радикально изменить медицину, сельское хозяйство и промышленность. Глава направления ИИ в компании Ginkgo Bioworks Анна Мари Вагнер в интервью для Eye on AI подробно рассказывает о том, как их роботизированная платформа Foundry и партнерство с Google на сумму почти 300 миллионов долларов позволяют программировать живую материю так же, как компьютерный код. В центре обсуждения — переход биологии от интуитивного искусства к точной инженерии, масштабные проекты вроде самоопыляющейся кукурузы и создание фундаментальных моделей для расшифровки «языка» ДНК, РНК и белков.

🧬 От кремния к углероду: как компьютерный подход меняет биологию 2:37

История Ginkgo Bioworks началась 15 лет назад, когда пять соучредителей из Массачусетского технологического института (MIT) решили переосмыслить саму суть работы с живыми системами . Четверо из них оканчивали аспирантуру по биоинженерии, а пятым был легендарный профессор электротехники Том Найт, отдавший MIT более 40 лет своей жизни . В свое время Найт создавал первые полупроводники, проектировал Lisp-машины и написал первый в мире интерактивный отладчик в режиме реального времени .

В начале 1990-х годов Найт увлекся биологией по двум ключевым причинам:

В возрасте сорока с лишним лет профессор Найт начал посещать лекции по биологии для первокурсников и построил полноценную лабораторную зону прямо на кафедре компьютерных наук MIT . Он привлек инженеров из самых разных областей — механиков, химиков, электронщиков — чтобы превратить биологию из описательной науки в строгую инженерную дисциплину .

Найт сформулировал три фундаментальных принципа, легших в основу Ginkgo Bioworks:

  1. Создание уровней абстракции: в традиционной биологии ученый вынужден лично работать с пипеткой, настраивая базовые физические процессы. Это эквивалентно программированию компьютеров в 1960-х годах на уровне спайки транзисторов. Программисту биологического кода нужны высокоуровневые инструменты, абстрагированные от физической рутины .
  2. Экономика масштаба: биологическое проектирование должно опираться на автоматизацию и миниатюризацию, аналогично промышленному производству. Это продиктовало выбор горизонтальной платформенной бизнес-модели вместо создания одного конечного продукта .
  3. Открытые библиотеки кода: в фармацевтике и биотехе компании ревниво оберегают свою интеллектуальную собственность, постоянно изобретая велосипед. Ginkgo же изначально строилась на идее повторного использования отлаженных генетических элементов в самых разных отраслях .

Сегодня Ginkgo Bioworks располагает роботизированным лабораторным комплексом Foundry площадью около 300 000 квадратных футов (около 28 000 кв. м), который выполняет функции универсального конвейера для биологических разработок .

💰 Бизнес-модель: «AWS» и «App Store» для живых организмов 7:29

Бизнес-модель Ginkgo сочетает в себе подходы двух ИТ-гигантов: Amazon Web Services (AWS) и Apple App Store . От AWS компания унаследовала взимание платы за непосредственные вычислительные и лабораторные услуги (сервисный сбор). Подобно App Store, Ginkgo получает роялти или долю в прибыли, если разработанный на платформе продукт оказывается коммерчески успешным .

Исторически биотехнологии ассоциировались исключительно с медициной. Однако 15 лет назад молодая компания не могла конкурировать с гигантами вроде Pfizer на их поле . Ginkgo начала с сегмента парфюмерии и пищевых ароматизаторов, сотрудничая с европейскими лидерами индустрии, такими как Robertet и Givaudan . Постепенно компания поднималась по лестнице технологической сложности.

Сегодня портфель Ginkgo Bioworks разделен примерно на три равные части:

По словам Анны Мари Вагнер, ключевое отличие платформы от классических контрактных исследовательских организаций (CRO) заключается в характере задач . Традиционные CRO получают от заказчика готовую инструкцию: провести конкретный анализ на масс-спектрометре или запустить определенный процесс ферментации . В Ginkgo клиент приходит с техническим заданием на конечный продукт, например: «Нам нужен фермент, катализирующий конкретную реакцию с эффективностью не ниже X% и стоимостью производства не выше Y» . Всю исследовательскую программу ученые Ginkgo разрабатывают самостоятельно, задействуя гигантский массив накопленных данных .

🌾 Кейс: кукуруза без синтетических удобрений и биокатализ 23:38

Один из наиболее амбициозных проектов, над которым Ginkgo работает совместно с агротехнологическим гигантом Bayer, нацелен на создание самоопыляющейся кукурузы , . Производство азотных удобрений — это гигантская индустрия с оборотом около 70 миллиардов долларов в год . Однако этот процесс крайне неэкологичен: на него приходится около 5% мирового потребления энергии и 5% глобальных выбросов парниковых газов .

Суть биологического решения состоит в следующем:

Сложность проекта заключается в тонкой настройке метаболических путей. Процесс фиксации азота требует участия цепочки белков, катализирующих последовательные реакции . Необходимо точно отрегулировать активность промоторов (некодирующих участков ДНК) . Неправильная балансировка может привести к тому, что промежуточный продукт реакции начнет накапливаться в клетках бактерии и убьет ее еще до того, как синтезируется аммиак .

Другим примером успешной работы служит проект по биокатализу для фармацевтической компании Merck . Производство многих лекарственных препаратов включает сложные, дорогие и экологически грязные этапы химического синтеза. Ginkgo помогает заменять эти этапы ферментативными реакциями. Ученые проектируют специальный белок-фермент, который проводит реакцию быстрее, чище и при комнатной температуре .

🤖 Искусственный интеллект как «Scale AI» для биологических данных 12:47

Первые 14 лет своей истории Ginkgo часто подвергалась критике со стороны академического сообщества за «грубую силу» — компания просто автоматизировала миллионы параллельных экспериментов . Однако именно этот подход позволил накопить уникальный актив: базу данных, где зафиксированы не только редкие успехи, но и 99% неудачных экспериментов .

«Для обучения качественной модели вам, безусловно, нужны примеры того, как выглядит успех. Но вам также требуется колоссальное количество примеров неудач. На ошибках алгоритмы учатся даже лучше», — поясняет Анна Мари Вагнер .

В сфере биологического ИИ компания Ginkgo занимает нишу, аналогичную роли Scale AI в сегменте больших языковых моделей (LLM) — она выступает главным генератором качественных размеченных данных для обучения .

Собственная метагеномная база данных Ginkgo, собранная из природных источников по всему миру, примерно в 10 раз превосходит по объему все публичные базы данных вместе взятые . Это дает колоссальное преимущество при проектировании белков и ДНК. Алгоритмы машинного обучения сначала выполняют интеллектуальный поиск по гигантской библиотеке природных вариантов, отбирая перспективные стартовые точки . Затем генеративные модели создают новые варианты белков на основе природных «каркасов» (scaffolds) , сохраняя их стабильность и жизнеспособность .

На следующем этапе ИИ оптимизирует сразу несколько параметров: селективность (минимизацию побочных реакций) , растворимость белков и их термостабильность. В конечном итоге конечный дизайн высокоэффективного белка может не иметь ничего общего с тем вариантом, с которого клиент начинал проект .

☁️ Стратегический альянс с Google на $300 миллионов 46:50

Для обучения масштабных моделей Ginkgo заключила пятилетнее стратегическое партнерство с Google Cloud стоимостью около 300 миллионов долларов , . В рамках этого соглашения Google не только предоставляет свои облачные мощности и процессоры TPU, но и напрямую выделяет около 50 миллионов долларов на финансирование внутренних исследований и разработок Ginkgo в области ИИ .

Интерес Google к этому альянсу носит стратегический характер. По мнению Анны Мари Вагнер, если Google подпишет стандартный контракт с отдельной фармкомпанией, это даст ей лишь одного клиента и красивый логотип в презентации . Сотрудничество с Ginkgo как с горизонтальной платформой позволяет создать фундаментальные модели для ДНК, РНК и белков, которые привлекут в облако Google всю биотехнологическую отрасль .

На вопрос о том, почему Ginkgo строит собственные модели, а не просто использует готовые решения от Google DeepMind, Анна Мари Вагнер отвечает, что в биологии, в отличие от человеческого языка, данные не лежат в открытом доступе , . Для создания прорывных моделей требуются три компонента:

Если вычислительные ресурсы сегодня можно купить, а архитектуру трансформеров адаптировать из открытых источников , то проприетарные данные Ginkgo остаются уникальным и незаменимым ресурсом . Компания активно взаимодействует с ведущими разработчиками архитектур из Google DeepMind и академических лабораторий, выступая ключевым партнером по поставке данных для обучения .

🛡️ Биобезопасность, биопластики и будущее без рутины 32:32

Автоматизация лабораторий уже позволила Ginkgo отделить интеллектуальный труд ученого от рутинных манипуляций . В обычных исследовательских центрах высококлассные PhD тратят до 95% своего рабочего времени на ручной перенос прозрачных жидкостей из одной пробирки в другую . В Ginkgo эту работу выполняют роботы . Более того, компания внедряет технологии анализа пулов (pooling): миллионы вариантов дизайна ДНК кодируются уникальными молекулярными штрихкодами и тестируются в одной лабораторной лунке, после чего результаты считываются с помощью высокопроизводительного секвенирования , .

Развитие синтетической биологии неизбежно вызывает опасения общественности по поводу биобезопасности. Анна Мари Вагнер успокаивает: в реальных условиях модифицированные в лаборатории организмы обычно оказываются крайне слабыми . Они тратят слишком много энергии на производство нужного человеку целевого вещества в ущерб собственному размножению, поэтому мгновенно проигрывают конкурентную борьбу диким штаммам .

Тем не менее, Ginkgo активно сотрудничает с оборонным агентством DARPA и разведывательным управлением IARPA . Компания разрабатывает алгоритмы, способные по фрагментам ДНК определять, имеет ли патоген естественное происхождение или был создан человеком , а также предсказывать его свойства . По мнению Вагнер, человечеству необходим глобальный «биологический радар» — аналог метеорологических систем, который в режиме реального времени отслеживал бы патогены в школах, аэропортах и общественных пространствах , что позволило бы предотвратить пандемии вроде COVID-19 на самых ранних стадиях .

Еще одно перспективное направление — создание биоразлагаемых материалов и пластиков . Пластик, производимый сегодня из ископаемой нефти, по сути является продуктом древней, переработанной миллионами лет биологии . Биологически синтезировать аналогичные полимеры не представляет сложности, однако главным препятствием остается экономика . Современные производители нефти не включают в стоимость сырья экологические издержки его добычи и утилизации .

Кроме того, классическая ферментация требует сахара в качестве корма для бактерий . Если сахар стоит дороже нефти, биопластик никогда не станет дешевле традиционного . Сейчас Ginkgo и ее партнеры работают над созданием микроорганизмов, способных напрямую усваивать углекислый газ вместо дорогого сахара . Успех на этом направлении ознаменует переломный момент в истории производства материалов .

💬 Цитаты

«Биология — это программируемая физическая дисциплина... Она работает на коде ACTG, а не на нулях и единицах.»

Анна Мари Вагнер 03:58

«Мы собираем данные о 99% экспериментов, которые не увенчались успехом... Для обучения моделей неудачи важнее успехов.»

Анна Мари Вагнер 13:29
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Синтетическая биология
Научное направление, занимающееся проектированием и созданием новых биологических систем с заданными свойствами.
Биокатализ
Ускорение химических реакций в промышленности с использованием биологических ферментов вместо дорогой и токсичной химии.
Метагеномика
Изучение генетического материала, полученного напрямую из образцов окружающей среды без предварительного культивирования организмов.
Промотор
Последовательность ДНК, которая служит стартовой площадкой для синтеза РНК и регулирует уровень активности гена.
Анализ пулов
Лабораторная методика тестирования миллионов различных ДНК-дизайнов в одной пробирке с использованием штрихкодов.
📊 Цифры
🗓 Хронология
  1. 1990-е гг. Профессор MIT Том Найт начинает изучать биологию и основывает wet-лабораторию на базе кафедры компьютерных наук.
  2. 2008 г. Основание компании Ginkgo Bioworks пятью соучредителями из MIT.
  3. 2019 г. Анна Мари Вагнер присоединяется к Ginkgo Bioworks в качестве руководителя корпоративного развития.
  4. 2023 г. Ginkgo заключает альянс с Google Cloud на $300 млн, а Анна Мари Вагнер возглавляет ИИ-направление компании.
⚖️ Другая сторона
Биология и медицина Анна Мари Вагнер Ginkgo Bioworks синтетическая биология Google Cloud биокатализ