Архитектура жизни: как модульные белки меняют медицину

Lex Fridman 124 тыс. 2 ч 12 мин 14 мин 11.01.2021
Главное

Белок — это не просто хаотичная цепочка аминокислот, а сложная модульная машина, способная менять облик целых цивилизаций или стоять на страже вирусной защиты. Биоинформатик Дмитрий Коркин раскрывает анатомию «строительных блоков» жизни, обсуждая, как эволюция доменов превратилась в основу для машинного дизайна лекарств и почему будущее биологии немыслимо без жесткой этики и поэзии.

🧬 Белковые домены: кирпичики жизни 1:58

В биологии существует давнее убеждение, что белки являются фундаментальными строительными блоками жизни. Как отмечает Дмитрий Коркин, это утверждение верно лишь отчасти. На самом базовом уровне белки действительно выполняют критически важные функции в клетке, однако при детальном изучении их структуры становится очевидно, что они обладают куда более сложной архитектурой — так называемой модульной сложностью.

Белок можно представить как «бусы на нитке», где каждое «зерно» — это отдельный домен. Эти домены являются самостоятельными структурными единицами, которые в процессе эволюции могут перемешиваться, перекомбинироваться и переходить от одного белка к другому, привнося с собой те или иные функции. Исторически ученые долгое время не осознавали этот модульный принцип из-за ограничений в методах исследования. Ранние структурные методы, такие как рентгеноструктурный анализ и ЯМР-спектроскопия, были эффективны преимущественно для небольших белков, которые зачастую состоят лишь из одного домена. Складывалось ложное впечатление, что белок — это просто монолитная глобула, и лишь развитие криоэлектронной микроскопии (cryo-EM) позволило нам увидеть истинную картину: структуру огромных молекулярных комплексов, состоящих из множества доменов.

🦠 Структура и мутации S-белка SARS-CoV-2 6:23

Изучение спайкового (S) белка коронавируса стало одним из самых ярких примеров прогресса структурной биологии в 2020 году. Благодаря совершенствованию методов криоэлектронной микроскопии, ученым удалось в кратчайшие сроки расшифровать структуру этого белка. S-белок — это не просто отдельная молекула, а сложный тример, состоящий из трех идентичных цепей, которые при взгляде сверху образуют идеальный треугольник.

Фундаментальная роль S-белка заключается в прикреплении к рецептору ACE2 на поверхности человеческой клетки, что запускает процесс проникновения вируса. Этот процесс крайне динамичен: три рецептор-связывающих домена (RBD) «расплетаются» и по очереди выходят наружу для взаимодействия с клеткой. Примечательно, что они работают не синхронно. Недавние исследования, проведенные в коллаборации с Медицинской школой Массачусетского университета, выявили, что определенные мутации могут изменять эту динамику: они заставляют чаще открываться сразу два «рычага» одновременно, что теоретически повышает шансы вируса на успешное закрепление. Хотя мутации — естественный способ эволюции вируса, позволяющий ему адаптироваться к новым хозяевам, исследователи продолжают изучать, как эти изменения влияют на устойчивость к вакцинам и динамику заражения.

🛡️ Механизмы сборки вирусной оболочки 15:39

Помимо спайкового белка, вирусная частица содержит другие структурные компоненты, взаимодействие которых определяет стабильность оболочки вируса. В частности, белок M (мембранный) формирует своего рода каркас, организуясь в димеры и образуя упорядоченную решетку. Эти димеры служат основными структурными кирпичиками оболочки: если S-белки (которых на поверхности около 50–90) отвечают за «взлом» клетки, то тысячи M-димеров создают защитный барьер и придают частице её форму.

Исследование того, как эти белки самоорганизуются в сложную lattice-структуру, открывает новые горизонты для создания лекарств. Если спайковый белок постоянно эволюционирует и мутирует, то M-белок выглядит гораздо более стабильной мишенью с эволюционной точки зрения. Ученые рассматривают его как перспективный «вектор атаки»: повреждение оболочки вируса может привести к разрушению самой вирусной частицы, лишая её возможности функционировать. Изучение этой «кибербезопасности» вируса, включая роль белков E и N, — одна из самых актуальных задач, помогающих понять, как вирус реплицируется и как мы можем прервать этот процесс.

🧬 Модульность жизни: от белковых вселенных до сложности генома 27:26

Эволюция белков и модульность 27:26

Завершив обсуждение изменчивости вирусных оболочек и мутаций поверхностных антигенов, Дмитрий Коркин и Лекс Фридман перешли к фундаментальным законам белковой эволюции. В качестве отправной точки они взяли известную научную работу 2010 года из журнала Nature, посвященную «непрекращающемуся расширению белковой вселенной». Эта концепция наглядно иллюстрирует, что колоссальное разнообразие органической жизни на Земле началось с единого общего предка. Спустя 3,5 миллиарда лет эволюционного отбора планету населяют миллионы уникальных белков, и этот масштабный процесс продолжается прямо сейчас.

Описывая механизмы развития живых систем, профессор Коркин выделяет одно ключевое понятие — модульность. Современная биоинформатика давно отошла от примитивного представления о белке как о простой линейной строке из аминокислотных букв. В макромолекулах заложена строгая иерархическая сложность, которая уходит корнями глубоко в нуклеотидные последовательности генов. Структурные белковые домены представляют собой не только функциональные, но и эволюционные строительные блоки. Как только природа в ходе естественного отбора находит стабильную конфигурацию такого блока, она «консервирует» её. Сравнивая различные белки, ученые постоянно обнаруживают идентичные фрагменты, принадлежащие к одним и тем же семействам доменов. Внутри этих блоков происходят точечные мутации, однако эволюция практически никогда не расщепляет сами домены на части. Разрушение целостности домена неизбежно приводит к полной потере его функции или катастрофическому снижению эффективности, что делает подобные изменения тупиковыми для выживания клетки.

Тем не менее, белковая архитектура не ограничивается жесткими стабильными блоками. Гораздо менее изученными, но критически важными элементами являются линкеры — гибкие связующие участки, соединяющие домены между собой. К ним примыкают концевые фрагменты белковой цепи, известные как C- и N-концы, которые отвечают за специфические межбелковые взаимодействия. Влияние линкеров на макромолекулы огромно: короткий связующий элемент жестко фиксирует домены друг рядом с другом, тогда как длинный линкер обеспечивает им колоссальную пространственную свободу и способность к сложной перестройке в пространстве. Благодаря своей невероятной гибкости линкер может принимать практически любую форму, идеально подстраиваясь под молекулы-партнеры. Примечательно, что эволюция линкеров подчиняется совершенно иным законам, отличным от законов развития доменов: им не требуется удерживать фиксированную жесткую структуру, что открывает перед ними безграничные регуляторные возможности.

Альтернативный сплайсинг и сложность организма 33:04

Еще одним важнейшим уровнем молекулярной пластичности, изучению которого лаборатория Дмитрия Коркина посвятила более десяти лет, является альтернативный сплайсинг. Привычное школьное представление о том, что один ген строго равен одному белковому продукту, оказывается слишком упрощенным, когда речь заходит о сложных эукариотах. В реальности один и тот же ген способен генерировать множество функционально различных, активных белков, называемых изоформами.

Этот феномен возможен благодаря дискретной структуре самого гена, напоминающей мозаику из чередующихся блоков. Кодирующие участки, которые впоследствии переносятся в итоговую структуру белка, называются экзонами, а разделяющие их некодирующие фрагменты — интронами.

В одном гене могут содержаться десятки таких элементов. В процессе копирования информации с ДНК на РНК специальные внутриклеточные машины вырезают интроны и сшивают экзоны между собой. Однако при альтернативном сплайсинге система может выборочно исключать определенные экзоны из финальной сборки или заменять один экзон другим.

Профессор Коркин акцентирует внимание на том, что этот процесс не является хаотичным или случайным. Благодаря внедрению современных технологий секвенирования следующего поколения (NGS), включая методы транскриптомного анализа отдельных клеток (RNA-seq), ученые увидели, что сплайсинг — это тонко регулируемый, динамичный процесс. Клетка меняет конфигурацию вырезания экзонов в ответ на развитие заболеваний или при переходе на новые стадии клеточного развития. Наблюдается поразительное эволюционное взаимодействие между миром нуклеиновых кислот и белковой вселенной: границы экзонов в ДНК удивительно часто идеально совпадают с границами функциональных доменов в готовом белке. Естественный отбор подхватывает эту системную сложность, аккумулируя удачные комбинации для расширения адаптационного потенциала живых организмов.

Стоит добавить, что в рамках данной части беседы Дмитрий Коркин и Лекс Фридман также мимоходом затронули концепции эволюционных алгоритмов в компьютерных науках и математические расчеты вероятности зарождения жизни на базе уравнения Дрейка. Эти темы, возникшие как междисциплинарные параллели к биологической эволюции, подробно анализируются в других главах данного материала.

🧬 За пределами Земли: Поиск жизни и алгоритмическая эволюция 50:21

Вопрос о том, одиноки ли мы во Вселенной, Дмитрий Коркин рассматривает через призму математической вероятности и биологической интуиции. Ученый полагает, что реальность редко находится в крайних точках спектра — между идеей о полной уникальности человечества и представлением о том, что жизнь встречается повсеместно. Вероятность существования жизни, по мнению Коркина, достаточно мала, чтобы не быть очевидной, но не настолько ничтожна, чтобы мы могли считать себя «венцом творения».

Перспективы внеземной жизни 51:38

Коркин проводит аналогию с колонией муравьев, которые в силу своей природы не способны осознать существование чего-либо за пределами их маленького муравейника. Точно так же человечество может быть неспособно понять истинные масштабы распространения жизни во Вселенной. Научный поиск в этой области сегодня выходит далеко за рамки теоретических дискуссий: ученые активно изучают признаки жизни в газообразных формах на Венере, возможности существования микроорганизмов на Марсе и подледные океаны спутника Юпитера, Европы.

Отвечая на вопрос, будут ли внеземные формы жизни углеродными, Дмитрий Коркин склоняется к утвердительному ответу, подчеркивая, что обнаружение даже простейшей одноклеточной жизни за пределами Земли станет поворотным моментом в истории науки. Это подтвердит гипотезу о том, что биологические системы — закономерный результат эволюции материи, а не уникальная случайность.

Эволюционные алгоритмы: Код как живая материя 39:40

В компьютерных науках принципы эволюции, такие как мутация и рекомбинация, находят свое применение в создании интеллектуальных систем. Дмитрий Коркин отмечает, что переход от простых правил к высокой сложности — это фундаментальный принцип, который роднит физику зарождения планет с развитием самовоспроизводящихся алгоритмов. Используя эволюционные подходы в коде, исследователи фактически пытаются воспроизвести способность природы находить решения в условиях неопределенности.

Наследие Джошуа Ледерберга и экспертных систем 54:04

Обсуждение экспертных систем немыслимо без упоминания Джошуа Ледерберга, лауреата Нобелевской премии 1958 года, который, помимо фундаментальных открытий в генетике бактерий, стоял у истоков биоинформатики. Ледерберг занимался проектом Dendral — одной из первых экспертных систем, предназначенной для анализа химических соединений, что стало прообразом современных методов в хемоинформатике.

Коркин делится личной историей о том, как молодой исследователь получил профессиональный совет от Ледерберга на форуме CCL (Computational Chemistry List) в начале 2000-х годов. Идея Ледерберга заключалась в создании системы, способной автоматически обрабатывать данные масс-спектрометрии для идентификации внеземных молекул. Этот подход, соединивший химию и компьютерные науки, заложил фундамент для того, что мы сегодня называем искусственным интеллектом в биоинформатике.

Эволюция ИИ: От правил к обучению 103:08

Почему экспертные системы, которые казались столь многообещающими, уступили место современному машинному обучению? Дмитрий Коркин предлагает два взгляда: либо они не оправдали завышенных ожиданий, либо, наоборот, оказались настолько эффективными, что «растворились» в современных технологиях, став невидимым стандартом. Современные алгоритмы, включая те, что используются в предсказании структуры белков, в определенной мере включают в себя накопленную экспертную базу, «встроенную» в логику работы нейросетей. Таким образом, наследие ранних экспертных систем продолжает жить в архитектурах нынешнего поколения ИИ.

🧬 Эволюция предсказаний: от экспертных систем к AlphaFold 1:15:22

Современная биоинформатика прошла долгий путь от первых попыток автоматизированного анализа молекул до мощных нейросетевых архитектур. Фундамент этого направления был заложен еще в конце 1960-х годов, когда Джошуа Ледерберг (Joshua Lederberg) начал работу над экспертной системой DENDRAL. Этот проект стал пионерским в области применения компьютерных методов для идентификации химических структур, по сути, задав вектор развития для всех будущих алгоритмов биоинформатического анализа.

Сегодня фокус сместился в сторону машинного обучения, где ключевую роль играет эволюционная информация. Когда мы не имеем экспериментально подтвержденной структуры белка, ученые используют доступные последовательности из тысяч известных организмов. Путем их выравнивания (alignment) исследователи могут определить, какие участки белка являются консервативными, а значит — структурно стабильными, а какие — подвержены вариациям [1:15:48–1:16:28]. Объединение этих данных с информацией о вторичной структуре позволяет строить высокоточные модели даже в условиях дефицита данных.

Революция AlphaFold и машинное обучение 1:16:54

AlphaFold2 стал настоящим технологическим скачком в предсказании 3D-структуры белков. Дмитрий Коркин отмечает, что в отличие от ранних подходов, где данные о сходстве последовательностей подавались в нейросеть как статические признаки, AlphaFold интегрирует эволюционную информацию непосредственно в итеративный процесс обучения [1:17:06–1:17:32].

Несмотря на впечатляющие успехи, эксперты призывают к осторожности в оценках. Информационные материалы, сопровождающие такие проекты, зачастую носят маркетинговый характер, напоминая «поэтическую интерпретацию священного писания», а не техническое описание методологии.

Барьер сложности: мультидоменные белки 1:18:13

Основной вызов для современной науки — это переход от компактных однодоменных белков, на которых фокусируются традиционные соревнования вроде CASP, к сложным мультидоменным структурам. Большинство белков в человеческой нервной системе состоят из пяти, шести или более доменов, и их фолдинг — это задача совершенно иного порядка сложности [1:18:25–1:19:05].

Например, белок PSD-95 (постсинаптический белок плотности 95), с которым Дмитрий Коркин работал еще будучи постдоком, является «молекулярной машиной» с пятью доменами. Его гибкая архитектура позволяет ему выступать в роли функционального каркаса (scaffold), связывая другие молекулы для координации неврологических процессов [1:15:42–1:16:10]. Понимание того, как именно сворачиваются такие динамические системы, остается «святым граалем» биоинформатики.

Будущее вычислительной биологии 1:36:24

Вопрос о том, приведет ли развитие систем уровня AlphaFold к Нобелевским премиям, кажется неизбежным. Дмитрий Коркин подчеркивает, что наука становится всё более междисциплинарной, и вычислительные методы уже давно признаны мировым сообществом — достаточно вспомнить премию 2013 года, когда награду за изучение принципов фолдинга белков получили ученые-вычислители [1:39:42–1:40:09].

Ранее в разговоре они касались того, как развитие ИИ в творческих индустриях меняет представление о возможностях алгоритмов, однако в биологии ставки гораздо выше: здесь речь идет не о создании музыки, а об инструментовке жизни на молекулярном уровне.

🧬 Будущее медицины: дизайн белков, вирусы и этика алгоритмов

Применение методов машинного обучения в биоинженерии открывает новую эру в научных исследованиях, где границы между компьютерным моделированием и экспериментальной биологией стремительно стираются. Дмитрий Коркин отмечает, что использование алгоритмов для дизайна белков уже стало фундаментальной частью современной науки. Пионеры в этой области, такие как Дэвид Бейкер с алгоритмом Rosetta, доказали, что контроль над структурой белка позволяет управлять его функциями. Если ученые могут задать форму «строительного блока» жизни, они способны проектировать специфические биологические инструменты под конкретные задачи.

Однако переход от дизайна белков к полноценному инженерному проектированию вирусов с помощью машинного обучения ставит перед человечеством серьезные вопросы. Хотя такие инструменты, как AlphaFold, революционизируют понимание структуры, практическое инженерное использование вирусов остается областью, вызывающей жаркие споры.

Моделирование патогенности и «контроль над хаосом»

Одной из ключевых задач для лаборатории Коркина является создание алгоритма, способного определять патогенность вирусных штаммов. Анализируя последовательности генов, ученые стремятся понять, какие именно молекулярные детерминанты делают вирус опасным. Это не просто теоретическое упражнение: возможность предсказывать, какие мутации могут усилить или ослабить патогенность, критически важна для разработки вакцин и противовирусных препаратов.

Тем не менее, эта же технология создает потенциальную угрозу «двойного назначения». Существует риск, что системы, созданные для защиты, могут быть использованы для обратной цели — модификации вирусов с целью повышения их разрушительной силы. Коркин подчеркивает, что даже если алгоритм «придумает» опасную последовательность, превращение её в реальный патоген требует колоссальных экспериментальных усилий. Тем не менее, научное сообщество уже имеет опыт введения мораториев на подобные исследования (как это было с экспериментами по изучению «gain-of-function» у гриппа в 2015 году), что подтверждает необходимость жесткого регулирования и высокого профессионализма при работе с такими технологиями.

Ответственность цивилизации и прозрачность данных

Лекс Фридман переводит дискуссию в плоскость долгосрочного выживания человечества, апеллируя к уравнению Дрейка, где продолжительность жизни цивилизации является ключевой переменной. В этом контексте возникает вопрос: что опаснее в долгосрочной перспективе — естественные пандемии или созданные человеком?

Коркин выражает сдержанный оптимизм, полагая, что природа всё еще остается более эффективным «дизайнером» патогенов, чем люди. Более того, сама концепция использования вируса в качестве оружия кажется крайне сомнительной с тактической точки зрения из-за невозможности точного таргетирования.

Важным фактором безопасности будущего он называет глобальную прозрачность. Ученый уверен, что в XXI веке закрытость, присущая правительственным структурам и военным ведомствам, будет проигрывать открытости научного сообщества и частных компаний. Эффективность, с которой исследователи отреагировали на текущую пандемию, проявившись в беспрецедентной скорости расшифровки данных и обмена знаниями, подтверждает, что именно прозрачность и скорость доступа к информации являются главными инструментами борьбы с биологическими угрозами.

📖 Литературные горизонты и наследие русской культуры 2:08:22

В завершающей части беседы Дмитрий Коркин и Лекс Фридман обращаются к теме, выходящей за рамки сугубо научной дискуссии, — к влиянию русской поэзии и литературы на мировоззрение. Несмотря на то что значительную часть времени эксперты посвятили обсуждению сложных биоинформатических задач, таких как эволюция белков и вирусная архитектура, они находят пространство для рефлексии о культурном коде.

Поэзия как зеркало души и времени 2:08:35

Дмитрий Коркин делится своей глубокой привязанностью к поэзии, выбирая для чтения произведение своего однофамильца Дмитрия Кедрина (в транскрипте — Kemirfeldt). Выбор стихотворения «Ведьма» (известного также как «Колдунья») не случаен для ученого.

Для Коркина поэзия — это способ выразить чувство близости к чему-то далекому, «неуловимому», что особенно остро ощущается в зимнее время.

Магия русского языка против английской точности 2:11:18

Лекс Фридман, будучи ценителем поэзии на обоих языках, отмечает уникальность русского слога. В ходе обсуждения он признает, что русский язык обладает особой способностью передавать «магию» и эмоциональные оттенки, которые порой ускользают при переводе на английский.

Для Коркина, человека, чья профессиональная деятельность сфокусирована на фундаментальных алгоритмах жизни, литература и поэзия остаются важнейшими инструментами гуманизации этого мира. Как подчеркивает Фридман в завершение, ссылаясь на мысль Джеффри Евгенидиса: биология дает нам мозг, но именно жизнь, наполненная культурой и смыслом, превращает его в разум. Это подводит итог их встрече — разговор, начавшийся с обсуждения молекулярных механизмов, завершается признанием того, что человеческий опыт выходит далеко за пределы чистых данных.

💬 Цитаты

«Белки на самом деле намного сложнее... они обладают так названием модульной сложностью. Можно представить белок как нить бус, где каждая бусина — это домен.»

Дмитрий Коркин 02:37

«If I were to pick a single keyword about protein evolution, I would pick modularity.»

Дмитрий Коркин 28:24

«Повреждая внешнюю оболочку, вы, по сути, уничтожаете саму вирусную частицу, предотвращая её функционирование.»

Дмитрий Коркин 19:43

«Белок PSD-95 — это ключевой игрок в постсинаптической плотности... это мультифункциональная машина.»

Дмитрий Коркин 135:02

«Если вы хотите получить строительный блок определенной формы, вы можете попытаться добиться этого, введя новую последовательность белка и предсказав, как он свернется.»

Дмитрий Коркин 142:08
👥 Спикеры
📚 Упомянутые книги
📖 Термины
Домен
Функционально и структурно обособленная часть белковой молекулы.
Альтернативный сплайсинг
Процесс создания различных зрелых мРНК из одного транскрипта, позволяющий кодировать разные белки.
Gain-of-function
Тип исследований, направленных на искусственное придание организму новых функций, часто обсуждается в контексте вирусной патогенности.
Биология и медицина Дмитрий Коркин SARS-CoV-2 AlphaFold2 Биоинформатика Дизайн белков