Как Fermat's Library развивает концепцию открытой науки и меняет arXiv

В рамках интервью для Y Combinator сооснователи проекта Fermat's Library, братья Жуан Баталья (João Batalha) и Луис Баталья (Luís Batalha), подробно рассказали о создании платформы для совместного аннотирования научных статей. Стартап, родившийся как внутренний клуб рецензирования и развивающийся в формате сайд-проекта, ставит своей целью продвижение концепции открытой науки (Open Science). Предприниматели поделились тактическими решениями по привлечению аудитории, разбором системных проблем современного академического издательства и своим видением будущего научных коллабораций.

🛠️ Платформа Fermat's Library: аннотирование научных публикаций и борьба со сложным текстом 0:00

Fermat's Library представляет собой специализированную краудсорсинговую платформу, разработанную для аннотирования научных статей напрямую в окне браузера. Как объясняют Жуан Баталья и Луис Баталья, интерфейс продукта работает как встроенный PDF-ридер, в котором на боковой панели отображаются комментарии и заметки пользователей с полной поддержкой разметки LaTeX и Markdown. Пользователи могут добавлять аннотации к наиболее плотным и сложным для понимания участкам научных текстов, дополняя их формулами, кодом или развернутыми комментариями.

По мнению основателей, академические публикации часто представляют собой самый плотный и лаконичный тип контента, который только приходится читать человеку. Авторы статей нередко опускают промежуточные логические шаги, используя спартанский язык и стандартные фразы вроде «это должно быть очевидно», что ставит читателей в тупик. Платформа Fermat's Library призвана оцифровать и перенести в онлайн тот опыт разбора сложных публикаций, который традиционно существует в офлайне — в рамках университетских исследовательских групп и закрытых журнальных клубов.

📈 От хакатона на выходных к Open Science: история стартапа как хобби 0:41

История проекта началась после того, как четверо сооснователей окончили колледж. Обладая техническим бэкграундом (Луис Баталья изучал физику и экономику, а Жуан Баталья — компьютерные науки), они организовали закрытый журнальный клуб, где по очереди разбирали и презентовали друг другу сложные статьи. Жуан Баталья вспоминает, как объяснял основы биткоина (концепцию хеш-функций и шифрования с открытым ключом) Луису и еще одному сооснователю, Мике, которые на тот момент не имели базового ИТ-образования. Поняв ценность таких разборов, команда решила создать полноценный веб-инструмент.

Первая версия Fermat's Library была написана буквально за выходные и сразу же запущена в открытый доступ. Проект до сих пор развивается как сайд-проект: основатели исправляют баги и добавляют фичи по ночам, совмещая это с основной работой. В качестве долгосрочной миссии Fermat's Library основатели выделяют ускорение перехода науки к модели Open Science (открытой науки), которая включает в себя несколько фундаментальных элементов:

Open Data (открытые данные): свободный обмен исходными массивами данных, использованными в исследованиях, для их легкой репликации и верификации другими учеными.
Open Code (открытый код): публикация алгоритмов и программного кода, на которых строились вычисления.
Open Publishing (открытые публикации): отказ от размещения научных работ в журналах, скрытых за paywall (платными подписками), в пользу общедоступных ресурсов.

Первым серьезным успехом и главным драйвером первоначального роста (growth hack) для платформы стало аннотирование знаменитой «Белой книги» Биткоина (Bitcoin whitepaper). Эта работа до сих пор остается самой комментируемой на сайте. Она получила широкое цитирование в медиа, а ссылки со сторонних новостных сайтов вели на Fermat's Library как на эталонную версию документа с разбором смыслов. В дискуссии под этой статьей приняли участие многие известные представители криптосообщества и даже знаменитый американский профессор права Лоуренс Лессиг (Lawrence Lessig).

🤝 Сила краудсорсинга и онлайн-коллаборации: от GitHub до блога Теренса Тао 4:23

По мнению Жуана и Луиса Баталья, в современной науке формируется устойчивый тренд на удаленное онлайн-взаимодействие ученых вокруг сложных теоретических задач. В качестве наиболее яркого примера они приводят решение знаменитой математической проблемы — гипотезы Эрдеша о расхождении (Erdos discrepancy problem), сформулированной Полом Эрдешем около 80 лет назад. Выдающийся математик и лауреат Филдсовской премии Теренс Тао (Terence Tao) опубликовал в своем блоге описание своего подхода к решению этой задачи. Один из читателей блога из Германии оставил короткий комментарий размером с твит, указав, что проблема Эрдеша имеет сходство со структурой судоку, и для ее решения можно применить математический аппарат, используемый в этих головоломках. Эта подсказка стала ключом, позволившим Тао полностью взломать задачу. В итоге решение проблемы расхождения Эрдеша было опубликовано в 2016 году, став одной из важнейших вех в теории чисел, и все это произошло благодаря одному онлайн-комментарию.

Другим важным прецедентом распределенной научной работы гости называют проект Polymath, инициированный еще одним филдсовским лауреатом Тимом Гауэрсом (Tim Gower). Это был осознанный социальный эксперимент, призванный проверить, способны ли математики со всего мира кооперироваться в интернете для коллективного решения сложнейших задач. Эксперимент увенчался успехом.

Жуан Баталья сравнивает потенциал научных платформ с тем влиянием, которое оказали крупнейшие краудсорсинговые экосистемы:

GitHub: оцифровал и масштабировал движение open source, позволив миллионам разработчиков беспрепятственно вносить свой вклад в общий код.
Wikipedia: доказала жизнеспособность модели создания общедоступных знаний исключительно на энтузиазме редакторов.
Stack Overflow: сформировала эффективную среду взаимопомощи программистов.

Собеседники сходятся во мнении, что человечество обладает колоссальными, но до сих пор не задействованными в полной мере фондами доброй воли. Если бы Wikipedia или Stack Overflow были презентованы инвесторам до своего физического появления, любой прагматичный аналитик отнесся бы к ним скептически, поскольку альтруистическая модель создания бесплатного и качественного контента кажется противоречащей эгоистичной природе человека. Тем не менее, эти платформы доказали свою критическую важность для цивилизации. Подобная централизованная экосистема краудсорсинга, по словам основателей, должна быть создана и для фундаментальной науки.

🔌 Расширение для arXiv: решение «горящих проблем» ученых и автоматизация рутины 7:18

Поскольку Fermat's Library начиналась как локальный журнальный клуб, команда быстро поняла необходимость расширения продукта до полноценной платформы. Ключевым тактическим решением стал выпуск расширения для браузера Chrome, интегрированного с крупнейшим репозиторием научных препринтов arXiv (arXiv.org). Площадка arXiv хранит черновые варианты статей до их официальной публикации в рецензируемых научных журналах. В таких динамичных дисциплинах, как машинное обучение (Machine Learning) и глубокое обучение (Deep Learning), arXiv имеет критическое значение: новые прорывные работы выходят с такой скоростью, что исследователи физически не могут ждать месяцами прохождения традиционного академического рецензирования и начинают строить свои модели поверх свежих препринтов.

Основная проблема arXiv заключается в том, что платформа выполняет исключительно функцию хостинга файлов. В лучшем случае читателю приходится вручную писать автору на email, чтобы задать вопрос. Расширение от Fermat's Library встраивает интерфейс комментирования прямо на страницы arXiv, позволяя видеть заметки коллег на полях без перехода на сторонние сайты.

При проектировании расширения разработчики опирались на официальный опрос пользователей, проведенный администрацией arXiv. По результатам этого опроса был опубликован документ с перечнем функций, которые ученые больше всего хотели бы видеть в репозитории. Руководство arXiv тогда открыто заявило, что планирует оставаться лишь базовой инфраструктурой и API, предложив сторонним разработчикам самостоятельно реализовать пользовательские фичи.

Команда Fermat's Library сфокусировалась на решении самых критических («горящих») проблем исследователей, выяленных в опросе:

Reference extraction (извлечение ссылок): в стандартном PDF читателю приходится копировать название статьи из списка литературы внизу страницы, вставлять в Google и искать ссылку. Расширение позволяет кликнуть на кнопку и мгновенно получить список кликабельных ссылок на все упомянутые источники.
BibTeX extraction: автоматизированное извлечение библиографических данных для быстрого цитирования.
Инструменты навигации: адаптивный просмотр формул, графиков и метаданных.

В настоящий момент верификация качества препринтов на arXiv осуществляется исключительно через текстовые комментарии. Однако основатели активно прорабатывают внедрение многоаспектной системы рейтингов. По их задумке, вместо простых лайков или апвоутов научную работу необходимо оценивать дифференцированно: отдельно за качество и объем использованного датасета, отдельно за методологию и отдельно за математическую строгость выводов.

🔬 Системные сбои в академической среде: p-value hacking и кризис отрицательных результатов 14:28

Одним из наиболее разрушительных явлений в современной академической науке гости называют полное отсутствие стимулов для публикации отрицательных результатов исследований. В погоне за карьерным ростом, грантами и постоянными позициями (tenure) в университетах ученые стремятся публиковать только высокоэффективные «сенсации». Если эксперимент провалился и гипотеза не подтвердилась, работа отправляется «в стол». Луис Баталья приводит в пример личную историю своего друга, проходящего обучение в докторантуре Кембриджского университета в области биологии. Только приехав на конференцию в США, этот аспирант случайно узнал, что исследовательская группа из Австралии прямо сейчас параллельно бьется над точно такой же проблемой и совершает те же самые ошибки в экспериментах. Из-за того, что австралийские биологи не публиковали свои неудачные методы, британский ученый потерял месяцы работы, заново изобретая колесо.

С этой проблемой тесно связано так называемое «взламывание p-value» (p-value hacking). Жуан Баталья объясняет, что показатель p-value является общепринятым статистическим стандартом, определяющим, является ли полученный в ходе эксперимента результат случайным или же он статистически значим и достоин публикации. В условиях жесткого давления академической системы исследователи подсознательно или намеренно подгоняют выборки и манипулируют данными, чтобы искусственно протиснуться под этот стандарт и обнаружить корреляцию там, где ее нет. По словам основателей стартапа, p-value hacking приобрел огромные масштабы в таких сферах, как экономика, нутрициология и биология. В частности, данные проблемы подробно исследует профессор Стэнфордского университета Джон Иоаннидис (John Ioannidis), чьи работы часто обсуждаются в научных подкастах (например, в EconTalk).

Команда Fermat's Library планирует бороться с академической недобросовестностью с помощью технических инструментов:

Интеграция с DOI: создание API, позволяющего по цифровому идентификатору статьи мгновенно подтягивать метаданные о статистической достоверности выводов.
Визуальные предупреждения: отображение ярких плашек в Chrome-расширении прямо поверх статьи, сигнализирующих о признаках манипуляции с p-value или, наоборот, подтверждающих железную солидность исследования.

🏀 Парадокс Симпсона, баскетбол и Dyson Sphere: уроки из «случайного чтения» научных статей 19:11

Поиск статей для еженедельного дайджеста Fermat's Library часто напоминает алгоритм случайного блуждания (random walk). Жуан Баталья делится забавным примером: купив фитнес-трекер Fitbit для мониторинга сна, он начал хаотично читать массив публикаций по сомнологии. В итоге он наткнулся на масштабное финское исследование, изучавшее связь между продолжительностью сна и смертностью, и обнаружил контринтуитивные закономерности:

Продолжительность сна: у людей, спящих менее 7 часов в сутки, риски преждевременной смерти ожидаемо повышены. Однако у тех, кто спит более 8 часов, показатели смертности возрастают аналогичным образом.
Качество сна: согласно выводам финских ученых, субъективное качество сна (крепкий сон или прерывистый) оказывает гораздо меньшее влияние на долголетие, чем строгое соблюдение его временного хронометража.

Другим примером качественного анализа данных силами основателей стала проверка классической статьи 1990-х годов, посвященной феномену «горячей руки» (hot hand phenomenon) в баскетболе и парадоксу Симпсона. Данный феномен описывает психологическую уверенность в том, что игрок, забросивший первый мяч, имеет повышенный шанс на успешное выполнение следующего броска. Опросы студентов Стэнфорда и Корнелла начала 90-х показывали, что 68 из 100 человек свято верили в существование «горячей руки». Однако оригинальное исследование на скромной выборке штрафных бросков команды Boston Celtics показало, что вероятность попадания второго броска статистически выше сама по себе, независимо от успеха или провала первого броска.

Жуан Баталья решил верифицировать это утверждение, скачал современный датасет с платформы Kaggle, содержащий более 600 000 штрафных бросков, и перезапустил алгоритмы авторов оригинального исследования. Огромный массив данных полностью подтвердил выводы тридцатилетней давности: точность второго броска объективно и существенно выше первого броска, но этот паттерн никак не коррелирует с тем, попал ли баскетболист в предыдущей попытке.

Иллюзия «горячей руки» возникает из-за парадокса Симпсона (Simpson's paradox). Суть парадокса заключается в том, что в одном и том же массиве данных можно получить два противоположных, но математически верных вывода, в зависимости от того, как именно агрегируются и разбиваются данные. В контексте баскетбола общая объединенная таблица бросков всех игроков показывает один результат, но если декомпозировать данные персонально по каждому игроку, картина меняется. Собеседники приводят наглядный экономический пример парадокса Симпсона в США в период с 2000 по 2013 год:

По сегментам образования: медианная заработная плата упала абсолютно во всех отдельных категориях граждан — среди людей без школьного образования, выпускников школ, бакалавров и лиц с учеными степенями.
В агрегированном виде: общий показатель медианной зарплаты по стране за этот же период вырос.
Причина аномалии: за 13 лет произошел масштабный демографический сдвиг — огромное количество людей получило высшее образование. Переток населения в более высокооплачиваемые когорты поднял средний показатель по стране, хотя внутри самих когорт доходы снизились.

Луис Баталья также отмечает свое увлечение классическими короткими работами физика Фримена Дайсона (Freeman Dyson). Его знаменитая статья 1960 года, в которой впервые была предложена концепция сферы Дайсона (Dyson Sphere) — мегаструктуры вокруг звезды для улавливания ее энергии развитыми цивилизациями, — занимала всего одну страницу. С помощью простейших уравнений физики Дайсон сумел рассчитать стабильность этой сферы и температурные ограничения. Другим примером лаконичного шедевра Луис называет статью Дайсона о выводе уравнения Шрёдингера Ричардом Фейнманом, демонстрирующую чистую квантовомеханическую интуицию. В середине XX века величайшие открытия (такие как обнаружение нейтрона или позитрона) умещались в одну-две страницы текста, в то время как современные работы (например, об открытии гравитационных волн) разрастаются до 15 и более страниц из-за жестких требований к формату и усложнения методологии.

📝 Искусство научного текста: почему обзоры важнее открытий и как аннотировать книги 29:25

Как замечает Луис Баталья, статус самой влиятельной публикации в конкретной научной дисциплине далеко не всегда принадлежит автору первоначального открытия. При создании квантовой электродинамики (QED) трое выдающихся физиков — Ричард Фейнман, Джулиан Швингер и Синъитиро Томонага — работали параллельно и независимо друг от друга, выпуская разрозненные статьи. Однако ключевой и самый цитируемый труд в этой сфере написал Фримен Дайсон. Он не совершал исходного открытия, но взял на себя колоссальный труд по анализу, систематизации и унификации подходов Фейнмана, Швингера и Томонаги. Дайсон создал понятный, структурированный текст, который наконец позволил остальному мировому научному сообществу осознать и начать применять квантовую электродинамику на практике. Таким образом, ясное, доступное и качественное изложение (review paper) зачастую имеет гораздо большей вес для прогресса, чем спартанский язык оригинального первооткрывателя.

Основатели Fermat's Library убеждены, что практика открытого краудсорсингового аннотирования должна быть перенесена с академических статей на фундаментальные учебники и книги. Этот тезис созвучен с публичными рассуждениями главы Stripe Патрика Коллисона (Patrick Collison), который заявлял, что готов платить за электронные книги значительно больше, если бы имел возможность видеть на полях хайлайты, маргиналии и живые комментарии своих друзей или признанных экспертов. Друг основателей, исследователь из Института периметра (Perimeter Institute) Джесси Риддл (Jesse Riddle), приводит в пример культовый учебник по классической механике Герберта Голдстейна. Эта книга великолепна и используется тысячами студентов по всему миру, за исключением одного конкретного раздела, посвященного преобразованию Лежандра (Legendre transform) — этот кусок написан плохо и непонятно. В традиционном мире, чтобы исправить это, кому-то нужно написать альтернативный учебник целиком и попытаться убедить университеты отказаться от Голдстейна, что практически невозможно. Модель open-source аннотирования позволила бы сообществу просто «закоммитить» идеальное альтернативное объяснение конкретной главы, сохранив остальной шедевральный текст нетронутым.

При переносе этой модели на современные книги неизбежно возникают юридические сложности и вопросы соблюдения авторских прав. Тем не менее, Луис и Жуан Баталья считают, что лазейкой может послужить доктрина добросовестного использования (Fair Use), аналогичная той, что позволяет блогерам использовать фрагменты фильмов в обзорах, поскольку аннотации создают добавочную образовательную ценность поверх оригинального текста. Огромный массив человеческих мыслей и инсайтов, рождающихся в головах людей в процессе чтения, сейчас безвозвратно теряется, оседая в закрытых интерфейсах Kindle Highlights.

Интересным наблюдением основателей является тот факт, что сами авторы научных работ зачастую оказываются худшими аннотаторами собственных текстов. Создатель статьи находится внутри «проклятия знания»: он досконально понимает тему, автоматически проскакивает промежуточные выкладки и физически не способен предугадать, на каком именно абзаце споткнется студент. При создании аннотаций к «Белой книге» Ethereum Виталика Бутерина команда Fermat's Library напрямую связывалась с разработчиком по электронной почте. Бутерин мгновенно отвечал на вопросы, предоставляя статистику самых частых затруднений пользователей. Авторам гораздо проще точечно отвечать на конкретные вопросы со стороны, чем превентивно закладывать пояснения в текст.

Опыт ведения научно-популярного аккаунта Fermat's Library в Twitter показал, что приобретение новых микрознаний вызывает у людей сильное привыкание. Команда научилась упаковывать сложные физические и математические концепты в формат одного твита с емкой инфографикой, собирая сотни тысяч вовлеченных читателей. В качестве примера социального влияния они приводят историю 14-летнего школьника из России, который прочитал их аннотацию к доказательству иррациональности (в оригинале оговорено как рациональность) квадратного корня из двух ($\sqrt{2}$). Вдохновившись разбором, подросток самостоятельно разработал альтернативное математическое доказательство, прислал его Жуану и Луису на верификацию, и после подтверждения его легитивности отправил работу в профильный научный журнал.

💰 Бизнес-модель линейного роста: почему Fermat's Library не спешит зарабатывать 1:02:03

С точки зрения венчурного бизнеса и классических метрик Кремниевой долины, Fermat's Library развивается по аномальной траектории. Собеседники признаются, что проект до сих пор полностью бесплатен, не приносит прибыли и основатели никогда всерьез не занимались его монетизацией. Все операционные расходы, включая оплату серверов, команда покрывает из собственного кармана, поскольку никто из четырех создателей не получает в Fermat's Library зарплату. Проект принимает донаты в криптовалюте, но они носят символический характер.

Жуан Баталья проводит прямую аналогию между Fermat's Library и историей развития самого репозитория arXiv, который был запущен в августе 1991 года. Если посмотреть на график объема публикаций и аудитории arXiv за 35 лет, там нет привычной для стартапов экспоненциальной клюшки (hockey stick growth) — график абсолютно линеен. Однако arXiv без какого-либо экспоненциального взрыва стал главным инфраструктурным столпом распределения научного знания на планете. Команда Fermat's Library осознанно готова к долгой, линейной игре в течение десятилетий для достижения своей финальной концептуальной цели.

В академическом мире существует жесткий статус-кво («стабильное равновесие»), мешающий переходу на открытые рельсы:

Карьерные ловушки: молодым исследователям кровно необходимы публикации в элитарных закрытых журналах вроде Nature или Science, так как без этого они физически не смогут претендовать на позиции постдоков в престижных университетах. Хотя защитники традиционной системы рецензирования подчеркивают важность строгого контроля качества со стороны авторитетных институтов, основатели Fermat's Library указывают на торможение прогресса.
Экономическое неравенство: студенты в США, находясь в кампусной Wi-Fi сети топовых вузов вроде MIT, даже не осознают, что научные статьи скрыты за платными барьерами, ведь университет незаметно оплачивает миллионные подписки. В это же время исследовательские группы в Португалии или развивающихся странах не имеют бюджетов на подписки. Ученым приходится идти на ухищрения: использовать VPN-доступы через инфраструктуру CERN или напрямую просить авторов прислать PDF-файл по почте.

По мнению Луиса Батальи, главным рычагом (growth hack) для слома этой системы и вывода открытых журналов (overlay journals) на уровень авторитета Nature является привлечение «неприкасаемых» академиков — лауреатов Филдсовской и Нобелевской премий, которые уже имеют пожизненные контракты (tenure) и не зависят от мнения грантодателей. Именно так поступил Теренс Тао, опубликовав свое прорывное решение проблемы Эрдеша в открытом журнале Discrete Analysis, основанном Тимом Гауэрсом.

В рамках интеграции с открытым сообществом Fermat's Library уже активно сотрудничает со сторонними проектами. Например, они полностью обеспечивают интерфейс комментирования и аннотирования для независимого открытого журнала Quantum (информационный оверлей над категорией квантовой физики в arXiv). Такие журналы не несут затрат на хостинг файлов, являясь по сути курируемыми списками качественных ссылок на arXiv-препринты, но их репутация стремительно растет.

Желающие поддержать проект Fermat's Library могут сделать это тремя основными способами:

Самостоятельно аннотировать интересную научную статью на платформе, отправив её основателям по электронной почте.
Организовать локальный журнальный клуб или исследовательскую группу на базе Fermat's Library в своем университете, где все инструменты полностью бесплатны.
Загружать собственные научные работы на сайт и формировать открытые списки для совместного чтения с коллегами.