Алекс Вилтшко, основатель и генеральный директор компании Osmo, в интервью для проекта Eye on AI подробно рассказывает о том, как искусственный интеллект впервые в истории учится понимать и оцифровывать запахи. Путь исследователя от нейробиологии в Гарварде до разработки ИИ-платформы в Google Brain привел к созданию технологии, способной предсказывать аромат молекулы по ее структуре точнее, чем это делают профессиональные «носы».
🧠 Нейробиология обоняния: почему запахи так важны 2:40
Алекс Вилтшко подчеркивает, что обоняние — это глубоко недооцененное чувство, которое напрямую связано с нашими эмоциями и памятью. Согласно данным Allen Brain Atlas, если ранжировать чувства по количеству мозгового вещества, выделенного на их обработку, зрение занимает первое место, а обоняние — второе, опережая слух .
Ключевые особенности биологического обоняния:
- Сложность рецепторов: В человеческом глазу всего три типа цветовых каналов (RGB), в то время как в носу человека находится около 350 типов обонятельных рецепторов .
- Обонятельный эпителий: Область размером с почтовую марку, где нейроны экспрессируют рецепторы, чувствительные к различным частям химического пространства .
- Первичная обработка: Сигналы от рецепторов поступают в пириформную кору (piriform cortex), расположенную в нижней части мозга, где и происходит формирование восприятия запаха .
Алекс Вилтшко отмечает, что 90% того, что мы называем «вкусом», на самом деле является запахом . Благодаря «эффекту дымохода», когда мы глотаем пищу, пары поднимаются из горла в носоглотку, позволяя мозгу распознавать тысячи молекул, содержащихся, например, в вине. По мнению гостя, мастерство сомелье или парфюмера заключается не в биологической уникальности их носа, а в феноменальной способности ассоциировать запахи со словами и огромном накопленном каталоге опыта .
🗺️ Создание цифровой карты запахов 13:43
Главная проблема оцифровки запахов заключалась в отсутствии фундаментальной «карты». Для зрения есть модель RGB, для звука — частотная база (преобразование Фурье). Для запаха такой структуры не существовало, так как 350-мерное пространство невозможно нанести на плоский лист бумаги .
Для решения этой задачи Osmo применила подход ИИ:
- Графовые нейронные сети (GNN): Молекула представляется как граф, где атомы — это узлы, а связи между ними — ребра . Это позволяет ИИ анализировать структуру малых молекул (обычно от 5 до 20 атомов), которые мы способны ощущать.
- Обучение с учителем: Модель обучалась на парах «структура молекулы — описание парфюмера». Исследователи разработали стандартный лексикон из примерно 140 слов (в научной работе использовалось 55 слов для ускорения обучения), чтобы избежать субъективности .
- Эмбеддинги: В процессе обучения нейросеть создала внутреннюю карту (embedding) размерностью около 250 измерений. Вилтшко отмечает, что это число подозрительно близко к количеству биологических рецепторов человека (350) .
В результате эксперимента, опубликованного в журнале Science, модель Osmo прошла своего рода «тест Тьюринга для запахов» . Предсказания ИИ оказались ближе к среднему значению оценок группы экспертов-дегустаторов, чем оценки любого отдельного участника этой группы .
🦟 От парфюмерии до борьбы с насекомыми 32:58
Технология Osmo имеет два основных направления применения: коммерческое (создание новых ароматов) и гуманитарное (здравоохранение).
Безопасная парфюмерия: Вилтшко утверждает, что многие привычные нам ингредиенты в ближайшие 5–10 лет могут исчезнуть с рынка из-за ужесточения норм безопасности (раздражение кожи) или требований к биоразлагаемости . Osmo использует ИИ для поиска новых молекул, которые пахнут так же, как известные ароматы (например, роза или жасмин), но при этом полностью безопасны и дешевы в производстве.
Борьба с болезнями: Совместно с Фондом Билла и Мелинды Гейтс (Gates Foundation) Osmo разрабатывает новые репелленты .
- Исторические данные: Команда нашла данные Министерства сельского хозяйства США (USDA) 1942 года, которые были оцифрованы Google Books . В этих книгах содержались результаты испытаний тысяч химикатов на солдатах во время Второй мировой войны, когда комары были большей угрозой, чем противник.
- Результат: ИИ проанализировал эти данные и смог предсказать новые структуры репеллентов, которые по эффективности не уступают или превосходят ДЭТА (DEET), но потенциально более приятны для человека и безопасны . Тестирование проводится в партнерстве с TropIQ в Нидерландах.
📸 «Осмография» и будущее оцифровки воспоминаний 46:00
Алекс Вилтшко проводит аналогию: «Осмография» для запаха — это то же самое, что фотография для света . Он прогнозирует, что путь, который прошла фотография за 100 лет (от живописи к цифровым снимкам), обоняние пройдет за 10 лет благодаря современным технологиям.
Перспективы цифрового запаха по мнению Вилтшко:
- Запись и воспроизведение: Возможность захватить запах «подвала бабушкиного дома», сохранить его в цифровом виде и воспроизвести позже для возвращения к воспоминаниям .
- Электронные носы: Osmo готова сотрудничать с производителями датчиков, чтобы использовать свою карту для интерпретации шумных сигналов от физических сенсоров .
- Робототехника: Для того чтобы роботы могли полноценно взаимодействовать с миром, им необходимо «измерять то, что они хотят автоматизировать». Вилтшко цитирует своего научного кумира Зубина Гахрамани: «Нельзя автоматизировать то, что нельзя измерить» .
🤖 Роль LLM и масштабируемость технологий 55:23
Обсуждая хайп вокруг больших языковых моделей (LLM), Алекс Вилтшко выражает скептическое отношение к их способности напрямую проектировать молекулы.
Его аргументы:
- Специфичность данных: В корпусах текстов, на которых учатся LLM, недостаточно данных о молекулярном уровне запахов .
- Галлюцинации: Ошибка в историческом отчете безобидна, но галлюцинация при создании новой молекулы может быть опасной .
- LLM как интерфейс: Вилтшко видит будущее в использовании LLM как «клея» или естественного интерфейса, который будет обращаться к специализированным API Osmo для выполнения точных задач .
На текущий момент платформа Osmo является проприетарной. Компания фокусируется на создании облачной инфраструктуры для обработки химических данных, хотя теоретически такие модели могут быть развернуты локально на устройствах с датчиками в будущем .