Эндрю Ын: «ИИ сегодня — это эра хороших данных, а не только больших»

Эндрю Ын (Andrew Ng) — одна из наиболее влиятельных фигур в современном мире искусственного интеллекта. Будучи основателем Google Brain, сооснователем Coursera и бывшим вице-президентом Baidu, он стоял у истоков бума глубокого обучения. В беседе с Крейгом Смитом в подкасте Eye on AI Эндрю Ын объясняет, почему индустрии пора сместить фокус с разработки всё более сложных архитектур нейросетей на качество данных, и как этот подход поможет внедрить ИИ в традиционные сектора экономики.

📈 Переход к «центричности на данных» (Data-Centric AI) 4:27

На протяжении последнего десятилетия прогресс в области ИИ определялся «моделе-центричным» подходом: исследователи брали фиксированные наборы данных и пытались улучшить алгоритмы или архитектуры нейросетей. По мнению Эндрю Ына, для большинства прикладных задач этот путь зашёл в тупик . В то время как потребительский интернет (поиск, реклама) оперирует миллиардами пользователей, традиционные индустрии — здравоохранение, логистика и производство — сталкиваются с дефицитом качественной информации .

Суть концепции Data-Centric AI заключается в систематической работе над качеством данных при сохранении стабильной архитектуры модели. Эндрю Ын выделяет две ключевые проблемы внедрения ИИ вне IT-сектора:

Малые объемы данных: В производстве часто приходится работать не с миллионами, а всего с 50 изображениями дефектов .
Гетерогенность задач: Каждая больница кодирует медицинские записи по-своему, а каждый завод производит уникальную продукцию. Невозможно создать одну «монолитную» систему для всех заводов или больниц мира .

Эндрю Ын утверждает, что выход из этой ситуации — создание инструментов, которые позволят экспертам в предметной области (инспекторам на заводах, врачам), а не только инженерам по машинному обучению, самостоятельно готовить данные для ИИ .

🛠 Landing AI: как заставить нейросеть учиться на 50 примерах 8:37

Новый стартап Эндрю Ына, Landing AI, разрабатывает платформу Landing Lens, которая реализует принципы data-centric подхода для компьютерного зрения в промышленности. Собеседники обсудили технический парадокс: принято считать, что для глубокого обучения нужны гигантские датасеты, но Эндрю Ын настаивает, что 50 примеров может быть достаточно, если они «чистые» .

Основная сложность в малых выборках — противоречивость меток. По словам гостя, на заводах часто два инспектора не могут договориться, что считать дефектом, а что нет . В результате ИИ получает несогласованные данные и не может обучиться. Платформа Landing Lens фокусируется на:

Выявлении несоответствий в маркировке данных экспертами .
Обнаружении дефектов самих данных (размытые изображения, плохое освещение).
Итеративном улучшении датасета силами профильных специалистов, а не дата-сайентистов .

Эндрю Ын подчеркивает, что нейросеть способна понять разницу между царапиной и сколом даже на микро-выборке, если эти несколько примеров идеально и однозначно размечены .

🤖 Будущее обучения: Supervised vs Under-supervised 12:46

Ведущий Крейг Смит поднял вопрос о долгосрочных трендах, сославшись на мнение Яна Лекуна о том, что будущее ИИ — за самообучением (self-supervised/unsupervised learning), где метки не нужны вовсе . Эндрю Ын соглашается, что в долгосрочной перспективе (десятилетия или века) этот путь ведет к сильному ИИ (AGI), но делает важную оговорку для бизнеса.

По мнению Ына, в ближайшие несколько лет основную экономическую ценность будет продолжать приносить обучение с учителем (supervised learning) . Он вспоминает, что начинал Google Brain с фокуса на unsupervised learning, вдохновленный идеями Джеффа Хинтона о том, что люди учатся без надзора родителей за каждым шагом . Однако масштабирование нейросетей в Google показало колоссальную практическую эффективность именно обучения на размеченных данных, что на время «отвлекло» исследовательское сообщество .

🧩 Проблема объяснимости и доверия в ИИ 16:32

Крейг Смит привел позицию Тома Сибела (C3.ai), утверждающего, что промышленность скептично относится к сложному глубокому обучению из-за его непрозрачности («черный ящик») . Эндрю Ын, напротив, не видит массового сопротивления deep learning в компьютерном зрении, но признает критическую важность «объяснимости» в медицине и финансах.

В качестве примера он привел систему оценки риска смертности пациентов в Стэнфордской больнице . Интересное наблюдение Эндрю Ына: врачам нужна была объяснимость не для каждой конкретной рекомендации, а как инструмент формирования первичного доверия к системе . Как только врачи убедились, что алгоритм опирается на разумные медицинские показатели, они перестали заглядывать в «объяснения» и начали использовать ИИ просто как инструмент приоритизации .

🚀 Путь к AGI и большие языковые модели (LLM) 27:31

Обсуждая хайп вокруг мультимодальных моделей и LLM (таких как GPT или Wudao 2.0), Эндрю Ын высказал осторожную позицию. Он не считает, что от современных языковых моделей есть прямая дорога к человеческому интеллекту (AGI) .

Эндрю использовал аналогию с небоскребами: «Строительство небоскребов впечатляет, и вершина здания приближает вас к Луне, но одного умения строить высокие конструкции недостаточно, чтобы реально на нее высадиться» . Он отмечает, что LLM потребляют в тысячи раз больше текста, чем любой человек за всю жизнь, но при этом остаются менее гибкими и способными, чем типичный человек . Путь к AGI, по его мнению, потребует открытий в технологиях, которых сегодня просто не существует .

🌏 Глобальная конкуренция и роль фундаментальной науки 31:30

В завершение беседы Эндрю Ын затронул тему лидерства в исследованиях. Несмотря на успехи Китая, США и Европы, он выразил обеспокоенность судьбой молодых ученых. Он признался, что без грантов от NSF и DARPA он никогда не смог бы запустить Google Brain . Сегодняшняя сложность получения государственного финансирования и бюрократия при написании заявок могут затормозить следующее поколение инноваторов, которые должны создать «то самое» будущее ИИ.