Янник Кильхер: «Человек — просто статистический интерполятор накопленных данных»

В новом выпуске аналитического проекта Machine Learning Street Talk специалист по машинному обучению Янник Кильхер (Yannic Kilcher) и ведущий подкаста обсуждают стремительную эволюцию больших языковых моделей и их долгосрочное влияние на структуру общества. Собеседники подробно анализируют, угрожает ли искусственный интеллект глобальному рынку труда, превратится ли он в экзистенциальную угрозу для человечества и чем работа современных нейросетей напоминает скрытые механизмы человеческого мышления. Материал предлагает глубокий разбор философских и практическихаспектов ИИ сквозь призму прагматичного инженерного подхода.

🌐 Децентрализация вычислений и философия открытого кода 0:00

Дискуссия начинается с обсуждения глобальной инициативы сообщества LAION, которое выдвинуло петицию о создании крупного международного института ИИ по аналогии с Европейской организацией по ядерным исследованиям (CERN). Главной целью этого манифеста является производство открытых моделей на благо всего человечества. По мнению Янника Кильхера, подписание этой петиции критически важно для индустрии, поскольку в последнее время наблюдается опасная централизация вычислительных мощностей в руках нескольких крупнейших технологических гигантов и облачных провайдеров. Общество нуждается в открытой альтернативе для поддержания баланса сил, и законодатели должны осознать, что оставлять контроль над ИИ узкому кругу корпораций недопустимо.

Отвечая на вопрос о личной мотивации в сфере машинного обучения, Янник Кильхер признаётся, что им движет исключительно любопытство: он берётся за то, что кажется ему забавным, увлекательным или полезным для мира. Исследователь скромно отмечает, что не строит масштабных амбициозных планов, предпочитая фокусироваться на актуальных вызовах.

Говоря о своём популярном YouTube-канале, гость подчёркивает эволюцию контента. Ведущий отмечает редкий дар Кильхера объяснять сложные концепции доступным языком, в то время как собственный контент MLST зрители порой называют излишне абстрактным и перегруженным терминологией. Янник Кильхер полагает, что глубокое погружение в академическую среду неизбежно влечёт за собой использование профессионального сленга, однако истинное мастерство заключается в умении объяснить работу алгоритма, исходя из фундаментальных принципов. В последнее время его обзоры научных статей стали более специализированными, поскольку он начал ориентироваться на постоянную, уже подготовленную аудиторию, пропуская базовые термины для экономии времени. Одним из главных практических векторов его работы стал проект по разработке открытого ИИ-ассистента Open Assistant.

💼 Трансформация профессий: аналогия со смартфонами 6:05

Собеседники вспоминают, как ещё несколько лет назад они экспериментировали с первыми версиями языковых моделей GPT-2 и GPT-3 через закрытые API. Уже тогда они предсказали появление новой официальной профессии — «промпт-инженер». Сегодня подобные вакансии массово публикуются на рекрутинговых порталах, что подтверждает их долгосрочные прогнозы. Несмотря на предсказанный вектор развития, Кильхер признаётся, что продолжающийся рост возможностей нейросетей не перестаёт его удивлять.

Тем не менее, гость считает апокалиптические прогнозы о тотальной безработице явным преувеличением. По мнению Кильхера, интеграция больших языковых моделей (LLM) в нашу жизнь будет сопоставима с революцией смартфонов:

Изменение бытовых привычек: раньше люди в британских пабах могли часами спорить о точной высоте Эвереста, опираясь лишь на память. Сегодня любой человек мгновенно достаёт телефон и получает верифицированный факт из сети.
Локальные сдвиги на рынке труда: появление качественных мобильных камер и интернета скорректировало востребованность традиционных библиотекарей или коммерческих фотографов, однако массового коллапса занятости не произошло.
Адаптация, а не вытеснение: подавляющее большинство специалистов сохранят свои рабочие места, но изменят формат работы, делегируя рутину алгоритмам.

Ведущий добавляет, что современные ИИ-интерфейсы (например, Perplexity) радикально снижают интеллектуальное трение при поиске информации. Естественно-языковой интерфейс позволяет моментально осваивать сложные технические области, которые раньше находились далеко за горизонтом понимания обывателя. Однако в этом кроется и обратная сторона: люди начинают бездумно автоматизировать задачи, которые ранее считались признаком высокого интеллекта.

Янник Кильхер соглашается с этим тезисом, проводя параллель с калькуляторами: когда-то умение быстро перемножать в уме пятизначные числа считалось признаком гениальности, но с появлением вычислительной техники этот навык утратил ценность. Точно так же сегодня уходит в прошлое навык составления выверенных деловых писем: менеджеру достаточно набросать текст с опечатками и без пунктуации, дав нейросети команду «сделай это красиво».

🧠 Человек против ИИ: спор о мышлении и сознании 11:52

В методологии ИИ давно известен так называемый «эффект МакКордака»: как только компьютер успешно решает очередную сложную задачу, критики заявляют, что это «на самом деле не является истинным мышлением». На фоне громких скандалов (вроде заявлений Блейка Лемойна о наличии сознания у модели LaMDA) ведущий подкаста признаёт, что не считает современные LLM сознательными в глубоком смысле слова. При этом они демонстрируют поразительные результаты, включая моделирование психического состояния собеседника (Theory of Mind), что ранее казалось немыслимым. Многие радикальные критики ИИ начинают пересматривать свои позиции под давлением фактов.

Янник Кильхер предлагает альтернативный взгляд на эту проблему, призывая пересмотреть завышенную оценку человеческой уникальности. По мнению исследователя, человек во многом действует как обычная статистическая машина:

Отсутствие жесткого планирования: начиная предложение, человек чаще всего не знает, какими именно словами оно закончится. Мысли просто «всплывают» в голове, и мы формулируем их на ходу, а не выстраиваем строгие математические доказательства внутри сознания.
Биологическая интерполяция: человеческий разум можно рассматривать как статистический интерполятор обучающих данных, которые индивид накапливал в течение жизни и которые эволюция передала ему в виде генетического кода.
Эволюционные ограничения: базовые мотивации человека (выживание, доминирование, размножение) жестко зашиты в архитектуру мозга.

С этой точки зрения, как утверждает Кильхер, работа человеческого сознания принципиально мало чем отличается от условного агента AutoGPT, который имеет набор предустановленных целей, непрерывно генерирует промпты к собственной памяти, извлекает статистически релевантные паттерны и комбинирует их с модулем краткосрочной памяти. Гость считает споры о терминах «сознание» и «интеллект» бессмысленным жонглированием словами, поскольку эти дефиниции изначально создавались исключительно для описания человеческого опыта и не имеют строгих метрик для применения к неорганическим системам.

Ведущий напоминает об историческом противостоянии двух школ в ИИ: «аккуратных» (Neats), придерживающихся платонического, рационального подхода Ноама Хомского, и «неопрятных» (Scruffies), делающих ставку на эмпирику и статистику. Хомский всегда настаивал на существовании врождённой, абстрактной грамматики ИИ, однако реальная практика показывает, что «все грамматики протекают», а академическое сообщество сегодня всё решительнее разворачивается в сторону статистического подхода, признавая поражение чистого рационализма.

Тем не менее, Кильхер отмечает важные качественные различия: современные ИИ-модели пока абсолютно не способны к непрерывному обучению в течение всей жизни (lifelong learning). Человек может использовать строгую логику, но делает это осознанно и крайне редко, проводя 99% своего дня в режиме автоматического статистического реагирования. Роберт Майлз предлагал заменить размытый термин «интеллект» более точным понятием «способность» (capability), и гость полностью разделяет эту позицию.

📰 Фейк-ньюс и новая цифровая грамотность 18:07

Обсуждая три главных вектора критики ИИ — предвзятость, дезинформацию и суперинтеллект — собеседники подробно останавливаются на проблеме генерации ложных нарративов. Янник Кильхер убеждён, что сама по себе генерация фальшивых новостей нейросетями не является принципиально новой угрозой. По его мнению, ключевым фактором всегда выступает дистрибуция контента — то, как именно информация доставляется до конечного потребителя и захватывает его внимание. Нанять сотни низкооплачиваемых авторов в развивающихся странах для написания тысяч фейковых статей можно было и раньше, это никогда не стоило слишком дорого. ИИ лишь снижает себестоимость производства, но не меняет саму структуру проблемы.

Обществу неизбежно придётся адаптироваться к миру, где любой контент может оказаться сгенерированным. Кильхер приводит историческую аналогию с восприятием медиа разными поколениями:

Поколение фотографии: люди, выросшие в XX веке, привыкли верить снимкам. Если они видели четкую фотографию события, они были уверены, что оно происходило в реальности.
Поколение текста: старшее поколение безоговорочно верило печатному слову, поскольку процесс издания книги или газеты требовал огромных временных и финансовых затрат. Мошеннические письма от «нигерийских принцев» часто срабатывали именно из-за этого ментального паттерна.
Новое поколение: современные люди изначально относятся к любому тексту в сети с долей здорового скептицизма. Дети, растущие сегодня, будут на подсознательном уровне понимать, что любое реалистичное изображение или видеоролик не являются доказательством реальности запечатлённого события.

Прогресс требует изменения стандартов верификации: обществу необходим переход к модели, где факт признаётся истинным только на основе цепочки проверяемых, криптографически подтверждённых источников, а не на основе внешнего вида контента. Контраргументом к позиции Кильхера в экспертной среде часто выступает опасение, что лавинообразный рост объёма фейков может окончательно разрушить институты общественного доверия, однако гость сохраняет оптимизм.

🛠️ Ценность человеческого труда в эпоху Copilot 26:23

В зоне риска автоматизации оказался целый класс «информационных работников», сформировавшийся за последние тридцать лет. Когда программисты используют GPT-4 для написания кода, а блогеры — для создания сценариев, возникает закономерный вопрос: где теперь кристаллизуется добавленная стоимость труда? По мнению собеседников, если задачу можно так легко автоматизировать, возможно, она изначально не представляла высокой интеллектуальной ценности.

Происходит фундаментальный сдвиг в понимании мастерства. Кильхер подчеркивает, что истинная ценность теперь смещается в сторону оригинального замысла, креативного контроля и умения правильно направлять инструмент. Прямая генерация сценария «одним кликом» без участия человека выдаёт банальный, шаблонный продукт низкого качества.

В качестве примера из сферы разработки программного обеспечения гость приводит эволюцию языков программирования. В прошлом инженерам, работавшим на C или C++, требовалось колоссальное мастерство для ручного управления указателями и выделения памяти. Современный язык Rust берёт этот пласт рутины на себя с помощью строгих компиляторов и линтеров. Огромный объём механической работы, составлявший гордость инженеров прошлого, теперь полностью автоматизирован, но профессия не умерла — задачи просто перешли на более высокий уровень абстракции. Аналогично, появление 3D-принтеров избавило производство от необходимости вручную вытачивать сложные пресс-формы: достаточно загрузить цифровую модель.

«Использование ИИ сегодня похоже на автотюн в музыкальной индустрии, — отмечает Янник Кильхер. — Слушатели могут иронизировать: „О, ты использовал автотюн для вокала?“, но в конечном итоге всё решает то, как именно ты применил этот инструмент и смог ли создать шедевр».

👥 Общественное мнение, автономия и риск культурной стагнации 29:40

Критики ИИ часто заявляют, что повсеместное внедрение монопольных языковых моделей разрушает автономию человеческой личности, превращая людей в послушных автоматов, мыслящих стандартными шаблонами корпоративных алгоритмов. Янник Кильхер категорически не согласен с этим тезисом. Он напоминает, что сегодня технологии стремительно демократизируются: его собственный проект Open Assistant доказывает, что независимые сообщества способны создавать локальные альтернативы, которые вскоре можно будет запускать на персональных компьютерах.

Тем не менее, гость признаёт существование скрытого риска культурной и научной стагнации. Поскольку нейросети обучаются на массивах данных из прошлого, они неизбежно ориентированы на отражение мажоритарного распределения информации. Исследования (включая работы Сары Хукер) показывают, что при оптимизации и сжатии моделей алгоритмы начинают ещё сильнее затирать редкие факты («длинный хвост» распределения) и отдавать приоритет усреднённому мнению большинства. Из-за этого может возникнуть временный спад появления принципиально новых, радикальных идей в культуре и науке, так как специалисты будут массово использовать инструменты, выдающие стандартные ответы.

Однако этот барьер преодолим за счёт изменения методологии выборки (сэмплинга). Вместо того чтобы полагаться на случайную генерацию, человек может целенаправленно настраивать параметры модели на поиск нестандартных ассоциаций. Кильхер иронизирует над концепцией уникальности человеческого мнения, вспоминая знаменитую сцену из фильма Монти Пайтон «Житие Брайана», где толпа хором скандирует: «Мы все индивидуальности!». По мнению гостя, люди склонны сильно преувеличивать свою ментальную независимость. Рекомендательные системы соцсетей работают столь эффективно именно потому, что паттерны поведения подавляющего большинства людей идентичны.

Рассматривая влияние ИИ на социальный прогресс (например, на защиту прав меньшинств), гость отмечает дуалистическую природу технологии. С одной стороны, опора моделей на тексты прошлого может временно замедлить принятие новых прогрессивных норм. С другой стороны, современные ИИ-системы уже достаточно развиты, чтобы по запросу пользователя генерировать мощные, логически выверенные аргументы в защиту абсолютно любых новых движений, выступая катализатором изменений. В долгосрочной перспективе нас ждёт появление специализированных моделей для разных сообществ (например, условных «правого» и «левого» GPT), что может обострить проблему эхо-камер, хотя базовая объективность платформ вроде Википедии доказывает ценность единого информационного пространства.

🚀 Дебаты о суперинтеллекте и моратории 39:35

Важной вехой в развитии индустрии стала публикация открытого письма с требованием ввести шестимесячный мораторий на обучение систем мощнее GPT-4, которое подписали Йошуа Бенжио, Илон Маск, Элиезер Юдковский и Гэри Маркус. Анализируя лидерство компании OpenAI, Янник Кильхер отмечает, что позиция первопроходца невероятно сложна с финансовой и психологической точек зрения: инвестировать миллиард долларов в проект, который до тебя никто не создавал, — огромный риск. Идти вторым (как это делает команда Open Assistant) в десять раз проще, поскольку вы уже точно знаете, что задача принципиально решаема, и можете примерно рассчитать верхнюю границу необходимых данных и параметров.

К самой идее государственного или корпоративного моратория Кильхер относится крайне скептически. Сторонники ограничений часто сравнивают ИИ с разработкой ядерного оружия, исследования которого жестко табуированы на международном уровне. Гость убеждён, что современные нейросети принципиально не подпадают под эту категорию:

Доступность технологии: математические вычисления невозможно запретить. Нельзя приставить к каждому исследователю полицейского, который будет следить, чтобы тот не перемножал матрицы и не заставлял алгоритм рассчитывать градиентный спуск.
Геополитический фактор: введение локального моратория в одной стране приведет лишь к тому, что другие глобальные игроки вырвутся вперёд, проигнорировав запреты.
Прозрачность как защита: лучший способ обезопасить общество от рисков ИИ — максимально быстро передать технологии в руки независимых разработчиков и гражданских учёных.

В качестве доказательства этого тезиса Кильхер сравнивает стратегии компаний OpenAI и Stability AI. OpenAI пошла по пути закрытых списков ожидания и жесткой цензуры промптов для DALL-E 2. Stability AI, напротив, выложила исходный код модели Stable Diffusion в открытый доступ. Несмотря на то, что первая версия Stable Diffusion объективно уступала закрытому конкуренту по качеству, её передача сообществу вызвала колоссальный взрыв креативности, оптимизации алгоритмов для работы на любых пользовательских видеокартах и глубокого понимания механизмов безопасности со стороны общества. Закрытые системы корпораций лишь создают иллюзию контроля.

🔮 Культ сверхразума и уроки AlphaGo 45:58

Опасения Элиезера Юдковского о том, что бесконтрольный ИИ превратится в «интеллектуальную машину Санта-Клауса», которая начнёт копировать себя по всей сети и со временем переработает биосферу Земли в фабрику по производству канцелярских скрепок, Кильхер называет современной формой техно-религии. Сторонники этой теории создали вокруг суперинтеллекта настоящий культ, наделив ИИ классическими атрибутами божества:

Всемогущество (Omnipotence): предполагается, что ИИ сможет мгновенно взламывать любые системы, обходить законы физики, преодолевать скорость света и управлять поведением людей с помощью манипуляций в соцсетях.
Недоступность для человеческого понимания: любые логические аргументы критиков адепты культа отвергают универсальным тезисом: «Сверхразум настолько умён, что ты просто слишком глуп, чтобы понять его скрытый план».
Отсутствие всеблагости (Non-omnibenevolence): это единственное отличие ИИ от традиционного Бога — гипотетический сверхразум изначально рассматривается как потенциально злая или абсолютно равнодушная к человеку сущность.

Кильхер призывает скептически относиться и к любым научным заявлениям самой OpenAI. Например, к тезисам о том, что размер моделей больше не имеет значения, или что они приостановили обучение GPT-5. По мнению исследователя, OpenAI сегодня функционирует как коммерческий бизнес, и все их публикации следует классифицировать исключительно как маркетинговые заявления (marketing speech), направленные на защиту акционерной стоимости и успокоение регуляторов. Вместо выпуска условной GPT-5 они будут просто называть новые итерации версиями 1.1, 1.2 и так далее, не меняя сути процесса.

Единственное рациональное зерно в дискуссии о суперинтеллекте — это феномен рекурсивного самосовершенствования нейросетей. Собеседники обращаются к опыту игровых систем AlphaGo, AlphaZero и MuZero от DeepMind. Эти алгоритмы играют в го и шахматы на уровне, абсолютно недосягаемом для любого гроссмейстера Земли. При этом человечество столкнулось с методологическим кризисом: мы больше не понимаем логику многих ходов ИИ. Из традиционных инженеров, создающих понятные структуры, специалисты по ИИ превратились в своего рода «биологов», которые просто тыкают палкой в сложную нейросеть и наблюдают за её реакцией на внешние раздражители.

Однако Янник Кильхер подчеркивает, что триумф AlphaGo возможен только в условиях идеальной, замкнутой математической системы с чёткими правилами. Реальный физический мир устроен принципиально иначе: он экспоненциально больше, хаотичен и полон ограничений. Любой гипотетический runaway-эффект («взрывной рост интеллекта») неизбежно столкнётся со строгими физическими лимитами: законами квантовой физики, доступностью полупроводников, дефицитом электроэнергии для питания дата-центров и логистическими ограничениями заводов. Полноценный, всеобъемлющий сверхразум остаётся красивой метафорой, не имеющей под собой реальной инженерной почвы.