Зепп Хохрайтер: «Человеческое мышление дискретно, а не непрерывно»

Machine Learning Street Talk 11,9 тыс. 11 мин 3 мин 01.04.2023
Главное

Профессор Зепп Хохрайтер (Sepp Hochreiter), легендарный исследователь в области глубокого обучения и создатель архитектуры LSTM (Long Short-Term Memory), встретился с ведущим канала Machine Learning Street Talk, чтобы обсудить текущее состояние искусственного интеллекта, проблемы абстракции и будущее «широкого ИИ». В этой беседе ученый поделился своим критическим взглядом на современные большие языковые модели и объяснил, почему человеческое мышление фундаментально дискретно, а нынешние методы обучения требуют фундаментального переосмысления.

🧠 Проблема определений и «широкий ИИ» 1:08

Дискуссия началась с вопроса о предсказаниях относительно создания общего искусственного интеллекта (AGI). По мнению Хохрайтера, основная проблема заключается в «антропоцентричности» наших определений: мы склонны называть «интеллектом» всё то, что свойственно людям, игнорируя возможность существования принципиально иных форм интеллекта.

Ведущий согласился с этим тезисом, отметив, что способность выполнять одну задачу «слишком хорошо» не эквивалентна истинному интеллекту, где обобщение (генерализация) должно быть приоритетом.

🧩 Происхождение абстракций и роль priors 2:45

Критическим моментом дискуссии стал анализ того, откуда берутся абстракции в современных системах. Сейчас нейронные сети черпают их исключительно из человеческих данных, что, по мнению Хохрайтера, является серьезным ограничением.

🔢 Дискретность против непрерывности 7:51

В ходе беседы Хохрайтер высказал радикальное мнение о природе мышления, которое удивило ведущего.

🛡️ Надежность моделей и «состязательные» угрозы 9:20

Говоря о текущих трендах, Хохрайтер выразил обеспокоенность по поводу доверия к «фундаментальным моделям» (Foundation Models).

В завершение дискуссии профессор раскритиковал методы градиентного спуска, используемые в обратном распространении ошибки (backpropagation). По его мнению, этот алгоритм слишком «жадный» — он застревает в первом же удобном локальном минимуме, игнорируя более качественные и обобщающие решения, которые могли бы быть найдены, если бы мы привносили в обучение больше априорных знаний и осознанных архитектурных ограничений.

💬 Цитаты

«Все наше мышление фундаментально дискретно. Мы не можем мыслить непрерывно.»

Зепп Хохрайтер 08:03

«Непрерывность — это иллюзия.»

Зепп Хохрайтер 08:15
👥 Спикеры
📚 Упомянутые книги
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
LSTM (Long Short-Term Memory)
Архитектура рекуррентных нейронных сетей, специально разработанная для борьбы с проблемой затухающего градиента и способная запоминать долгосрочные зависимости в данных.
Затухающий градиент (Vanishing gradient)
Проблема при обучении глубоких нейронных сетей, когда градиенты становятся крайне малыми на ранних слоях, что делает обучение невозможным.
AGI (Artificial General Intelligence)
Гипотетический уровень развития ИИ, способный выполнять любую интеллектуальную задачу на уровне человека или выше.
Priors (Априорные знания)
Предварительные предположения или знания о структуре данных, которые закладываются в модель до начала обучения.
Обратное распространение ошибки (Backpropagation)
Основной алгоритм обучения нейронных сетей, основанный на вычислении градиента функции потерь по весам сети.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Sepp Hochreiter LSTM AGI Deep Learning Machine Learning Street Talk