Франсуа Шолле: «Градиентный спуск — не способ обучения алгоритмам»

Machine Learning Street Talk 17,9 тыс. 31 мин 3 мин 23.03.2025
Главное

Программный синтез и предел нейронных сетей: взгляд Франсуа Шолле и Кевина Эллиса 🤖 0:00

В индустрии искусственного интеллекта развернулась дискуссия о том, способны ли текущие архитектуры, основанные на глубоком обучении, достичь уровня настоящего обобщения или же нам необходимы принципиально новые подходы. В интервью каналу Machine Learning Street Talk эксперты Франсуа Шолле (исследователь ИИ, создатель Keras) и Кевин Эллис (специалист в области программного синтеза) обсудили, почему нейросети буксуют в алгоритмических задачах и какую роль в будущем будет играть программный синтез.

Тупик градиентного спуска: когда статистика мешает логике 0:28

В начале своей карьеры Франсуа Шолле полагал, что нейронные сети и градиентный спуск смогут стать полноценной заменой программированию, так как теоретически они обладают свойством полноты по Тьюрингу. Однако опыт работы над задачами по доказательству теорем в Google вместе с Кристианом Сегеди показал обратное.

По мнению Шолле, градиентный спуск — это «не тот способ», которым нужно изучать алгоритмы. Он утверждает, что нейросети эффективны для задач со структурой непрерывного пространства (паттерн-матчинг), но для дискретных логических задач они являются субоптимальным выбором. Кевин Эллис соглашается: попытки вложить дискретные структуры в непрерывные пространства векторов часто приводят к созданию «неуправляемых поверхностей оптимизации».

Будущее: гибридные архитектуры и программные интерфейсы 7:47

Собеседники сходятся во мнении, что вопрос создания гибридного «субстрата» — того, что не является чисто нейросетевым или чисто символьным, — остается ключевой задачей для ИИ.

Почему большие языковые модели побеждают? 16:35

Кевин Эллис задался вопросом: если классические методы (SAT/SMT-решатели, символьный поиск) были теоретически обоснованы, почему сегодня доминируют LLM?

ARC и вызовы сильного обобщения 21:27

Обсуждая бенчмарк ARC (Abstraction and Reasoning Corpus), Шолле поделился ожиданиями от предстоящей второй версии.

💬 Цитаты

«Градиентный спуск — это просто не способ учить алгоритмы.»

Франсуа Шолле 04:15

«Мир не закодирован в графах. Нам нужны системы, которые масштабируются от данных.»

Кевин Эллис 20:04
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Программный синтез
Автоматическое создание программ, которые удовлетворяют заданным спецификациям или требованиям.
ARC
Набор задач для измерения способности ИИ к обобщению и абстрактному мышлению (Abstraction and Reasoning Corpus).
Сильное обобщение
Способность системы решать совершенно новые задачи, опираясь на логику, а не на статистику прошлых примеров.
Полнота по Тьюрингу
Способность системы выполнить любое вычислимое действие, если достаточно времени и памяти.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Франсуа Шолле Кевин Эллис программный синтез ARC challenge глубокое обучение