Й Кэпитал и будущее ИИ: как превратить инференс в интеллект и преодолеть «стену данных»

Y Combinator 24,4 тыс. 1 ч 7 мин 6 мин 28.05.2026
Главное

В стенах знаменитого офиса Pioneer «Й Кэпитал» (Y Combinator) состоялось открытие первого в истории YC Paper Club. Мероприятие собрало уникальное сообщество: от исследователей с десятками тысяч цитирований до основателей стартапов, привлекших более 50 миллионов долларов инвестиций, чтобы обсудить передовые разработки в области инференса, робототехники и фундаментальных теорий машинного обучения.

🚀 Возрождение Pioneer и дух раннего OpenAI 0:07

Ведущий мероприятия, Аман, открыл встречу с ностальгического экскурса в историю YC. Он напомнил, что именно здесь, в Pioneer, проходил батч Winter 2016, который оказался аномально успешным: из 140 компаний того набора 10–15 стали «единорогами» . Среди них — WPY, Astronis, Deepgram.

Аман поделился личными воспоминаниями о том времени:

По мнению Амана, около половины всех талантов в сфере ИИ в районе залива Сан-Франциско сосредоточены в городе (OpenAI, Anthropic, Cursor), но другая половина находится в Пало-Альто и окрестностях (Google DeepMind, Tesla, xAI, Thinking Machines), и YC стремится объединить эти сообщества на своей площадке .

🏎️ Инференс как новая «способность» модели 3:38

Танишк, аспирант Стэнфорда, представил доклад о проекте Speculative Speculative Decoding (SSD). Его главный тезис заключается в том, что в ближайшие годы инференс перестанет восприниматься просто как статья расходов или вопрос удобства.

Основные идеи Танишка:

  1. Инференс — это интеллект. Если производительность системы масштабируется вместе с объемом «размышлений» (compute-at-test-time), то скорость генерации токенов напрямую определяет пиковый уровень интеллекта, который модель может выдать пользователю .
  2. Экономика. Затраты на инференс при обслуживании миллиардов пользователей или мощных агентов уже начинают доминировать над затратами на обучение . По его словам, обучение с подкреплением (RL) по сути является «оберткой над инференсом», и требования RL к вычислительным мощностям уже начинают превышать требования претрейнинга .

Механика Speculative Speculative Decoding (SSD)

Обычное спекулятивное декодирование использует маленькую модель-черновик (draft model) для генерации нескольких токенов, которые затем проверяются большой целевой моделью (target model) в один проход . Это позволяет менять вычислительную мощность (FLOPS) на снижение задержки (latency).

Однако в классической схеме есть узкое место: последовательная зависимость. Черновик должен закончить работу, прежде чем начнется проверка . Алгоритм SSD решает эту проблему через параллелизацию:

🤖 Диффузионные модели в управлении роботами 17:32

Станнис, исследователь из Google DeepMind, представил работу по Diffusion Model Predictive Control (DMPC). Он отметил, что хотя диффузионные модели произвели революцию в генерации изображений, их применение в робототехнике открывает новые возможности для адаптивного управления.

Ключевые преимущества подхода DMPC, по словам Станниса:

Станнис подчеркнул, что этот метод позволяет использовать видеоданные (без разметки действий) для обучения, что критически важно, так как данные — это главное «бутылочное горлышко» в современной робототехнике .

🌍 Мир внутри нейросети: архитектура JEPA 29:50

Айзек представил доклад о Layered World Models, ссылаясь на работы группы Яна Лекуна. Он назвал создание моделей мира «вопросом на миллиард долларов», напомнив о недавних крупных инвестициях в компании, занимающиеся именно этим направлением .

Основные тезисы обсуждения:

Одним из самых интересных свойств таких моделей Айзек назвал «квантификацию сюрприза». Модель мира позволяет агенту точно определять момент, когда реальность перестает соответствовать его ожиданиям (например, если объект внезапно телепортировался или изменил цвет). Это дает встроенную метрику неуверенности (uncertainty estimation), которой лишены обычные архитектуры .

🧠 Глубокое обучение больше не загадка? 43:21

Эш, сооснователь стартапа Q Labs, представил разбор статьи Эндрю Гордона Уилсона, которая утверждает: глубокое обучение не так таинственно, как принято считать.

Темы, которые долгое время считались парадоксами, находят объяснение в классической теории :

  1. Оверпараметризация. Почему огромные модели с миллиардами параметров не переобучаются? Согласно теории PAC-Bayes, с ростом числа параметров объем «плоских минимумов» в пространстве весов растет экспоненциально . Плоские минимумы легче сжимаются, что ведет к лучшей обобщающей способности .
  2. Мягкие индуктивные предубеждения (Soft Inductive Biases). Нейросети способны запоминать случайный шум, но при работе со структурированными данными они естественным образом отдают предпочтение более простым, «сжимаемым» решениям .

Эш считает, что понимание этих механизмов позволит инженерам не просто полагаться на масштабирование (scaling), но и осознанно оптимизировать модели для достижения эффективности обучения, сравнимой с человеческой .

📉 Преодоление «стены данных» через бесконечные вычисления 51:24

Завершающий доклад Куана был посвящен проблеме нехватки данных. Если интернет-данные растут на 3% в год, а вычислительные мощности для обучения ИИ — в 4–5 раз, то скоро мы окажемся в ситуации, когда данных будет катастрофически мало по сравнению с доступным железом .

Куан предложил рецепты для мира, где «вычисления бесконечны, а данные ограничены» :

В завершение встречи Аман подчеркнул, что YC Paper Club станет регулярным форматом, призванным объединить теоретические прорывы с практическими задачами стартапов .

💬 Цитаты

«Инференс сегодня воспринимается как рычаг стоимости или удобства. Но через год-два он станет восприниматься как способность (capability).»

«Скорость инференса — это именно тот пик интеллекта, который вы можете предоставить.»

«В 2016 году Грег Брокман и Сэм Альтман сидели здесь и спрашивали нас: «Над какими проблемами вы работаете?», потому что они еще даже не знали, что именно исследовать в OpenAI.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Инференс
Процесс использования обученной нейросети для получения предсказаний или генерации контента.
Speculative Decoding
Метод ускорения работы ИИ, при котором маленькая модель делает быстрые предположения, а большая их проверяет.
World Model (Модель мира)
Внутреннее представление нейросети о том, как устроена реальность и как действия меняют состояние среды.
PAC-Bayes
Теоретическая база для понимания того, как нейросети обобщают знания и почему они не переобучаются.
📊 Цифры
🗓 Хронология
  1. 2016 Батч Winter 16 в Y Combinator; начало работы OpenAI в офисе Pioneer.
  2. Март (без года) Ян Лекун и команда привлекли $1,03 млрд на обучение моделей мира.
  3. 2024 Появление моделей с упором на рассуждения (OpenAI o1, DeepSeek R1).
⚖️ Другая сторона
Стартапы и бизнес Y Combinator OpenAI Llama 3 Speculative Decoding World Models