Гарри Тан: «OpenAI o1 захватит световой конус всей будущей ценности?»

Y Combinator 62,1 тыс. 33 мин 5 мин 01.11.2024
Главное

Недавний раунд финансирования OpenAI на сумму $6,6 млрд ознаменовал переход ИИ-индустрии к новой фазе «законов масштабирования». Партнеры акселератора Y Combinator Гарри Тан (Garry Tan), Диана, Харш и Джаред обсуждают, как модели с 10 триллионами параметров и уровнем интеллекта, превышающим человеческий, изменят работу программистов и будущее стартапов.

🚀 Гонка масштабов: от миллиардов к 10 триллионам параметров 0:52

OpenAI привлекла крупнейший в истории венчурный раунд — $6,6 млрд. По словам финансового директора компании Сары Фрайар, эти средства пойдут в первую очередь на вычислительные мощности, поскольку индустрия находится на этапе, где «порядки величин имеют значение». Каждая следующая модель будет на порядок больше предыдущей.

В Y Combinator предлагают заглянуть в будущее, где существуют модели с 10 триллионами параметров. Для контекста:

Харш отмечает, что если законы масштабирования продолжат работать, нас ждет трансформация, сопоставимая по масштабу с периодом 2022–2023 годов, когда мир впервые увидел возможности ChatGPT.

🧠 Интеллект уровня 300 IQ и модель OpenAI o1 3:36

С появлением OpenAI o1 (известной как Strawberry) и внедрением механизмов «цепочки мыслей» (Chain of Thought), ИИ начал соперничать с человеческим интеллектом в сложных задачах. Гарри Тан утверждает, что AGI (общий искусственный интеллект) фактически уже здесь: 98% задач, которые выполняют «белые воротнички», теперь могут быть автоматизированы с точностью 90–98%.

Ключевые тезисы участников дискуссии об уровне интеллекта:

📈 Уроки истории: преобразование Фурье и инерция внедрения 5:42

Диана приводит историческую аналогию с преобразованием Фурье, чтобы объяснить, почему мощь ИИ пока не ощущается «каждым встречным» на улице. Жозеф Фурье разработал свою теорию в начале XIX века, но потребовалось 150 лет (до 1950-х годов), чтобы она нашла применение в цифровой связи, телевидении и сжатии данных.

Параллели с современным ИИ:

📊 Статистика Y Combinator: OpenAI теряет монополию среди девелоперов 12:08

Джаред представил внутренние данные батча S24 (лето 2024), которые показывают резкую диверсификацию используемых моделей. Еще год назад OpenAI имела практически 100% долю рынка среди стартапов («обертки над ChatGPT»), но ситуация изменилась:

Гарри Тан считает использование инструментов в YC отличным предиктором успеха будущих продуктов во всем мире. Он отмечает, что до выхода o1 казалось, будто OpenAI стремительно теряет позиции среди разработчиков.

🛠 Эффект o1: от «промпт-инжиниринга» к классическому софту 15:48

Появление более детерминированных моделей, таких как o1, меняет фокус работы фаундеров. Если раньше огромное количество времени уходило на «укрощение» модели (настройку промптов, очистку вывода), то теперь это знание может стать нерелевантным.

Аргументы участников:

В качестве примера Диана приводит хакатон для фаундеров YC, где команда стартапа Freestyle всего за несколько часов создала аналог Replit Agent для разработки веб-приложений на базе o1 и собственной документации.

🎙 Голос и вертикальные агенты как «киллер-фичи» 21:24

Гарри Тан и его коллеги видят огромный потенциал в специализированных ИИ-агентах и голосовых интерфейсах.

  1. Vertical Agents (на примере TaxGPT): Компания начинала как простая «обертка», дающая советы по налогам на базе документов IRS. Теперь они перешли к крупным контрактам (ACV $10k–$100k), автоматизируя сотни часов работы бухгалтеров через анализ загруженных документов.
  2. Голосовой ИИ: Стоимость Realtime Voice API от OpenAI составляет около $9 за час. Гарри Тан утверждает, что это делает ИИ опасным конкурентом для традиционных колл-центров, так как цена уже сопоставима.
  3. Логистика: Стартап Happy Robot успешно использует голосовых агентов для координации телефонных звонков между водителями грузовиков и логистами, решая проблему «телефонного ада».

💻 Cursor против GitHub Copilot: битва IDE 29:30

Особое внимание партнеры YC уделили успеху редактора кода Cursor. По данным опроса батча S24:

Джаред называет это невероятным прорывом: стартап из ниоткуда смог в 5 раз обойти продукт от Microsoft и GitHub на поле профессиональных инструментов. Это подтверждает тезис о том, что даже при наличии «гиганта» на рынке, побеждает тот, кто лучше прорабатывает детали пользовательского опыта.

🚀 Финальный прогноз: ИИ как ускоритель науки 32:06

В завершение дискуссии Харш выдвигает «бычий» сценарий для моделей с 10 триллионами параметров. По его мнению, главной преградой прогресса является нехватка умных людей, способных проанализировать миллионы существующих научных статей.

Суперинтеллект (ASI) сможет:

Гарри Тан резюмирует: если раньше ИИ называли «велосипедом для ума», то теперь это «беспилотный автомобиль» или даже «ракета на Марс» для человеческого интеллекта.

💬 Цитаты

«Мы находимся на этапе законов масштабирования, где порядки величин имеют значение.»

Сара Фрайар 1:22

«Если GPT-4 — это IQ 120, то 10 триллионов параметров — это IQ 300, за пределами человеческих возможностей.»

Гарри Тан 4:31

«Cursor в пять раз популярнее GitHub Copilot внутри батча — стартап-фаундеры задают тренды.»

Гарри Тан 30:33
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Дистилляция
Процесс переноса знаний из большой и сложной нейросети в более компактную и быструю.
Inference (инференс)
Процесс работы уже обученной модели при ответе на запрос пользователя.
Chain of Thought
Метод работы ИИ, при котором модель «рассуждает» вслух перед выдачей финального ответа.
ACV
Annual Contract Value — годовая стоимость контракта с одним клиентом.
📊 Цифры
🗓 Хронология
  1. 1800-е Жозеф Фурье описывает математическое преобразование сигналов.
  2. 1950-е Появление Fast Fourier Transform и начало цифровой эры связи.
  3. 2022 Выход ChatGPT, ставший моментом инфлексии для ИИ-индустрии.
  4. 2024 Выход OpenAI o1 и массовый переход стартапов на альтернативные модели (Claude, Llama).
⚖️ Другая сторона
Искусственный интеллект OpenAI o1 Y Combinator Cursor Claude LLM