Гарри Тан: «OpenAI o1 захватит световой конус всей будущей ценности?»

Недавний раунд финансирования OpenAI на сумму $6,6 млрд ознаменовал переход ИИ-индустрии к новой фазе «законов масштабирования». Партнеры акселератора Y Combinator Гарри Тан (Garry Tan), Диана, Харш и Джаред обсуждают, как модели с 10 триллионами параметров и уровнем интеллекта, превышающим человеческий, изменят работу программистов и будущее стартапов.

🚀 Гонка масштабов: от миллиардов к 10 триллионам параметров 0:52

OpenAI привлекла крупнейший в истории венчурный раунд — $6,6 млрд. По словам финансового директора компании Сары Фрайар, эти средства пойдут в первую очередь на вычислительные мощности, поскольку индустрия находится на этапе, где «порядки величин имеют значение». Каждая следующая модель будет на порядок больше предыдущей.

В Y Combinator предлагают заглянуть в будущее, где существуют модели с 10 триллионами параметров. Для контекста:

Текущие передовые модели (Llama 3, GPT-4o, Claude 3.5 Sonnet) имеют объем около 400–500 миллиардов параметров.
Переход к 10 триллионам параметров — это скачок на два порядка величины.
Аналогичный рывок произошел при переходе от GPT-2 (около 1 млрд параметров) к GPT-3 (175 млрд параметров), что создало современную эпоху ИИ-стартапов.

Харш отмечает, что если законы масштабирования продолжат работать, нас ждет трансформация, сопоставимая по масштабу с периодом 2022–2023 годов, когда мир впервые увидел возможности ChatGPT.

🧠 Интеллект уровня 300 IQ и модель OpenAI o1 3:36

С появлением OpenAI o1 (известной как Strawberry) и внедрением механизмов «цепочки мыслей» (Chain of Thought), ИИ начал соперничать с человеческим интеллектом в сложных задачах. Гарри Тан утверждает, что AGI (общий искусственный интеллект) фактически уже здесь: 98% задач, которые выполняют «белые воротнички», теперь могут быть автоматизированы с точностью 90–98%.

Ключевые тезисы участников дискуссии об уровне интеллекта:

Превосходство над человеком: Если текущие модели соответствуют IQ 120, то модели с 10 триллионами параметров могут достичь IQ 200–300, что выходит за рамки возможностей обычного человека.
Пример Теренса Тао: Знаменитый математик с IQ выше 200 уже использует ChatGPT для расширения своих возможностей, что Гарри Тан называет «разблокировкой новых горизонтов».
ASI (Суперинтеллект): По мнению участников, мы движемся к моменту, когда ИИ сможет моделировать реальность на уровне, недоступном людям, подобно тому как теоретическое предсказание ядерного распада предшествовало экспериментам.

📈 Уроки истории: преобразование Фурье и инерция внедрения 5:42

Диана приводит историческую аналогию с преобразованием Фурье, чтобы объяснить, почему мощь ИИ пока не ощущается «каждым встречным» на улице. Жозеф Фурье разработал свою теорию в начале XIX века, но потребовалось 150 лет (до 1950-х годов), чтобы она нашла применение в цифровой связи, телевидении и сжатии данных.

Параллели с современным ИИ:

Фундаментальная математика: Линейная алгебра, лежащая в основе ИИ, существует более 100 лет.
Инфлексия: По мнению Гарри Тана, мы можем находиться в процессе, который длится десятилетиями, но именно сейчас он достиг точки перегиба.
Скорость внедрения: В отличие от аппаратных технологий прошлого (телефоны, грампластинки), ИИ распространяется через софт. Такие гиганты, как Meta, уже внедряют ИИ-функции (например, в очки Ray-Ban) напрямую миллиардам пользователей.

📊 Статистика Y Combinator: OpenAI теряет монополию среди девелоперов 12:08

Джаред представил внутренние данные батча S24 (лето 2024), которые показывают резкую диверсификацию используемых моделей. Еще год назад OpenAI имела практически 100% долю рынка среди стартапов («обертки над ChatGPT»), но ситуация изменилась:

Claude (Anthropic): Доля рынка среди компаний батча выросла с 5% (зимой) до 25% всего за полгода.
Llama (Meta): Рост с 0% до 8%.
OpenAI o1: Несмотря на то что модели всего пара недель, её уже используют 15% компаний батча.

Гарри Тан считает использование инструментов в YC отличным предиктором успеха будущих продуктов во всем мире. Он отмечает, что до выхода o1 казалось, будто OpenAI стремительно теряет позиции среди разработчиков.

🛠 Эффект o1: от «промпт-инжиниринга» к классическому софту 15:48

Появление более детерминированных моделей, таких как o1, меняет фокус работы фаундеров. Если раньше огромное количество времени уходило на «укрощение» модели (настройку промптов, очистку вывода), то теперь это знание может стать нерелевантным.

Аргументы участников:

Повышение точности: Стартап DryMerge смог поднять точность работы с 80% до 99% просто заменив GPT-4o на o1.
Снижение барьера входа: Если точность 100% гарантирована «из коробки», конкуренция сместится в сторону лучшего UI/UX, продаж и выстраивания отношений с клиентами.
Дистилляция: OpenAI разрешила дистиллировать знания из мощных моделей (o1) в более дешевые и быстрые (4o-mini), что позволяет создавать экономически эффективные продукты.

В качестве примера Диана приводит хакатон для фаундеров YC, где команда стартапа Freestyle всего за несколько часов создала аналог Replit Agent для разработки веб-приложений на базе o1 и собственной документации.

🎙 Голос и вертикальные агенты как «киллер-фичи» 21:24

Гарри Тан и его коллеги видят огромный потенциал в специализированных ИИ-агентах и голосовых интерфейсах.

Vertical Agents (на примере TaxGPT): Компания начинала как простая «обертка», дающая советы по налогам на базе документов IRS. Теперь они перешли к крупным контрактам (ACV $10k–$100k), автоматизируя сотни часов работы бухгалтеров через анализ загруженных документов.
Голосовой ИИ: Стоимость Realtime Voice API от OpenAI составляет около $9 за час. Гарри Тан утверждает, что это делает ИИ опасным конкурентом для традиционных колл-центров, так как цена уже сопоставима.
Логистика: Стартап Happy Robot успешно использует голосовых агентов для координации телефонных звонков между водителями грузовиков и логистами, решая проблему «телефонного ада».

💻 Cursor против GitHub Copilot: битва IDE 29:30

Особое внимание партнеры YC уделили успеху редактора кода Cursor. По данным опроса батча S24:

50% фаундеров используют Cursor.
Только 12% продолжают использовать GitHub Copilot.

Джаред называет это невероятным прорывом: стартап из ниоткуда смог в 5 раз обойти продукт от Microsoft и GitHub на поле профессиональных инструментов. Это подтверждает тезис о том, что даже при наличии «гиганта» на рынке, побеждает тот, кто лучше прорабатывает детали пользовательского опыта.

🚀 Финальный прогноз: ИИ как ускоритель науки 32:06

В завершение дискуссии Харш выдвигает «бычий» сценарий для моделей с 10 триллионами параметров. По его мнению, главной преградой прогресса является нехватка умных людей, способных проанализировать миллионы существующих научных статей.

Суперинтеллект (ASI) сможет:

Проводить глубокий анализ и обладать оригинальным мышлением.
Находить скрытые связи в данных, недоступные человеческому пониманию.
Ускорить изобретение термоядерного синтеза, комнатных сверхпроводников и даже технологий перемещения в пространстве.

Гарри Тан резюмирует: если раньше ИИ называли «велосипедом для ума», то теперь это «беспилотный автомобиль» или даже «ракета на Марс» для человеческого интеллекта.