Алекс Кер из Base 10: «Открытые модели — секретный двигатель ИИ-кодинга»

DeepLearning.AI 1,4 тыс. 24 мин 4 мин 02.12.2025
Главное

В современном мире разработки искусственный интеллект стал неотъемлемым инструментом, однако зависимость от закрытых проприетарных моделей (таких как GPT-4 или Claude) создает барьеры в виде высокой стоимости и задержек. Алекс Кер, инженер по росту в компании Base 10, утверждает, что открытые (open-source) модели не просто догнали лидеров рынка, но и стали «секретным двигателем» для ИИ-кодинга в промышленных масштабах благодаря гибкости и скорости.

🔓 Почему открытый код побеждает закрытые системы 2:47

Несмотря на популярность решений от OpenAI и Anthropic, разработчики все чаще сталкиваются с ограничениями закрытых моделей при масштабировании продуктов. По словам Алекса Кера, разработчики продолжают использовать GPT-4 или Claude 3.5 Sonnet просто потому, что те «очень умные» , однако качественный разрыв между ними и открытыми решениями стремительно сокращается.

Кер выделяет три критических фактора, где open-source модели получают преимущество в промышленной эксплуатации (production):

🏆 Топ-3 модели для программирования в 2025 году 5:19

Алекс Кер выделил трех фаворитов, которые, по его мнению, являются лучшими на текущий момент. Интересно, что все три модели имеют китайское происхождение, что вызвало вопросы в зале о лидерстве Китая в ИИ-гонке .

  1. GLM 4.6: Универсальная модель с выдающейся эффективностью. По данным Base 10, она на 30% эффективнее предыдущих итераций в потреблении токенов, что делает ее дешевле и быстрее при инференсе .
  2. Qwen 2.5 Coder: Специализированная модель от Alibaba. Хотя интерес к чисто «кодинговым» моделям падает из-за универсальности агентских систем, Qwen остается отличным выбором для прототипирования и выполнения базовых, повторяющихся задач программирования .
  3. Kimi K2 Thinking: Главный фаворит спикера, вышедший в начале 2025 года. Это модель с 1 триллионом параметров, использующая архитектуру Mixture of Experts (MoE) . По утверждению Кера, она способна выполнять до 200–300 последовательных вызовов инструментов (tool calls), сохраняя фокус и минимизируя галлюцинации .

🧠 Технологический прорыв Kimi K2: «Чередующееся мышление» 7:42

Ключевое отличие Kimi K2 от традиционных моделей вроде GPT или Claude заключается в методе рассуждений. Вместо стандартной «цепочки мыслей» (Chain of Thought), где модель сначала думает, а потом выдает серию действий, Kimi использует Interleaved Thinking (чередующееся мышление) .

Этот метод имитирует человеческий подход: модель совершает действие, анализирует результат, корректирует подход в реальном времени и переходит к следующему шагу . В качестве примера Кер привел решение задачи по геометрии уровня PhD, где модели потребовалось 23 цикла чередующихся размышлений и вызовов инструментов .

Для обучения Kimi K2 использовался пятиэтапный конвейер:

🛠 Как внедрить Open Source в рабочий процесс за 10 минут 9:40

Алекс Кер предложил три способа перехода на открытые модели: от простых «хаков» до полноценных сред разработки.

⚡ Оптимизация инференса: Кейс Sourcegraph 14:10

Особое внимание Кер уделил техническим аспектам работы автодополнения кода (autocomplete). Для пользователя важна задержка не более 200–300 мс, иначе опыт перестает быть бесшовным .

На примере компании Sourcegraph были показаны три техники оптимизации:

  1. KV Cache Reuse: Повторное использование кеша ключей и значений, чтобы не обрабатывать одну и ту же кодовую базу при каждом нажатии клавиши .
  2. KV-Aware Routing: Направление запросов пользователя на те же серверные реплики, где уже построен кеш для его текущей сессии .
  3. n-gram Speculation: Использование словаря n-грамм для предсказания следующих токенов в языках программирования с жестким синтаксисом. Это позволяет модели-черновику предлагать варианты, которые основная модель лишь подтверждает, что значительно ускоряет генерацию .

В завершение выступления Алекс Кер подчеркнул, что разработчики, ограничивающие себя только закрытыми моделями, упускают огромные возможности рынка. Будущее ИИ-разработки — в экспериментах с открытыми стеками, которые дают контроль над производительностью и стоимостью .

💬 Цитаты

«С открытым исходным кодом у вас есть возможность управлять всеми рычагами и действительно заставлять вещи работать быстро.»

Алекс Кер 04:07

«Если вы разработчик, использующий только Claude или Codec, вы определенно упускаете возможности рынка.»

Алекс Кер 18:11

«Kimi K2 — первая в мире модель с триллионом параметров, способная выполнять до 300 вызовов инструментов подряд.»

Алекс Кер 06:47
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
TTFT (Time to First Token)
Время, проходящее с момента отправки запроса до получения самого первого символа ответа.
KV Cache
Механизм кеширования промежуточных состояний нейросети для ускорения обработки длинных контекстов.
Mixture of Experts (MoE)
Архитектура нейросети, где для выполнения конкретной задачи активируется только часть наиболее подходящих параметров (экспертов).
Инференс
Процесс использования обученной модели для получения предсказаний или генерации текста.
📊 Цифры
🗓 Хронология
  1. 2024 Выход специализированной кодинговой модели Qwen 2.5 Coder от Alibaba.
  2. Начало 2025 Релиз модели Kimi K2 с архитектурой MoE и 1 триллионом параметров.
⚖️ Другая сторона
Искусственный интеллект Alex Ker Base 10 Kimi K2 Qwen 2.5 Coder GLM 4.6