# OpenAI против Llama 2: как тонкая настройка моделей меняет рынок разработки и медицины

Источник: https://www.youtube.com/watch?v=O3capVKgFsw
Канал: The Cognitive Revolution
Опубликовано: 25.08.2023

---

В новом выпуске подкаста *The Cognitive Revolution* ведущие Натан Лабенс и Эрик Торнберг обсуждают последние тектонические сдвиги в индустрии искусственного интеллекта. Основное внимание уделено запуску возможности тонкой настройки (fine-tuning) модели GPT-3.5 Turbo от OpenAI, которая радикально меняет правила игры для разработчиков, а также потенциалу ИИ в таких критически важных сферах, как программирование, образование и доказательная медицина.

## 🚀 Революция цен и возможностей: GPT-3.5 Turbo Fine-tuning
[[JUMP:01:06]]

Главной новостью недели стал выпуск OpenAI возможности дообучения (тонкой настройки) модели GPT-3.5 Turbo. По мнению Натана Лабенса, это событие устраняет самую большую слабость в продуктовой линейке компании, существовавшую последний год [01:45]. Ранее для розничных клиентов была доступна настройка только оригинальных моделей поколения GPT-3 (например, DaVinci), которые не понимали инструкции так же хорошо, как современные чат-боты [02:27].

Лабенс подчеркивает колоссальный масштаб изменений:

*   **Снижение стоимости:** Новое предложение на 90% дешевле предыдущих вариантов тонкой настройки [01:00].
*   **Эффективность:** Обученная GPT-3.5 Turbo во многих сценариях может превосходить базовую GPT-4 по качеству выполнения узкоспециализированных задач [05:48].
*   **Сравнение с конкурентами:** Хотя модель Llama 2 от Meta оказала влияние на рынок, Лабенс считает, что GPT-3.5 Turbo все еще превосходит её по чистоте ответов и отсутствию ложных отказов (false positives), когда ИИ ошибочно считает безобидный запрос вредным [06:41].

Для компаний, таких как Waymark (где Натан является сооснователем), стоимость генерации видео раньше составляла около 10 центов за эпизод при использовании старой DaVinci [04:02]. С новой моделью цена падает примерно до 1 цента, что делает технологию доступной для гораздо более широкого круга задач [05:08].

## 🛡️ Безопасность и «рвы» OpenAI против открытого кода
[[JUMP:11:19]]

Дискуссия затронула вопрос конкуренции с открытыми моделями (Open Source). Лабенс признается, что планировал эксперименты с Llama 2, но после релиза OpenAI вычеркнул этот пункт из списка дел [13:55]. Главными аргументами в пользу проприетарных моделей остаются:

1.  **Простота масштабирования:** OpenAI берет на себя всю сложность инфраструктуры и автоскейлинга, в то время как альтернативные решения (MosaicML, Hugging Face) часто требуют ручного управления мощностями [08:53].
2.  **Экосистема:** Скорое появление функций вызова инструментов (function calling) в GPT-3.5 Turbo еще сильнее увеличит разрыв с конкурентами [13:14].

Что касается безопасности, OpenAI внедрила систему модерации на базе GPT-4 для проверки данных, на которых пользователи обучают свои модели [15:38]. По словам Лабенса, компания стремится предотвратить создание вредоносного ПО или инструментов для фишинга, хотя он сомневается, что эти фильтры невозможно обойти при должной «изобретательности» злоумышленников [16:04]. Тот факт, что сначала открыли доступ к 3.5 Turbo, а не к GPT-4, спикеры объясняют именно соображениями безопасности: нужно увидеть, как сработают фильтры на менее мощной модели [21:49].

## 📉 Статистика и «красные селедки» индустрии
[[JUMP:24:55]]

Ведущие прокомментировали новости о падении трафика ChatGPT. Лабенс считает это «красной селедкой» (отвлекающим маневром) и утверждает, что реальное потребление ИИ только растет [27:05]. Падение посещаемости сайта объясняется сегментацией рынка: пользователи уходят в специализированные инструменты вроде Perplexity или Claude, а разработчики переходят на API [26:13].

В качестве доказательства приводится мнение Дарио Амодея (CEO Anthropic), который в редком интервью заявил об экспоненциальном росте использования их моделей, несмотря на минимальные усилия по коммерциализации [28:13]. Лабенс приводит личный пример: использование GPT-4 для обучения и разбора сложнейших научных работ по безопасности ИИ экономит ему сотни долларов в час, которые пришлось бы платить консультантам из научной среды [30:50].

## 💻 Будущее программирования: от 10x до 10 000x разработчиков
[[JUMP:31:16]]

В сфере кодинга ИИ становится полноценным напарником. Собеседники приводят в пример Андрея Карпатого, который, будучи блестящим экспертом, использовал GPT-4 для написания низкоуровневого кода на языке C [36:21]. Это позволило ему сосредоточиться на архитектуре, переложив рутинную и подверженную ошибкам работу на нейросеть [36:48].

Ключевые идеи раздела:

*   **ИИ для менеджеров:** Продукт-менеджеры теперь выигрывают хакатоны, так как ИИ отлично справляется с превращением четких спецификаций в работающий код [32:07].
*   **Кодинг по аналогии:** Эффективный метод — предоставить ИИ пример рабочего кода и попросить адаптировать его под новую задачу [32:38].
*   **CPU против GPU:** Карпатый доказал, что даже на обычных процессорах (CPU) можно запускать модели среднего размера (7B параметров) с приемлемой скоростью, что открывает доступ к ИИ на любом ноутбуке [37:28].

## 🏥 Медицина и образование: персональный тьютор и врач в кармане
[[JUMP:38:08]]

В образовании Лабенс выделяет «сократический подход» Khan Academy, где ИИ не дает ответы, а ведет ученика к ним [39:12]. Это решает фундаментальную проблему масштабируемости: теперь соотношение учителя и ученика составляет 1:1 для каждого ребенка на планете [39:39].

В медицине наиболее впечатляющие результаты показывает модель Med-PaLM M от Google:

*   **Мультимодальность:** ИИ уже понимает медицинские изображения (рентген, МРТ) и может давать «второе мнение» [43:12].
*   **Результативность:** В 40% случаев отчеты Med-PaLM по радиологии признавались предпочтительными по сравнению с отчетами врачей-людей [47:47].
*   **Экономика:** ИИ-врач доступен 24/7 и обходится в «гроши» по сравнению с традиционной медициной [48:25].

Завершая беседу, участники сравнивают внедрение ИИ в медицине с беспилотными автомобилями. Лабенс полагает, что для полной адаптации технологии в диагностике может потребоваться стандарт «в 10 раз безопаснее человека» [49:07]. Однако, в отличие от вождения, медицинский ИИ сейчас выступает в роли советника, а не исполнителя, что снижает риски и позволяет внедрять его быстрее [49:34].