OpenAI против Llama 2: как тонкая настройка моделей меняет рынок разработки и медицины

В новом выпуске подкаста The Cognitive Revolution ведущие Натан Лабенс и Эрик Торнберг обсуждают последние тектонические сдвиги в индустрии искусственного интеллекта. Основное внимание уделено запуску возможности тонкой настройки (fine-tuning) модели GPT-3.5 Turbo от OpenAI, которая радикально меняет правила игры для разработчиков, а также потенциалу ИИ в таких критически важных сферах, как программирование, образование и доказательная медицина.

🚀 Революция цен и возможностей: GPT-3.5 Turbo Fine-tuning 1:06

Главной новостью недели стал выпуск OpenAI возможности дообучения (тонкой настройки) модели GPT-3.5 Turbo. По мнению Натана Лабенса, это событие устраняет самую большую слабость в продуктовой линейке компании, существовавшую последний год . Ранее для розничных клиентов была доступна настройка только оригинальных моделей поколения GPT-3 (например, DaVinci), которые не понимали инструкции так же хорошо, как современные чат-боты .

Лабенс подчеркивает колоссальный масштаб изменений:

Снижение стоимости: Новое предложение на 90% дешевле предыдущих вариантов тонкой настройки .
Эффективность: Обученная GPT-3.5 Turbo во многих сценариях может превосходить базовую GPT-4 по качеству выполнения узкоспециализированных задач .
Сравнение с конкурентами: Хотя модель Llama 2 от Meta оказала влияние на рынок, Лабенс считает, что GPT-3.5 Turbo все еще превосходит её по чистоте ответов и отсутствию ложных отказов (false positives), когда ИИ ошибочно считает безобидный запрос вредным .

Для компаний, таких как Waymark (где Натан является сооснователем), стоимость генерации видео раньше составляла около 10 центов за эпизод при использовании старой DaVinci . С новой моделью цена падает примерно до 1 цента, что делает технологию доступной для гораздо более широкого круга задач .

🛡️ Безопасность и «рвы» OpenAI против открытого кода 11:19

Дискуссия затронула вопрос конкуренции с открытыми моделями (Open Source). Лабенс признается, что планировал эксперименты с Llama 2, но после релиза OpenAI вычеркнул этот пункт из списка дел . Главными аргументами в пользу проприетарных моделей остаются:

Простота масштабирования: OpenAI берет на себя всю сложность инфраструктуры и автоскейлинга, в то время как альтернативные решения (MosaicML, Hugging Face) часто требуют ручного управления мощностями .
Экосистема: Скорое появление функций вызова инструментов (function calling) в GPT-3.5 Turbo еще сильнее увеличит разрыв с конкурентами .

Что касается безопасности, OpenAI внедрила систему модерации на базе GPT-4 для проверки данных, на которых пользователи обучают свои модели . По словам Лабенса, компания стремится предотвратить создание вредоносного ПО или инструментов для фишинга, хотя он сомневается, что эти фильтры невозможно обойти при должной «изобретательности» злоумышленников . Тот факт, что сначала открыли доступ к 3.5 Turbo, а не к GPT-4, спикеры объясняют именно соображениями безопасности: нужно увидеть, как сработают фильтры на менее мощной модели .

📉 Статистика и «красные селедки» индустрии 24:55

Ведущие прокомментировали новости о падении трафика ChatGPT. Лабенс считает это «красной селедкой» (отвлекающим маневром) и утверждает, что реальное потребление ИИ только растет . Падение посещаемости сайта объясняется сегментацией рынка: пользователи уходят в специализированные инструменты вроде Perplexity или Claude, а разработчики переходят на API .

В качестве доказательства приводится мнение Дарио Амодея (CEO Anthropic), который в редком интервью заявил об экспоненциальном росте использования их моделей, несмотря на минимальные усилия по коммерциализации . Лабенс приводит личный пример: использование GPT-4 для обучения и разбора сложнейших научных работ по безопасности ИИ экономит ему сотни долларов в час, которые пришлось бы платить консультантам из научной среды .

💻 Будущее программирования: от 10x до 10 000x разработчиков 31:16

В сфере кодинга ИИ становится полноценным напарником. Собеседники приводят в пример Андрея Карпатого, который, будучи блестящим экспертом, использовал GPT-4 для написания низкоуровневого кода на языке C . Это позволило ему сосредоточиться на архитектуре, переложив рутинную и подверженную ошибкам работу на нейросеть .

Ключевые идеи раздела:

ИИ для менеджеров: Продукт-менеджеры теперь выигрывают хакатоны, так как ИИ отлично справляется с превращением четких спецификаций в работающий код .
Кодинг по аналогии: Эффективный метод — предоставить ИИ пример рабочего кода и попросить адаптировать его под новую задачу .
CPU против GPU: Карпатый доказал, что даже на обычных процессорах (CPU) можно запускать модели среднего размера (7B параметров) с приемлемой скоростью, что открывает доступ к ИИ на любом ноутбуке .

🏥 Медицина и образование: персональный тьютор и врач в кармане 38:08

В образовании Лабенс выделяет «сократический подход» Khan Academy, где ИИ не дает ответы, а ведет ученика к ним . Это решает фундаментальную проблему масштабируемости: теперь соотношение учителя и ученика составляет 1:1 для каждого ребенка на планете .

В медицине наиболее впечатляющие результаты показывает модель Med-PaLM M от Google:

Мультимодальность: ИИ уже понимает медицинские изображения (рентген, МРТ) и может давать «второе мнение» .
Результативность: В 40% случаев отчеты Med-PaLM по радиологии признавались предпочтительными по сравнению с отчетами врачей-людей .
Экономика: ИИ-врач доступен 24/7 и обходится в «гроши» по сравнению с традиционной медициной .

Завершая беседу, участники сравнивают внедрение ИИ в медицине с беспилотными автомобилями. Лабенс полагает, что для полной адаптации технологии в диагностике может потребоваться стандарт «в 10 раз безопаснее человека» . Однако, в отличие от вождения, медицинский ИИ сейчас выступает в роли советника, а не исполнителя, что снижает риски и позволяет внедрять его быстрее .