OpenAI против Llama 2: как тонкая настройка моделей меняет рынок разработки и медицины

The Cognitive Revolution 732 52 мин 4 мин 25.08.2023
Главное

В новом выпуске подкаста The Cognitive Revolution ведущие Натан Лабенс и Эрик Торнберг обсуждают последние тектонические сдвиги в индустрии искусственного интеллекта. Основное внимание уделено запуску возможности тонкой настройки (fine-tuning) модели GPT-3.5 Turbo от OpenAI, которая радикально меняет правила игры для разработчиков, а также потенциалу ИИ в таких критически важных сферах, как программирование, образование и доказательная медицина.

🚀 Революция цен и возможностей: GPT-3.5 Turbo Fine-tuning 1:06

Главной новостью недели стал выпуск OpenAI возможности дообучения (тонкой настройки) модели GPT-3.5 Turbo. По мнению Натана Лабенса, это событие устраняет самую большую слабость в продуктовой линейке компании, существовавшую последний год . Ранее для розничных клиентов была доступна настройка только оригинальных моделей поколения GPT-3 (например, DaVinci), которые не понимали инструкции так же хорошо, как современные чат-боты .

Лабенс подчеркивает колоссальный масштаб изменений:

Для компаний, таких как Waymark (где Натан является сооснователем), стоимость генерации видео раньше составляла около 10 центов за эпизод при использовании старой DaVinci . С новой моделью цена падает примерно до 1 цента, что делает технологию доступной для гораздо более широкого круга задач .

🛡️ Безопасность и «рвы» OpenAI против открытого кода 11:19

Дискуссия затронула вопрос конкуренции с открытыми моделями (Open Source). Лабенс признается, что планировал эксперименты с Llama 2, но после релиза OpenAI вычеркнул этот пункт из списка дел . Главными аргументами в пользу проприетарных моделей остаются:

  1. Простота масштабирования: OpenAI берет на себя всю сложность инфраструктуры и автоскейлинга, в то время как альтернативные решения (MosaicML, Hugging Face) часто требуют ручного управления мощностями .
  2. Экосистема: Скорое появление функций вызова инструментов (function calling) в GPT-3.5 Turbo еще сильнее увеличит разрыв с конкурентами .

Что касается безопасности, OpenAI внедрила систему модерации на базе GPT-4 для проверки данных, на которых пользователи обучают свои модели . По словам Лабенса, компания стремится предотвратить создание вредоносного ПО или инструментов для фишинга, хотя он сомневается, что эти фильтры невозможно обойти при должной «изобретательности» злоумышленников . Тот факт, что сначала открыли доступ к 3.5 Turbo, а не к GPT-4, спикеры объясняют именно соображениями безопасности: нужно увидеть, как сработают фильтры на менее мощной модели .

📉 Статистика и «красные селедки» индустрии 24:55

Ведущие прокомментировали новости о падении трафика ChatGPT. Лабенс считает это «красной селедкой» (отвлекающим маневром) и утверждает, что реальное потребление ИИ только растет . Падение посещаемости сайта объясняется сегментацией рынка: пользователи уходят в специализированные инструменты вроде Perplexity или Claude, а разработчики переходят на API .

В качестве доказательства приводится мнение Дарио Амодея (CEO Anthropic), который в редком интервью заявил об экспоненциальном росте использования их моделей, несмотря на минимальные усилия по коммерциализации . Лабенс приводит личный пример: использование GPT-4 для обучения и разбора сложнейших научных работ по безопасности ИИ экономит ему сотни долларов в час, которые пришлось бы платить консультантам из научной среды .

💻 Будущее программирования: от 10x до 10 000x разработчиков 31:16

В сфере кодинга ИИ становится полноценным напарником. Собеседники приводят в пример Андрея Карпатого, который, будучи блестящим экспертом, использовал GPT-4 для написания низкоуровневого кода на языке C . Это позволило ему сосредоточиться на архитектуре, переложив рутинную и подверженную ошибкам работу на нейросеть .

Ключевые идеи раздела:

🏥 Медицина и образование: персональный тьютор и врач в кармане 38:08

В образовании Лабенс выделяет «сократический подход» Khan Academy, где ИИ не дает ответы, а ведет ученика к ним . Это решает фундаментальную проблему масштабируемости: теперь соотношение учителя и ученика составляет 1:1 для каждого ребенка на планете .

В медицине наиболее впечатляющие результаты показывает модель Med-PaLM M от Google:

Завершая беседу, участники сравнивают внедрение ИИ в медицине с беспилотными автомобилями. Лабенс полагает, что для полной адаптации технологии в диагностике может потребоваться стандарт «в 10 раз безопаснее человека» . Однако, в отличие от вождения, медицинский ИИ сейчас выступает в роли советника, а не исполнителя, что снижает риски и позволяет внедрять его быстрее .

💬 Цитаты

«То, что я получаю за 2-5 центов, легко стоило бы 200 с лишним долларов, если бы я нанял аспиранта или доктора наук для объяснения концепций.»

Натан Лабенс 00:27

«Думаю, многие люди вчера просто вычеркнули пункт «изучить тонкую настройку Llama 2» из своего списка дел.»

Натан Лабенс 13:55

«Отчеты Med-PaLM M по радиологии предпочитают человеческим в 40% случаев. Это всё ещё проигрыш, но разрыв минимален.»

Натан Лабенс 47:47
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Fine-tuning
Процесс дообучения предварительно обученной нейросети на специфическом наборе данных для улучшения её работы в конкретных задачах.
Inference
Процесс работы уже обученной модели (её «рассуждение» или генерация ответа) в реальном времени.
MMLU
Масштабный тест для измерения понимания языка моделями на уровне бакалавриата и магистратуры.
Multimodal
Способность модели ИИ обрабатывать разные типы данных одновременно, например, текст и изображения.
📊 Цифры
🗓 Хронология
  1. Август 2023 OpenAI выпускает возможность fine-tuning для модели GPT-3.5 Turbo.
  2. Март 2023 Релиз GPT-4, которая была готова за несколько месяцев до официального выхода.
  3. Осень 2023 Ожидаемый выпуск возможности тонкой настройки для GPT-4.
⚖️ Другая сторона
Искусственный интеллект OpenAI GPT-4 Llama 2 тонкая настройка Med-PaLM