В новом выпуске подкаста The Cognitive Revolution ведущие Натан Лабенс и Эрик Торнберг обсуждают последние тектонические сдвиги в индустрии искусственного интеллекта. Основное внимание уделено запуску возможности тонкой настройки (fine-tuning) модели GPT-3.5 Turbo от OpenAI, которая радикально меняет правила игры для разработчиков, а также потенциалу ИИ в таких критически важных сферах, как программирование, образование и доказательная медицина.
🚀 Революция цен и возможностей: GPT-3.5 Turbo Fine-tuning 1:06
Главной новостью недели стал выпуск OpenAI возможности дообучения (тонкой настройки) модели GPT-3.5 Turbo. По мнению Натана Лабенса, это событие устраняет самую большую слабость в продуктовой линейке компании, существовавшую последний год . Ранее для розничных клиентов была доступна настройка только оригинальных моделей поколения GPT-3 (например, DaVinci), которые не понимали инструкции так же хорошо, как современные чат-боты .
Лабенс подчеркивает колоссальный масштаб изменений:
- Снижение стоимости: Новое предложение на 90% дешевле предыдущих вариантов тонкой настройки .
- Эффективность: Обученная GPT-3.5 Turbo во многих сценариях может превосходить базовую GPT-4 по качеству выполнения узкоспециализированных задач .
- Сравнение с конкурентами: Хотя модель Llama 2 от Meta оказала влияние на рынок, Лабенс считает, что GPT-3.5 Turbo все еще превосходит её по чистоте ответов и отсутствию ложных отказов (false positives), когда ИИ ошибочно считает безобидный запрос вредным .
Для компаний, таких как Waymark (где Натан является сооснователем), стоимость генерации видео раньше составляла около 10 центов за эпизод при использовании старой DaVinci . С новой моделью цена падает примерно до 1 цента, что делает технологию доступной для гораздо более широкого круга задач .
🛡️ Безопасность и «рвы» OpenAI против открытого кода 11:19
Дискуссия затронула вопрос конкуренции с открытыми моделями (Open Source). Лабенс признается, что планировал эксперименты с Llama 2, но после релиза OpenAI вычеркнул этот пункт из списка дел . Главными аргументами в пользу проприетарных моделей остаются:
- Простота масштабирования: OpenAI берет на себя всю сложность инфраструктуры и автоскейлинга, в то время как альтернативные решения (MosaicML, Hugging Face) часто требуют ручного управления мощностями .
- Экосистема: Скорое появление функций вызова инструментов (function calling) в GPT-3.5 Turbo еще сильнее увеличит разрыв с конкурентами .
Что касается безопасности, OpenAI внедрила систему модерации на базе GPT-4 для проверки данных, на которых пользователи обучают свои модели . По словам Лабенса, компания стремится предотвратить создание вредоносного ПО или инструментов для фишинга, хотя он сомневается, что эти фильтры невозможно обойти при должной «изобретательности» злоумышленников . Тот факт, что сначала открыли доступ к 3.5 Turbo, а не к GPT-4, спикеры объясняют именно соображениями безопасности: нужно увидеть, как сработают фильтры на менее мощной модели .
📉 Статистика и «красные селедки» индустрии 24:55
Ведущие прокомментировали новости о падении трафика ChatGPT. Лабенс считает это «красной селедкой» (отвлекающим маневром) и утверждает, что реальное потребление ИИ только растет . Падение посещаемости сайта объясняется сегментацией рынка: пользователи уходят в специализированные инструменты вроде Perplexity или Claude, а разработчики переходят на API .
В качестве доказательства приводится мнение Дарио Амодея (CEO Anthropic), который в редком интервью заявил об экспоненциальном росте использования их моделей, несмотря на минимальные усилия по коммерциализации . Лабенс приводит личный пример: использование GPT-4 для обучения и разбора сложнейших научных работ по безопасности ИИ экономит ему сотни долларов в час, которые пришлось бы платить консультантам из научной среды .
💻 Будущее программирования: от 10x до 10 000x разработчиков 31:16
В сфере кодинга ИИ становится полноценным напарником. Собеседники приводят в пример Андрея Карпатого, который, будучи блестящим экспертом, использовал GPT-4 для написания низкоуровневого кода на языке C . Это позволило ему сосредоточиться на архитектуре, переложив рутинную и подверженную ошибкам работу на нейросеть .
Ключевые идеи раздела:
- ИИ для менеджеров: Продукт-менеджеры теперь выигрывают хакатоны, так как ИИ отлично справляется с превращением четких спецификаций в работающий код .
- Кодинг по аналогии: Эффективный метод — предоставить ИИ пример рабочего кода и попросить адаптировать его под новую задачу .
- CPU против GPU: Карпатый доказал, что даже на обычных процессорах (CPU) можно запускать модели среднего размера (7B параметров) с приемлемой скоростью, что открывает доступ к ИИ на любом ноутбуке .
🏥 Медицина и образование: персональный тьютор и врач в кармане 38:08
В образовании Лабенс выделяет «сократический подход» Khan Academy, где ИИ не дает ответы, а ведет ученика к ним . Это решает фундаментальную проблему масштабируемости: теперь соотношение учителя и ученика составляет 1:1 для каждого ребенка на планете .
В медицине наиболее впечатляющие результаты показывает модель Med-PaLM M от Google:
- Мультимодальность: ИИ уже понимает медицинские изображения (рентген, МРТ) и может давать «второе мнение» .
- Результативность: В 40% случаев отчеты Med-PaLM по радиологии признавались предпочтительными по сравнению с отчетами врачей-людей .
- Экономика: ИИ-врач доступен 24/7 и обходится в «гроши» по сравнению с традиционной медициной .
Завершая беседу, участники сравнивают внедрение ИИ в медицине с беспилотными автомобилями. Лабенс полагает, что для полной адаптации технологии в диагностике может потребоваться стандарт «в 10 раз безопаснее человека» . Однако, в отличие от вождения, медицинский ИИ сейчас выступает в роли советника, а не исполнителя, что снижает риски и позволяет внедрять его быстрее .