Новое десктопное приложение ChatGPT: гайд по установке и возможностям GPT-4o

Wes Roth 91,2 тыс. 18 мин 4 мин 20.05.2024
Главное

Компания OpenAI выпустила масштабное обновление экосистемы ChatGPT, включающее долгожданное десктопное приложение, глубокую интеграцию с облачными хранилищами и расширение возможностей модели GPT-4o. Техноблогер Уэс Рот (Wes Roth) подробно разобрал, как получить доступ к новым функциям, продемонстрировал работу обновленного анализа данных и провел практический урок по использованию API новой флагманской модели для тех, кто никогда не занимался программированием.

🖥️ Десктопное приложение ChatGPT: запуск на Mac и ограничения 1:29

Главным событием релиза стал запуск официального приложения ChatGPT для настольных компьютеров. Уэс Рот подчеркивает, что на данный момент приложение доступно исключительно для пользователей macOS . Версия для Windows, по словам автора, находится в разработке, и пользователям этой ОС традиционно приходится ждать дольше. Рот иронично замечает, что в мире ИТ-релизов пользователи Windows часто ощущают себя «гражданами второго сорта» .

Ключевые особенности и требования приложения:

Уэс Рот отдельно предостерегает пользователей от поиска приложения в стандартных магазинах App Store или Google Play. По его мнению, эти площадки превратились в «выгребные ямы» (cesspits) из мошеннических приложений, которые мимикрируют под OpenAI или Anthropic (Claude 3), чтобы вымогать деньги у доверчивых пользователей . Настоящее приложение следует скачивать только с официального сайта chatgpt.com .

👁️ Возможности GPT-4o: зрение и «псевдо-видео» 4:42

В десктопном приложении по умолчанию установлена модель GPT-4o (Omni), которая обладает продвинутыми мультимодальными способностями. Рот демонстрирует, как модель анализирует скриншоты: ChatGPT смог не только распознать текст на экране, но и понять, что он видит «самого себя» — открытое окно приложения ChatGPT с предыдущим контекстом диалога .

Разбирая механизм работы зрения в GPT-4o, Уэс Рот ссылается на интервью Сэма Альтмана:

📊 Продвинутый анализ данных и облачная интеграция 8:12

Функция, ранее известная как «Code Interpreter», а затем переименованная в «Advanced Data Analytics», получила значительное обновление интерфейса и функционала. Теперь ChatGPT может напрямую подключаться к корпоративным и личным облачным хранилищам.

Основные новшества в работе с данными:

🧠 Память ChatGPT: «скрытая» осведомленность 10:08

Уэс Рот обращает внимание на функцию «Memory», которая теперь включена по умолчанию. Она позволяет ChatGPT запоминать детали о пользователе в ходе разных диалогов для формирования более релевантных ответов.

Автор приводит примеры того, что ИИ успел запомнить о нем: использование Visual Studio Code на Windows и интерес к программированию на Python . Рот цитирует пост Ника Добоса, который назвал память ChatGPT «пугающе скрытной» (sneaky AF) . Добос заметил, что чат-бот запомнил его имя, просто проанализировав путь к файлу в ошибке терминала, которую Ник скопировал в чат .

В ходе теста Рот попросил ChatGPT запомнить название его компании — «Natural 20». После создания нового чистого диалога ИИ не только вспомнил название, но и успешно интегрировал его в запрос на создание логотипа .

🛠️ Практическое руководство: создание приложения на GPT-4o через API 13:20

Для тех, кто хочет выйти за рамки стандартного интерфейса чата, Уэс Рот представил пошаговый гайд по работе с API. По его мнению, сейчас наступил «момент уникальных возможностей», когда даже люди без навыков программирования могут начать создавать собственных ИИ-агентов .

Пошаговый алгоритм от Уэса Рота:

  1. Получение ключа: необходимо зайти на platform.openai.com и создать новый секретный API-ключ. Автор напоминает о критической важности сохранения ключа в секрете .
  2. Среда разработки: Рот рекомендует использовать Google Colab — бесплатный облачный инструмент, который не требует настройки окружения на локальном компьютере .
  3. Установка библиотеки: в блоке кода выполняется команда pip install openai .
  4. Запуск модели: автор демонстрирует простой скрипт, где указывается модель gpt-4o. При подаче запроса через API модель работает быстрее и позволяет автоматизировать задачи .

В качестве финального примера Рот показал использование функции Vision через API. Он загрузил URL-адрес изображения из Википедии (вид на кампус университета Висконсин-Мэдисон) и попросил GPT-4o описать его. Модель успешно идентифицировала дорожку, береговую линию и детали пейзажа всего за несколько секунд .

💬 Цитаты

«Мы, пользователи Windows, — граждане второго сорта; нам всегда приходится ждать по году.»

«Это не совсем понимание видео, но оно способно следить за происходящим, делая снимки кадр за кадром.»

«Память ChatGPT пугающе скрытна (sneaky AF).»

Ник Добос (в цитировании Уэса Рота) 11:00
👥 Спикер
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
GPT-4o
Новая мультимодальная флагманская модель от OpenAI, способная работать с текстом, аудио и изображениями в реальном времени.
API Key
Уникальный идентификатор, позволяющий сторонним программам подключаться и использовать функции моделей OpenAI.
Apple Silicon
Серия процессоров собственной разработки Apple (M1, M2, M3), необходимых для работы нового десктопного приложения ChatGPT.
Red Teaming
Процесс тестирования системы на уязвимости и этические риски перед массовым выпуском.
📊 Цифры
🗓 Хронология
  1. Май 2024 Выпуск GPT-4o и запуск десктопного приложения для macOS.
  2. Ближайшие недели Ожидаемый запуск нового голосового режима (Alpha) для пользователей Plus.
  3. В течение года Планируемый выход версии приложения для Windows.
⚖️ Другая сторона
Искусственный интеллект OpenAI ChatGPT GPT-4o Wes Roth Google Colab