GPT-5.5 против Opus 4.7: результаты тестирования на 8 реальных задачах

Pat Simmons 218 26 мин 2 мин 28.04.2026
Главное

Автор протестировал возможности GPT-5.5 и Opus 4.7 в восьми прикладных задачах, от кодинга до финансовой аналитики. По результатам сравнения Opus 4.7 лидирует в дизайне и программировании, в то время как GPT-5.5 точнее справляется со сложными офисными отчетами .

💻 Программирование и веб-разработка 0:26

В категории кодинга модели создавали лендинги, интерфейсы приложений и 3D-сцены. Основное внимание автор уделил соблюдению инструкций по дизайну и отсутствию типичных ошибок ИИ — лишних градиентов и неуместных эмодзи .

📊 Офисные задачи и анализ данных 18:31

Для тестирования офисных навыков автор использовал шесть CSV-файлов с тысячами строк данных, имитирующих отчеты из HubSpot и Salesforce . Модели должны были рассчитать финансовые показатели и оформить их в виде презентации.

🏆 Итоговые результаты и специализация 25:49

Несмотря на общую победу Opus 4.7 по количеству выигранных раундов за счет дизайна и кода, автор выделил четкую специализацию для каждой нейросети .

Эффективность моделей по типам задач:

  1. Программирование и UI-дизайн: Opus 4.7. Модель лучше чувствует нюансы взаимодействия с пользователем и современную эстетику.
  2. Деловое письмо: GPT-5.5 показал более стабильные результаты в текстовых задачах.
  3. Анализ данных и сложные отчеты: GPT-5.5. Модель OpenAI продемонстрировала высокую устойчивость к галлюцинациям и внимательность к деталям в таблицах .

Google Gemini использовался в качестве нейтрального судьи, однако в ряде случаев он не смог корректно оценить визуальные элементы из-за ошибок рендеринга .

💬 Цитаты

«Для кодинга и UI-дизайна я все еще считаю, что Opus справляется лучше.»

Автор ролика 26:28

«GPT-5.5 корректно разделил наличные, которые считаются выручкой, от собранных средств, еще не попавших в отчетность.»

Автор ролика 23:37
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
One-shot
Выполнение задачи ИИ-моделью по единственному запросу без дополнительных уточнений.
Bento grid
Стиль оформления интерфейса, напоминающий японские коробки для обедов с ячейками разного размера.
ARR
Годовая повторяющаяся выручка, ключевой показатель для сервисов по подписке.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект GPT-5.5 Opus 4.7 OpenAI Anthropic 3JS