Grok 2 Large против лидеров рынка: разбор Уэса Рота о возможностях и цензуре ИИ от xAI

Wes Roth 49,6 тыс. 27 мин 5 мин 24.08.2024
Главное

Новая нейросеть от Илона Маска, Grok 2, стремительно ворвалась в топ мировых рейтингов, заняв второе место в Chatbot Arena и вплотную приблизившись к лидерам от OpenAI и Google. В своём новом видео техноблогер Уэс Рот (Wes Roth) проводит детальный тест-драйв модели, проверяя её логику, навыки программирования и готовность отвечать на «запретные» вопросы. Главная интрига заключается в том, действительно ли xAI удалось создать мощный ИИ без жесткой цензуры и идеологических ограничений.

🏆 Прорыв в рейтингах и техническое ускорение 0:00

Grok 2 Large показал впечатляющие результаты сразу после выхода, заняв вторую строчку в глобальном лидерборде Chatbot Arena . Его «младший брат», Grok 2 Mini, также вошел в пятерку лучших, заняв почетное пятое место. По словам ведущего разработчика команды xAI Игоря Бабушкина, Grok Mini стал в два раза быстрее всего за один день благодаря оптимизации .

Технический прогресс модели обусловлен серьезной переработкой инфраструктуры. Алам Джанг и Малики С. полностью переписали стек инференса (inference stack), используя SG Lang . Это позволило запускать большую модель Grok 2, требующую работы на нескольких хостах (multihost inference), с приемлемой скоростью . Как утверждает Уэс Рот, команда xAI движется «очень, очень быстро», стремясь сократить отставание от конкурентов.

🧩 Тесты на логику и пространственное мышление 1:05

Уэс Рот подверг Grok 2 серии испытаний, чтобы проверить, насколько хорошо модель понимает контекст и сложные условия задач.

Пространственная ориентация :

Классическая задача о загадочном убийстве :

Задача выбора Уэйсона (Wason selection problem) :

Задача с расстановкой мебели на сетке 3x3 :

💻 Программирование: скорость против качества 17:20

В тесте на написание кода Уэс Рот попросил Grok 2 создать игру «Змейка» на Python с использованием библиотеки PyGame.

Результаты итеративной разработки:

  1. Базовая версия: Работала безупречно сразу после генерации .
  2. Добавление функций: Рот попросил сделать так, чтобы змейка росла на 10 единиц за раз, и добавить падающие с неба объекты, которые «отрубают» хвост змейке .
  3. Ошибки в логике: Модель начала путаться: змейка росла сама по себе без еды, а падающие объекты не влияли на длину .
  4. Исправления: После нескольких попыток исправить код, Grok 2 наладил механику роста, но так и не смог корректно реализовать столкновение с падающими предметами .

Уэс Рот считает, что способности Grok 2 к программированию пока заметно уступают модели Claude (от Anthropic). По мнению блогера, Claude гораздо лучше справляется с итеративными правками и отслеживанием версий кода .

🔓 Цензура и «режим демона» 21:48

Одной из самых обсуждаемых особенностей Grok является его «неподцензурность». Илон Маск позиционирует свои модели как максимально правдивые и свободные от идеологических рамок (anti-woke).

🔍 Что «под капотом»: системные инструкции 23:05

Блогеру удалось (со ссылкой на исследователя Pliny the Liberator) получить доступ к системным промптам Grok 2, которые раскрывают его внутренние настройки .

Основные директивы из промпта:

🖼️ Генерация изображений и этические споры 25:40

Grok 2 интегрирован с моделью Flux.1 от Black Forest Labs для генерации изображений. Уэс Рот характеризует эту связку как «необузданную» (unhinged) .

В отличие от инструментов Google или OpenAI, Grok позволяет создавать изображения публичных личностей и политиков в компрометирующих ситуациях без жестких фильтров. По словам Рота, Илон Маск сознательно идет на этот шаг, считая, что ИИ должен выполнять запросы пользователя, а не контролироваться цензурой третьих лиц . Это вызывает бурные дебаты в обществе: одни видят в этом долгожданную свободу, другие — опасный потенциал для дезинформации.

Уэс Рот резюмирует, что Grok 2 — это очень сильный игрок, который по уровню рассуждений уже стоит в одном ряду с моделями от OpenAI . Главным преимуществом продукта xAI блогер называет отсутствие ограничений, что делает взаимодействие с моделью «гораздо более веселым» .

💬 Цитаты

«Grok 2 не боится отвечать на острые вопросы, которые отвергаются большинством других ИИ-систем.»

«Илон Маск стремится раздвигать границы, создавая модели, которые делают то, что вы просите, а не то, что решит третья сторона.»

👥 Спикер
📚 Упомянутые книги
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Inference stack
Программная инфраструктура, обеспечивающая работу (вывод) уже обученной нейросети.
SG Lang
Специализированный язык или библиотека для оптимизации работы больших языковых моделей.
System prompt
Скрытая инструкция, задающая правила поведения и личность ИИ-модели.
Woke
Политический термин, относящийся к осознанности в вопросах социальной, расовой и гендерной справедливости; Илон Маск критикует его как форму цензуры.
📊 Цифры
🗓 Хронология
  1. Август 2024 Выход Grok 2 и его попадание на высокие позиции в Chatbot Arena.
⚖️ Другая сторона
Искусственный интеллект Grok 2 xAI Илон Маск Wes Roth Flux.1