State of AI 2025: Почему роботы в одежде и научные открытия ИИ меняют мир прямо сейчас

Wes Roth 32,5 тыс. 23 мин 4 мин 10.10.2025
Главное

Обзор состояния индустрии искусственного интеллекта на начало 2025 года демонстрирует стремительное сближение возможностей ведущих лабораторий и выход робототехники на потребительский рынок. Пока OpenAI и Anthropic ведут борьбу за лидерство в кодинге и науке, стартапы вроде Figure готовятся отправить андроидов в дома обычных людей, радикально меняя подход к дизайну домашних помощников.

🤖 Figure 03: Роботы в одежде идут в наши дома 0:00

Основатель компании Figure Robotics Бретт Эдкок (Brett Adcock) представил третье поколение своего гуманоидного робота — Figure 03. Важнейшим изменением в дизайне стала «человечность» внешнего вида: теперь машина облачена в мягкую тканевую оболочку, напоминающую одежду . По мнению Уэса Рота, это стратегическое решение продиктовано психологическим комфортом: результаты пользовательских тестов, вероятно, показали, что люди опасаются «голого» металла в жилых помещениях.

Ключевые особенности новой модели:

Эдкок также объявил о личной вендетте против Apple после того, как компания запретила ему гравировку его фамилии (Adcock) на продукте . В ответ он запускает новый проект и планирует начать поставки роботов в ограниченное число домохозяйств уже в следующем году .

🧠 Битва моделей: GPT-5 Pro против o3 и Grok 4 11:02

На бенчмарке ARC AGI, оценивающем способность ИИ к решению новых, не виденных ранее логических задач, развернулась серьезная конкуренция. Актуальные данные показывают, что модель GPT-5 Pro от OpenAI удерживает лидерство среди коммерчески доступных систем, достигнув результата в 70,2% .

Однако Уэс Рот подчеркивает странную аномалию в показателях:

  1. Превосходство o3: Модель o3 Preview, представленная OpenAI еще в декабре 2024 года, по-прежнему показывает лучший результат (75,7%), чем новая GPT-5 Pro .
  2. Экономический фактор: Стоимость вычислений для o3 на порядок выше. Если решение задачи на GPT-5 Pro стоит около $4,78, то для o3 эта цифра может достигать $200–300 на логарифмической шкале .
  3. Триумф Grok 4: Исследователь Джереми Берман (Jeremy Burman) сумел модифицировать Grok 4, достигнув рекордных 80% на ARC AGI . Он использовал метод эволюционного поиска и многократной проверки решений (evolve and revise), который позволяет модели самой тестировать написанный код и исправлять ошибки .

🇨🇳 Утечка мозгов и «китайский вопрос» в Anthropic 16:36

Компания Anthropic столкнулась с репутационным вызовом: ведущий исследователь Шунью Яо (Shunyu Yao) покинул стартап, чтобы присоединиться к Google DeepMind . По словам Яо, 40% причины его ухода — категорическое несогласие с «антикитайскими заявлениями» руководства Anthropic.

Ведущий отмечает иронию ситуации: генеральный директор Anthropic Дарио Амодеи (Dario Amodei) получил свой первый опыт работы с ИИ в китайской компании Baidu, где и узнал о «законах масштабирования» (scaling laws) . По мнению исследователя Юджина Джина, резкая публичная риторика Амодеи в отношении Китая теперь отталкивает талантливых специалистов .

📊 Отчет State of AI 2025: миф о «пузыре» 17:15

Свежий аналитический отчет Натана Бенайха (Nathan Benaich) демонстрирует, что индустрия ИИ переходит от стадии хайпа к реальным доходам. Вопреки опасениям о «пузыре», цифры говорят о значительном росте:

🧬 ИИ в науке: От протеомики до квантовой математики 18:46

Искусственный интеллект перестает быть просто «чат-ботом» и становится полноценным соавтором научных открытий.

По признанию Ааронсона, это первый зафиксированный случай, когда большая языковая модель внесла фундаментальный вклад в серьезное математическое исследование, доказав свою полезность в качестве научного инструмента.

💬 Цитаты

«Figure 3 вводит дизайн с тканевым слоем — корпус, похожий на одежду, поверх прецизионного оборудования.»

«GPT-5 Pro по-прежнему не достигла производительности модели o3 Preview, которую мы тестировали в декабре 2024 года.»

«Эти компании тратят наличные, у них больше денег, чем у некоторых стран. Это не заемные средства.»

👥 Спикер
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
ARC AGI
Тест на абстрактное мышление для ИИ, проверяющий способность решать задачи без предварительного обучения на аналогичных примерах.
Протеомика
Область биологии, изучающая белки, их структуру и функции в организмах.
RLVR
Reinforcement Learning with Verifiable Rewards — обучение с подкреплением на основе проверяемых ответов в математике и кодинге.
📊 Цифры
🗓 Хронология
  1. Декабрь 2024 OpenAI тестирует модель o3 Preview с результатом 75.7% на ARC AGI.
  2. 2023 Только 5% американских компаний платили за использование ИИ.
  3. 2025 Публикация отчета State of AI 2025 и выход Figure 03.
  4. 2026 Планируемое начало поставок домашних роботов Figure в домохозяйства.
⚖️ Другая сторона
Искусственный интеллект Figure 03 OpenAI Anthropic ARC AGI Dario Amodei