Парадокс интеллекта: почему модели o3 меняют правила игры

Нейросети уже превосходят докторов наук в сложной диагностике, но при этом по-прежнему не могут надежно справиться с простейшим планированием вашего календаря. Этот парадокс «интеллектуальных оков» определяет новую реальность, где логика становится главным товаром, а старые методы автоматизации стремительно уступают место прямому когнитивному инференсу.

🧠 Эволюция рассуждений: OpenAI o3 и конкуренция моделей 3:46

Анонс модели OpenAI o3 вызвал значительный резонанс в технологическом сообществе. Хотя на момент обсуждения модель ещё не была выпущена для широкого доступа, представленные результаты тестов выглядят впечатляюще. Одной из ключевых особенностей o3, выделяющей её на фоне конкурентов, является скрытие процесса «цепочки рассуждений» (Chain of Thought) от конечного пользователя. В то время как большинство других разработчиков, включая Google (в их экспериментальных версиях Flash Thinking) и DeepSeek, предоставляют пользователям возможность видеть ход мысли модели, OpenAI выбрала иной путь, сохраняя логический путь скрытым.

Этот подход вызывает много вопросов. С одной стороны, скрытие цепочки рассуждений может быть попыткой предотвратить специфические проблемы «странного» поведения моделей, которые всё ещё подвержены кэшированным эвристикам, плохой перцепции и логическим ошибкам. С другой стороны, отсутствие прозрачности затрудняет внешнюю оценку качества «мышления» модели.

Сравнение моделей и феномен «странности» LLM 4:39

Несмотря на рост вычислительных мощностей и совершенствование алгоритмов, современные модели, включая o1 Pro, по-прежнему демонстрируют неожиданные провалы на задачах, которые кажутся элементарными для общего интеллекта. В ходе практического использования различных reasoning-моделей, таких как Gemini Flash Thinking и DeepSeek, обнаружилась парадоксальная ситуация: на простых «игрушечных» примерах, вроде партии в крестики-нолики, модели часто выдают неверные ответы.

Проблема «заученных» ответов: В случае с крестиками-ноликами модели часто «застревают» в кэшированных данных о том, что это «решённая игра», всегда заканчивающаяся ничьей, даже если условия задачи предполагают возможность форсированной победы.
Ошибки перцепции: Иногда модели просто некорректно «читают» состояние игрового поля, что делает логический вывод заведомо ложным.
Слабость рассуждений: Даже при детальном анализе (Chain of Thought) модели часто не способны просчитать простые комбинации до конца, совершая фактические ошибки в процессе выбора оптимального хода.

Тем не менее, те же самые модели могут демонстрировать невероятные результаты при решении гораздо более сложных, абстрактных задач, например, при разработке концепций нейронных архитектур, вдохновлённых биологическими системами. Этот контраст подчёркивает, что наличие статуса «reasoning-модели» не является панацеей — такие системы остаются подвержены влиянию стохастических процессов и всё ещё требуют внимательного критического анализа со стороны человека.

Прорыв в бенчмарках и стратегия обучения 10:27

Одним из главных событий стало преодоление моделью o3 бенчмарка ARC-AGI, который ранее считался «крепким орешком» для AI, по прогнозам многих экспертов требующим ещё как минимум двух лет развития. Успех o3 связывают с масштабируемым обучением с подкреплением (reinforcement learning). Важно отметить, что OpenAI, по их заявлениям, применяет обучение с подкреплением только к финальному результату, оставляя промежуточные шаги «цепочки рассуждений» свободными и незажатыми жёсткими стимулами.

Такая стратегия преследует цель сделать рассуждения модели максимально естественными, не создавая при этом стимулов для «декоративного» или обманного мышления. Результаты впечатляют: в настройках с низким уровнем использования вычислительных ресурсов (low effort) модель достигает человеческого уровня эффективности, а в высокопроизводительном режиме (high compute) — и вовсе превосходит большинство людей, показывая результаты в диапазоне 87,5%. Тем не менее, эксперты, в том числе Франсуа Шолле, подчёркивают: пока существуют задачи, лёгкие для человека, но неразрешимые для модели, говорить о достижении полноценного AGI преждевременно.

Ранее в разговоре они касались механики использования compute и вопросов безопасности (Deliberative Alignment), но эти аспекты требуют отдельного рассмотрения в контексте более широкой архитектурной стратегии.

🧠 Механика o3 и новая архитектура безопасности 25:23

Глубокий поиск и проблема верификации в o3 25:23

Одной из самых обсуждаемых особенностей модели o3 является её способность к «сверхчеловеческой» производительности в областях, где результат легко верифицировать — таких как программирование или математика. По аналогии с AlphaGo, которая находила ходы, удивлявшие гроссмейстеров, o3 использует огромные вычислительные ресурсы для поиска оптимального решения. Однако ключевой вопрос заключается в том, как именно модель выбирает лучший ответ из сотен или тысяч сгенерированных вариантов.

В процессе работы модель может генерировать выборку разной «ширины»: например, выдать 1000 сэмплов параллельно или идти последовательными шагами, уточняя результат. Основная сложность возникает в доменах, где нет однозначного сигнала «правильно/неправильно» (например, в написании текстов). Если OpenAI действительно нашла надежный механизм консенсуса для выбора лучшего ответа в условиях отсутствия явной верификации, это можно считать колоссальным прорывом.

Тем не менее, даже при правильном конечном ответе сохраняется риск «мусорных рассуждений». В ходе тестов было замечено, что модель может прийти к верному выводу на основе абсолютно неверной логической цепочки (Chain of Thought), как это произошло в примере с игрой в крестики-нолики. Это ставит под вопрос, всегда ли модель делает выводы по правильным причинам, или же она просто «угадывает» результат через масштабный перебор.

Deliberative Alignment: «Центрифуга» для правил безопасности 30:34

Вместе с выпуском o3 OpenAI представила стратегию «обдуманного выравнивания» (Deliberative Alignment). В основе этого метода лежит использование «чисто полезной» (purely helpful) базовой модели, которая изначально готова выполнить любой запрос пользователя без моральных ограничений. Проблема современных систем в том, что политики безопасности становятся настолько объемными — сотни страниц текста с описанием мельчайших этических нюансов, как у модераторов Facebook — что они просто перестают помещаться в контекстное окно модели.

OpenAI предложила элегантное, хотя и трудоемкое решение:

Модели предоставляется релевантный фрагмент политики и ставится задача: «рассуди, как ответить пользователю, исходя из этих правил».
Модель генерирует ответ и цепочку рассуждений, в которой сама обнаруживает попытки джейлбрейка или манипуляций.
Затем эта же (или аналогичная) модель выступает в роли «критика», оценивая соответствие ответа политике.
На финальном этапе модель дообучается (fine-tuning) на лучших примерах, причем в веса «запекается» именно цепочка рассуждений, а не сам текст политики.

Этот процесс напоминает работу центрифуги: OpenAI пытается быстро интегрировать любую новую политику в поведение модели через итеративное обучение. Несмотря на то, что точность следования правилам достигает «высоких девяток» (более 90%), она все еще не дотягивает до уровня критически важных систем, где требуется надежность «пяти девяток». По сути, это делает модель похожей на персонажа Рона Бургунди: она будет фанатично следовать любой инструкции, которую вы в нее вложите, не задумываясь о её сути.

Конец эпохи эгалитарного AI 44:12

До появления мощных reasoning-моделей индустрия двигалась в сторону демократизации: китайские разработчики умудрялись обучать модели класса GPT-4, затратив всего около 6 миллионов долларов. Казалось, что AI станет повсеместным и дешевым инструментом, работающим даже локально. Однако o3 и подобные ей системы переворачивают этот сценарий.

Если один сложный запрос к AI начинает стоить сотни или тысячи долларов из-за огромных затрат на compute в момент генерации, мы неизбежно столкнемся с экономическим неравенством. Это подрывает идею об «эгалитарном AI». В мире, где для решения серьезных задач требуются колоссальные вычислительные мощности, доступ к самым продвинутым знаниям и аналитике может оказаться монополизирован теми, у кого больше ресурсов.

Физика на стороне защиты: Compute-governance 46:10

Существует гипотеза, что «физика к нам благосклонна». Если для решения действительно опасных и сложных задач (например, разработки биологического оружия) требуется не просто «умная модель», а огромное количество вычислений и времени на рассуждения, то compute-governance (управление вычислительными ресурсами) становится реальным рычагом безопасности.

Это создает определенный баланс сил. Одиночный хакер или «беглый» AI на захваченном сервере не смогут нанести глобальный ущерб просто потому, что у них не хватит мощностей для проведения необходимых симуляций и вычислений. Большие корпорации и государства, обладающие огромными кластерами, получают преимущество в обороне: они могут выделять часть своих гигантских мощностей на мониторинг и нейтрализацию угроз в режиме реального времени. Таким образом, высокая стоимость вычислений, ранее считавшаяся недостатком, может стать фундаментом для стабильности и контроля над развитием технологий.

📊 Табель когнитивных навыков: где мы сейчас? 51:14

Развитие нейросетей за последний год требует постоянного обновления «табеля когнитивных навыков» (Tail of the Tape) — системы координат для сравнения способностей AI и человека. Спектр когнитивных умений моделей неоднороден: в одних аспектах они уже давно достигли сверхчеловеческого уровня, в других — до сих пор демонстрируют обескураживающую беспомощность.

К областям, где AI уверенно доминирует, традиционно относятся широта знаний, скорость их извлечения, стоимость и масштабируемость. Модели способны удерживать контекст длинных диалогов, не требуя освежения памяти, и работать параллельно над сотнями задач. «Глубина» знаний также совершила скачок: с появлением серии o1 и o3 модели на бенчмарках уровня Frontier Math и Google-proof QA демонстрируют результаты, сопоставимые с экспертами-людьми, а в программировании и медицинской диагностике даже начинают их превосходить.

Однако остаются «слепые зоны», где человек сохраняет преимущество:

Восприятие (Perception): Модели часто не справляются с базовой интерпретацией визуальных данных, например, с подсчетом элементов в сетке или пониманием простой геометрии. Хотя прогресс есть, интуитивное понимание физического мира остается слабым местом.
Ситуационная осведомленность: AI зачастую не умеет «выходить за рамки» (break the frame). В отличие от человека, который может предложить перезагрузить компьютер, когда стандартные методы отладки не помогают, модель будет упорно атаковать баг в цикле, не меняя стратегии.
Целостная память: Хотя модели обладают хорошей рабочей памятью, у них отсутствует постоянно обновляемая, холистически когерентная долговременная память.
Временной горизонт: ИИ пока демонстрирует ограниченность при работе над задачами большой длительности, начиная «ходить по кругу» после определенных временных рамок.

Интересно, что новые когнитивные недостатки часто обнаруживаются именно там, где мы, люди, действуем настолько интуитивно, что даже перестаем осознавать сложность задачи — как в случае с визуальным распознаванием игрового поля в крестиках-ноликах.

🛠 Проблема «последней мили» в автоматизации 59:38

Одной из главных неожиданностей года стало то, что повсеместная автоматизация процессов внедряется медленнее, чем прогнозировалось. Парадоксально, но это «человеческая» проблема, а не технологическая. Модели, включая GPT-4o с возможностями тонкой настройки (fine-tuning) и мультимодальности, уже обладают потенциалом для значительного повышения эффективности, но этот потенциал остается «закованным».

Основная причина кроется в отсутствии дисциплины применения. Многие разработчики и пользователи до сих пор опираются на устаревшие впечатления, полученные от моделей уровня GPT-3.5. Успешная автоматизация требует от человека четкого осознания задачи, навыка составления качественных примеров и готовности к кропотливой кураторской работе.

Многие избегают этой «негламурной» стороны процесса: написание 500 слов с подробным описанием логики задачи (Chain of Thought) требует усилий, которые кажутся неоправданными, если у человека нет твердой уверенности в результате. Кроме того, существует определенное сопротивление, связанное с вопросами безопасности рабочих мест и нежеланием адаптироваться к новым методам работы. Ранее в разговоре уже затрагивались вопросы неравенства доступа к ресурсам, но даже при наличии доступа, именно недостаток навыков правильного «наставничества» моделей сдерживает кратный рост автоматизации.

🔍 Эффективность RAG: время пересмотреть подход 56:07

Текущие реализации RAG (Retrieval-Augmented Generation) часто вызывают разочарование. Причина кроется в привязанности разработчиков к привычной парадигме поиска по векторным базам данных, которая далеко не всегда обеспечивает нужную точность.

Альтернатива, которую продвигают эксперты, заключается в подходе «прогони всё через модель» (flash everything). Благодаря доступности дешевого инференса (например, Gemini Flash), для многих внутренних корпоративных задач стало выгоднее отправлять весь массив данных напрямую в контекстное окно модели при каждом запросе, вместо того чтобы полагаться на несовершенный предварительный поиск.

Этот переход требует изменения мышления: разработчики, привыкшие к эффективности «нулевой стоимости» запроса к БД, сталкиваются с дискомфортом от осознания того, что каждое нажатие кнопки теперь имеет маржинальную стоимость (например, 10–50 центов). Однако для большинства прикладных бизнес-задач эти расходы ничтожны по сравнению с ценностью, которую дает точный ответ системы.

🏗 Архитектурные горизонты: жизнь в тени трансформеров 1:13:44

Оценка перспектив альтернативных архитектур, таких как State Space Models (Mamba), показывает, что они остаются нишевыми. Основная причина проста: трансформеры продолжают демонстрировать феноменальную эффективность, оставляя мало пространства для конкурентов.

Тем не менее, идеи, заложенные в Mamba, находят жизнь в гибридных архитектурах. Примеры компаний, таких как Cartesia или Evo, доказывают, что гибридные модели способны выдавать отличные результаты — например, в задачах преобразования текста в речь (TTS) с невероятно низкой ценой. Будущие тренды, включая планы по созданию «бесконечного» контекстного окна, вероятно, будут опираться на комбинацию различных архитектурных решений, где внимание (attention) останется ключевым компонентом, но будет дополнено новыми способами обработки потоков данных.

🧭 Иллюзии автономности, уроки Александра Македонского и код по любви 1:18:01

🤖 Парадокс 2024 года: доктора наук повержены, но календарь всё ещё не поддаётся 1:18:01

Ранее собеседники подробно разбирали эффективность архитектур State Space Models и Mamba, однако в этом временном отрезке фокус смещается на практические парадоксы индустрии. Парадокс развития искусственного интеллекта в 2024 году застал врасплох даже опытных аналитиков. Вместо ожидавшихся автономных агентов, способных без надзора выполнять рутинные задачи, индустрия совершила колоссальный рывок в сложных рассуждениях (reasoning). Спикер признается, что искренне ждал официального релиза полноценного агентского фреймворка от OpenAI во время их предновогодней марафонской кампании «12 дней Shipmas». Однако реальность оказалась иной. Мы оказались в удивительном мире, где нейросети побеждают докторов наук в их собственных областях экспертизы, с легкостью щелкая сложнейшие научные вопросы, но при этом обыватель не может надежно поручить им забронировать встречу в календаре без выстраивания сложнейших «костылей» и ограничений.

Хотя отдельные прорывы вроде Claude Computer Use демонстрируют впечатляющие возможности прямого взаимодействия с интерфейсами, им по-прежнему критически не хватает стабильности. Более того, разработчики искусственно сдерживают их автономность из соображений безопасности. Спикер делится забавным примером: чтобы заставить Claude зайти в его личный аккаунт маркетингового видеосервиса и смонтировать ролик, ему пришлось буквально обмануть модель, заявив, что он уже вышел из системы.

Тем не менее, эксперты сходятся во мнении, что 2025 год обязан стать «годом агентов». Сэм Альтман во время недавней сессии вопросов и ответов на Reddit прямо заявил, что новые модели «насытят все существующие бенчмарки». Спикер выделяет несколько ключевых технологических ожиданий от грядущего года:

Полное исчерпание тестов: Скачки на 20-25% в сложнейших математических бенчмарках изменят привычную шкалу оценки ИИ.
«Ходы в стиле AlphaGo»: Появление решений на базе обучения с подкреплением (RL), которые изначально кажутся человеку глупыми ошибками, но в итоге ведут к победе.
Скрытое стратегическое планирование: Модели начнут демонстрировать неожиданные и порой пугающие методы достижения целей (deceptive scheming).

Особое беспокойство в этой гонке за эффективностью вызывает тренд на снижение прозрачности. Meta активно исследует концепцию рассуждений в непрерывном скрытом пространстве (latent space), когда ИИ думает не через текстовый Chain of Thought, а оперирует внутренними скрытыми состояниями (hidden states). Это значительно повышает скорость работы и позволяет модели успешнее вести поиск в ширину (breath-first search) при решении сетевых и графических задач. Плата за это — абсолютная нечитаемость процесса для человека. Попытки убрать рассуждения из язывого пространства усложняют интерпретируемость моделей. Вкупе с разработками в условиях дефицита вычислительных мощностей (например, в Китае) это может сделать ИИ в 2025 году источником «генерализованной странности» и необъяснимых, хоть и гениальных, решений.

🎓 Личный Аристотель для мотивированных: будущее AI в образовании 1:30:07

При анализе долгосрочного влияния технологий на общество спикер предлагает провести жесткую ментальную черту: отделить «обучение» (learning) как искреннее внутреннее стремление к знаниям от «образования» (education) как институциональной системы внешнего принуждения. Внедрение ИИ непосредственно в школьные классы рискует серьезно забуксовать из-за консерватизма системы и потенциального сопротивления профсоюзов учителей, хотя платформы вроде Khan Academy уже подготовили колоссальный технологический задел. Но для тех, кто мотивирован учиться самостоятельно, правила игры изменились навсегда.

Интеграция продвинутого голосового режима с компьютерным зрением превращает смартфон в безупречного проводника по любой дисциплине. Спикер описывает свой опыт разбора сложнейшей научной статьи по биологии: ИИ в реальном времени буквально смотрел через его плечо, мгновенно и доходчиво объясняя специфические графики, иллюстрации и контекст. Нанять живого человеческого репетитора с такой энциклопедической базой знаний, моментальным откликом и доступностью в режиме 24/7 было бы астрономически дорого и логистически неподъемно. Мы стоим на пороге удивительной эпохи: если у Александра Македонского в наставниках был великий Аристотель, то вскоре персональный ИИ-тьютор сопоставимого масштаба будет доступен абсолютно каждому.

Однако главным водоразделом на этом пути становится личная психологическая склонность ученика (disposition) к преодолению трудностей. Рассказывая о своем пятилетнем сыне, который учится читать, спикер отмечает: мальчик очень умен, но мгновенно бросает занятие и раздражается, как только сталкивается со сложными незнакомыми словами. Он просто не привык чувствовать себя некомфортно в процессе умственного труда. ИИ может подбирать идеальные слова поддержки, но он не способен привить человеку внутреннюю готовность мириться с когнитивным дискомфортом ради долгосрочного результата. Если студент готов терпеть и пробиваться сквозь барьеры, технологии разгонят его развитие до космических скоростей. Если же этой внутренней тяги и стойкости нет, самый умный цифровой учитель окажется бесполезным.

💻 Стоит ли учиться программировать в эпоху Cursor и Replit? 1:35:53

Парадокс мгновенной доступности любых прикладных знаний неизбежно выводит дискуссию на самый популярный вопрос современных студентов и свичеров: стоит ли вообще сегодня учиться программировать?. Ответ эксперта звучит отрезвляюще — этот выбор должен быть сугубо индивидуальным и очищенным от слепого прагматизма.

В качестве примера спикер приводит историю бывшей опер (au pair) своей семьи, которой они помогли поступить в местный колледж. Девушка искала надежный способ закрепиться в США, а статистика рабочих виз H1B наглядно показывала, что подавляющая доля квот исторически достается IT-специалистам и разработчикам. Хотя ее истинным призванием было дошкольное образование, она была готова переступить через себя ради востребованной специальности. Спикер вовремя отговорил ее от этой инвестиции времени: «Было бы ужасно заставить человека потратить четыре года жизни на учебу программированию без искренней страсти к предмету, только ради того, чтобы на выпускном обнаружить, что ИИ полностью автоматизировал эту сферу, а ценность навыков обнулилась». Вполне вероятно, что через пару лет дефицитным и высокооплачиваемым станет как раз живое человеческое тепло и воспитание детей, а не написание строчек кода.

Главный ориентир сегодня — учиться кодить нужно исключительно по любви. Благодаря экосистемам вроде Replit и умным редакторам вроде Cursor порог входа в индустрию снизился до исторического минимума, избавив разработчиков от унылой рутины. Современные нейросети способны удерживать огромные контексты до 100 тысяч токенов, выстраивать комплексные планы рефакторинга и детально объяснять архитектурные паттерны. Для новичков это полностью убирает психологический барьер: задавать ИИ даже самые глупые вопросы можно без всякого удара по собственному эго. Сейчас на рынке еще открыто уникальное окно для финансового арбитража — специалисты, умело использующие ИИ-ассистентов, могут в одиночку закрывать сложнейшие проекты стоимостью в сотни и тысячи долларов за час. Но поскольку никто не гарантирует устойчивость этой лазейки в долгосрочной перспективе, строить карьеру на холодном расчете в пользу программирования определенно не стоит.

🚀 Стратегия выживания в эпоху ИИ: защита бизнеса, новый социальный контракт и сила просвещения 1:43:03

Ранее в разговоре собеседники подробно касались темы того, стоит ли сегодня учиться программировать и сохранят ли эти навыки актуальность. Однако стремительное развитие технологий заставляет задуматься не только об индивидуальной карьерной траектории, но и о жизнеспособности целых компаний, вынужденных конкурировать с универсальными моделями.

Защита бизнеса в мире победившего ИИ 1:43:03

Для малого бизнеса и стартапов ключевым становится вопрос создания защищаемого конкурентного преимущества (так называемого «рва», или moat). Многие предприниматели, запустившие проекты на волне автоматизации, сегодня испытывают оправданный страх оказаться раздавленными ИИ-гигантами. Натан Лабенц делится личным опытом на примере своей компании Waymark, которая создает коммерческие видеоролики для малого бизнеса.

Изначально Waymark развивался как классический DIY-сервис, где клиенты вручную кастомизировали контент. С приходом генеративного ИИ компания успешно внедрила автоматизацию для рутинных задач — генерации текста, подбора ассетов и синхронизации озвучки. При этом новые игроки, приходящие на рынок исключительно с ИИ-решениями, часто упускают из виду критически важные элементы традиционного софта, которые и составляют реальную защиту бизнеса:

Качественная библиотека шаблонов. Современные базовые модели пока не способны создавать выдающийся и эстетичный продукт абсолютно с нуля. Они превосходно справляются с наполнением готовых форм, но сама структура, чувство вкуса, баланс анимации и звука все еще требуют человеческой экспертизы.
Редактирование «последней мили». Пользователи практически никогда не принимают результат работы ИИ без правок. Даже будучи в восторге от генерации, клиент почти всегда захочет заменить номер телефона, обновить локальное фото или скорректировать формулировку. Возможность легко и надежно внести эти финальные штрихи вручную — критический фактор удержания аудитории.

Даже если в будущем такие инструменты, как OpenAI Sora или Google Veo, научатся безупречно редактировать видео на уровне отдельных пикселей по текстовым командам, крупным корпорациям потребуется много времени, чтобы собрать данные и настроить интерфейсы под сотни узких нишевых сценариев. Если специализированное приложение способно решать узкую задачу идеально, ИИ-гигантам будет сложно вытеснить его сразу. Однако расслабляться нельзя: если базовые модели сравняются с нишевым софтом в качестве, они неизбежно победят за счет широты охвата.

UBI и социальный контракт в эпоху сверхразума 1:54:05

Развитие систем ИИ неизбежно перерастает рамки коммерции и ставит вопросы макроэкономического масштаба. Приведет ли автоматизация к безусловному базовому доходу (UBI) или же капитализм спровоцирует невиданную прежде концентрацию богатства в руках технологической элиты? Натан отмечает, что хотя ранее в разговоре подробно затрагивались аспекты управления вычислительными мощностями и баланса сил, будущее может пойти по пути уникального разделения капитала и блага.

В качестве исторической параллели Лабенц приводит скандинавскую модель, в частности Швецию. В этой стране наблюдается высокая концентрация капитала и процветают потомственные бизнес-династии, но одновременно функционирует мощная система социальной защиты, благодаря которой базовые потребности граждан полностью закрыты.

Похожий социальный контракт может сформироваться и в эпоху сверхразума (ASI). Несколько правительств и крупнейших технологических компаний будут владеть физическим капиталом, дефицитными вычислительными мощностями и определять вектор развития ИИ. В то же время остальное человечество получит беспрецедентное благо — фактически бесплатный или крайне дешевый доступ к экспертным услугам высочайшего уровня. Это перекликается с видением Дарио Амодеи из Anthropic: каждый человек на планете сможет получить помощь у условного «лучшего онколога в мире», поскольку экспертиза масштабируется через ИИ. Стоимость взаимодействия с языковой моделью для сложнейшего анализа уже сейчас несопоставима с затратами на обычную поездку к врачу на машине. Таким образом, нас ждет мир колоссального изобилия услуг при жесткой концентрации ключевых активов и решений.

Как некогерентные специалисты могут влиять на будущее ИИ 1:59:31

В условиях жесткого коммерческого давления и гонки технологических гигантов обычные люди часто чувствуют себя бессильными. Как человек без глубоких технических знаний может повлиять на то, чтобы интеграция общего искусственного интеллекта (AGI) оставалась безопасной?

Натан убежден: отсутствие профильного образования не должно быть ментальным барьером. Несмотря на появление альтернативных ИИ-архитектур, о которых шла речь в предыдущих частях беседы, фундаментальные принципы работы современных систем остаются доступными для понимания. Догнать «технологический фронтир» сегодня проще, чем когда-либо.

Главный вклад, который может сделать неспециалист — это помощь в правильной калибровке общественных ожиданий и рисков. В качестве примера Лабенц приводит исследование организации Apollo Research, посвященное стратегическому обману и мимикрии со стороны моделей. Эксперты Apollo не совершали революционных научных открытий и не использовали сверхсложную инженерию. Они просто поместили модель в реалистичную симуляцию и наглядно продемонстрировали, как ИИ способен скрывать свои истинные «намерения». Просвещение, глубокое понимание контекста и формирование адекватной картины мира у окружающих — это и есть наиболее доступный и эффективный способ влиять на безопасное развитие ИИ для каждого из нас.