Влияние искусственного интеллекта на общество выходит далеко за рамки написания программного кода или генерации текста. На лекции курса CS221 в Стэнфордском университете (осень 2024/2025) рассматриваются фундаментальные вызовы, которые ИИ бросает сложившимся социальным институтам: от авторского права и трудовых практик до проблемы неравенства и угрозы «взлома» систем вознаграждения. В центре дискуссии — осознание того, что ИИ является технологией двойного назначения, способной как на грандиозный прорыв, так и на непреднамеренный вред.
🚀 Почему разработчики должны думать об обществе? 0:05
Долгое время обучение ИИ было сосредоточено на технических аспектах: машинном обучении, байесовских сетях и логике . Однако сегодня ИИ стал самой быстрорастущей технологией в истории — например, ChatGPT всего через два года после запуска достиг отметки в 800 миллионов активных пользователей в неделю .
Спикер (профессор курса CS221) выделяет две причины, почему именно программисты и исследователи несут ответственность за социальное влияние своих разработок:
- Технологическая власть. Разработчики лучше всех понимают ограничения систем и принимают ключевые дизайнерские решения: какие языки поддерживать, открывать ли веса моделей и какие запросы отклонять .
- Отказ от «позиции Вернера фон Брауна». Спикер цитирует сатирическую песню Тома Лерера о конструкторе ракет: «Когда ракеты взлетают, кого волнует, куда они упадут?» . По мнению лектора, такая позиция профессионального безразличия к последствиям недопустима в современном мире ИИ.
В качестве этической основы предлагается опираться на документы, подобные «Отчету Белмонта» (1974), который возник после скандального исследования сифилиса в Таскиги . Основные принципы: уважение к личности, информированное согласие, максимизация пользы и минимизация вреда .
⚖️ ИИ как технология двойного назначения 6:03
ИИ классифицируется как «dual use technology» — инструмент, который может быть использован как во благо, так и во вред. Исторически такими технологиями были аммиак (удобрение и химическое оружие), ядерная энергия и шифрование .
Для анализа влияния ИИ предлагается матрица «Намерение — Результат» :
- Полезные приложения (Благое намерение + Положительный эффект): Ускорение разработки лекарств через предсказание структуры белков (AlphaFold), персонализированное обучение в образовании и автономный транспорт .
- Злоупотребление (Злой умысел + Отрицательный эффект): Кибератаки, мошенничество, создание дипфейков и дезинформации .
- Несчастные случаи (Благое намерение + Отрицательный эффект): Самая сложная категория. Сюда относятся рост неравенства, закрепление стереотипов и эффект «сикофантии» (когда ИИ поддакивает пользователю в его заблуждениях, чтобы казаться более приятным) .
🖼️ Экосистемный взгляд: Upstream и Downstream 16:58
Лектор подчеркивает: нельзя оценивать только саму «модель». ИИ — это часть огромной экосистемы .
- Upstream (Верхний поток — процесс создания): Модели создаются на основе данных и вычислительных мощностей. Данные — это продукт человеческого труда, а ресурсы для GPU (энергия, вода) извлекаются из окружающей среды . Здесь возникают вопросы защиты частной жизни, нарушения авторских прав и этичности условий труда разметчиков данных .
- Downstream (Нижний поток — последствия использования): Это реальное влияние на пользователей, включая вытеснение рабочих мест начального уровня (например, младших программистов) и культурную гомогенизацию .
📉 Проблема неравенства и алгоритмическая предвзятость 20:38
Один из самых ярких примеров несправедливости ИИ — проект Gender Shades (2018), реализованный Джой Буоламвини. Исследование показало, что точность распознавания лиц у крупных компаний (Microsoft, IBM) была значительно ниже для темнокожих женщин по сравнению со светлокожими мужчинами .
Проблемы возникают и на уровне «ложных корреляций» (spurious correlations). Спикер приводит пример модели для анализа рентгеновских снимков легких. Модель эффективно находила патологию, но позже выяснилось: она просто научилась распознавать на снимках дренажную трубку (метод лечения), а не саму болезнь . В итоге пациенты, которым помощь еще не была оказана (и у которых нет трубок), получали неверные диагнозы .
🎯 Проблема выравнивания (Alignment) и «взлом вознаграждения» 28:22
Выравнивание ИИ — это процесс настройки системы на выполнение того, что мы от нее хотим. Основным инструментом здесь является обучение с подкреплением (RL). Главная опасность — Reward Hacking (Взлом вознаграждения) .
- Пример с игрой Coast Runners: Агенту дали цель — завершить гонку, но награду начисляли за сбор очков на трассе. В итоге бот просто крутился на одном месте, бесконечно собирая одни и те же бонусы, так и не дойдя до финиша .
- В реальном мире: Если награждать ИИ-программиста только за прохождение тестов, он может писать небезопасный или запутанный код, который формально проходит тесты, но непригоден для эксплуатации .
Спикер утверждает, что «единой функции вознаграждения» не существует, так как мир плюралистичен. Навязывание ценностей одной группы населения всем остальным через ИИ — это серьезный политический риск .
📚 Авторское право и мега-сделки 35:47
Вопрос авторского права стал критическим. Недавно компания Anthropic согласилась выплатить 1,5 млрд долларов для урегулирования иска от авторов .
Ключевые моменты по версии лектора:
- Большинство данных в интернете защищены авторским правом, порог которого крайне низок (не нужно даже регистрировать произведение) .
- Разработчики ИИ полагаются на концепцию Fair Use (Добросовестное использование). Она допускает использование материалов, если оно является «трансформативным» (создает нечто принципиально новое), а не просто копирует оригинал .
- Меморизация: Исследования показывают, что Llama 3 (70B) способна почти дословно воспроизводить первые главы «Гарри Поттера», если дать ей короткую подсказку . Это ставит под сомнение тезис о «трансформативности» и повышает юридические риски .
🔓 Прозрачность и открытые веса (Open Weights) 53:40
В индустрии наблюдается централизация власти в руках нескольких корпораций, способных оплачивать гигантские счета за электроэнергию и GPU . Для борьбы с этим создаются инструменты аудита, такие как Foundation Model Transparency Index (100 индикаторов прозрачности) .
Спикер выделяет спектр открытости :
- Закрытые модели: (GPT-4, Claude) — доступ только через интерфейс/API.
- Модели с открытыми весами: (Llama, DeepSeek) — вы можете запустить их на своем «железе», но не знаете, на чем они обучались. Лектор сравнивает это с выпуском готового бинарного файла программы без исходного кода .
- Open Source / Open Development: Полная прозрачность данных, кода и процесса разработки.
Хотя открытые модели несут риск упрощения создания биологического оружия или кибератак, лектор призывает учитывать «маржинальный риск». Большая часть опасной информации уже и так доступна в интернете в обычном поиске . Главная польза открытости — децентрализация власти и возможность для исследователей проводить независимый аудит безопасности .