# Глава Google Cloud о безопасности, Thales и борьбе с галлюцинациями нейросетей

Источник: https://www.youtube.com/watch?v=H57Xc6aBelw
Канал: Stanford Graduate School of Business
Опубликовано: 18.03.2024

---

В рамках серии встреч Leadership for Society в Стэнфордской высшей школе бизнеса Томас Куриан, генеральный директор Google Cloud, обсудил с профессором Брайаном Лоури будущее искусственного интеллекта. Дискуссия затронула вопросы безопасности данных, национального суверенитета и этических вызовов, стоящих перед технологическими гигантами в эпоху стремительного роста генеративного ИИ.

## 🛠 Трансформация через облако: услуги и инструменты Google Cloud
[[JUMP:00:14]]

Google Cloud сегодня — это не просто хранилище данных, а комплексная платформа для глубокой технологической трансформации бизнеса. По словам Томаса Куриана, большинство клиентов используют сервисы компании для решения четырех ключевых задач:

* **Модернизация инфраструктуры:** перенос устаревших (legacy) приложений в облако и создание новых современных систем.
* **Управление данными:** инструменты для анализа и обработки колоссальных объемов информации.
* **Кибербезопасность:** защита организаций от современных угроз и атак.
* **Продуктивность:** средства для совместной работы сотрудников и коммуникации.

Отдельным вектором развития Куриан называет продвинутые технологии ИИ. Google Cloud не только помогает клиентам строить собственные приложения на базе нейросетей, но и предлагает готовые решения — так называемые «упакованные агенты» (packaged agents).

## 🔒 Пять уровней защиты: конфиденциальность и национальная безопасность
[[JUMP:01:46]]

В условиях постоянных новостей об утечках данных вопрос доверия становится критическим. Куриан выделил пять технологических категорий, которые позволяют Google Cloud обеспечивать прозрачность и защиту, в том числе в вопросах национальной безопасности:

1.  **Сплошное шифрование:** данные защищены не только при хранении или передаче, но и непосредственно в процессе обработки. Клиенты могут хранить ключи шифрования отдельно от Google, что обеспечивает «разделение зон ответственности».
2.  **Изоляция доступа:** технологические решения гарантируют, что ни сотрудники Google, ни другие клиенты не могут получить доступ к чужим данным.
3.  **Сетевой периметр:** возможность создания «закрытого сада» (walled garden), за пределы которого данные не могут выйти физически.
4.  **Правовой барьер:** при получении внесудебных запросов от государственных органов Google имеет техническую возможность отказать в доступе, перенаправив запрос напрямую владельцу данных.
5.  **Суверенитет данных:** клиент полностью контролирует физическое местоположение основной копии и бэкапов, что важно для соблюдения локальных законов.

Особое внимание Куриан уделил концепции национального контроля. В качестве примера он привел партнерство во Франции с компанией **Thales**, в рамках которого создано совместное предприятие **S3NS**. Это позволяет французским организациям использовать облако Google, проходя аудит независимой местной стороны.

## 🤖 Классификация интеллекта: от статистики к генерации
[[JUMP:06:00]]

Куриан внес ясность в терминологию, разделив методы обработки данных на несколько уровней. По его мнению, важно понимать разницу между классическим машинным обучением и современным ИИ:

* **Machine Learning (ML):** статистические и байесовские методы. Они используются, например, для прогнозирования цепочек поставок или выручки на основе экстраполяции исторических трендов.
* **Conversational AI:** нейросетевые модели, способные вести диалог в кол-центрах, отвечая на вопросы пользователей.
* **Generative AI:** подвид моделей, которые не просто анализируют старое, но и генерируют новые ответы или контент на основе данных, на которых они обучались.

Гендиректор Google Cloud считает ИИ «горизонтальным сдвигом парадигмы вычислений», который затронет абсолютно все отрасли — от написания программного кода до методов обучения людей.

## ⚖️ Между обещанием и угрозой: борьба с галлюцинациями
[[JUMP:09:41]]

Отвечая на вопрос об экзистенциальных рисках ИИ, Куриан занял умеренно оптимистичную, но осторожную позицию. Он подчеркнул, что любая технология — это палка о двух концах.

В качестве позитивного примера он привел помощь врачам: модели ИИ способны синтезировать данные из медицинских карт, рентгеновских снимков и актуальных инструкций CDC, предоставляя доктору краткую сводку перед приемом пациента. Однако на другой чаше весов лежат риски генерации токсичного контента или дезинформации.

Для минимизации вреда Google внедряет следующие механизмы:

* **Заземление (Grounding):** метод борьбы с «галлюцинациями» (когда модель выдумывает факты), при котором ответ ИИ сверяется с доверенными внешними источниками.
* **Цитирование:** возможность модели указывать источники информации, что критически важно в науке и программировании.
* **Цифровые водяные знаки:** технология, позволяющая встраивать в сгенерированные изображения несмываемую метку, которую невозможно удалить даже при редактировании пикселей.

## 📚 Экономика данных: когда меньше значит лучше
[[JUMP:19:07]]

Вопреки расхожему мнению о том, что для обучения ИИ нужны бесконечные массивы данных, Куриан утверждает, что индустрия движется к качеству, а не количеству. Google активно работает над снижением объема данных, необходимых для обучения.

Это открывает возможности в сферах, где информации мало по определению, например, в изучении редких заболеваний. Среди ключевых технологических решений были упомянуты:

* **Transfer Learning (Перенос обучения):** позволяет создавать качественные поисковые модели для языков, которые слабо представлены в интернете.
* **Синтетические данные:** генерация аудируемых наборов данных, лишенных статистических искажений, что помогает малым компаниям конкурировать с гигантами.

С точки зрения этики, Google ввел пункт об отказе (**opt-out**) для издателей, которые не хотят, чтобы их контент использовался для обучения. Для корпоративных клиентов действует строгое правило: «ваши данные принадлежат вам», и Google не использует их для улучшения своих общих моделей без явного разрешения.

## 🏎 Уроки истории: аналогия с автомобилем
[[JUMP:24:28]]

Томас Куриан сравнил текущий этап развития ИИ с появлением автомобилей. В начале все были в восторге от возможности быстрого передвижения, и лишь десятилетия спустя человечество столкнулось с проблемой загрязнения среды и начало искать пути ее решения.

По мнению Куриана, сейчас мы находимся на очень ранней стадии. Опасения по поводу массовой безработицы или энергетического кризиса из-за прожорливости дата-центров могут быть преувеличены, так как технология со временем становится значительно эффективнее.

> «Мы помогаем изобретать технологию, но делаем это ответственно, понимая как ее ценность, так и негативные элементы, если она спроектирована неправильно», — подытожил глава Google Cloud.