Николас Карлини

Николас Карлини

Исследователь безопасности ИИ в Google DeepMind

8статей

174 тыс.просмотров

2021–2026период

5каналов

Wikipedia →

Nicholas Carlini is an American researcher affiliated with Anthropic and previously with Google DeepMind who has published research in the fields of computer security and machine learning. He is known for his work on adversarial machine learning, particularly his work on the Carlini & Wagner attack in 2016. This attack was particularly useful in defeating defensive distillation, a method used to increase model robustness, and has since been effective against other defenses against adversarial input. In 2018, Carlini demonstrated an attack on Mozilla's DeepSpeech model, showing that hidden comm

💬 Заметные цитаты

Природа состязательных атак

«Adversarial examples are not bugs, they are features.»

→ Почему безопасность ИИ невозможна: взгляд Николаса Карлини

Преимущество атакующего в ИИ

«Атакующий ходит вторым... он может подождать, пока область знаний продвинется, и применить новые знания к уже зафиксированной защите.»

→ Почему безопасность ИИ невозможна: взгляд Николаса Карлини

Предвзятость в научных исследованиях

«Трудно заставить исследователя понять что-то, если его публикация зависит от того, что он этого не понимает.»

→ Николас Карлини об ИИ-безопасности: «Если от модели зависит жизнь — не развертывайте ее»

Этика развертывания критических систем

«Если бы кто-то мог обмануть ваш классификатор и из-за этого кто-то погиб бы, то просто не развертывайте свой классификатор.»

→ Николас Карлини об ИИ-безопасности: «Если от модели зависит жизнь — не развертывайте ее»

Смена парадигмы программирования

«Цель инженера — не печатать строки кода, а решать проблемы. Раньше это был ассемблер, потом Python, теперь — английский язык.»

→ Николас Карлини: „Безопасность станет главным барьером для внедрения ИИ-агентов“

«Безопасность ИИ может пойти путем симметричной криптографии, где надежность доказывается десятилетиями безуспешных попыток взлома всем миром.»

→ Почему безопасность ИИ невозможна: взгляд Николаса Карлини

«Unlearning doesn't do what you think it does... unlearning knowledge is very different from unlearning facts.»

→ Почему безопасность ИИ невозможна: взгляд Николаса Карлини

«Если биологическая система слишком интерпретируема, она становится очень уязвимой, так как появляются паразиты.»

→ Почему безопасность ИИ невозможна: взгляд Николаса Карлини

Все цитаты (21) →

👥 Часто вместе с

📺 Где появляется

🧠 Ключевые концепции

📈 Темы Nicholas Carlini4 Николас Карлини3 Google DeepMind3 Anthropic2 кибербезопасность2 Adversarial Machine Learning2 AI Safety1 Model Stealing1 состязательные примеры1 Florian Tramèr1 Nicolas Carlini1 Состязательные атаки1

📺 Материалы с участием

🛡 Anthropic о Claude Mythos: «Мы создали ИИ, который слишком опасен для выпуска»

80,000 Hours · 10.04 · 41,4 тыс. просм.

🚀 Николас Карлини: „Безопасность станет главным барьером для внедрения ИИ-агентов“

Stanford Online · 22.10.25 · 10,6 тыс. просм.

🛡 Почему безопасность ИИ невозможна: взгляд Николаса Карлини

The Cognitive Revolution · 27.02.25 · 39 тыс. просм.

🛡 Николас Карлини: «Мы обречены жить в мире уязвимых ИИ»

Machine Learning Street Talk · 25.01.25 · 30,7 тыс. просм.

🛡 Николас Карлини: «Языковые модели — это не волшебство, а вызов безопасности»

Machine Learning Street Talk · 25.01.25 · 30,7 тыс. просм.

🛠 Николас Карлини: «Мы выкупили домены LAION за 100 долларов»

The TWIML AI Podcast with Sam Charrington · 27.02.23 · 1,6 тыс. просм.

🧩 Почему состязательные примеры остаются неразрешимой проблемой машинного обучения

Machine Learning Street Talk · 31.01.21 · 10 тыс. просм.

🧩 Николас Карлини об ИИ-безопасности: «Если от модели зависит жизнь — не развертывайте ее»

Machine Learning Street Talk · 31.01.21 · 10 тыс. просм.