Цитаты — Николас Карлини

«

Adversarial examples are not bugs, they are features.

01:27 · Почему безопасность ИИ невозможна: взгляд Николаса Карлини

«

Безопасность ИИ может пойти путем симметричной криптографии, где надежность доказывается десятилетиями безуспешных попыток взлома всем миром.

02:17 · Почему безопасность ИИ невозможна: взгляд Николаса Карлини

«

Unlearning doesn't do what you think it does... unlearning knowledge is very different from unlearning facts.

01:16 · Почему безопасность ИИ невозможна: взгляд Николаса Карлини

«

Атакующий ходит вторым... он может подождать, пока область знаний продвинется, и применить новые знания к уже зафиксированной защите.

21:30 · Почему безопасность ИИ невозможна: взгляд Николаса Карлини

«

Если биологическая система слишком интерпретируема, она становится очень уязвимой, так как появляются паразиты.

01:47 · Почему безопасность ИИ невозможна: взгляд Николаса Карлини

«

Мое самое большое опасение заключается в том, что люди начнут принимать решения, будучи дезинформированными.

02:32 · Почему безопасность ИИ невозможна: взгляд Николаса Карлини

«

Так зачем жертвовать 10% точности на чистых данных ради защиты, которую мотивированный хакер обойдет с пяти попыток?

1:32:22 · Почему состязательные примеры остаются неразрешимой проблемой машинного обучения

«

Если выстроить идеальное объяснение причин состязательных примеров, обычно на его основе можно создать защиту, которая их устранит.

16:47 · Николас Карлини об ИИ-безопасности: «Если от модели зависит жизнь — не развертывайте ее»

«

Трудно заставить исследователя понять что-то, если его публикация зависит от того, что он этого не понимает.

1:07:56 · Николас Карлини об ИИ-безопасности: «Если от модели зависит жизнь — не развертывайте ее»

«

Если бы кто-то мог обмануть ваш классификатор и из-за этого кто-то погиб бы, то просто не развертывайте свой классификатор.

1:32:37 · Николас Карлини об ИИ-безопасности: «Если от модели зависит жизнь — не развертывайте ее»

«

Безопасность модели должна быть такой же строгой, как и контроль доступа к данным, на которых она обучалась.

53:04 · Николас Карлини: „Безопасность станет главным барьером для внедрения ИИ-агентов“

«

Цель инженера — не печатать строки кода, а решать проблемы. Раньше это был ассемблер, потом Python, теперь — английский язык.

1:08:35 · Николас Карлини: „Безопасность станет главным барьером для внедрения ИИ-агентов“

«

Если человек хочет, чтобы на вашем компьютере произошло что-то плохое, он победит. В ML-системах «средний» человек может добиться успеха почти всегда.

03:59 · Николас Карлини: «Мы обречены жить в мире уязвимых ИИ»

«

Модели — это отражение вас. Если вы хороший шахматист, модель отвечает как хороший шахматист.

13:49 · Николас Карлини: «Мы обречены жить в мире уязвимых ИИ»

«

Если модель дает правильный ответ каждый раз, я не уверен, что мне важно, рассуждала ли она логически или использовала таблицу поиска.

21:48 · Николас Карлини: «Мы обречены жить в мире уязвимых ИИ»

«

Мы просто полагаемся на тот факт, что правительство, вероятно, не хочет, чтобы с вашим конкретным компьютером случилось что-то плохое.

03:43 · Николас Карлини: «Языковые модели — это не волшебство, а вызов безопасности»

«

Языковые модели — только семь лет значимого прогресса. Прогнозировать на пять лет вперед — это почти удвоить этот срок.

07:40 · Николас Карлини: «Языковые модели — это не волшебство, а вызов безопасности»

«

Для большинства систем самый простой путь для атаки — это не модель машинного обучения, а какой-то другой компонент.

10:08 · Николас Карлини: «Мы выкупили домены LAION за 100 долларов»

«

Если ваши медицинские снимки оказались среди тех 109 извлеченных изображений, вы не скажете: «Ну ладно, ничего страшного, ведь большинство остальных людей в безопасности».

21:28 · Николас Карлини: «Мы выкупили домены LAION за 100 долларов»

«

Внедрение хэшей — идеальная защита, но она приводит к потере огромного количества хороших данных.

44:54 · Николас Карлини: «Мы выкупили домены LAION за 100 долларов»

«

Я нашел больше багов за последние несколько недель с Mythos, чем за всю остальную жизнь вместе взятую.

01:32 · Anthropic о Claude Mythos: «Мы создали ИИ, который слишком опасен для выпуска»