← Николас Карлини
Николас Карлини
21 цитата из наших статей · нажмите, чтобы открыть статью-источник
Исследователь безопасности ИИ в Google DeepMind
«
Adversarial examples are not bugs, they are features.
01:27 · Почему безопасность ИИ невозможна: взгляд Николаса Карлини
«
Безопасность ИИ может пойти путем симметричной криптографии, где надежность доказывается десятилетиями безуспешных попыток взлома всем миром.
02:17 · Почему безопасность ИИ невозможна: взгляд Николаса Карлини
«
Unlearning doesn't do what you think it does... unlearning knowledge is very different from unlearning facts.
01:16 · Почему безопасность ИИ невозможна: взгляд Николаса Карлини
«
Атакующий ходит вторым... он может подождать, пока область знаний продвинется, и применить новые знания к уже зафиксированной защите.
21:30 · Почему безопасность ИИ невозможна: взгляд Николаса Карлини
«
Если биологическая система слишком интерпретируема, она становится очень уязвимой, так как появляются паразиты.
01:47 · Почему безопасность ИИ невозможна: взгляд Николаса Карлини
«
Мое самое большое опасение заключается в том, что люди начнут принимать решения, будучи дезинформированными.
02:32 · Почему безопасность ИИ невозможна: взгляд Николаса Карлини
«
Так зачем жертвовать 10% точности на чистых данных ради защиты, которую мотивированный хакер обойдет с пяти попыток?
1:32:22 · Почему состязательные примеры остаются неразрешимой проблемой машинного обучения
«
Если выстроить идеальное объяснение причин состязательных примеров, обычно на его основе можно создать защиту, которая их устранит.
16:47 · Николас Карлини об ИИ-безопасности: «Если от модели зависит жизнь — не развертывайте ее»
«
Трудно заставить исследователя понять что-то, если его публикация зависит от того, что он этого не понимает.
1:07:56 · Николас Карлини об ИИ-безопасности: «Если от модели зависит жизнь — не развертывайте ее»
«
Если бы кто-то мог обмануть ваш классификатор и из-за этого кто-то погиб бы, то просто не развертывайте свой классификатор.
1:32:37 · Николас Карлини об ИИ-безопасности: «Если от модели зависит жизнь — не развертывайте ее»
«
Безопасность модели должна быть такой же строгой, как и контроль доступа к данным, на которых она обучалась.
53:04 · Николас Карлини: „Безопасность станет главным барьером для внедрения ИИ-агентов“
«
Цель инженера — не печатать строки кода, а решать проблемы. Раньше это был ассемблер, потом Python, теперь — английский язык.
1:08:35 · Николас Карлини: „Безопасность станет главным барьером для внедрения ИИ-агентов“
«
Если человек хочет, чтобы на вашем компьютере произошло что-то плохое, он победит. В ML-системах «средний» человек может добиться успеха почти всегда.
03:59 · Николас Карлини: «Мы обречены жить в мире уязвимых ИИ»
«
Модели — это отражение вас. Если вы хороший шахматист, модель отвечает как хороший шахматист.
13:49 · Николас Карлини: «Мы обречены жить в мире уязвимых ИИ»
«
Если модель дает правильный ответ каждый раз, я не уверен, что мне важно, рассуждала ли она логически или использовала таблицу поиска.
21:48 · Николас Карлини: «Мы обречены жить в мире уязвимых ИИ»
«
Мы просто полагаемся на тот факт, что правительство, вероятно, не хочет, чтобы с вашим конкретным компьютером случилось что-то плохое.
03:43 · Николас Карлини: «Языковые модели — это не волшебство, а вызов безопасности»
«
Языковые модели — только семь лет значимого прогресса. Прогнозировать на пять лет вперед — это почти удвоить этот срок.
07:40 · Николас Карлини: «Языковые модели — это не волшебство, а вызов безопасности»
«
Для большинства систем самый простой путь для атаки — это не модель машинного обучения, а какой-то другой компонент.
10:08 · Николас Карлини: «Мы выкупили домены LAION за 100 долларов»
«
Если ваши медицинские снимки оказались среди тех 109 извлеченных изображений, вы не скажете: «Ну ладно, ничего страшного, ведь большинство остальных людей в безопасности».
21:28 · Николас Карлини: «Мы выкупили домены LAION за 100 долларов»
«
Внедрение хэшей — идеальная защита, но она приводит к потере огромного количества хороших данных.
44:54 · Николас Карлини: «Мы выкупили домены LAION за 100 долларов»
«
Я нашел больше багов за последние несколько недель с Mythos, чем за всю остальную жизнь вместе взятую.
01:32 · Anthropic о Claude Mythos: «Мы создали ИИ, который слишком опасен для выпуска»