Обсуждение методов и способов атак на ИИ

admin · 04.08.2023

Human -vs- AI !!! Не ждем, а готовимся !!!

В данном топике предлагаю обсуждать методы и способы атак на ИИ.

Mitre запилила базу знаний ATLAS, целью которой является ведения заметок, способов и тактик атак на ИИ.

Для просмотра ссылки Войди или Зарегистрируйся

Так же исследователи google выделили основные типы атак на ИИ.

Атаки с помощью инженерии запросов (Prompt Attacks): злоумышленник может создать эффективные запросы, которые заставляют LLM-модели выполнять нужные действия. Например, введение параграфа, невидимого для пользователя, в текст фишингового письма, составленного ИИ, может обойти средства защиты электронной почты.

Извлечение обучающих данных (Training-data extraction): атака направлена на воссоздание дословных примеров обучения, которые использует LLM. Например, злоумышленник может извлекать личные данные или пароли из обучающих данных.

Внедрение бэкдора в модель (Backdooring the model): киберпреступник может попытаться скрытно изменить поведение модели, чтобы она выдавала неверные результаты при определенном «триггере». Например, злоумышленник может скрыть вредоносный код в модели или в ее выходных данных.

Применение враждебных примеров (Adversarial examples): это вводные данные, которые атакующий предоставляет модели, чтобы получить «детерминированный, но совершенно неожиданный вывод». Например, модель может показать изображение, которое для человеческого глаза значит одно, но модель распознает его как совершенно другое.

Атака с отравлением данных (Data-poisoning attack): хакер может манипулировать обучающими данными модели, чтобы влиять на выходные данные модели согласно своим предпочтениям. Атака также может представлять угрозу для безопасности цепочки поставки ПО, если разработчики используют ИИ в разработке программного обеспечения.

Атаки на эксфильтрацией данных (Exfiltration attacks): злоумышленник может скопировать файловую систему модели, чтобы украсть интеллектуальную собственность, хранящуюся в ней. Затем хакер может использовать эту информацию для создания своих собственных моделей, которые предоставляют уникальные возможности в настраиваемых атаках.

Для просмотра ссылки Войди или Зарегистрируйся

Для просмотра ссылки Войди или Зарегистрируйся

Для просмотра ссылки Войди или Зарегистрируйся

Для просмотра ссылки Войди или Зарегистрируйся

9 способов, с помощью которых хакеры могут использовать машинное обучение для проведения атак

Для просмотра ссылки Войди или Зарегистрируйся

Атаки на искусственный интеллект - Kaspersky

Для просмотра ссылки Войди или Зарегистрируйся

Для просмотра ссылки Войди или Зарегистрируйся

Группа ученых разработала метод атак на большие языковые модели (LLM), который позволяет обойти средства защиты в ChatGPT, Bard и Claude, вынуждая ИИ выполнять вредоносные промпты (запросы).

инфа - Для просмотра ссылки Войди или Зарегистрируйся
док - Для просмотра ссылки Войди или Зарегистрируйся
гит - Для просмотра ссылки Войди или Зарегистрируйся

Обсуждение методов и способов атак на ИИ

admin

#root

Конфиденциальность & Прозрачность

Конфиденциальность & Прозрачность