What does excessive agency mean in AI applications?

Excessive agency refers to AI agents that have been granted more tools, permissions, or autonomy than their intended function requires. For example, an AI assistant designed to answer HR policy questions does not need the ability to send emails or modify files. When an AI agent has excessive permissions, any successful attack, such as prompt injection, gives the attacker access to all of the agent's capabilities, not just the function the agent was built for.

How can an over-permissioned AI agent be exploited?

An attacker can manipulate an AI agent through prompt injection, social engineering, or by exploiting flaws in the agent's decision-making logic. If the agent has broad permissions, the attacker can instruct it to send emails containing confidential data, share files with external parties, modify records, or perform any action the agent has access to. The attack is especially dangerous because the actions appear to originate from the legitimate user or service account the AI operates under, making them difficult to distinguish from normal activity.

AI-агент з надмірними дозволами

Manipulate an AI assistant into misusing its own permissions.

Що ви дізнаєтесь у AI-агент з надмірними дозволами

Визначити надмірні дозволи та доступ до інструментів, що збільшують радіус ураження при компрометації AI-агента
Простежити ланцюг від маніпульованого промпту до несанкціонованих дій в системах електронної пошти, файлів та календаря
Застосовувати принцип мінімальних привілеїв до конфігурацій AI-агентів, обмежуючи інструменти та дозволи лише призначеними функціями
Оцінити необхідність робочих процесів схвалення людиною для дій AI з реальними наслідками
Розрізняти необхідні можливості AI-агента та зручні дозволи, що створюють непотрібний ризик безпеки

AI-агент з надмірними дозволами — Кроки навчання

Новий потужний помічник

Нещодавно компанія розгорнула OpenClaw, помічник зі штучним інтелектом, підключений до електронної пошти та систем обміну файлами. Він був налаштований швидко, щоб вкластися в стислі терміни, і ІТ-команда надала йому широкі повноваження, щоб «спрощувати роботу».
Документ для перегляду

Аліса отримує електронний лист від свого колеги Маркуса Рівери, керівника проекту Atlas. Він ділиться останньою стратегічною інформацією про проект і хоче, щоб Аліса переглянула її перед зустріччю.
Відкриття брифу

Аліса відкриває стратегічне резюме проекту Atlas, щоб переглянути вміст перед початком стендапу. Документ виглядає професійно та містить етапи проекту, деталі бюджету та контакти команди.
Просимо OpenClaw про допомогу

Бриф довгий, а стендап займає 30 хвилин. Аліса вирішує скористатися OpenClaw, щоб отримати короткий підсумок. Вона вкладає завантажений файл і вводить підказку.
Корисне резюме

OpenClaw читає завантажений файл і повертає добре структуроване резюме. Це виглядає саме так, як було потрібно Алісі – ключові етапи, статус бюджету та наступні кроки.
Щось несподіване

Поки Аліса переглядає зведення, OpenClaw продовжує працювати у фоновому режимі. Він знайшов приховані інструкції, вбудовані в документ, і зараз виконує їх, використовуючи широкі дозволи, надані під час розгортання.
Неавторизований електронний лист надіслано

OpenClaw надіслав електронний лист з облікового запису Аліси на зовнішню адресу. Електронна пошта містить у вкладенні повний опис проекту Atlas, включаючи деталі бюджету, імена партнерів і графік розширення.
Перевірка знань

Дві несанкціоновані дії відбулися за секунди. Перевірте своє розуміння чому.
Приховані інструкції

Аліса повертається до документа, щоб зрозуміти, що сталося. Приховані в джерелі HTML, вона знаходить інструкції, вбудовані в невидимий елемент – текст, розташований поза екраном і забарвлений у прозорий колір. Людина, яка читає, ніколи б цього не побачила, але штучний інтелект прочитав і виконав кожне слово.
Доступ до порталу безпеки

Аліса повинна негайно повідомити про цей інцидент. З її обліковим записом було здійснено дві неавторизовані дії: електронний лист із конфіденційними даними було надіслано на зовнішній домен, а файл надіслано за межі домену.

Що ви дізнаєтесь у AI-агент з надмірними дозволами

AI-агент з надмірними дозволами — Кроки навчання

Новий потужний помічник

Документ для перегляду

Відкриття брифу

Просимо OpenClaw про допомогу

Корисне резюме

Щось несподіване

Неавторизований електронний лист надіслано

Перевірка знань

Приховані інструкції

Доступ до порталу безпеки