<léxico_da_IA/>

Injeção de prompt

Tipo de ataque a sistemas de IA em que instruções maliciosas são escondidas em um texto que o modelo vai processar, levando-o a ignorar suas regras ou a revelar informações que não deveria.

Tipo de ataque a sistemas de IA em que instruções maliciosas são escondidas em um texto que o modelo vai processar, levando-o a ignorar suas regras ou a revelar informações que não deveria. Por exemplo, uma página web pode conter um comando oculto destinado a um assistente que venha a lê-la. É uma vulnerabilidade relevante sobretudo para agentes, que processam conteúdo externo de forma autônoma e podem agir com base nele.

Voltar ao léxico completo