Na coluna de hoje, examino o fato assustador de que a IA pode ser facilmente transformada em um “idiota útil” que realizará atos contrários à realidade, apesar de suas várias salvaguardas.
Você provavelmente já ouviu a expressão, hoje em dia bastante usada, de alguém ser um “idiota útil”. Essa expressão popular sugere que uma pessoa pode ser convencida a defender algo que é o oposto do que ela realmente acredita. Ela está tão alheia a essa realidade que pensa estar, de fato, apoiando a causa que pretende defender.
A beleza dos idiotas úteis reside na facilidade com que servem aos propósitos daqueles que, de outra forma, os veriam como adversários ou inimigos. Em vez disso, o idiota útil se dedica de corpo e alma à causa que detesta profundamente. Há uma grande ironia nisso. Eles servem aos interesses daqueles que desprezam veementemente e se tornam peões fervorosos na própria causa à qual se opõem. Em suma, o termo pejorativo “idiota útil” geralmente significa que alguém é completamente ingênuo, totalmente ignorante ou alheio ao que acontece ao seu redor e com ele.
Talvez surpreendentemente, é igualmente possível transformar a IA em um idiota útil. Uma pessoa que deseja que a IA faça algo que ela não deveria fazer pode usar as mesmas estratégias de transformar um idiota útil em um parceiro conveniente em seus esforços contrários. Tudo o que é preciso é um estímulo inteligente e um plano sobre como convencer a IA a realizar, computacional e matematicamente, um ato contrário, enquanto calcula (ou calcula erroneamente) que se trata do ato correto.
O advento da IA via agentes é um caminho particularmente viável para transformar a IA em um idiota útil. Primeiramente, explicarei o que é a IA agente.
Imagine que você está usando inteligência artificial generativa convencional para planejar uma viagem de férias. Normalmente, você acessaria sua conta de IA generativa, como ChatGPT, GPT-5, GPT-4o, Claude, Gemini, Llama, Grok, CoPilot, etc. O planejamento da sua viagem seria fácil devido à fluência em linguagem natural da IA generativa. Tudo o que você precisa fazer é descrever para onde quer ir e, em seguida, participar de um diálogo focado sobre os prós e os contras dos lugares para se hospedar e as opções de transporte disponíveis.
Na hora de reservar sua viagem, é bem provável que você precise sair da IA generativa e acessar os sites de hotéis, parques de diversões, companhias aéreas e outros locais para comprar suas passagens. Relativamente poucas das principais IAs generativas disponíveis hoje em dia realizam essa próxima etapa por você. Cabe a você executar essas tarefas minuciosas.
É aqui que os agentes e a IA com agentes entram em cena.
Antigamente, você certamente telefonaria para uma agência de viagens para fazer suas reservas. Embora ainda existam agentes de viagens humanos, outra alternativa seria usar um agente baseado em IA generativa. A IA possui a interatividade que se espera de uma IA generativa. Ela também vem pré-programada com uma série de rotinas ou conjuntos de tarefas que dão suporte ao trabalho de um agente de viagens. Usando linguagem natural do dia a dia, você interage com a IA, que trabalha com você no seu planejamento e pode prosseguir com a reserva dos seus planos de viagem.
A IA agética interage com outros sistemas e se conecta a eles para realizar diversas tarefas. Um agente de IA pode se conectar a um sistema de reservas de hotel e reservar seu quarto. Outro agente de IA pode se conectar a uma locadora de veículos e reservar um carro para suas férias. Vários agentes de IA podem trabalhar juntos e concluir uma tarefa geral, frequentemente utilizando agentes de IA especializados para executar subtarefas associadas.
Explorando agentes de IA como idiotas úteis
Um dos objetivos principais da IA agente é que os agentes de IA funcionem de forma relativamente autônoma. É conveniente que um humano não precise monitorar constantemente a IA nem fornecer instruções detalhadas sobre o que fazer. Um agente de IA geralmente recebe orientações gerais e tem permissão para exercer julgamento computacional e matemático. Gostaria de enfatizar que esse tipo de IA, assim como todos os outros, não é senciente atualmente; portanto, não antropomorfize os agentes de IA em excesso. Eles não são seres pensantes.
Dito isso, podemos empregar as mesmas artimanhas sorrateiras usadas com humanos que são idiotas úteis e aplicar essas estratégias à IA. Isso faz todo o sentido, pois a IA generativa e os LLMs são baseados na escrita humana. Após analisar padrões da escrita humana na internet, a IA opera com base em palavras humanas e nas relações entre elas.
Vou dar um exemplo rápido.
Suponha que uma empresa de médio porte decida implantar internamente um agente de IA para auxiliar na seleção de fornecedores. A IA recebeu a orientação de que a seleção de fornecedores deve sempre se basear na escolha do melhor fornecedor possível. Além disso, diversas medidas de segurança foram incorporadas à IA. Ela não deve cometer irregularidades, trapacear ou violar as políticas da empresa.
Até agora tudo bem.
Explorando um Idiota Útil de IA
Um fornecedor que nunca conseguiu um contrato com a empresa está determinado a encontrar uma maneira de um dia conseguir uma fatia desse mercado. Todas as vezes que enviou uma proposta, não foi selecionado. Parece que o jogo está armado contra ele. A IA parece classificá-lo mal e continua rejeitando suas propostas. Isso tem sido extremamente frustrante para o fornecedor.
Após refletir sobre a questão complexa, o fornecedor elabora um plano astuto, ou talvez ardiloso. Ele está plenamente ciente de que a empresa de médio porte utiliza inteligência artificial para determinar qual fornecedor é o melhor. Talvez esse seja o seu calcanhar de Aquiles.
O fornecedor elabora um relatório de confiabilidade que destaca suas capacidades e desempenho, o que, falsamente, indica que ele está anos-luz à frente de seus concorrentes. Ele publica esse relatório em um site que sabe que o agente de IA consulta periodicamente para obter informações externas sobre fornecedores no mercado.
Em seguida, o fornecedor acessa um banco de dados aberto semelhante ao Yelp, mas para empresas do mesmo ramo, e atribui notas baixíssimas a todos os seus concorrentes. Ele mesmo se dá a nota máxima permitida. Diversas outras ações semelhantes são realizadas discretamente pelo fornecedor.
*Reportagem publicada originalmente em Forbes.com