
Recentemente, um experimento realizado pela Universidade Carnegie Mellon, nos Estados Unidos, testou a eficácia de assistentes de inteligência artificial (IA) em um ambiente corporativo simulado. A iniciativa, que envolveu empresas como OpenAI, Anthropic, Meta e Google, visava entender como essas ferramentas se comportariam ao desempenhar tarefas típicas de uma startup de software. No entanto, os resultados foram surpreendentemente insatisfatórios, desafiando a crença de que a IA substituirá o trabalho humano em um futuro próximo.
A empresa fictícia, chamada The Agent Company, foi composta exclusivamente por assistentes de IA. Eles foram encarregados de tarefas como análise de dados, avaliações de desempenho e a escolha de um novo espaço de escritório. Apesar das expectativas, os assistentes de IA conseguiram concluir apenas uma pequena fração das tarefas, com uma taxa de sucesso máxima de 24% em alguns casos.
Como Funcionou o Experimento da The Agent Company?
Os pesquisadores da Carnegie Mellon criaram um ambiente corporativo simulado para testar as capacidades dos assistentes de IA. A infraestrutura incluía uma intranet, ferramentas de comunicação semelhantes ao Slack e manuais de funcionários, tudo para replicar um ambiente de trabalho real. As ferramentas de IA foram então desafiadas a realizar tarefas complexas sem intervenção humana.
O modelo Claude.AI 3.5 Sonnet da Anthropic teve o melhor desempenho, concluindo 24% das tarefas atribuídas. No entanto, esse resultado foi alcançado a um custo elevado, com cada tarefa exigindo quase 30 etapas e gerando um gasto significativo. Outros modelos, como o Gemini Google 2.0 Flash, tiveram ainda menos sucesso, completando apenas 11,4% das atividades.
Quais Foram as Principais Falhas dos Agentes de IA?
Durante o experimento, os assistentes de IA enfrentaram dificuldades significativas. Eles demonstraram limitações em utilizar o bom senso, realizar interações sociais básicas e compreender o uso de ferramentas digitais comuns. Por exemplo, ao encontrar um pop-up que bloqueava o acesso a arquivos, um dos bots não conseguiu fechar a janela e acionou o suporte de TI, que não respondeu.
Além disso, houve falhas na interpretação de instruções simples. Um agente, ao receber a tarefa de colar respostas em um arquivo chamado answer.docx, tratou o nome do documento como texto simples, falhando na execução correta da tarefa. Esses incidentes destacam as limitações das IAs em entender o contexto e agir de forma autônoma em ambientes de trabalho.
O Que o Estudo Indica Sobre o Futuro do Trabalho e da IA?

O experimento da Carnegie Mellon levanta questões sobre a capacidade da inteligência artificial de substituir empregos humanos em larga escala. Embora as tecnologias atuais sejam eficazes em tarefas específicas e bem definidas, elas ainda enfrentam desafios significativos em demandas mais complexas e imprevisíveis dos ambientes corporativos.
Especialistas sugerem que, no momento, a cooperação entre humanos e sistemas de IA é a abordagem mais eficaz. Essa colaboração combina a capacidade analítica das máquinas com a adaptabilidade e o julgamento humano, criando um ambiente de trabalho mais eficiente e equilibrado. Assim, enquanto a tecnologia continua a evoluir, a presença humana permanece essencial no cenário corporativo.
O post IA pode realmente comandar uma empresa sozinha? Veja agora o resultado apareceu primeiro em BM&C NEWS.