Deepfake? Suposto áudio de André Fernandes tem análises divergentes

Esta checagem foi realizada por jornalistas que integram o Projeto Comprova, criado para combater a desinformação, do qual o Metrópoles faz parte. Leia mais sobre essa parceria aqui.

Conteúdo analisado: Áudio em que André Fernandes (PL) teria dito ser necessário “derramar dinheiro na mão de pastor e de líder comunitário” para conseguir vencer no segundo turno das eleições municipais.

Onde foi publicado: YouTube.

Contextualizando: Na semana que antecedeu o segundo turno das eleições 2024, circulou nas redes sociais um áudio atribuído a André Fernandes, candidato a prefeito de Fortaleza, em que ele supostamente afirma que é preciso distribuir dinheiro a lideranças religiosas e comunitárias.

No áudio, uma voz parecida com a do candidato diz que ele foi ultrapassado nas pesquisas de intenção de voto. Após a divulgação do conteúdo, Fernandes chamou uma coletiva de imprensa e disse ter provado que o material seria falso e teria sido criado pela campanha do adversário Evandro Leitão (PT), com uso de inteligência artificial. O candidato, no entanto, não apresentou evidências do uso de deepfake no material que viralizou.

O Comprova pediu a dois peritos forenses que analisassem o material, mas as conclusões apresentadas mostraram resultados divergentes. A Agência Lupa submeteu o áudio a três ferramentas de detecção de IA e também obteve resultados diferentes.

Mauricio de Cunto, cientista forense em material multimídia, um dos especialistas consultados pelo Comprova, analisou, em estudo preliminar, ser “muito improvável que a gravação tenha sido espontaneamente gerada por André Fernandes”. Ele esclarece, no entanto, que um estudo completo do material demandaria dias ou até semanas.

Cunto comparou o áudio que viralizou a gravações reais coletadas no perfil de Fernandes. Ele afirmou que “é muito improvável” que o áudio e as gravações reais tenham a mesma origem. O perito informou que fez “rápidas avaliações fonéticas, linguísticas, comportamentais, observação da forma de onda, espectro e espectrograma”. Esses últimos três termos se referem a gráficos que mostram aspectos técnicos como frequência, amplitude, tempo e harmônicos (características de ondas, sons, luz e variadas radiações) de elementos do áudio.

“Há, de fato, um conjunto minimamente robusto de evidências, como irregularidades no ritmo e entonação da voz, anomalias no ruído de fundo, tempos excessivamente longos entre algumas palavras e formações improváveis de formas de onda, entre vários outros aspectos, que indicam que a gravação pode ter ser sido gerada artificialmente, editada ou ainda imitada”, afirmou o perito.

Para fazer a análise preliminar, o especialista aplicou uma abordagem baseada em probabilidades bayesianas (Teorema de Bayes), muito comum em exames forenses. O teorema permite calcular a probabilidade de uma hipótese ser verdadeira com base em evidências observadas e conta com uma escala que vai de -4 a +4. Para a conclusão da análise do áudio atribuído a Fernandes, foi adotado o índice -3.

“Quanto mais próximo de ‐4, mais forte é a indicação de que as amostras não correspondem”, disse. “Por isso, a conclusão de que é muito improvável que as vozes tenham sido originadas pelo mesmo falante.”

Para essa análise, Cunto usou parâmetros como “características acústicas em comparação de voz, para determinar se ela corresponde à mesma origem de outra”. O perito informou que avaliou ainda o histograma de frequência fundamental (que demonstra a distribuição de frequência da voz) e padrões de entonação.

Outra perícia feita a pedido do Comprova deu resultado diferente. O professor e pesquisador em Computação Forense da Universidade Federal do ABC (UFABC) Mario Gazziro analisou o áudio em oito trechos separados e concluiu que é Fernandes na gravação. Ele alerta, contudo, que o material pode ter sido montado ou adulterado para parecer que o candidato mencionou uma distribuição de dinheiro.

“As evidências indicam que todos os oito trechos de áudio estavam com similaridade acima de 90%, logo eles pertencem ao suposto autor, o candidato André Fernandes”, afirmou. “Mas as montagens detectadas podem ter atribuído outro contexto à mensagem, a exemplo do trecho em que é mencionado ‘derramar dinheiro na mão de…’. Aqui é identificado um corte antes de ele falar ‘…de pastor, líder comunitário’”.

O detalhamento da inspeção visual e os diferentes ruídos encontrados entre os trechos aponta a realização dos cortes, segundo Gazziro.

“Esse trecho poderia facilmente ter sido adulterado a partir de um diálogo hipotético do tipo: ‘derramar dinheiro na mão de marketeiros e depois pedir apoio de pastor, líder comunitário’”, explicou. “Mas também poderia ter sido cortado apenas para suprimir algum nome que não era de interesse que fosse vazado junto com o material”.

O professor afirmou que sem o áudio completo e sem cortes, não é possível afirmar o que o candidato realmente disse na gravação.

Para a análise, Gazziro utilizou a inspeção visual das formas de onda utilizando o software GoldWave. Ele buscou por trechos de alteração do padrão do ruído de fundo ou ruído de conforto (gerado pelos aparelhos de captação, como smartphones, quando não existe ruído ambiente).

Uma vez diferenciados eventuais trechos, cada um deles foi comparado com um áudio de controle, que contém a voz verdadeira de Fernandes, livre de ruídos ambientes e outras vozes, e adquirida com tecnologia de qualidade similar. “A comparação trecho a trecho se faz necessária, pois um desses trechos pode pertencer ao autor e outro não, principalmente pela evidência da constatação de cortes”, explicou.

Para realizar a comparação, segundo Gazziro, foi utilizada a extração de coeficientes cepstrais na escala MEL de frequências, que é uma técnica padrão ouro de computação forense para extração de características de biometria vocal, usada para gerar um “mapa” similar a uma “impressão digital” da voz do interlocutor.

Extraídas as características, foi aplicada a checagem de batimento, que determina o percentual de verossimilhança da comparação. Todos os oito trechos tiveram fator de comprovação da hipótese acima de 90%. “De acordo com essa técnica, imitadores são classificados por fatores de comprovação entre 50% e 80% e deepfakes, entre 80% e 90%”, detalhou Gazziro.

De acordo com Gazziro, o trecho mais comprometedor do áudio, que fala em “derramar dinheiro” na mão de pastores, teve semelhança de 92,5% com a voz verdadeira de Fernandes. Os outros trechos têm percentuais de similaridade com média de 91,5%.

Acusações

No dia 21 de outubro, Fernandes voltou a acusar, durante uma coletiva de imprensa, a campanha do adversário Evandro Leitão de espalhar o áudio e de tê-lo criado usando inteligência artificial. O candidato do PL já havia feito isso dois dias antes, em 19 de outubro. André afirmou que o conteúdo teria sido publicado primeiro em um grupo oficial de Leitão e posteriormente em dois perfis no Instagram de integrantes do PT do município de Eusébio, no Ceará. O candidato do PL informou que pediu ao Ministério Público Eleitoral do Ceará (MP-CE) e à Polícia Federal (PF) a abertura de um inquérito contra o adversário.

A reportagem do Aos Fatos teve acesso ao material enviado por Fernandes ao MP-CE e à PF e constatou, por meio de uma imagem anexada à denúncia, que o áudio, na verdade, foi enviado ao grupo oficial de Leitão e não postado originalmente por eles. A mensagem com o áudio estava marcada como “encaminhada com frequência”. Além disso, a apuração detalhou que o vídeo compartilhado no Instagram de integrantes do PT já tinha marca d’água de outro usuário do TikTok, o que indica que foi uma reprodução.

No Instagram, Leitão negou as acusações de Fernandes, chamando-o de “rei das fake news”, e disse ser vítima de notícias falsas. O candidato, porém, não apresentou esclarecimento sobre o fato de aliados terem reproduzido vídeos com o áudio citado por André. As postagens com o compartilhamento do áudio já não estão mais disponíveis.

O Comprova tentou contato com André Fernandes para obter detalhes sobre a denúncia, com a diretoria estadual do PT no Ceará e com duas lideranças do partido no município de Eusébio para pedir um posicionamento sobre as publicações, mas não houve resposta. O Tribunal Regional Eleitoral do Ceará (TRE-CE) e o Tribunal Superior Eleitoral (TSE) também não retornaram o e-mail da reportagem questionando a denúncia do candidato do PL em Fortaleza.

Fontes consultadas: Peritos Mauricio de Cunto e Mario Gazziro, reportagens de Lupa e Aos Fatos, vídeo da transmissão da coletiva de imprensa do candidato André Fernandes.

Por que o Comprova contextualizou este conteúdo: O Comprova monitora conteúdos suspeitos publicados em redes sociais e aplicativos de mensagem sobre políticas públicas, saúde, mudanças climáticas e eleições e abre investigações para aquelas publicações que obtiveram maior alcance e engajamento. Você também pode sugerir verificações pelo WhatsApp +55 11 97045-4984.

Para se aprofundar mais: Os serviços de checagens Aos Fatos e Agência Lupa apresentaram as informações que existem até o momento sobre o caso. Várias publicações com conteúdos políticos circulam às vésperas das eleições municipais. O Comprova já contextuailzou, por exemplo, que livro de prefeito de Belo Horizonte teve relato de estupro tirado do contexto em campanha de adversário e investigou 16 ocorrências reunidas em vídeo viral sobre a gestão Nunes em São Paulo.

Adicionar aos favoritos o Link permanente.