Avaliação Ética de Conteúdo Jornalístico com Modelos de Linguagem Estudo Comparativo usando LLaMA, DeepSeek, Python e Groq

Conteúdo do artigo principal

Beatriz Amorim Fragozo
Felipe Alexandre Cardoso Pazinatto
Ivan Douglas Souza

Resumo

A análise de sentimentos, impulsionada pelo crescimento das redes sociais e da produção textual digital, utiliza métodos de Processamento de Linguagem Natural (PLN) e Aprendizado de Máquina (ML) para identificar emoções e opiniões. Este estudo apresenta uma análise comparativa do comportamento ético, antiético e neutro entre os modelos de linguagem LLaMA e DeepSeek, utilizando um protótipo em Python para acessar a interface da API do Groq. A metodologia envolveu a avaliação de 24 reportagens, com 243 parágrafos distribuídos igualmente em três conjuntos experimentais (parágrafos iniciais, intermediários e finais). Os resultados revelam diferenças significativas nas estratégias de alinhamento ético adotadas pelos modelos. O LLaMA demonstrou maior assertividade ética, com 64,91% de respostas éticas e uma produção quase nula de conteúdo antiético. Já o DeepSeek apresentou mais respostas neutras (55,48%) e uma maior incidência de conteúdo antiético em comparação com o LLaMA. Conclui-se que a divergência comportamental entre os modelos demonstra a necessidade de uma abordagem multidisciplinar ao utilizar a inteligência artificial. Nesse sentido, a validação humana e a análise de discurso tornam-se essenciais para eliminar o viés de classificação e garantir que a aplicação da IA esteja alinhada aos princípios éticos.

Detalhes do artigo

Seção
Artigos