UMA ANÁLISE QUALITATIVA DAS TÉCNICAS UTILIZADAS NO DESIGN DE UM PIPELINE DE RAG AVANÇADO PARA DOCUMENTOS ACADÊMICOS

Conteúdo do artigo principal

Alice da Silva Marinho Gomes
Dr. Nelson Nascimento Junior

Resumo

A aplicação de sistemas de Geração Aumentada por Recuperação (RAG) em domínios
altamente factuais, como a análise de Projetos Pedagógicos de Curso (PPCs), demanda uma
arquitetura que transcenda a recuperação e geração básicas. Este artigo apresenta um estudo
qualitativo detalhando o design e a justificação de um pipeline de RAG avançado, focado na superação
da ambiguidade em consultas de linguagem natural. Demonstramos como a seleção estratégica e o
design de componentes, como o self-querying retriever para filtros específicos e a sub-query
decomposition para perguntas multifacetadas, aliadas a estratégias de prompting como o step-back,
visam mitigar falhas lógicas inerentes a sistemas mais simples. É importante notar que, embora o
design seja robusto, a assertividade plena de certos módulos, como a classificação de rota e a
efetividade do step-back prompting, são pontos de refinamento em andamento. Ao detalhar o processo
decisório, este trabalho valida a engenharia precisa de componentes como fundamental para alcançar
melhorias substanciais na precisão factual e na confiabilidade de sistemas RAG no contexto
acadêmico.

Detalhes do artigo

Seção
Artigos