UMA ANÁLISE QUALITATIVA DAS TÉCNICAS UTILIZADAS NO DESIGN DE UM PIPELINE DE RAG AVANÇADO PARA DOCUMENTOS ACADÊMICOS
Conteúdo do artigo principal
Resumo
A aplicação de sistemas de Geração Aumentada por Recuperação (RAG) em domínios
altamente factuais, como a análise de Projetos Pedagógicos de Curso (PPCs), demanda uma
arquitetura que transcenda a recuperação e geração básicas. Este artigo apresenta um estudo
qualitativo detalhando o design e a justificação de um pipeline de RAG avançado, focado na superação
da ambiguidade em consultas de linguagem natural. Demonstramos como a seleção estratégica e o
design de componentes, como o self-querying retriever para filtros específicos e a sub-query
decomposition para perguntas multifacetadas, aliadas a estratégias de prompting como o step-back,
visam mitigar falhas lógicas inerentes a sistemas mais simples. É importante notar que, embora o
design seja robusto, a assertividade plena de certos módulos, como a classificação de rota e a
efetividade do step-back prompting, são pontos de refinamento em andamento. Ao detalhar o processo
decisório, este trabalho valida a engenharia precisa de componentes como fundamental para alcançar
melhorias substanciais na precisão factual e na confiabilidade de sistemas RAG no contexto
acadêmico.
Detalhes do artigo

Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial 4.0 International License.