Aplicação de LLMs na Sumarização de Documentos
Nos últimos anos, o volume de dados textuais disponíveis digitalmente tem crescido exponencialmente, gerando uma demanda crescente por ferramentas capazes de processar, compreender e sintetizar essas informações de maneira eficiente e precisa. A Sumarização Automatica de Textos destaca-se como uma tecnica indispensável para facilitar o acesso e a compreensão de grandes quantidades de dados. Este estudo revisa as abordagens mais recentes que empregam Grandes Modelos de Linguagem (LLMs) na sumarização automatica de textos, abordando tanto técnicas extrativas quanto abstrativas. A abordagem extrativa seleciona e concatena as sentenças mais importantes do documento, enquanto a abordagem abstrativa gera novas sentenças que transmitem de maneira concisa as informações mais significativas. Ambas as técnicas podem ser aplicadas na sumarização de um único documento ou de múltiplos textos relacionados a um mesmo tema. A pesquisa foi conduzida através de uma revisão bibliografica sistematica dos trabalhos mais relevantes na área de sumarização automatica e LLMs. Foram utilizados critérios de inclusão e exclusão para selecionar artigos publicados em periódicos ou conferencias entre 2019 e 2024, além de alguns artigos anteriores devido à sua relevância. Os modelos de sumarização extrativa são amplamente utilizados devido à sua simplicidade e eficiência, mas enfrentam limitações em termos de coerência e consistência factual. Modelos de sumarização abstrativa, por outro lado, geram resumos mais fluentes e gramaticais, mas enfrentam desafios relacionados à utilização do contexto completo e à ”maldição do meio”. Abordagens hibridas, que combinam técnicas extrativas e abstrativas, mostram-se promissoras para superar essas limitações. A sumarização automatica de textos com LLMs possui grande relevância para o avanço de tecnologias de NLP e para áreas praticas que demandam a analise e interpretação de grandes volumes de dados textuais. Este estudo contribui para o entendimento do papel dos LLMs na sumarização automatica, promovendo o desenvolvimento de sistemas mais robustos e eficientes. Futuras pesquisas devem focar na melhoria da coerência, precisão factual e relevância dos resumos gerados.
2024/2 - MSI2
Orientador: Marcos André Gonçalves
Palavras-chave: LLM; Sumarização Automática de Textos; Sumarização Extrativa; Sumarização Abstrativa;
Link para vídeo
PDF Disponível