Identificação de Momentos Relevantes em Vídeos do YouTube: Uma Abordagem Multimodal com Arquitetura Transformer e Aprendizado Auto-Supervisionado Utilizando Incômodo Psicoacústico

GUSTAVO RIBEIRO ALVES RODRIGUES

Com o aumento da popularidade das plataformas de mídia de vídeo, tornou-se comum a criação de conteúdos a partir de fragmentos de vídeos mais longos, destacando momentos de grande interesse para os usuários. Esse movimento evidencia a necessidade do desenvolvimento de novas ferramentas que auxiliem os usuários a produzir, consumir e armazenar conteúdos de vídeo de forma eficiente. Este trabalho propõe um estudo de caso que aplica um modelo projetado para a tarefa de sumarização na geração de cortes de vídeo, mantendo informações relevantes para o usuario. O estudo contribui de forma teorica, analisando o impacto de mudanças na tarefa, no dataset e nas configurações de modelos preestabelecidos na literatura, e de forma pratica, auxiliando no desenvolvimento de ferramentas que supram a necessidade do consumo eficiente.


2024/1 - POC1

Orientador: Erickson Rangel do Nascimento

Palavras-chave: video summarization, youtube heatmap estimator

PDF Disponível