Identificação de Momentos Relevantes em Vídeos do YouTube: Uma Abordagem Multimodal com Arquitetura Transformer e Aprendizado Auto-Supervisionado Utilizando Incômodo Psicoacústico
Com o aumento da popularidade das plataformas de mídia de vídeo, tornou-se comum a criação de conteúdos a partir de fragmentos de vídeos mais longos, destacando momentos de grande interesse para os usuários. Esse movimento evidencia a necessidade do desenvolvimento de novas ferramentas que auxiliem os usuários a produzir, consumir e armazenar conteúdos de vídeo de forma eficiente. Este trabalho propõe um estudo de caso que aplica um modelo projetado para a tarefa de sumarização na geração de cortes de vídeo, mantendo informações relevantes para o usuario. O estudo contribui de forma teorica, analisando o impacto de mudanças na tarefa, no dataset e nas configurações de modelos preestabelecidos na literatura, e de forma pratica, auxiliando no desenvolvimento de ferramentas que supram a necessidade do consumo eficiente.
2024/1 - POC1
Orientador: Erickson Rangel do Nascimento
Palavras-chave: video summarization, youtube heatmap estimator
PDF Disponível