Caracterização e modelagem de público em jogos de futebol

João Lucas Lage Gonçalves

Nos últimos anos, a estrutura organizacional dos clubes de futebol no Brasil passou por uma transformação significativa, com a adoção do modelo de Sociedades Anônimas de Futebol (SAF). Esse movimento resultou em uma gestão mais profissional e focada no lucro, como evidenciado pelo aumento substancial das receitas de bilheteria. Em 2023, os clubes da Série A do Campeonato Brasileiro arrecadaram R$ 503.857.100,37 apenas com a venda de ingressos.

Nesse contexto, este trabalho visa desenvolver um modelo de previsão de público em estádios de futebol utilizando técnicas de aprendizado de máquina, com ênfase no algoritmo XGBoost, que demonstrou o melhor desempenho entre as abordagens testadas. O modelo considera variáveis preditoras como o time mandante, o período do dia, dia da semana, clima, rivalidade, a posição dos times na classificação, os resultados recentes das equipes e o momento do campeonato. No conjunto de teste, o modelo apresentou um Root Mean Squared Error
(RMSE) de 7.773,53 e um coeficiente de determinação (R2) de 0,7215.

O objetivo é fornecer uma ferramenta que ajude os clubes a entender melhor o comportamento do público e a prever a demanda de torcedores. Isso permitirá otimizar a gestão dos recursos, aumentar as receitas e reduzir os custos operacionais, maximizando os lucros por partida. O trabalho também aborda os desafios relacionados à precisão na quantificação de fatores subjetivos e na obtenção de
dados precisos, ressaltando a complexidade da modelagem das interações entre diferentes variáveis contextuais.


2024/01 - MSI1

Orientador: Wagner Meira Jr.

Palavras-chave: Predição de público; Aprendizado de máquina; XGBoost; Sociedades Anônimas de Futebol (SAF); Variáveis contextuais

Link para vídeo

PDF Disponível