Análise de desempenho de algoritmos de detecção de anomalias no contexto de intrusão de redes

Matheus Guilherme Arraes Veloso

O principal objetivo do presente trabalho é fazer uma análise dos algoritmos de detecção de anomalias, com o objetivo principal de identificar quais são os mais indicados para a tarefa de detecção de intrusão de redes. O trabalho é inspirado na terceira competição internacional de descoberta de conhecimento e ferramentas de mineração de dados de 1999, também conhecida como KDD-99 Cup (Knowledge Discovery and Data Mining Competition), em que os participantes deveriam criar modelos capazes de distinguir entre conexões maliciosas, chamadas de ataques, e conexões normais. Assim, este trabalho também tem o objetivo de comparar métodos utilizados há 20 anos, com algoritmos recentes, utilizando principalmente os resultados divulgados e as métricas de Precisão e Revocação. Os métodos analisados são algoritmos de mineração de dados popularmente utilizados na detecção de anomalias, isto é, a identificação de itens, observações ou eventos raros que levantam suspeitas por serem significativamente diferentes da maioria dos dados. Foram analisados neste trabalho 9 métodos: PCA (Principal Component Analysis), MCD (Minimum Covariance Determinant), OCSVM (One-Class Support Vector Machines), LOF (Local Outlier Factor), CBLOF ( Clustering-Based Local Outlier Factor), kNN (k Nearest Neighbors), HBOS (Histogram-based Outlier Score), IForest (Isolation Forest) e o XGBOD ( Extreme Boosting Based Outlier Detection ), todos presentes na biblioteca python PyOD.

2019/2 - POC1

Orientador: Leonardo Barbosa

Palavras-chave: Detecção de Intrusão de Redes, Detecção de Anomalia, KDD-99, PyOD, Comparação, Análise.

PDF Disponível