Estudo de Estimativa de Sucesso de Re-Identificações em Divulgações Estatísticas Brasileiras

Lucas Starling de Paula Salles

Dados demográficos estatísticos são importantíssimos para direcionar a política de um estado democrático, porém essas informações também representam um risco à privacidade dos cidadãos. Para garantir o direito da população à privacidade foi criada a LGPD, em 2018, que estabelece que dados demográficos precisam ser anônimos para poderem ser publicados. A anonimização por desidentificação e amostragem é a metodologia mais frequentemente usada no Brasil, por instituições como o Instituto Brasileiro de Geografia e Estatística, para proteger esse tipo de dados. Esse trabalho busca verificar se essa estratégia de anonimização resulta, ou não, em dados que permanecem vulneráveis à re-identificação. São avaliados dados da pesquisa PeNSE, realizada pelo IBGE, e é observado que re-identificações bem sucedidas são extremamente prováveis, o que pode configurar uma violação da LGPD.


2023/1 - POC2

Orientador: Mario S. Alvim

Palavras-chave: Privacidade, Divulgações Estatísticas, Anonimização, Re-identificação, Desidentificação, Amostragem

Link para vídeo

PDF Disponível